0 votes
in SoSci Survey (dt.) by s145108 (130 points)

Hallo SoSci Survey Team,

ich habe Auffälligkeiten in meinem Datensatz entdeckt. Seit dem 20.12.-21.12. sind über 300 neue Datensätze dazugekommen. Das ist allerdings unrealistisch und bei genauerer Betrachtung fallen die folgenden Punkte auf:

  • Daten wurden zum Großteil über die Nacht erhoben
  • geschlossene Aufgaben wurden bearbeitet aber die Aufgaben mit offenem Textformat alle nicht --> hier wurden in allen Datensätzen Antworten wie "nein", "nicht zutreffend" und "unsicher" ausgewählt --> diese Antworten machen hier absolut keinen Sinn

Wir verlosen am Ende Gutscheine und dort haben sich tatsächlich alle eingetragen. Bei den E-Mailadressen handelt es sich meist um Gmail Adressen mit untypischen Namen und einer Zahlenreihe am Ende.

Wie können Sie mir hier helfen?

Besten Dank

1 Answer

0 votes
by SoSci Survey (306k points)

Wie können Sie mir hier helfen?

(1) Ich kann Ihnen raten, das nächste Mal keine Verlosung zu machen oder dafür ein Captcha einzusetzen. Auch Bogus Items sind hilfreich, um Datenmüll zu entlarven.

(2) Weiterhin würde ich Ihnen dringend raten, dass Sie keine E-Mail-Adressen direkt im Datensatz abfragen. Denn damit haben Sie ganz schnell personenbezogene Daten - und womöglich kommen Sie nicht allen damit verbundenen Verpflichtungen nach DSGVO nach: Personenbezogene Daten

Inhaltlich stimme ich Ihnen zu. Das sieht so aus, als ob jemand Ihr Gewinnspiel betrügen wollte. Technisch ist das nicht besonders aufwändig. Nachdem Sie die E-Mail-Adressen offenbar Datensätzen zuordnen können, können Sie diese ja gezielt löschen. Fehlden offene Antworten und TIME_RSI sind dafür evtl. gute Indikatoren. Vielleicht übersehen Sie einige Bot-Antworten und vielleicht löschen Sie einige valide Antworten ... aber das sind Unschärfen, mit denen Sie statistisch wahrscheinlich gut leben können.

by s145108 (130 points)
1.) Ein Bogus Item könnte ich doch auch jetzt noch einfügen?

2.) Die Mailadressen werden extra als "getrennt erhobene Kontaktadressen" erhoben.

Können wir dann jetzt gar nichts tun, damit nicht weitere betrügerische Antworten dazu kommen? Es kommen nämlich immer noch Antworten in diesem Stil dazu.
by SoSci Survey (306k points)
ad 1) Klar, aber das hilft natürlich nur bei den neu erhobenen Daten. Und zwei oder besser drei werden Sie vermutlich schon brauchen. Die Gewinnspiel-Frage sollten Sie dann nur den Leuten zeigen, die bei allen (oder zumindest 2 von 3) richtig geantwortet haben. Sie können auch einen Filter auf Basis der Antwortzeit einfügen.

ad 2) Gut, dann haben Sie eine Datenschutz-Sorge weniger. Allerdings können Sie dann auch die Adressen nicht in Abhängigkeit des Datensatzes löschen. "Getrennt" bedeutet, dass SoSci Survey sich wirklich Mühe gibt, dass die Zuordnung technisch unmöglich ist.

> Können wir dann jetzt gar nichts tun, damit nicht weitere betrügerische Antworten dazu kommen?

Bogus Items mit Filter, Captcha (als Fragetyp), das sollte den Nervensägen das Leben schonmal ziemlich schwer machen. Vielleicht zeigen Sie im Fall falsch beantworteter Bogus-Items eine zweite Kontaktdaten-erheben-Frage an. Dann merkt es niemand (und passt das Antwortschema an), aber die Adresse, die darüber reinkommen, können Sie einfach anhand der Kennung in der Liste löschen.
by s145108 (130 points)
Okay, dann würde ich das Captcha Item nun einfügen. Vermutlich macht es Sinn, ein Captcha zu Beginn des Fragebogens und ein weiteres vor der Verlosung einzupflegen.

Hier bräuchte ich nochmal Unterstützung: Wie kann ich es einstellen, dass die Option an der Verlosung teilzunehmen (getrennt erhobene Daten), nur den Personen zur Auswahl steht, die das Captcha richtig beantwortet haben? Leider habe ich dazu nichts gefunden...
by SoSci Survey (306k points)
> Vermutlich macht es Sinn, ein Captcha zu Beginn des Fragebogens und ein weiteres vor der Verlosung einzupflegen.

Nein, nicht wirklich. Ein Captcha reicht.

> Wie kann ich es einstellen, dass die Option an der Verlosung teilzunehmen (getrennt erhobene Daten), nur den Personen zur Auswahl steht, die das Captcha richtig beantwortet haben?

Das Captcha blockiert das Fortsetzen der Befragung bis es korrekt gelöst wurde. Ein Filter ist also gar nicht erforderlich.

Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

...