Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

0 votes

Hallo,

bei einer Befragung, welche wir mit SoSci Survey durchgeführt haben, würden wir gerne neben den erhobenen Antwortdaten ebenfalls die Verweildauer der Benutzer auf den einzelnen Seiten auswerten. Bei einer ersten Sichtung der Daten ist allerdings aufgefallen, dass die Daten teilweise extreme Ausreißer enthalten.

So ist bei einem Teilnehmer für eine Seite, in der Mitte der Befragung eine Verweildauer von 4413540 angegeben, was ungefähr 51 Tagen entspricht. Die anderen Werte für diesen Teilnehmer scheinen plausibel zu sein und bewegen sich im Rahmen von bis zu 120 Sekunden.

Handelt es sich hierbei um einen extremen Messfehler? Oder bilden die Daten bespielsweise ab, dass der Benutzer die Seite ein erstes Mal aufgerufen hat und wesentlich später zu dieser zurück gekehrt ist und sie dann beendet hat?

Vielen Dank!

in SoSci Survey (dt.) by s075054 (110 points)

1 Answer

0 votes

Solche extremen Ausreißer bei der Verweildauer sind nicht ungewöhnlich. Sie kommen zustande, wenn ein Teilnehmer das Ausfüllen unterbricht und den Fragebogen entweder in einem Browser-Tab offen lässt, als Lesezeichen ablegt oder über einen personalisierten Link nach einer Weile wieder aufruft, um ihn abzuschließen.

51 Tage ist tatsächlich ziemlich lang - aber wenn Ihr Befragungsprojekt so lange im Feld war, auch nicht vollkommen abwegig. Zumal offenbar zu einer ähnlichen Tageszeit abgebrochen wie fortgesetzt wurde (die Zahl entspricht 51 Tagen und knapp 5 Minuten).

Bei der Berechnung von TIME_SUM oder TIME_RSI werden solche Ausreißer (eben weil sie häufiger vorkommen) automatisch entfernt bzw. durch den Median ersetzt.

by SoSci Survey (71.9k points)
Danke erst einmal für die Antwort! Nach welchem Kriterium werden die Ausreißer bei TIME_SUM oder TIME_RSI automatisch entfernt?
Für detaillierte Informationen zu TIME_RSI verweise ich auf folgendes Paper: https://www.researchgate.net/publication/258997762 (Relative Speed Index).

Die Variable TIME_SUM ist in der Anleitung dokumentiert: https://www.soscisurvey.de/help/doku.php/de:results:variables
...