Hallo liebes SoSci-Team,
um TIME_SUM für meinen Datensatz neu zu berechnen, habe ich zunächst den Median und den IQR für die einzelnen Seiten meines Fragebogens ausgerechnet.
Laut der Seite "Zusätzliche Variablen in der Datenausgabe" unter TIME_SUM ist als Definition von Unterbrechungen (Ausreißern) folgendes angegeben:
"länger als zwei Stunden oder den Median der Bearbeitungszeit um mehr als den 3-fachen Interquartilsabstand (IQR) dividiert durch 1.34 übersteigt (entsprechend mehr als 3 Standardabweichungen in einer normalverteilten Stichprobe)", was mich zu folgender Formel zur Berrechnung der Höhe bzw. Grenze der Ausreißer führt:
Median + 3 x IQR/1.34
Ab diesem Wert müsste dann statt den Ausreißern für jeden Wert der Median in die Aufsummierung des TIME_SUM eingesetzt werden.
Wenn ich die Formel anhand meines Ursprungsdatensatzes überprüfe, komme ich allerdings nicht auf den richtigen TIME_SUM Wert. Es sieht so aus als wäre der berrechnete Wert zu niedrig, wodurch einige Ausreißer folglich nicht durch den Median ersetzt werden.
Können Sie mir bitte weiterhelfen, wo mein Fehler liegt?
Wichtig wäre für mich die Information, wie ich auf den Grenzwert komme, ab wann der Median in die Berechnung für TIME_SUM eingeht.
Beste Grüße und vielen Dank!