0 votes
in SoSci Survey (dt.) by s225883 (110 points)

Guten Tag zusammen,

ich habe mich schon durch sämtliche youtube Tutorials und Co. gekämpft und bekomme das Splithalf Verfahren in R nicht hin.
Könntet ihr mir da weiterhelfen? :)

Ich habe diese Syntax benutzt:

install.packages("splithalfr")
library(splithalfr)
spearman_brown(ds$IA04D01,ds$IA04D02,fn_cor = cor)

Leider kommt als Ergebnis nur
[1] NA
raus.

Die Variable IA04D01 ist "Teilergebnis basierend auf den Trainigs-Blöcken 3 und 6 (D-Score)", die Variable IA04D02 "Teilergebnis basierend auf den Test-Blöcken 4 und 7 (D-Score)".

Eine weitere Frage hätte ich noch so zum statistischen Vorgehen/Ablauf.

Nachdem man den Datensatz eingelesen hat habe ich die D-Scores auf Normalverteilung (Shapiro Wilk Test, Histogramm, Q-Q-Plot) geprüft.
Dann müsste ich ja die Reabilität mithilfe des Splithalfs Verfahren überprüfen.
Und danach, je nachdem ob es eine Normalverteilung ist oder nicht, mit einem t-Test für paarweise abhängige Gruppen (bei parametrisch) und Wilcoxon-Vorzeichen-Rang-Test (nicht parameterisch) weiterrechnen oder?
Jetzt bin ich mir aber unsicher welche Variablen ich zum testen hernehme.

Ich kann ja schlecht nur eine Variable (IA04R02 Testergebnis nach Greenwald et al. 2003 (improdes, D-Score) hernehmen.
Ich hatte jetzt mal die Variablen wie im Splithalf Verfahren hergenommen:

t.test(ds$IA04D01,ds$IA04D02, paired = TRUE, alternative = "two.sided")
cohensD(ds$IA04D01,ds$IA04D02, method="paired")

Aber ich bin mir nicht sicher, ob das sinnvoll und richtig wäre. Ich will nur herausfinden/untermauern, dass das Ergebnis des D-Score den statistischen Richtlinien entspricht.

Ich hoffe ihr könnt mir da weiterhelfen :)

Vielen Dank.

Liebe Grüße

1 Answer

0 votes
by SoSci Survey (327k points)
edited by SoSci Survey

Leider kommt als Ergebnis nur [1] NA raus.

Traditionell liegt das an fehlenden Werten in den Ursprungsvariablen. Das ist beim IAT ja nicht ungewöhnlich. Die Reliabilität können Sie dann nur mit den vollständigen Variablen rechnen, z.B.

tmp = ds[c("IA04D01", "IA04D02")]
tmp = tmp[complete.cases(tmp), ]
# Und sofern ihr restlicher Code korrekt war...
spearman_brown(tmp$IA04D01, tmp$IA04D02, fn_cor = cor)

Und danach, je nachdem ob es eine Normalverteilung ist oder nicht, mit einem t-Test für paarweise abhängige Gruppen (bei parametrisch) und Wilcoxon-Vorzeichen-Rang-Test (nicht parameterisch) weiterrechnen oder?

Das kommt auf Ihre Fragestellung/Hypothese an. Aber ja, das wäre ein gängiges Vorgehen, wenn Sie zwei Gruppen vergleichen wollen.

Ich kann ja schlecht nur eine Variable (IA04R02 Testergebnis nach Greenwald et al. 2003 (improdes, D-Score) hernehmen.

Eigentlich schon ... was ist denn Ihre Hypothese? Da wird es ja eine UV geben, oder? Falls Sie keine Hypothese haben, macht ein Signifikanztest auch keinen Sinn.

Ich will nur herausfinden/untermauern, dass das Ergebnis des D-Score den statistischen Richtlinien entspricht.

Welche statistischen Richtlinien meinen Sie?

by s225883 (110 points)
Guten Tag,

vielen Dank für die rasche Rückmeldung.
Ich habe vier IATs für meine Arbeit. Ich will die Auswirkung von Phänotypen auf die Erfolgszuschreibung erforschen. Ein Beispiel:

Hypothese: Es besteht ein Unterschied in der Erfolgszuschreibung zwischen Weißen Mitmenschen und PoC Mitmenschen.

H0: Weißen Mitmenschen werden weniger oder gleiche Erfolgseigenschaften als PoC zugeschrieben.

HA: Weißen Mitmenschen werden mehr Erfolgseigenschaften als PoC zugeschrieben.

Und da ist die Frage, ob man dann nicht einfach den D-Score dafür hernehmen könnte und dadurch die Hypothesen obsolet wären. Ich hatte nicht auf dem Schirm, dass man ja dann keinen Signifikanztest durchzuführen hat, da war wohl mein Denkfehler.
Bei den statistischen Richtlinien meinte ich die quantitativen Gütekriterien: Validität, Reliabilität und Objektivität. Bei der Validität habe ich in der Literatur schon einiges gefunden, die Reliabilität würde ja mit dem Split half Verfahren getestet werden können und die Objektivität ist ja meine Forschungsarbeit.
Ich war mir nur unsicher ob noch weitere statistische Kennzahlen benötigt werden, um den D-Score zu rechtfertigen. Aber da sollte ja die Literatur reichen.

Leider kommt bei der Syntax zum Split half Verfahren diese Fehlermeldung raus:

Error in `[.data.frame`(tmp, complete.cases(tmp)) :
  nicht definierte Spalten gewählt

ich bin gerne auch für eine anderen Code für das Split half Verfahren offen.  

Vielen Dank für Eure Hilfe!

Liebe Grüße
by SoSci Survey (327k points)
> H0: Weißen Mitmenschen werden weniger oder gleiche Erfolgseigenschaften als PoC zugeschrieben.

Das klingt nach einem t-Test mit einer Gruppe, wobei Sie als Referenzwert 0 annehmen.

> Und da ist die Frage, ob man dann nicht einfach den D-Score dafür hernehmen könnte und dadurch die Hypothesen obsolet wären.

Mit dem Signifikanztest prüfen Sie ja, wie groß die Wahrscheinlichkeit ist, dass ein Hypothesen-konformes Ergebnis rein zufällig zustande kam, obwohl die Hypothese in Wirklichkeit gar nicht stimmt. Also: Nein.

> Error in `[.data.frame`(tmp, complete.cases(tmp)) :
>  nicht definierte Spalten gewählt

Pardon, da hatte ich noch ein Komma vergessen:

tmp = tmp[complete.cases(tmp), ]
by s225883 (110 points)
Vielen lieben Dank für die hilfreichen Antworten!!! :)

Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

...