0 votes
in Datenauswertung by s084918 (335 points)

Nachdem ich mittels t-Test festgestellt habe, dass eine meiner UVs keinen signifikanten Mittelwertsunterschied in Bezug auf meine AV aufweist, hier meine Frage:

Ist es in diesem Zusammenhang dann noch sinnvoll, eben diese UV in mein Regressionsmodell aufzunehmen?

1 Answer

0 votes
by SoSci Survey (323k points)

Theoretisch ist es möglich, dass der Effekt der einen UV vom Effekt einer anderen UV verdeckt wird. Das ist zwar ein eher seltener Fall, aber möglich. Wenn dem so ist (was man vorab i.d.R. nicht weiß), könnte man das in einer Regression herausfinden.

Oder anders formuliert: Die Kontrolle von UV2 (einfach dadurch, dass ein Regressionsmodell mit mehreren UVs gerechnet wird) kann dazu führen, dass der Effekt von UV1 deutlicher sichtbar wird.

Die eigentliche Frage ist aber: Warum wollen Sie eine Regression rechnen? Nur um ihrer selbst Willen? Dann lassen Sie es bleiben. Oder steht eine konkrete Hypothese dahinter? Dann stellt sich die Frage eigentlich gar nicht, welche UVs hinein gehören.

by s084918 (335 points)
Vielen lieben Dank! (Dahinter steht natürlich eine Hypothese, die Effekte dieser UV auf die AV annimmt.)

D.h. ich könnte wie folgt für einen Fortbestand dieser UV für die Regression argumentieren?:

Um zu analysieren, ob mögliche Effekte dieser Variablen auf YX möglicherweise durch andere Prädiktorvariablen verschleiert werden, wird diese Variable dennoch in das Regressionsmodell mit aufgenommen.
by SoSci Survey (323k points)
Wenn man in der Hypothese nichts anderes geschrieben hat, dann sollte man diese entsprechend dem t-Test ablehnen. Das wäre das saubere Vorgehen. Weitere Tests anzuwenden, bis irgendwas "signifikant wird" ist zwar verlockend, aber kein Hypothesentest mehr, sondern nur noch explorativ. Und bei explorativer Forschung braucht man keine Signifikanzen.

Ich würde entweder eine partielle Korrelation rechnen (wobei man da mit dichotomen UVs vorsichtig sein sollte) oder eine Regression - dann aber nur noch über die Effektstärken sprechen (ändert sich etwas?) und nicht mehr über eventuelle Signifikanzen. Denn wie gesagt: Als Hypothesentest geht das nicht mehr durch, wenn man bei der Festlegung der Hypothese die Kontrollvariable nicht ohnehin schon als solche vorgesehen hat.
by s084918 (335 points)
D.h. ich würde die Hypothese ablehnen, die Effekte dieser UV auf die AV annimmt, obwohl **Effekte** über einen t-Test nicht festgestellt werden können und ich den t-Test eher i.S. einer **Voranalyse** durchgeführt habe?

Für die Regression könnte ich diese UV jedoch dennoch mit aufnehmen um mögliche Effektstärken zu ermitteln (standardisierter Beta-Koeffizient). Sollte diese Effektstärke allerdings keine Signifikanz aufweisen, würde ich dies vermerken?

Ist ein t-Test für die UV denn überhaupt richtig/sinnvoll, wenn in Gruppe 1 n = 112, aber in Gruppe 2 die Anzahl der Personen nur n = 6 ist? Oder sollte ich da besser auf einen anderen Test zum Vgl. der Mittelwerte ausweichen?

Vielen lieben Dank!
by SoSci Survey (323k points)
> D.h. ich würde die Hypothese ablehnen, die Effekte dieser UV auf die AV annimmt, obwohl **Effekte** über einen t-Test nicht festgestellt werden können

Ein t-Test überprüft - ebenso wie die Regression - statistische Zusammenhänge (=Effekte). Kausalität werden Sie mit Ihren Daten unabhängig vom rechnerischen Verfahren ohnehin nicht überprüfen können.

> Sollte diese Effektstärke allerdings keine Signifikanz aufweisen, würde ich dies vermerken?

Eine Signfikanz hat streng genommen nur im Kontext einer Hypothese Bedeutung - und wenn die Hypothese sachlich keine (multiple) Regression erfordert, dann ist die Signifikanz streng genommen nicht interpretierbar... Aber streng genommen müssten wir dann vermutlich auch darauf verweisen, dass es sich vermutlich nicht um eine echte Zufallsstichprobe handelt - tja, es ist so einiges im Argen mit unseren statistischen Methoden.

> Ist ein t-Test für die UV denn überhaupt richtig/sinnvoll, wenn in Gruppe 1 n = 112, aber in Gruppe 2 die Anzahl der Personen nur n = 6 ist?

Naja - bei n=6 würde ich die Qualität der Daten generell in Frage stellen und die Variable mangels Varianz aus der Analyse ausschließen. Die Daumenregel lautet, dass man Gruppengrößen von n > 20 benötigt, damit man zumindest ansatzweise in den Bereich der "großen Zahlen" kommt, wo individuelle Ausreißer das Ergebnis nicht mehr maßgeblich verzerren.

Aber auch hier gilt: Es ist egal, ob Sie einen t-Test oder eine Regression rechnen. Die Verfahren sind rechnerisch bei Weitem nicht so unterschiedlich, wie man meinen möchte.
by s084918 (335 points)
Vielen vielen Dank für die hilfreiche Antwort!

Demnach macht es wenig Sinn, diese Variable, die insgesamt zwei Ausprägungen enthält (Ausprägung 1 mit n = 112 und Ausprägung 2 mit n = 6) mit in das Regressionsmodell aufzunehmen? Begründung: mangelnde/fehlende Varianz (Kriterium der Homoskedastizität nicht erfüllt) ?
by SoSci Survey (323k points)
Es gibt sicher immer irgendeinen Grenzfall, wo das Sinn ergeben kann (Datenanalyse hat viel mehr mit Interpretation und subjektiver Auslegung zu tun, als man meinen möchte) - aber so, wie Sie die Sachlage darstellen: Nein, vermutlich sollten Sie die Variable nicht in das Modell aufnehmen bzw. selbst wenn Sie sie aufnehmen, werden Sie dort nicht viel mehr (eher weniger) finden als im t-Test.

Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

...