Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

0 votes

Hallo zusammen,

ich habe mir für meine Auswertung unter Interpretation bzgl. einer Clusteranalyse diverse Kreuztabellen mit dem Chi Koeffizienten ausgeben lassen.

Gehe ich nun richtig vor, wenn ich
1) davon ausgehe, dass die H0 besagt, dass es keinen Zusammenhang gibt und die H1 besagt, dass es einen Zusammenhang zwischen den Variablen gibt?

2) bei einem Chi Quadrat nach Pearson (Spalte Asymptotische Signifikanz zweiseitig) mit einem Wert kleiner 0,05 (Alpha = 5%) die H0 verwerfe und einen Zusammenhang der beiden Variable bzw. die H1 annehme?

3) ich diese unterschiedlich skalierten Variablen (metrisch, ordinal, nominal) auf diese Weise prüfe und mit den gebildeten Clustertypen in Verbinung setzen möchte?

4) sollte ich mich bei der Ausprägung der Variablen, welche ich in Bezug auf die Clustertypen prüfe, jeweils auf den höchsten %-Wert beziehen oder kann/darf ich bei zwei sehr hohen Werten diese Ausprägungen der Variablen auch zusammenfassen?

Vielen Dank im voraus!

in Datenauswertung by s082238 (125 points)
edited by s082238

1 Answer

0 votes

Bei (1) und (2) kann ich uneingeschränkt zustimmen.

Was (3) angeht: Die Kreuztabelle "sieht" alle Variablen als nominal skaliert. Wenn Sie prüfen möchten, ob eine intervallskalierte Variable mit dem Cluster zusammenhängt, ist eine ANOVA u.U. akkurater. Prinzipiell kann man aber auch den Chi²-Test verwenden.

Die Darstellung (4) ist eine Frage der persönlichen Stils und der konkreten Aussage. Wenn man in einem Cluster zwei sehr starke Ausprägungen hat (z.B. 30 Fällle mit Ausprägung A und 29 Fälle mit Ausprägung B), dann wäre die Nennung nur einer Ausprägung sicherlich nicht ganz angemessen.

by SoSci Survey (85.2k points)
Nun, eine z-Standardisierung ist definitiv nicht im Bereich 0..1. Insofern müssen sich die beiden Häkchen auf unterschiedliche Aspekte der Auswertung beziehen. Haben Sie denn nun noch konkrete offene Fragen? Was die Häkchen genau bedeuten, kann ich Ihnen nicht beantworten, da ich derzeit kein SPSS zur Hand habe.
Also, ich bin inzwischen schlauer geworden - hoffe ich. :)

Bei "Werte transformieren" kann ich natürlich meine Variablen z-standardisieren.
Die Rubrik "Maße transformieren", bei denen ich 0-1 anklicken wollte, bezieht sich auf das Distanzmaß (hier nutze ich die quadrierte euklidische Distanz). Hier gibt es neben "auf 0-1 skalieren" die Möglichkeit "Vorzeichen ändern" oder "Absolutwerte nutzen".

Ich denke es mir nun so, aber ich bin nicht sicher, ob ich richtig liege: Ich habe ja Variablen, denen eine Antwortskala von 1-5 zugrunde liegt. Demnach bewegen sich auch alle Werte zwischen 1 und 5, dies ist jedoch aufgrund des Mittelwertindex bei der Variable des latenten Konstrukts nicht so. Durch die Verrechnung der 8 einzelnen Itemantworten zu dem Index liegen die Werte hier zwischen 1,56 und 5, d.h. das Minimum hat sich hier verschoben bei dieser Variable. Deshalb denke ich, benötige ich hier eine z-Standardisierung.

Die Transformationen des Maßes, also meiner quadrierten euklidischen Distanz, würde ich weg lassen. Hier finde ich keinerlei Hinweise in meinen Büchern oder im Internet. Ich weiß nicht, ob ich das transformieren muss. Deshalb würde ich mich schlicht dagegen entscheiden, wenn Sie hier keinen Tipp haben?

Gehe ich so vor, also nutze ich nur die z-Standardisierung, habe ich ein inhaltlich nachvollziehbares Ergebnis. Ich würde dann so weiter vorgehen, wie wir es oben bereits besprochen haben, sprich, ich würde meine Cluster nach einer Anova durch Kreuztabellen weiter ausdifferenzieren. Da die Clustervariable dann jedoch z-standardisiert ist, müsste ich auch die passiven Variablen, welche in die Kreuztabellen einfließen, zuvor z-standardisieren, oder?

Dann wäre ich hoffentlich durch - wenn ich jetzt nicht absolut falsch liege. :)
Da passive Variablen keinen EInfluss auf die Clusterzuordnung haben, ist es hier für die eigentliche Analyse irrelevant, wie Sie diese Werte transformieren. Nicht-standardisierte Werte sind in aller Regel einfacher zu interpretieren als z-standardisierte Werte.
Kann oder vielmehr darf ich denn einfach so standardisierte Variablen mit nicht standardisierten Variablen vergleichen?

Ist es in Ordnung, das Proximitätsmaß nicht zu transformieren?
Sie könnten genauso fragen, ob Sie standardisierte Variablen "einfach so" miteinander vergleichen dürfen. Es kommt auf den Kontext an. Ich denke, für Ihren Kontext werden Sie es sich selbst beantworten können. Für meinen Geschmack stehen hier unter der Frage jedenfalls schon deutlich zu viele Comments :)
...