Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

0 votes

Hallo zusammen,

ich habe eine Multi-Item-Skala zur Messung eines latenten Konstrukts entwickelt. Diese umfasst insgesamt 8 Items mit 5 Antwortmöglichkeiten (1=stimme voll zu bis 5=stimme überhaupt nicht zu).

Die Reliabilität habe ich bereits geprüft und soweit ist alles in Ordnung.

Um nun statt 8 Werten nur einen Wert für das Konstrukt zu bekommen, würde ich schlicht den Mittelwert bilden. Wäre dieses Vorgehen korrekt? Oder müsste ich über eine Faktorenanalyse gehen?

Müsste der Mittelwert, um ihn mit anderen Konstrukten, welche anderen Skalen zu Grunde liegen z-standardisiert werden?

In der Literatur habe ich nun gelesen, dass die Skalierung eig. anders herum ist (1=stimme überhaupt nicht zu bis 5=stimme voll zu) - empfiehlt sich hier die Erstellung einer neuen Variablen mit neuen Wertzuordnungen für eine leichtere Auswertung?

Danke,
marketingwipsy

in Datenauswertung by s082238 (125 points)

1 Answer

+1 vote

Prinzipiell stehen Ihnen alle Möglichkeiten offen. In der Anleitung beantwortet das folgende Kapitel (nachdem ich die Frage zu Faktorwerten nun ergänzt habe) schon fast alle Fragen:

Skalenindex -> Häufige Fragen

In der Literatur habe ich nun gelesen, dass die Skalierung eig. anders herum ist (1=stimme überhaupt nicht zu bis 5=stimme voll zu) - empfiehlt sich hier die Erstellung einer neuen Variablen mit neuen Wertzuordnungen für eine leichtere Auswertung?

Ob Sie das direkt bei der Erhebung "umdrehen", in der Datenvorbereitung oder gar nicht, das bleibt Ihnen persönlich überlassen. Wenn Sie die Daten ohne "Umdrehen" verwenden, müssen Sie halt bei der Interpretation ein wenig mehr aufpassen, ob ein positives/negatives Vorzeichen nun im Sinne der Hypothese ist oder nicht.

by SoSci Survey (85.2k points)
Vielen Dank, diese Kapitel habe ich bislang noch gar nicht entdeckt, aber das Kapitel hat natürlich all meine Fragen direkt und vor allem nachvollziehbar beantwortet!

Ich habe einen gemischt skalierten Datensatz und möchte ggf. eine Faktoren- sowie Clusteranalyse durchführen. Um die gemischt skalierten Variablen vergleichbar zu machen, würde ich diese zunächst z-standardisieren. Gilt dies auch für nominale, binäre Variablen, welche mit 0 und 1 kodiert sind? Diese würde ich unter anderem als quasi-metrische Variablen für die Clusteranalyse verwenden wollen...

Vielen Dank!
Dichtome Daten und in Dummys umkodierte nominale Daten machen in Clusteranalysen regelmäßig Ärger. Da hilft auch deren z-Standardisierung nur wenig. Wenn man es nicht vermeiden kann, dann empfehle ich zumindest eine Clusterzentren- und keine hierarchische Clusteranalyse.
Darf ich fragen, inwiefern solche Variablen Ärger machen?
Da eine dichotome Variable keine Differenzierung kennt, sorgt sie v.a. in einer hierarchischen Clusteranalyse schnell zur "Aufspaltung" in zwei Gruppen. Und weil alle dichotomen Variablen im Großen und Ganzen die selbe Schrittweite (1) haben, ist es weitgehend vom Zufall abhängig, ob in einem Schritt nun nach Variable A oder B getrennt bzw. zusammengefasst wird.

Falls Sie die Variablen vorher z-standardisieren, entscheidet die ursprüngliche Varianz der dichotomen Variablen darüber, die große der Schritt zwischen "nein" und "ja" ist (das könnten dann z.B. die Werte -0,8 und +0,8 sein). Und dies wiederum entscheidet, welche Variablen als erste für die Clusterbildung "ignoriert" werden (welche Fälle also zusammenfallen) und welche später.

Ein weiteres Problem: Wenn sie z.B. 10 dichotome Variablen haben, dann lassen sich daraus nur 1024 mögliche Kombinationen ableiten. Wenn Sie im Sample 200 dieser Kombinationen finden und 30 Personen dieselbe Kombination haben, dann fallen diese sofort in einen Cluster. Und wenn sich die anderen Kombinationen jeweils in 1 oder 2 Variablen unterscheiden, sind diese alle gleichermaßen (un)ähnlich. Was dann hierarchisch geclustert wird, ist mitunter schwer interpretierbar. Metrische Variablen machen da deutlich mehr Freude, weil "Ähnlichkeit" hier viel fassbarer ist.
Super, vielen Dank - so ist es doch gleich viel nachvollziehbarer! Ich habe mir für die Clusterung entsprechend (quasi-) metrische Variablen ausgeguckt - diese sind ohnehin in meinem Fall von interessanterer Bedeutung für die Gruppenbildung.
...