0 votes
ago in Datenauswertung by s310676 (110 points)

Hallo Zusammen, ich bin gerade dabei meine Datenauszuwerten bzw. die Daten zu bereinigen dabei stehe ich nun vor folgendem Problem:

Ich habe in meinem Fragebogen Fragen gestellt die mit Ja stimme ich / Stimme zu / Neutal / Nein stimme nicht zu zu beantworten waren.

Nun wird es bei der Auswertung so dargestellt das für jede Auswahlmöglichkeit entweder True / False steht je nach Auswahl: KU07_01_1" "KU07_01_2" "KU07_01_3" "KU07_01_4" "KU07_01_5 Sodass ich für eine Frage eigentlich 5 Datensätze habe.

Bei Excel würde ich das einfach manuell anpassen. :)

Wie bekommen ich es aber direkt bei Rstudio mit meiner CSV Datei hin bzw ist es überhaupt möglich R eine Funktion vorzugeben?
Ziel soll es sein eine Variable zu haben voraus direkt zu erkennen ist was gewählt wurde. z.B. Interviewer 3 hat bei der Frage Teilweise genommen Interviewer 8 hat Stimme zu und so weiter

Hoffe verständlich :)

Freue mich auf eine Erklärung am besten direkt mit der Funktion stelle mich mit Rstudio noch etwas dämlich an .

Danke

1 Answer

0 votes
ago by SoSci Survey (341k points)

Höchstwahrscheinlich haben Sie als Fragetyp nicht die "Skala" verwendet (die wäre hier richtig"), sondern eine Mehrfachauswahlmatrix - dort können Befragte für jedes Item mehrere Antworten auswählen. Also z.B. auch "Stimmt zu" und "stimme nicht zu" gleichzeitig.

Sie sollten im ersten Schritt also mal testen, ob es Fälle gibt, wo mehrere Antworten ausgewählt wurden - Sie haben für eine zusätzliche Variable, welche Ihnen die Anzahl der Kreuzchen verrät. Wenn das nicht der Fall ist, können Sie umkodieren. In Base R könnte das so aussehen:

df$KU07_value = NA
df[which(df$KU07_01_1 == 2), "KU07_value"] = 1
df[which(df$KU07_01_2 == 2), "KU07_value"] = 2
df[which(df$KU07_01_3 == 2), "KU07_value"] = 3
df[which(df$KU07_01_4 == 2), "KU07_value"] = 4
df[which(df$KU07_01_5 == 2), "KU07_value"] = 5

Nachdem Sie vermutlich mehrere solche Variablen haben, wäre es sinnvoll, eine Funktion dafür zu schreiben. Und mit einer Schleife sieht es etwas eleganter aus.

ago by s310676 (110 points)
Ja das ist korrekt das habe ich leider nicht richtig eingestellt, zum Glück nur bei zwei Fragen.

Es sind keine Dopplungen dabei.

Ich habe die vorgeschlagene Funktion ausprobiert aber etwas scheint nicht zu stimmen... Ich habe nur NA überall bei meiner neunen Variable stehen. Scheint etwas mit der Funktion nicht zu stimmen. Können sie vielleicht sehen woran es liegt?:

Data$KU07_Value=NA
> Data[which(Data$KU07_01_1==2),"KU07_Value"]=1
> Data[which(Data$KU07_01_2==2),"KU07_Value"]=2
> Data[which(Data$KU07_01_3==2),"KU07_Value"]=3
> Data[which(Data$KU07_01_4==2),"KU07_Value"]=4
> Data[which(Data$KU07_01_5==2),"KU07_Value"]=5

Danke
ago by SoSci Survey (341k points)
Ach ja, stimmt, die Daten in R sind nicht 1/2-kodiert, sondern FALSE/TRUE. Also...

Data$KU07_Value=NA
Data[which(Data$KU07_01_1),"KU07_Value"]=1
Data[which(Data$KU07_01_2),"KU07_Value"]=2
Data[which(Data$KU07_01_3),"KU07_Value"]=3
Data[which(Data$KU07_01_4),"KU07_Value"]=4
Data[which(Data$KU07_01_5),"KU07_Value"]=5

Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

...