Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

0 votes

Wenn ich meine lineare Regression berechnen will, kommt folgende Fehlermeldung:

Error in contrasts<-(*tmp*, value = contr.funs[1 + isOF[nn]]) :
Kontraste können nur auf Faktoren mit 2 oder mehr Stufen angewendet werden

Ich habe jedoch alle Variablen in Faktorvariablen (mit 2 Ausprägungen) transformiert und meine AV ist metrisch.

Wo liegt der Fehler?

closed with the note: Es liegen keine neuen Informationen zur Frage vor.
in Datenauswertung by s084918 (335 points)
closed by SoSci Survey
Die Levels der Faktorvariablen sehen wie folgt aus:

> levels(erfassungall$DigitalErfassung)
[1] "digitaldoc"    "notdigitaldoc"
> levels(erfassungall$Zeitmodell)
[1] "fixtime"  "flextime"
> levels(erfassungall$Vertrauensarbeitszeit)
[1] "nottrust" "trust"   
> levels(erfassungall$Einzelzeiten2)
[1] "nottrust" "trust"
Die Struktur schaut insgesamt so aus:

> str(erfassungall)
'data.frame':    356 obs. of  12 variables:
 $ data.DigitalEinzel   : Factor w/ 2 levels "digitaldoc","notdigitaldoc": 1 1 1 1 NA NA 1 NA NA NA ...
 $ data.DigitalGesamt   : Factor w/ 2 levels "digitaldoc","notdigitaldoc": 1 1 NA 1 2 NA 2 NA NA 1 ...
 $ NEW                  : chr  "digitaldoc" "digitaldoc" "digitaldoc" "digitaldoc" ...
 $ Autonomie            : num  4.42 3.08 2.67 3.08 4.5 ...
 $ NEW2                 : chr  "other" "other" "other" "other" ...
 $ NEW3                 : chr  "digitaldoc" "digitaldoc" "digitaldoc" "digitaldoc" ...
 $ NEW4                 : chr  "other" "other" "other" "other" ...
 $ FINAL                : chr  "digitaldoc" "digitaldoc" "digitaldoc" "digitaldoc" ...
 $ DigitalErfassung     : Factor w/ 2 levels "digitaldoc","notdigitaldoc": 1 1 1 1 2 NA 1 NA NA 1 ...
 $ Zeitmodell           : Factor w/ 2 levels "fixtime","flextime": 2 2 2 1 2 2 2 2 2 1 ...
 $ Vertrauensarbeitszeit: Factor w/ 2 levels "nottrust","trust": 1 1 1 NA 1 2 1 2 2 1 ...
 $ Einzelzeiten2        : Factor w/ 2 levels "nottrust","trust": NA NA 2 NA NA 1 NA 1 1 NA ...

Mich interessieren die UV: DigitalErfassung, Zeitmodell, Vertrausarbeitszeit, Einzelzeiten2 und die AV: Autonomie
Liegt es möglicherweise an den "NAs"?
Muss ich die Zeilen mit NAs dann vorher entfernen?

Würde ich den Datensatz um alle Fälle mit "NAs" in einer der vier UVs bereinigen, würde meine Anzahl an Fällen extrem schrumpfen und eine Auswahl an Fällen treffen, die eine best. Gruppe von Probanden ausschließt.
R entfernt Zeilen mit min. einem NA aus der Regression. Prüfen Sie 2 Dinge: (1) Wie viele Zeilen haben Sie dann übrig und (2) haben alle Variablen in diesen verbleibenden Fällen noch min. 2 Ausprägungen? Oder wird eine konstant?

Mit Subsetting und complete.cases() können Sie ein data.frame stellen, welches nur die gültigen Zeilen enthält. Dort können Sie dann Häufigkeiten für alle Variablen ausgeben.
...