0 votes
in SoSci Survey (dt.) by s170894 (150 points)
edited by SoSci Survey

Ich wollte nun zum ersten Mal die Daten mit R auswerten. Ich habe dafür das von Ihnen zur Verfügung gestellte Skript verwenden wollen und habe auch die entsprechende csv Datei importiert.
Allerdings erhalte ich konstant die Fehlermeldung:

Error in read.table(file = ds_file, encoding = "UTF-8", header = FALSE,  : 
  object 'ds_file' not found

Muss ich den ds_file erst definieren? Ich habe schon zahlreiche Änderungsmöglichkeiten versucht, allerdings gelingt mir nichts.
Beim Import der csv Datei sind alle Daten in einer Variable hinterlegt. Wenn ich die Date im Vorfeld so bearbeite, dass die Daten in Spalten angezeigt werden und abspeichere, importiert R die Datei trotzdem als eine Variable.

1 Answer

0 votes
by SoSci Survey (304k points)

Am einfachsten ist es, wenn Sie den API-Import verwenden, den Sie im R-Download-Fenster mittels Knopfdruck freischalten können. Das lädt Script und Daten direkt vom Server.

Wenn Sie das Script separat verwenden, sollte dort ein file.choose() stehen, welches wiederum ein Fenster zur Dateiauswahl öffnet und den Dateinamen in ds_file ablegt.

by s170894 (150 points)
Ich habe beides ausprobiert, leider hat beides nicht geklappt. Auch habe ich den Import der Daten sowohl mit csv als auch xlsx Format versucht. Es klappt leider nur der read.table Befehl nicht. Der Rest funktioniert. Auch bei dem read.table Befehl habe ich verschiedene Importmöglichkeiten versucht, leider immer nur mit Fehlermeldung.
Der API Link funktioniert aber leider gar nicht. Ich denke, ich werde dann doch alles selbst manuell formatieren müssen.
by SoSci Survey (304k points)
> Der API Link funktioniert aber leider gar nicht.

Das passiert denn, wenn Sie das nach RStudio kopieren und laufen lassen?

Was passiert speziell, wenn Sie die Ziele im Script ausführen:

ds_file = file.choose()

Öffnet sich da im Hintergrund (oder gar im Vordergrund) ein Dialog zur Auswahl der Datei?
by s170894 (150 points)
Ich habe noch einmal alles von vorne gestartet und das Skript zum Laufen bekommen. Allerdings gibt es nach wie vor viele Probleme, da z.B. die Variable "Gewicht" nach Durchlaufen des Skriptes als "unknown" definiert ist. Auch werden einige Missings nicht als NA markiert, sondern als string "[NA] nicht beantwortet", sodass mir diese bei z.B. Kreuztabellen immer als gesonderte Antwortmöglichkeit angezeigt werden.

Seltsam ist, dass ich an dem einen Tag den Datensatz mit Ihrem Skript formatiert habe und anschließend den Variablen Namen zuordnen konnte und am zweiten Tag habe ich das Skript durchlaufen lassen und den Code vom Vortag zum Labeln verwendet und plötzlich sagt er, dass die gesamten Variablen eine falsche class haben. Alles in allem habe ich leider nur Probleme mit dem Skript und werde daher nun vermutlich selbst formatieren.
by SoSci Survey (304k points)
> Allerdings gibt es nach wie vor viele Probleme, da z.B. die Variable "Gewicht" nach Durchlaufen des Skriptes als "unknown" definiert ist

Was genau meinen Sie mit "unknown"? Liegt die Variable im data.frame nicht vor?

>  Auch werden einige Missings nicht als NA markiert, sondern als string "[NA] nicht beantwortet"

Dies ist bei Auswahlfragen beabsichtigt, weil dort mehrere Ausweichoptionen möglich sind. Sie können das bei den Download-Optionen anpassen.

> und plötzlich sagt er, dass die gesamten Variablen eine falsche class haben

Es ist wichtig, dass Sie Daten und Skript zeitgleich herunterladen. Standardmäßig blendet SoSci Survey alle Variablen aus, für die keine Werte vorliegen (das können Sie umstellen) - entsprechend variiert die Anzahl der Variablen.
by s170894 (150 points)
Vielen Dank für die schnelle Rückmeldung.
Mit "unknown" meine ich, dass die Variable so klassifiziert ist. Bei den anderen steht "numeric" o.ä. aber bei einigen steht nur "unknown"

Ich habe es gerade auch noch einmal getestet. Habe den API Link aktiviert, direkt die Daten heruntergeladen, habe den Link ausgeführt und bei dem Datensatz existieren trotzdem diese Probleme.

Zum Thema mit dem [NA] nicht beantwortet: Dieses wird nur sehr selten bei einigen angezeigt. Ansonsten funktioniert es mit den Missings. Daher wüsste ich nicht, was ich umstellen muss, damit es nur bei diesen ganz vereinzelten Fälle nicht so auftaucht.
by SoSci Survey (304k points)
> Bei den anderen steht "numeric" o.ä. aber bei einigen steht nur "unknown"

Können Sie dieses "unknown" einem bestimmten Fragetyp zuordnen?

Mit welcher Version von R arbeiten Sie?

> Daher wüsste ich nicht, was ich umstellen muss, damit es nur bei diesen ganz vereinzelten Fälle nicht so auftaucht.

Das können Sie im Karteireiter "GNU R" im Dropdown "Residualoptionen" einstellen.
by s170894 (150 points)
> Können Sie dieses "unknown" einem bestimmten Fragetyp zuordnen?
Ich habe gerade noch einmal alles heruntergeladen und als Einstellung: "numerische Codes beibehalten" + "immer als fehlende Daten behalten" ausgewählt. Als unknown werden Variablen verschiedener Fragetypen behandelt. Sowohl offene Texteingabe als auch Auswahl und Mehrfachauswahl.

>Mit welcher Version von R arbeiten Sie?
Version 4.1.0
by SoSci Survey (304k points)
Sehr seltsam... Ich kann Ihnen gerne anbieten, dass ich mir das Problem einmal direkt ansehe. Allerdings wäre es dafür erforderlich, dass ich einen Administrator-Zugang zu Ihrem Befragungsprojekt erstellen und die Daten herunterlade. Wenn Sie das möchten, teilen Sie mir bitte den Namen des Befragungsprojekts mit, um welches es geht. Und am besten auch die Namen einiger betroffener Variablen.
by s170894 (150 points)
Sehr gerne. Ich habe es gerade auch extra noch einmal mit einer unserer Statistikerinnen zusammen angeguckt und sie hatte die gleichen Probleme wie ich. Ich habe auch alle Einstellungen versucht (Numerische Codes für Skalen/Numerische Codes beibehalten; Immer als fehlende Daten behandeln etc.).
Das Projekt heißt: Bedarfsanalyse Psychotherapeutische Sprechstunde am Arbeitsplatz

Ich habe übrigens nun folgenden Importweg gewählt: Export der Excel Datei. Löschen der ersten Zeile und dann Import. Dann muss ich nur eben alles selbst formatieren.
by SoSci Survey (304k points)
> Ich habe übrigens nun folgenden Importweg gewählt: Export der Excel Datei.

Das erachte ich für keine gute Idee. Vielleicht finde ich morgen ja noch eine sinnvolle Lösung. Denn normalerweise funktioniert der R-Import problemlos. Es sollte sich ja herausfinden lassen, wo es bei Ihrem Projekt klemmt :)
by SoSci Survey (304k points)
Danke für die Freigabe. Mit RStudio Version 1.4.1103, R Version 4.0.2 und dem "API-Import" konnte ich das Problem nicht replizieren, dort funktionierte alles reibungslos. Ich habe Ihnen eine E-Mail mit Details gesendet.
by s170894 (150 points)
Ich bin gerade extra von R Version 4.1.0 auf 4.1.1 umgestiegen. RStudio habe ich die aktuellste Version. Leider entsteht bei mir weiterhin der Datensatz mit den unknown Variablen. Ich denke, das Problem lässt sich leider nicht replizieren. Sie haben mir aber ja angeboten, mir den Datensatz zuzusenden. Darüber wäre ich sehr dankbar.

Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

...