0 votes
in SoSci Survey (dt.) by s084918 (335 points)

Liebes Team,

beim Herunterladen meines Datensatzes über GNU R, der mehrere Variablen enthält, wird mir beim Öffnen der Datei angezegt, dass die Datensätze nur 1 Variable enthalten.

Wie kann ich diesen Fehler beheben?

Vielen Dank für eure Hilfe

1 Answer

0 votes
by SoSci Survey (312k points)
selected by s084918
 
Best answer

Bitte kontrollieren Sie zunächst, ob das Kapitel Problemlösungen beim Datenabruf den Sachverhalt vielleicht aufklärt.

Wenn nicht, sehen Sie bitte einmal im Import-Script nach, wie viele Variablen das Datenframe enthält. Wie heißt denn die 1 Variable, die angezeigt wird?

by s084918 (335 points)
Das Kapitel beschreibt leider nicht meinen Sachverhalt.

Wenn ich die CSV-Datei direkt nach dem Download öffne, werden alle Werte pro Versuchsperson in einer Zeile hintereinander dargestellt, d.h. es wird alles als insgesamt nur 1 Varriable angezeigt

Wenn ich die Datei nach Download über R Studio öffne und dann den Befehl data<-read.csv2("rdata_DigitaleTransformation2017_2018-03-04_11-52.csv")
eingebe, wird im Environment angezeigt "356 obs. of 1 variable"
by s084918 (335 points)
Die Datenstruktur als solche wird m.E. schon erkannt. Nur werden die Inhalt der Variablen nicht geladen:

# Dieses Script liest eine CSV-Datendatei in GNU R ein.
# Beim Einlesen werden für alle Variablen Beschriftungen (comment) angelegt.
# Die Beschriftungen für Werte wird ebenfalls als Attribute (attr) abgelegt.

data_file = file.choose()
# setwd("./")
# data_file = "rdata_DigitaleTransformation2017_2018-03-04_11-52.csv"

data = read.table(
  file=data_file, encoding="UTF-8",
  header = FALSE, sep = "\t", quote = "\"",
  dec = ".", row.names = "CASE",
  col.names = c(
    "CASE","SERIAL","REF","QUESTNNR","MODE","STARTED","SO01","SO02_01","SO03",
    "SO04","SO05","SO06","SO07","IT01_01","IT01_02","IT01_03","IT01_04","IT01_07",
    "IT01_08","IT01_09","IT01_10","IT01_11","IT02_01","IT02_15","IT02_03","IT02_14",
    "IT02_13","IT02_07","IT02_04","IT02_11","IT02_12","IT02_08","IT02_09","IT02_16",
    "IT02_10","IT02_17","ZF01","ZF02","ZF04_01","ZF04_02","ZF05","ZF05_01",
    "ZF05_02","ZF05_03","ZF05_04","ZF06","ZF06_01","ZF06_02","ZF06_03","ZF06_04",
    "ZF06_05","ZF06_06","OF01_01","OF02_01","OF02_02","OF02_03","OF02_04","OF02_05",
    "OF02_06","OF02_07","AU01_01","AU01_03","AU01_05","AU01_09","AU01_10","AU01_11",
    "AU01_08","AU02_01","AU02_02","AU02_03","AU02_04","AU02_05","SW01_01","SW01_02",
    "SW01_03","SW01_04","SW01_05","SW01_06","SW01_07","SW01_08","SW02_01","SW02_02",
    "SW02_03","SW02_04","SW02_05","SW02_06","AC01_01","AC01_02","AC01_03","AC01_04",
    "AC01_05","AZ01_01","AZ01_02","AZ01_03","FINISHED","Q_VIEWER","LASTPAGE",
    "MAXPAGE"
  ),
  as.is = TRUE,
  colClasses = c(
    CASE="numeric", SERIAL="character", REF="character", QUESTNNR="character",
    MODE="character", STARTED="POSIXct", SO01="numeric", SO02_01="numeric",
    SO03="numeric", SO04="numeric", SO05="numeric", SO06="numeric",
    SO07="numeric", IT01_01="numeric", IT01_02="numeric", IT01_03="numeric",
    IT01_04="numeric", IT01_07="numeric", IT01_08="numeric", IT01_09="numeric",
    IT01_10="numeric", IT01_11="numeric", IT02_01="numeric", IT02_15="numeric",
    IT02_03="numeric", IT02_14="numeric", IT02_13="numeric", IT02_07="numeric",
    IT02_04="numeric", IT02_11="numeric", IT02_12="numeric", IT02_08="numeric",
    IT02_09="numeric", IT02_16="numeric", IT02_10="numeric", IT02_17="numeric",
    ZF01="numeric", ZF02="numeric", ZF04_01="numeric", ZF04_02="numeric",
    ZF05="numeric", ZF05_01="logical", ZF05_02="logical", ZF05_03="logical",
    ZF05_04="logical", ZF06="numeric", ZF06_01="logical", ZF06_02="logical",
    ZF06_03="logical", ZF06_04="logical", ZF06_05="logical", ZF06_06="logical",
    OF01_01="numeric", OF02_01="numeric", OF02_02="numeric", OF02_03="numeric",
    OF02_04="numeric", OF02_05="numeric", OF02_06="numeric", OF02_07="numeric",
    AU01_01="numeric", AU01_03="numeric", AU01_05="numeric", AU01_09="numeric",
    AU01_10="numeric", AU01_11="numeric", AU01_08="numeric", AU02_01="numeric",
    AU02_02="numeric", AU02_03="numeric", AU02_04="numeric", AU02_05="numeric",
    SW01_01="numeric", SW01_02="numeric", SW01_03="numeric", SW01_04="numeric",
    SW01_05="numeric", SW01_06="numeric", SW01_07="numeric", SW01_08="numeric",
    SW02_01="numeric", SW02_02="numeric", SW02_03="numeric", SW02_04="numeric",
    SW02_05="numeric", SW02_06="numeric", AC01_01="numeric", AC01_02="numeric",
    AC01_03="numeric", AC01_04="numeric", AC01_05="numeric", AZ01_01="numeric",
    AZ01_02="numeric", AZ01_03="numeric", FINISHED="logical",
    Q_VIEWER="logical", LASTPAGE="numeric", MAXPAGE="numeric"
  ),
  skip = 1,
  check.names = TRUE, fill = TRUE,
  strip.white = FALSE, blank.lines.skip = TRUE,
  comment.char = "",
  na.strings = ""
)

rm(data_file)
by s084918 (335 points)
# Variable und Value Labels
data$SO01 = factor(data$SO01, levels=c("1","2","-9"), labels=c("männlich","weiblich","[NA] nicht beantwortet"), ordered=FALSE)
data$SO03 = factor(data$SO03, levels=c("1","2","3","4","5","6","-9"), labels=c("Angestellter","Beamter/Richter/Soldat/Polizist","selbstständig","\'Vollzeit\'-Student","Auszubildender","nicht berufstätig/arbeitssuchend","[NA] nicht beantwortet"), ordered=FALSE)
data$SO04 = factor(data$SO04, levels=c("1","2","3","4","5","-9"), labels=c("Bachelor","Meister","Master, Diplom, Magister, Staatsexamen","Doktor","abgeschlossene Berufsausbildung","[NA] nicht beantwortet"), ordered=FALSE)
data$SO05 = factor(data$SO05, levels=c("1","2","3","4","5","6","7","8","9","10","11","12","13","14","15","16","17","-9"), labels=c("Land- und Forstwirtschaft, Fischerei","Verarbeitendes Gewerbe","Energieversorgung","Wasserversorgung; Abwasser- und Abfallentsorgung","Baugewerbe","Handel; Instandhaltung und Reparatur von Kfz","Verkehr und Lagerei","Gastgewerbe","Information und Kommunikation","Erbringung von Finanz- und Versicherungsdienstleistungen","Grundstücks- und Wohnungswesen","Erbringung von freiberuflichen, wissenschaftlichen und technischen Dienstleistungen","Öffentliche Verwaltung, Verteidigung; Sozialversicherung","Erziehung und Unterricht","Gesundheits- und Sozialwesen","Kunst, Unterhaltung und Erholung","Sonstiges","[NA] nicht beantwortet"), ordered=FALSE)
data$SO06 = factor(data$SO06, levels=c("1","2","3","4","5","6","-9"), labels=c("< 10","10 - 49","50 - 99","100 - 249","250 - 500","> 500","[NA] nicht beantwortet"), ordered=FALSE)
data$SO07 = factor(data$SO07, levels=c("1","2","3","4","5","6","7","8","9","10","11","12","13","14","-9"), labels=c("Forschung/Entwicklung","Einkauf/Beschaffung","Produktion/Leistungserstellung","Logistik","Marketing/Vertrieb","Finanzierung/Controlling","Unternehmensleitung/Strategie","Consulting","Personalwesen","Verwaltung","Presse/Öffentlichkeitsarbeit","Sonstiges","Compliance/Recht","Softwareentwicklung/IT","[NA] nicht beantwortet"), ordered=FALSE)
data$ZF01 = factor(data$ZF01, levels=c("1","2","-9"), labels=c("Vollzeit","Teilzeit","[NA] nicht beantwortet"), ordered=FALSE)
data$ZF02 = factor(data$ZF02, levels=c("1","2","3","4","-9"), labels=c("feste Arbeitszeiten","wechselnde Arbeitszeiten/Schichtarbeit","flexible Arbeitszeiten mit Kernzeit","flexibe Arbeitszeiten ohne Kernzeit","[NA] nicht beantwortet"), ordered=FALSE)
attr(data$IT01_01,"1") = "niemals [1]"
attr(data$IT01_01,"2") = "[2]"
attr(data$IT01_01,"3") = "[3]"
attr(data$IT01_01,"4") = "[4]"
attr(data$IT01_01,"5") = "mehrmals täglich [5]"
attr(data$IT01_01,"-1") = "keine Antwort / weiß nicht"
attr(data$IT01_02,"1") = "niemals [1]"
attr(data$IT01_02,"2") = "[2]"
attr(data$IT01_02,"3") = "[3]"
attr(data$IT01_02,"4") = "[4]"
attr(data$IT01_02,"5") = "mehrmals täglich [5]"
attr(data$IT01_02,"-1") = "keine Antwort / weiß nicht"
attr(data$IT01_03,"1") = "niemals [1]"
attr(data$IT01_03,"2") = "[2]"
attr(data$IT01_03,"3") = "[3]"
attr(data$IT01_03,"4") = "[4]"
attr(data$IT01_03,"5") = "mehrmals täglich [5]"
attr(data$IT01_03,"-1") = "keine Antwort / weiß nicht"
attr(data$IT01_04,"1") = "niemals [1]"
attr(data$IT01_04,"2") = "[2]"
attr(data$IT01_04,"3") = "[3]"
attr(data$IT01_04,"4") = "[4]"
attr(data$IT01_04,"5") = "mehrmals täglich [5]"
attr(data$IT01_04,"-1") = "keine Antwort / weiß nicht"
attr(data$IT01_07,"1") = "niemals [1]"
attr(data$IT01_07,"2") = "[2]"
attr(data$IT01_07,"3") = "[3]"
attr(data$IT01_07,"4") = "[4]"
attr(data$IT01_07,"5") = "mehrmals täglich [5]"
attr(data$IT01_07,"-1") = "keine Antwort / weiß nicht"
attr(data$IT01_08,"1") = "niemals [1]"
attr(data$IT01_08,"2") = "[2]"
attr(data$IT01_08,"3") = "[3]"
attr(data$IT01_08,"4") = "[4]"
attr(data$IT01_08,"5") = "mehrmals täglich [5]"
attr(data$IT01_08,"-1") = "keine Antwort / weiß nicht"
attr(data$IT01_09,"1") = "niemals [1]"
attr(data$IT01_09,"2") = "[2]"
attr(data$IT01_09,"3") = "[3]"
attr(data$IT01_09,"4") = "[4]"
attr(data$IT01_09,"5") = "mehrmals täglich [5]"
attr(data$IT01_09,"-1") = "keine Antwort / weiß nicht"
attr(data$IT01_10,"1") = "niemals [1]"
attr(data$IT01_10,"2") = "[2]"
attr(data$IT01_10,"3") = "[3]"
attr(data$IT01_10,"4") = "[4]"
attr(data$IT01_10,"5") = "mehrmals täglich [5]"
attr(data$IT01_10,"-1") = "keine Antwort / weiß nicht"
attr(data$IT01_11,"1") = "niemals [1]"
attr(data$IT01_11,"2") = "[2]"
attr(data$IT01_11,"3") = "[3]"
attr(data$IT01_11,"4") = "[4]"
attr(data$IT01_11,"5") = "mehrmals täglich [5]"
attr(data$IT01_11,"-1") = "keine Antwort / weiß nicht"
attr(data$IT02_01,"1") = "niemals [1]"
attr(data$IT02_01,"2") = "[2]"
attr(data$IT02_01,"3") = "[3]"
attr(data$IT02_01,"4") = "[4]"
attr(data$IT02_01,"5") = "mehrmals täglich [5]"
attr(data$IT02_01,"-1") = "keine Antwort / weiß nicht"
attr(data$IT02_15,"1") = "niemals [1]"
attr(data$IT02_15,"2") = "[2]"
attr(data$IT02_15,"3") = "[3]"
attr(data$IT02_15,"4") = "[4]"
attr(data$IT02_15,"5") = "mehrmals täglich [5]"
attr(data$IT02_15,"-1") = "keine Antwort / weiß nicht"
attr(data$IT02_03,"1") = "niemals [1]"
attr(data$IT02_03,"2") = "[2]"
attr(data$IT02_03,"3") = "[3]"
attr(data$IT02_03,"4") = "[4]"
attr(data$IT02_03,"5") = "mehrmals täglich [5]"
attr(data$IT02_03,"-1") = "keine Antwort / weiß nicht"
attr(data$IT02_14,"1") = "niemals [1]"
attr(data$IT02_14,"2") = "[2]"
attr(data$IT02_14,"3") = "[3]"
attr(data$IT02_14,"4") = "[4]"
attr(data$IT02_14,"5") = "mehrmals täglich [5]"
attr(data$IT02_14,"-1") = "keine Antwort / weiß nicht"
attr(data$IT02_13,"1") = "niemals [1]"
attr(data$IT02_13,"2") = "[2]"
attr(data$IT02_13,"3") = "[3]"
attr(data$IT02_13,"4") = "[4]"

... etc.
by s084918 (335 points)
P.S.: Wenn ich die Datei bspw. ausschließlich über den Reiter für das Dateiformat CSV in Excel öffne, werden alle Variablen angezeigt
by SoSci Survey (312k points)
Sie schrieben, dass Sie dies hier verwenden:

data<-read.csv2("rdata_DigitaleTransformation2017_2018-03-04_11-52.csv")

Ich empfehle (dringend), dass Sie das Import-Script verwenden, das SoSci Survey liefert (und das Sie hier gepostet haben). Dann haben Sie auch die richtigen Labels etc.

Alternativ müssten Sie im read.csv2() die Trennzeichen und die Variablen manuell definieren. Aber wie gesagt: Die Syntax von Sosci Survey erledigt das eigentlich alles automatisch.
by s084918 (335 points)
Leider kenne ich nur die Option über das Einlesen der CSV-Datei.
Wie lese ich die Datei über das Import-Script ein?
by s084918 (335 points)
Für die Arbeit mit dem Datensatz benötige ich die eingelesene Datei doch im Environment. Dort ist jedoch kein Datensatz aufgeführt.

Wenn ich im Import-Script bspw. über str(data) oder head(data) einen Einblick in die Daten gewinnen möchte, werden leider keine brauchbaren Infos angezeigt, sondern nur:
function (..., list = character(), package = NULL, lib.loc = NULL, verbose = getOption("verbose"), envir = .GlobalEnv)
by SoSci Survey (312k points)
Die Verwendung des Einlese-Scripts ist hier in der Anleitung beschrieben:
https://www.soscisurvey.de/help/doku.php/de:results:import-gnu-r

Die Standard-Benennung "data" ist ein wenig unglücklich, weil - wenn der Import nicht funktioniert hat - Sie die Beschreibung der gleichnamigen Funktion data() sehen. In neueren Befragungsprojekten ist deshalb "ds" statt "data" voreingestellt. Sie können das vor dem Download des Import-Scripts aber einfach ändern.
by s084918 (335 points)
Vielen Dank. Nun hat es funktioniert!

Die Standard-Benennung "data" habe ich beibehalten. Ich hoffe, das ist nicht weiter hinderlich für meine Auswertung.

Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

...