Stellen Sie zunächst sicher, dass Excel oder welchses Programm Sie für die "manuelle Bereinigung" genutzt haben, die Daten als CSV-Datei speichert. Anschließend müssen Sie herausfinden, welcher Zeichensatz (bei Excel vermutlich UTF-17LE) und welcher Feld-Trenner (bei Excel vermutlich ein Tabulator) verwendet wurde.
Anschließend können Sie den Befehl in R, welcher die CSV-Datei einliest (read.csv
oder read.csv2
oder read.table
) entsprechend anpassen. Die Parameter dafür finden Sie in der R-Dokumentation zum Befehl.
So ist es aber eigentlich nicht gedacht. Das korrekt nachvollziehbare Vorgehen wäre, dass Sie den Datensatz komplett importieren und dann R-Befehle nutzen, um die ungültigen Fälle zu entfernen und ungültige Werte zu korrigieren. Dann kann man anhand Ihrer R-Scripte nachvollziehen, was bereinigt wurde.