Willkommen im Online-Support von SoSci Survey.

Hier bekommen Sie schnelle und fundierte Antworten von anderen Projektleitern und direkt von SoSci Survey.

→ Eine Frage stellen


Welcome to the SoSci Survey online support.

Simply ask a question to quickly get answers from other professionals, and directly from SoSci Survey.

→ Ask a Question

0 votes

Wenn ich meine Daten als csv downloade, ist bei mehreren Fragen vom Typ "Interne Variable", die im Fragebogen durch PHP-code befüllt wurden, bei Werten <1 ein einfaches Anführungszeichen (') vorangestellt, nicht aber bei Werten >1. Zudem wird das Anführungszeichen auf SoSci ("Daten ansehen") nicht angezeigt und ist auch beim Download als xlsx nicht enthalten. Geht da beim Download oder Erstellen der csv etwas schief? Ich habe schon alle Optionen durch probiert...

in SoSci Survey (dt.) by s143266 (415 points)

1 Answer

+1 vote
 
Best answer

Bei bestimmten Zeichenfolgen führt SoSci Survey in der CSV-Datei ein Leerzeichen oder eben ein einfaches Anführungszeichen ein. Und zwar immer dann, wenn Excel beim Öffnen der Datei sonst etwas falsch interpretieren würde.

Interne Variablen gelten per se als Strings (Texte). Und wenn dort z.B. eine Telefonnummer 017012345 steht, dann würde Excel die führenden Null abschneiden. Deshalb stellt SoSci Survey das Anführungszeichen voran, welches Excel signalisiert, dass es sich um einen Text handelt.

Beim Excel-Export kann diese Information direkt in der Datei abgelegt werden, deshalb ist dort i.d.R. kein Sonderzeichen erforderlich.

by SoSci Survey (222k points)
selected by s143266
Es handelt sich bei den Daten um floats, welche durch Excel richtig interpretiert würden auch wenn <1. In der Vergangenheit (min. bis 13.05.2021) hatte ich die selben Variablen, die beim csv-Export nicht verändert wurden, obwohl sie ebenfalls als Text gespeichert waren.

Kann ich (a) es irgendwie ausschalten, dass ein Sonderzeichen eingesetzt wird oder (b) SoSci irgendwie mitteilen, dass es sich bei bestimmten internen Variablen nicht um strings handelt?
Wenn Sie ohnehin mit Excel arbeiten ... möchten Sie vielleicht einfach den Excel-Export verwenden?

Es ist generell ein Umschalter geplant, dass man bei internen Variablen festlegen kann, welchen Datentyp sie enthalten. Vielleicht können wir das noch kurzfristig ergänzen.

Ansonsten ist es aber auch nicht schlimm, es gibt einen einfachen Workaround: Spalte per Copy&Paste in einen Texteditor kopieren (z.B. Notepad++), dort das Anführungszeichen per Such&Ersetzen entfernen und dann die Spalte zurückkopieren.
Ich arbeite eben nicht mit Excel, sondern habe es damit nur ausprobiert um den "Fehler" zu lokalisieren. Ich kann zwar damit leben, dass es aktuell nicht funktioniert und entsprechende Anpassungen nachträglich von Hand vorgenommen werden müssen, wundere mich aber trotzdem warum es bei früheren Studien/Downloads anders gelöst werden konnte.
Mit welcher Verisin geenau welche Optimierungen ergänzt wurden, müsste ich recherchieren. Ich kann Ihnen nicht genau sagen, wann dieser Workaround für interne Variablen ergänzt wurde.

Womit arbeiten Sie denn?
Python und R.
Na, für R gibt es aber einen super-komfortablen Export (API-Download) über das "GNU R" Tab - und dort bekommen Sie (wenn Sie möchten) auch eine CSV-Datei, die keine Optimierungen für Excel beinhaltet.
Danke, das habe ich übersehen. Löst zwar nicht das Problem mit Python, aber damit kann ich arbeiten.
Was ist mit dem CSV, das man im R-Karteireiter abrufen kann ... ist Python damit ein wenig glücklicher?
...