Nachdem die Sensibilität unserer Nutzer:innen für dieses Thema inzwischen ein wenig ausgeprägter ist, erlaube ich mir eine längere Antwort.
Hintergrund
In der sozialwissenschaftlichen Forschung ist es die Ausnahme, dass man Studien mit mehr als 2000 Befragten durchführt. Auf Basis einer Power-Analyse kommt man in aller Regel zu dem Schluss, dass eine kleinere Fallzahl für die Beantwortung einer Fragestellung vollkommen ausreicht. Und man möchte die Befragten ja auch nicht mehr strapazieren als notwendig.
Natürlich gibt es Situationen, in denen eine größere Fallzahl erwünscht ist (z.B. weil viele kleine Teilgruppen untersucht werden sollen) oder wo sie sich nicht vermeiden lässt (z.B. weil die Einladung schwer steuerbar ist oder weil ein toller Fragebogen viral geht).
Wir hatten auf www.soscisurvey.de leider einmal den Fall, dass ein Student seinen Fragebogen auf der Startseite eines sehr populären Herstellers als PopUp platziert hatte (nein, keine Einladung, direkt den Fragebogen!), sodass binnen weniger Stunden mehr als 1 Mio. Datensätze zusammenkamen. Die damalige Version von SoSci Survey war darauf nicht ausgerichtet, und entsprechend ging der Dienst in die Knie. Rund tausend andere Befragungsprojekte konnten an diesem Tag keine Daten erheben, weil jemand nicht mitgedacht hatte. Es hat damals sehr viel Zeit und Arbeit gekostet, das wieder in Ordnung zu bringen. So etwas sollte künftig nicht mehr passieren. Heute geht SoSci Survey mit bloßen Aufrufen von Fragebögen wesentlich effizienter um, und wir haben das Limit von 5000 Fällen für die kostenlose Nutzung eingeführt.
Wir investieren gerne Zeit und Geld in die kostenlose Bereitstellung von SoSci Survey. Aber das soll der gesamten wissenschaftlichen Gemeinschaft zu Gute kommen, der Aufwand soll sich nicht auf einzelne Befragungsstudien konzentrieren.
Umsetzung
Die Grenze von 5000 Fällen ist erstmal ein "weiches" Limit. Wenn der 5001ste Fall erhoben wird, ändert sich technisch gar nichts, und auch bis 7000 Fälle ignorieren wir eine Überschreitung in aller Regel geflissentlich.
Und dann gibt es Fälle, in denen die Zählung von Fällen im Datensatz die Realität nicht valide abbildet. Das kann zum Beispiel eine Multi-Level-Erhebung oder eine Tagebuchstudie sein, bei welcher pro Teilnehmer:in 5 kleine statt einem großen Fall in die Datenbank geschrieben werden. Solche Fälle lässen sich im Vorfeld problemlos klären.
Aber wenn ein Befragungsprojekt nun doch eine größere Menge von Daten sammelt, dann bedeutet das für uns und für unsere Infrastruktur mehr Aufwand, und damit zusätzliche Kosten. Und diese Zusatzkosten stellen wir dann ggf. in Rechnung. In aller Regel bewegt sich das im Bereich von 0,01 € pro Fall, also 50 € zzgl. USt. für weitere 5.000 Fälle. Wenn eine einzelne Erhebung besonders viel Arbeit macht (z.B. weil gleich auf der ersten Seite 30 Bilder eingebunden sind, und dadurch Datentransfer-Limits überzogen werden), kann es auch mal mehr sein.
Wenn es in der kostenlosen Nutzung mehr als 10.000 Fälle werden, und das war vorab nicht abgesprochen, nehmen wir Befragungsprojekte auch mal ohne Vorwarnung offline.
Berechnung
Was zählt in die 5.000 Fälle hinein?
SoSci Survey zählt schlicht und ergreifend die Fälle, die Sie unter Erhobene Daten -> Daten ansehen sehen. Wenn jemand den Fragebogen nur aufruft, dann aber nicht auf "Weiter" klickt, sondern das Fenster wieder schließt, wird dafür zwar eine Fallnummer (CASE) vergeben, aber der Fall taucht nicht im Datensatz auf (außer Sie konfigurieren in den Projekt-Einstellungen im Karteireiter "Datenschutz" etwas anderes oder schreiben beim Aufruf schon Daten in den Datensatz). Der großte Anteil der Abbrecher wird also i.d.R. nicht gezählt.
Sobald in einem Fall Daten erhoben wurden, wird er gezählt. Diese Fallzahl beinhaltet typischerweise nochmal ~10 % Abbrecher. Sollten sie aufgrund Ihres Designs (z.B. eine Screenout-Frage) einen deutlich höheren Anteil an ungültigen Fragebögen haben, sagen Sie bitte Bescheid (das gilt übrigens auch für die kostenpflichtige Nutzung).
SoSci Survey limitiert auch die Anzahl der Serienmails, die pro Tag (!) über www.soscisurvey.de verschickt werden dürfen. Im Prinzip können Sie aber über mehrere Tage hinweg mehr als 5.000 Serienmails versenden (natürlich nur wenn die rechtlichen Grundlagen für den Versand so vieler E-Mails gegeben sind). Für die Grenze der kostenlosen Nutzung ist nicht die Anzahl der verschickten E-Mails relevant, sondern die Anzahl der Personen, die den Fragebogen aufrufen und ausfüllen. Zu Spam (erkennbar an einer geringen Teilnahmequote < 10%) sollte Ihre Einladung deshalb natürlich trotzdem nicht ausarten.
Fazit
Prüfen Sie vorab, ob mehr als 5.000 Fälle methodisch sinnvoll sind, und ob sich die Einladung bei Bedarf entsprechend steuern lässt.
Wenn Sie sehr große Erhebungen planen, dann prüfen Sie auch, ob Sie SoSci Survey dafür nicht vielleicht kostenpflichtig nutzen möchten. In einem DFG-Projekt zum Beispiel sollten Sie nicht beim Erhebungswerkzeug sparen - selbst wenn www.soscisurvey.de in aller Regel problemlos funktioniert: Wenn der Dienst zu Stoßzeiten einmal nicht 100%ig verfügbar sein sollte (oder weil ein einzelner Nutzer den Server mal wieder massiv über Gebühr beansprucht) und deshalb die Datenerhebung nicht planmäßig läuft, dann ist der Schaden in aller Regel deutlich höher als die sehr moderaten Nutzungsentgelte für SoSci Survey. Abgesehend davon, sollten in jedem Forschungsprojekt dieses Umfangs Mittel für die Datenerhebung vorgesehen sein.
Wenn Sie nun aber große Fallzahlen nicht vermeiden können und realistisch mehr als 7.000 Fälle erwarten (also 5.000 Fälle plus 10% Abbrecher plus ein großzügiger Puffer), dann sagen Sie uns vorab per E-Mail an info@soscisurvey.de bescheid, in welchem Befragungsprojekt (URL) Sie in welchem Zeitraum wie viele Teilnehmer:innen erwarten. Schreiben Sie bitte auch, warum es so viele Fälle werden - speziell dann, wenn es technische Ursachen gibt wie eine Multi-Level-Struktur oder eine Tagebuchstudie. Und planen Sie ggf. eine Entschädigung für den Zusatzaufwand von 0,01 € bis 0,02 € pro zusätzlichem Fall im Datensatz ein (zzgl. USt.).