Wenn Sie einen Voice-to-Text Converter im Netzwerk haben (also einen, den Sie datenschutzkonform nutzen können), dann sehe ich zwei mögliche Wege:
1) Am effizientesten wäre es wohl, wenn Sie die Sprachaufnahme per JavaScript direkt im Browser an das Interface schicken, dieses den Text zurückschickt, und das Script selbigen in ein Texteingabefeld einträgt.
So eine rein auf JavaScript basierte Lösung würde komplett an SoSci Survey vorbei funktionieren. Herausforderung wäre in dem Fall, wie man die unberechtigte Nutzung durch Dritte verhindert. Da hätte ich bei Bedarf noch eine Idee.
2) Sie können auch eine Audio-Aufnahme machen, wie beschrieben, und würden diese dann im Nachgang (also z.B. im PHP-Code der nächsten Seite) via sendJSON() o.ä. an die API zur Text-Konvertierung senden.
Nachteile der zweiten Lösung: Der Aufbau der folgenden Fragebogen-Seite wird sich ein wenig verzögern, und die Befragten sehen nicht sofort, ob es funktioniert hat.