Vielen Dank für Ihre ausführliche Antwort!
Zu >> Die Hypothese 1 ist schwer (fast nicht) falsifizierbar. Geht es um den Unterschied zwischen den Situationen? Dann sollten Sie es anders formulieren.
Jede der vier Runden beinhaltet unterschiedliche Informationen, kurz kodiert als Risiko. Wobei Runde 1 nicht immer Risikoklasse 1 entspricht. Die Hypothese/Überlegung ist hier, dass bei niedrigem und hohen Risiko (jeweils 1 und 4) falsch entschieden wird.
Zu >>Es gibt keinen Lerneffekt, d.h auch in späteren Runden
Sie empfehlen, die Hypothese wie folgt zu ändern: In späteren Runden tritt ein Lerneffekt auf (d.h. in Runden 1 und 2 wird falsch entschieden, in Runden 3 und 4 jedoch richtig). Wenn dies rejected wird (durch den t-test), dann gibt es keinen Lerneffekt, richtig?
Zu >> Hier könnte man einen Summenindex für die Anzahl korrekter Kreuzchen wählen und anschließend einen t-Test rechnen.
Darf man denn t-tests rechnen, wenn es um kategorische Variablen geht? Dachte, die Normalverteilung ist nicht mehr gegeben, weshalb ich die ganzen logit/probit/ multivariate Analysen überhaupt erst durchführen muss..
Zu >> Anspruchsvoller - dafür müssten Sie die Daten noch so umstrukturieren, dass sie eine Variable ergänzen, welche den "früheren Erfolg" kodiert. Das könnte z.B. der Anteil korrekter Antworten in (allen) früheren Runden enthalten.
Genau, die ist schon vorhanden, nur meinen Sie die Variable sollte nicht "continuous" sein, sondern eher kategorisch?
Zu >> Die voin Ihnen oben angerissene Cluster-Lösung beachtet nicht die Reihenfolge, sondern kontrolliert die generelle Leistung einer Person. Dies dürfte in starke Konkurrenz zu der Hypothese 4 treten.
Vielen Dank! Sehr guter Hinweis!
Zu >> Wenn sich die 4 Kategorien inhaltlich unterscheiden, dann ja.
Es sind pro Runde immer die gleichen 4 Entscheidungen, aber die Runden unterscheiden sich vom Risiko.
Die Entscheidungen sind immer die Aufteilung eines bestimmten Budgets auf vier gleiche Kategorien (die vier Sub-Entscheidungen).
Zu >> Sie 4-mal so viele Fälle bekommmen
Genau, das habe ich bereits umgesetzt mit dem reshape long command (in Stata). Die Daten aus dem csv file waren ja ein Proband pro Zeile im wide Format. Der reshape command hat dann CASE 1 vier mal untereinander und in jeder Zeile jeweils eine Runde (mit zugehöriger Risikoklasse) und jeweils die Entscheidungen pro Runde. Zusätzlich steht dann in jeder Zeile, ob für jede der vier Entscheidungen pro Runde richtig entschieden wurde oder nicht (1 und 0).
Verstehe ich Sie richtig, dass ich zusätzlich zum CASE Cluster noch einen Multi-level cluster benötige, weil jetzt ein CASE vier Zeilen in Anspruch nimmt und das meine Analyse erneut komplizierter macht?
Vielen Dank!