Danke für die Darstellung der Hypothesen und Effekte.
Es ist m.E. erstmal hochplausibel, dass bei zwei ähnlichen Seiten die erste (welche ja etwas neues liefert) länger betrachtet wird als die zweite. Mir scheint die wiederholte Anzeige auch ein untypisches Szenario, weil das "kenne ich schon" in der Messwiederholung den eigentlich zu untersuchenden Effekt deutlich überlagert - das ist in einem Experiment i.d.R. nachteilig. Ein typisches experimentelles Szenario wäre gewesen, dass randomisiert jeweils nur eine der beiden Seiten angezeigt wird. Vielleicht möchten Sie nochmal prüfen, ob es da vielleicht ein Missverständnis oder eine Fehlkommunikation gab?
Dass die Betrachtungszeit bei der Wiederholung kürzer ausfällt ist ohne Frage ein sehr starker Effekt. Für diesen starken Effekt beobachten wir eine zeitliche Differenz von 8 Sekunden. Die Irritation, die Ihre Manipulation auslöst, dürfte eine deutlich geringere Effektstärke aufweisen. Ich rate einmal, dass wir hier vielleicht 5-10% Unterschied, also 1-2 Sekunden beobachten könnten. Vielleicht auch nur 0,5 Sek - wenn wir z.B. die IAT-Messungen ansehen, sind kognitive Effekte meist im Bereich < 1 Sek. zu finden. Um solch einen geringen Unterschied zu messen, ist die auf ca. 1-3 Sekunden genaue Verweildauer aber nicht ausreichend (bzw. man müsste sehr viele Messwiederholungen pro Teilnehmer machen). Um solch kleine Effekte reliabel zu messen, wäre eine auf JavaScript basierende Erhebung erforderlich.
Mittels JavaScript kann man die Zeitpunkte bestimmen, wenn die Seite vollständig im Browser geladen ist und wann der Teilnehmer auf "Weiter" klickt - unabhängig von den Übermittlungszeiten zwischen Server und Browser. Wenn man noch den Seitenaufbau (heutzutage i.d.R. < 100 ms) im Browser in Betracht zieht, bekommt man damit eine Messung auf ca. 0,1 Sek. genau. Natürlich hat man auch hierbei noch Verzerrungen (z.B. ob jemand auf einem kleinen Bildschirm/Fenster erst noch zum "Weiter"-Knopf scrollen muss), aber zumindest eine wesentliche Quelle für Messartefakte (die Ladezeit) ist ausgeschlossen.
Wie gesagt halte ich das verwendete Design aber allgemein als nicht optimal. Verbunden mir der groben messung wundert es mich nicht, wenn sich keine den Hypothesen folgenden Unterschiede zeigen...