wo ist das hier identisch? Jeder mag was anderes und es wird jedem ja einfach wahllos eins der drei ausgespielt. Hier bekommt ja nicht jedem alle drei angezeigt um zu schaut welches ausgewählt wird. Das musste aber um eine identische Situation zu haben.
Ich glaube da ist der Kontext beim Lesen verlorengegangen :p der Punkt war identische Thumbnails zu verwenden und drastisch unterschiedliche Resultate bekommen zu können. Habe ich 2/3 mal das gleiche Thumbnail drinnen um das Feature zu testen, dann erwarte ich 50/50 oder 33/33/33, nicht Werte die wild durch die Gegend fliegen. Nicht, weil ich das nicht verstehen könnte, sondern eher weil das dann heißt, dass ich mich auf die Resultate nicht verlassen kann.
Simples Beispiel: Ich hatte auf einem Video ~60/40 trotz identischem Thumbnail. Wir erfinden jetzt eine Situation, wo stattdessen ein besseres Thumbnail das 2. mit 40% ersetzt, aber die Zuschauer bleiben gleich, die für das 60/40 gesorgt hatten. Das Resultat ist nun 55%/45%, heißt für mich ist Thumbnail 1 der Sieger, aber in der Realität hat Thumbnail 2 mehr Leute angelockt. Der Unterschied kam nur daher, dass die andere Gruppe generell immer mehr angeschaut hätte.
Ich finde 48/52 und solche sehr nahen Werte lassen sich vertreten, im Sinne von, dass sie als gewöhnliche Varianz akzeptiert werden könnne. Aber 60/40% für dasselbe Thumbnail? Das macht es unmöglich andere Resultate zu bewerten.