fredag 7 mars 2014

Melodifestivalen 2014: Vinnaren - enligt statistiken och enligt vetenskapen

Då var det dags för lite statistik igen och denna gång ska vi kika närmare på finalen - en mycket avancerad historia numera. Sedan 2002 har vinnaren utsetts genom 50% telefonröster och 50% juryröster - och (för att göra saken än mer komplicerad) sedan 2009 med internationella juryer - och (till sist) sedan 2011 enbart med internationella juryer. Numera kan man alltså säga att det är svenska folket tillsammans med internationella expertgrupper som avgör vinnaren i Melodifestivalen. Dessa två poler brukar inte alltid vara överens, men det är väldigt sällan som det spelar någon större roll.

Så vad blir resultatet i Melodifestivalen 2014? Vem vinner? 

Ja, vi kan börja med att kika på det totala resultatet i finalen baserat på finalstatistik mellan 2002-2013. Vad jag har gjort här kallas en "Envägs-ANOVA" och redovisar medelvärden av alla slutplaceringar utefter deras startpositioner. Ni ser i stapeln till vänster alla startplaceringar som är möjliga (1-11 - glöm inte att 2009 var det ju 11 finalister!) och ni kan i stapeln "Mean" se medelvärdet av slutplaceringen som varje bidrag brukar få givet den startpositionen.
Stapeln längst till vänster: Möjliga startpositioner (1-11). N: Antal bidrag som hamnat på varje placering (12 år, 12 bidrag på varje placering). Mean: Medelvärdet av slutplaceringen - ju lägre (närmare 1) desto närmare vinsten. Std. Deviation: Standardavvikelse - hur mycket ett bidrag på denna startposition oftast brukar avvika från medelvärdet av slutplaceringen. Minimum & Maximum: De lägsta och högsta observerade slutplaceringarna för bidragen på denna startposition.




Här ser vi ganska tydligt att startposition 1 och 10 & 11 (alltså att start allra först och allra sist) är det absolut bästa. Att gå ut först verkar dock vara allra bäst - i snitt slutar man då på placering 2,33. Att gå ut sist i startfältet är också mycket bra - i snitt slutplacering 3. Det som dock förstör denna statistik något är att man 2009 hade 11 bidrag i finalen - och 11:an vann då alltihopa, medan 10:an kom sist. Detta bevisar att det inte har att göra med att vara det 10:e bidraget som avgör - utan att gå ut sist i startfältet. Om vi stryker 2009 års konstiga upplägg från statistiken så ser vi att det i princip blir helt jämnt mellan att gå ut 1:a som 10:a. Och det allra mest fascinerande är att första och sista bidraget aldrig har slutat sämre än 4 i finalen!!!! Helt otroligt egentligen! Det innebär att det rent statistiskt är 75% sannolikhet att dessa två bidrag ingår i topp 3! Och iallafall 100% sannolikhet att något av bidragen gör det! Helt galet.

Men varför är det då så oerhört bra att gå ut först eller sist? 

I psykologisk och kognitionsvetenskaplig forskning pratar man om "Primacy-effekten" och "Recency-effekten" - alltså seriepositionseffekter på minnet. När vi människor får mycket information (till exempel under en föreläsning eller en Melodifestival) så kan vi/orkar vi inte alltid minnas allt. Vissa saker fastnar lättare i minnet - då främst den information som kom först - och den som kom sist. "Primacy effekten" innebär att den information som kom allra först är den vi minns bäst, eftersom dess startposition får den att sticka ut. Man kan kanske se det som att den är svårare att bland ihop med annan liknande information eftersom den kom först i ordningen - då är den enklare att minnas. Jämför exempelvis med hur man minns en rolig historia eller en låt - man kan oftast början väldigt bra - mer sällan minns man mitten.
"Recency-effekten" menar å andra sidan att man bäst minns den senaste informationen - det man hörde sist. Det ligger ju närmast i tiden, och konkurrerar således inte med annan viktig information som kommer efteråt. Därför är det heller inte så konstigt om du bara kommer ihåg slutet på vissa filmer, eller slutposén i ett dansnummer - det är alltid slutklämmen man minns bäst.
Slår man ihop dessa så ser vi att Melodifestivalen kan förklaras av forskningen - eftersom vi oftast röstar efter att alla bidrag spelats. Då gör vi en bedömning av vilka bidrag vi tycker bäst om - oftast de vi har lättast att komma ihåg. Då kommer dessa seriepositionseffekter in, och vi får automatiskt lättare att komma ihåg första och sista bidraget.

Så hur slutar Melodifestivalen 2014 enligt forskningen och statistiken?

  • 1. Anton Ewald
  • 2. Ace Wilder
  • 3. Sanna Nielsen
  • 4. Yohio
  • 5. Helena Paparizou
  • 6. Oscar Zia
  • 7. Panetoz
  • 8. Linus Svenning
  • 9. Alcazar
  • 10. Ellen Benediktson

Internationella Jurygrupper

Men om vi nu bryter ned resultaten lite - och kikar på de internationella juryerna.
De internationella jurygrupperna är ju trots allt professionella - de jobbar ju med musik i sina hemländer, de är ansvariga för sitt lands egna uttagning till Eurovision. De borde ju logiskt sett, inte kunna påverkas av ordningseffekter eller annat irrelevant utan bara gå på kvaliteten i låtarna? Nja... Låt oss se...
Stapeln längst till vänster: Möjliga startpositioner (1-11). N: Antal bidrag som hamnat på varje placering (5 år, 5 bidrag på varje placering). Mean: Medelvärdet av slutplaceringen hos de internationella jurygrupperna - ju lägre (närmare 1) desto närmare vinsten. Std. Deviation: Standardavvikelse - hur mycket ett bidrag på denna startposition oftast brukar avvika från medelvärdet av slutplaceringen hos int. jurygrupperna. Minimum & Maximum: De lägsta och högsta observerade slutplaceringarna hos int. jurygrupperna för bidragen på denna startposition.
Vi kan här se att det skiljer sig en del från den totala statistiken för finalen. Först och främst baserar sig den här statistiken på resultaten från internationella jurygruppernas totala slutresultat mellan 2009-2013. 2009 var det bara EN internationell jury - 2010 var det bara 5 internationella jurygrupper och sedan 2011 är det 11 jurygrupper. Statistiken redovisar dessa jurygruppers sammanlagda röstning.
Vi ser tydligt att även om det fortfarande är bäst att börja först och sist (ignorera svansen längst till höger i grafen - det är det 11:e bidraget 2009- Malena Ernman med La Voix - som int. Juryn ratade), så är medelvärdena generellt mycket högre hos int. Juryn än i den tidigare totala statistiken. Det innebär att seriepositionseffekten INTE är lika tydlig hos internationella jurygrupperna som i den totala röstningen. Jämför vi så ser vi: Bidrag 1 har medelvärde 3,40 hos int. Jury, medan samma bidrag har 2,33 i den totala statistiken. Alltså skiljer det mer än 1 placering mellan juryerna och den totala röstningen! Att variationen är större ser vi också på standardavvikelsen hos int. jurygrupperna - jämfört med den totala röstningen. Allt detta innebär att det är mycket svårare att förutsäga hur internationella juryn ska rösta med hjälp av statistiken. Men helt klart är ändå att första och sista bidrag har bättre chanser även här.

Hur röstar då svenska folket?

Här kan vi använda statistik från 2002-2013, vilket innebär lite säkrare data. Rent tekniskt så borde det framgå att folket röstar lite mer efter psykologi än annat här - vi borde alltså förvänta oss mer recency och primacy-effekter här! Blir det så då? Jodå!
Stapeln längst till vänster: Möjliga startpositioner (1-11). N: Antal bidrag som hamnat på varje placering (12 år, 12 bidrag på varje placering). Mean: Medelvärdet av slutplaceringen hos folkets röstning - ju lägre (närmare 1) desto närmare vinsten. Std. Deviation: Standardavvikelse - hur mycket ett bidrag på denna startposition oftast brukar avvika från medelvärdet av slutplaceringen hos folket. Minimum & Maximum: De lägsta och högsta observerade slutplaceringarna hos folket för bidragen på denna startposition.

Som på beställning ser vi att det är första och sista bidraget som har störst chanser att gå hem hos folket! Till skillnad från internationella juryerna - så är det sista bidraget helt klart bäst hos svenska folket! Det är har ett medelvärde på 2,42 - och förmodligen ännu lägre om vi räknar med Malena 2009 - som gick ut som nr 11. Helt klart är iallafall att sista bidraget har oerhört mycket större chanser hos svenska folket än alla andra. Stort plus för Ace Wilder i år alltså. Vi ser dock att spridningen är ganska hög hos svenska folket jämfört med den totala röstningen - de som startar först eller sist har hamnat allt emellan 1:a till 8:a hos svenska folket - i den totala omröstningen så var samma statistik 1:a och 4:a (om man räknar in Malena Ernman 2009). Det är alltså inte alltid som svenska folket röstat helt efter ordningen, även om det är tydligt att de gör det mer än internationella juryn. Annars visar denna statistik att folket inte skiljer sig nämnvärt från resten av resultatet.
Folket är mer påverkat av "Recency-effekten" (den nyaste och senaste informationen är den man minns bäst), än internationella juryn som snarare påverkas av "Primacy-effekten" (den första informationen är den man minns bäst). Vad kan detta bero på? Ingen vet. Jurygrupperna kanske koncentrerar sig mer ifrån början - och börjar tröttna mot slutet? Svenska folket kanske äter tacos och pratar mer under första delen av tävlingen så att de koncentrerar sig bättre mot slutet? Det är min teori iallafall.

Jag måste ju dock till sist konstatera att det är fullt möjligt att vinna Melodifestivalen även från andra placeringar än bara första och sista. Om vi tittar över tabellen på hur många som vunnit från varje startposition så ser vi att det även går att vinna från position 6, 7 och 9! Däremot verkar det rätt lönlöst att starta från position 4 och 5 - som aldrig varit i topp 3 under de senaste 12 åren! Dåliga nyheter för Oscar Zia och Linus Svenning:  
   
Så varför är statistiken ett bra sätt att förutspå vinnaren för Melodifestivalen? Jo, Christer Björkman vet självklart om statistiken - och därför sätter han in de bidrag han tror mest på, på de startpositioner som ger dem störst chans att vinna. Det blir en självuppfyllande profetia. Om vi kikar på bettinglistorna så ser vi också att Sanna Nielsen (startnummer 8) och Ace Wilder (startnummer 10) ligger bäst till i oddsen - och har hyfsade startpositioner. Däremot har Björkman sett till att Sanna startar från en position som INGEN någonsin har vunnit från - 8. Han vill kanske inte se Sanna vinna på Lördag? Hmmm. Mysteriet är dock Anton Ewald, som inte alls är med i toppen i oddsen - men ändå går ut först. Kan det vara något scentekniskt som ligger bakom det beslutet? Vem vet. På Lördag får vi dock se om statistiken håller...

Inga kommentarer:

Skicka en kommentar