Hvis VM i Qatar i en eller anden form for parallelverden blev gennemspillet 100.000 gange, ville Danmark kunne løfte trofæet 6.500 af gangene.
Scenariet er måske en anelse absurd.
Men sådan lyder konklusionen i et omfattende stykke statistisk modelarbejde, som forskere fra Tyskland, Belgien, Østrig og Luxembourg står bag.
Forskerne gør desuden Brasilien til favoritter med 15 procents chance for at vinde VM. Argentina er anden størst favorit med 11,2 procents chance. Holland er treere, Tyskland er fiere og Frankrig er femmere.
Danmark har 6,5 procents sandsynlighed for at vinde VM, hvilket gør Danmark til den niende største favorit.
»Det er jo dobbelt så stor en chance for vinde, som hvis alle 32 hold havde lige gode chancer,« konstaterer professor i statistik og bioinformatik ved Københavns Universitet, Claus Ekstrøm, til Videnskab.dk.
Han har selv udgivet flere studier om statistiske forudsigelser af fodbold-slutrunder.

Forudså spansk succes tre gange i træk
Forskergruppen bag de nye forudsigelser har i årevis lavet simuleringer af fodboldslutrunder. De forudså med en lignende statistisk model, at Spanien vandt EM i 2008 og 2012 og VM i 2010, hvilket de altså fik ret i.
Selvom de regnede rigtigt dengang, gør det dem dog langtfra til profetiske spåmand.
Senest til coronaens EM i 2021 gjorde de Frankrig til favoritter, men franskmændene røg altså ud allerede i ottendedelsfinalen til Schweiz. Mens Italien, der vandt turneringen, blev givet 7,9 procents chance for succes.
»Det ligger i selve prognosernes natur, at de også kan være forkerte – ellers ville fodboldturneringer være meget kedelige,« siger Andreas Groll, der forsker i fodboldforudsigelser ved Technische Universität Dortmund, i en pressemeddelelse.
»Vi giver sandsynligheder, ikke sikkerheder, og en sandsynlighed for at vinde på 15 procent indebærer også en sandsynlighed på 85 procent for ikke at vinde,« tilføjer han.
Mest af alt laver de arbejdet, fordi de gerne vil træne forskellige statistiske modeller:
»Modellerne, der er trænet på denne måde, kan også bruges til andre prognoser i fremtiden – så en bedre fodbold-forudsigelse kan i sidste ende også give mere præcise vejrudsigter,« siger statistisk-forsker ved østrigske Universität Innsbruck Achim Zeileis ligeledes i en pressemeddelelse.
Hvad har forskerne gjort?
Men hvad er det så mere præcist, de har gjort i de her mystiske statistiske modeller?
Forskerne kombinerer forskellige typer data fra forskellige statistiske modeller, der har forskellige styrker og svagheder. Modellerne bygger blandt andet på:
- Historisk data fra hvert landsholds præstationer de seneste otte år
- Historisk data fra de seneste fem verdensmesterskaber
- Data om hvert lands styrke baseret på 28 betting-firmaer
- Spillertruppernes samlede værdi
Gennem maskinlæring kombineres alle de forskellige statstiske modellers styrke i en såkaldt hybrid-model.
Med denne hybrid-model blev slutrunden kamp for kamp simuleret 100.000 gange. Helt ligesom i et computerspil.
Danske forsker: »Kender dem særdeles godt«
»Det minder om den måde, man vurderer orkan-baner på i USA,« fortæller den danske professor Claus Ekstrøm.
»Der kører man også forskellige klimamodeller sammen og prøver at at opsummere, hvor orkanen vil lande om 4 dage,« siger professoren, der kender flere af forskerne bag VM-forudsigelserne »særdeles godt«.
Den danske statistik-forsker har ved de seneste to fodbold-slutrunder – VM i 2018 og EM i 2021 – afholdt en konkurrence, hvor statistikere dyster om, hvem der har den mest præcise statistiske model til at forudsige slutrundens udfald.
»Jeg skrev for nogle år siden et indlæg på min blog om, hvordan man laver vurdering af slutrunder. Resultatet af det underholdte jeg med på en konference, fordi fodbold jo altid fanger folks interesse, og så kom jeg i kontakt med nogle andre, der også lavede fodboldstatistik,« fortæller Claus Ekstrøm, der egentlig slet ikke interesserer sig for fodbold.
»Konkurrence er udelukkende for sjov, og vi dyster kun om æren,« siger han.
Ualmindelig svær disciplin
Selvom fodbold-forudsigelser mest er gak og løjer, er feltet interessant nok, fordi det er en »ualmindelig svær disciplin«, fortæller Claus Ekstrøm.
Klimamodeller kan eksempelvis – på trods af usikkerheder – bygges på historisk data, fordi de klimatiske mekanismer i stor udstrækning vil være de samme.
Men når statistikere arbejder med fodbold, bliver historisk data hurtigt forældet. Hvis den da overhovedet findes.
Danmark møder Tunesien i første kamp. De to nationer har kun mødt hinanden én gang tidligere tilbage i en venskabskamp i 2002, hvor Danmark vandt 2-1. Der er altså så godt som ingen historiske data at bygge det direkte styrkeforhold på.
Endelig er det absurd at skulle bruge en kamp fra 2002 til at vurdere styrkeforholdet i dag. Spillertrupperne i fodbold ændrer sig med få års mellemrum. Derfor kan du ikke bruge data fra en 8 år gammel kamp – som forskerne kigger tilbage på – til særlig meget i dag.
Endnu værre er det med slutrunder som VM, hvor mange hold måske aldrig har mødt hinanden eller kun møder hinanden hvert 20 år – som i tilfældet med Danmark og Tunesien.
»Den slags kan man ikke lige fikse. Så der bliver en del gætværk omkring, hvad der har betydning for styrkeforholdet. Det gør ikke problemstillingen mindre spændende eller interessant Men det skaber en del støj,« fortæller Claus Ekstrøm, der trods de mange indbyggede udfordringer, mener at forskerne har lavet et solidt stykke statistisk arbejde.

Forskerne påpeger også, at slutrunden i Qatar er ekstra svær at forudsige, fordi den foregår i november og december midt i de europæiske klubturneringer, og fordi det tørre og varme klima i ørkenstaten også er en ukendt faktor.
Og så dækker det statistiske arbejde – i sagens natur – slet ikke over, hvor tilfældigt en fodboldkamp kan udspille sig.
Neymar og Lionel Messi kan løbe ind i skader under første minut af første kamp. Simon Kjær kan få et uventet rødt kort mod Tunesien. Kasper Schmeichel kan få et sandkorn i øjet, da han skal til at redde en afgørende bold.
Ikke verdens største nyhed
Desuden kan det tilføjes, at man nok ikke havde behøvet avancerede statistiske modeller, 100.000 simuleringer og en stor gruppe forskere for at gøre Brasilien til favoritter.
»Det er jo ikke verdens største nyhed,« pointerer Claus Ekstrøm.
At Danmark er 9. største favoritter i forskernes model stemmer også meget godt overens med, at Danmark for indeværende er nr. 10 på verdensranglisten.
Derfor er Claus Ekstrøm også i tvivl om, hvorvidt forskernes regnearbejde bidrager med nogle nye og bedre forudsigelser, end dem som bookmakernes allerede har lavet.
Forskernes arbejde bygger desuden også på bookmakernes, og det er egentligt meget klogt, mener Claus Ekstrøm.
»Hvis bookmakerne skyder forkert på deres rangering af favoritter, så koster det dem en masse penge. Så de har noget mere på spil end os forskere, der kan lave nogle ‘gratis’ bud. Derfor må vi også forvente, at de har den bedste data,« lyder det fra Claus Ekstrøm.
Så man skal ikke satse sin pensionsopsparing på, at Brasilien vinder VM, fordi forskerne har udpeget landet som favorit?
»Nej, det ville jeg nok ikke gøre. Man skal generelt nøjes med at satse de penge, man har råd til at tabe.«