Pas på disse faldgruber, når du læser statistik
Når du støder på statistik, tabeller og diagrammer i medierne eller i videnskabelige artikler, kan det være let at falde for fejl. Her giver en forsker i statistik dig overblikket over de værste faldgruber.
statistik data faldgruber

For lille et datagrundlag, forkerte årsagsforklaringer eller manglende sans for det store perspektiv. Faldgruberne er mange, når du bliver præsenteret for oplysninger, der bygger på statistik. (Foto: Shutterstock)

Har du også prøvet den ene dag at støde på en nyhed om, at kartofler er sunde, og den anden dag en om, at de er usunde?

Data og Tal

Læs mere om, hvordan du analyserer statistik, meningsmålinger, tal og grafer på Videnskab.dk’s tema-site om 'Data og Tal'.

Her finder du et stort og bredt udvalg af artikler om brugen af data i nyheder.

Materialet er velegnet til undervisningsbrug i gymnasiet og på øvrige videregående ungdomsuddannelser.

Måske er den ene historie forkert, men måske er der bare målt ud fra forskellige parametre: Den ene historie kan for eksempel bygge på tal om, at kartofler er godt for fordøjelsen, og den anden på, at kartofler er skidt for vægttab.

Ofte bliver der draget for store konklusioner på baggrund af mangelfuld data, og det kan som læser være svært at navigere i sandt og falskt.

Hans Christian Petersen, der er lektor i statistik på Institut for Matematik og Datalogi på Syddansk Universitet, guider dig her igennem de værste statistiske faldgruber.

Faldgrube 1: Lavt antal observationer

En af de vigtigste ting at være opmærksom på, når du præsenteres for statistik, er, hvor mange antal observationer, tallene bygger på. Der er for eksempel alt for stor usikkerhed forbundet med en historie om, at enebørn generelt klarer sig dårligere i skolen, hvis kun enkelte børn har deltaget i studiet.

»Det er en klassisk uskik, at man ikke fortæller, hvor stor ens datamængde er. Ofte har man som læser ingen mulighed for at vurdere, hvor mange personer, der er målt på,« siger Hans Christian Petersen.

Faldgrube 2: Det store billede mangler

En anden faldgrube er, at der er taget et for lille udsnit af det store billede, og at ændringer i data derfor kan se unaturligt store eller små ud.

data statistik tal faldgruber

Hvis du ser den øverste graf for sig selv, kan du være tilbøjelig til at tænke: "Hold da op, antallet af vielser er godt nok faldet de seneste år." Men sammenligner du med en graf over antallet af 30-39-årige, som er den alder, hvor flest bliver gift, kan du se, at tallene ikke er så overraskende. (Tal: Danmarks Statistik)

»Når man laver grafer, hvor man måler på noget, der har ændret sig fra 10 til 12 procent, ser ændringen ikke særligt stor ud, hvis man lader grafen gå fra 0 til 15 procent. Men går den fra 9 til 13 procent, ser ændringen pludselig stor ud,« forklarer Hans Christian Petersen.

Hvis du eksempelvis ser en overskrift om, at antallet af indbrud er voldsomt stigende, skal du altså lige have for øje, om stigningen kun henviser til de sidste tre år. Måske viser en graf, der går 20 år tilbage i tiden, at det nuværende antal indbrud er rekordlavt.

»Nogle gange må man leve med, at man ikke kan få oplysninger, der giver det fulde billede. Men så skal man bare være bevidst om, at man kun kan sige noget om et smalt udsnit af virkeligheden,« siger Hans Christian Petersen.

Faldgrube 3: Kun adspurgt specifik gruppe mennesker

Når man laver en undersøgelse, kan man også nemt komme til at sige noget om en mere forskelligartet gruppe, end den snævre gruppe, der rent faktisk har deltaget i studiet.

Hvis du vil sige noget generelt om for eksempel alle ældre mennesker, er det ikke kun nok at have mange respondenter - de skal også repræsentere alle de forskellige typer ældre, der findes. 

»Hvis gymnasieelever laver en undersøgelse af, hvor mange unge mellem 15 og 18 år, der ryger, kan de nemt komme til kun at spørge deres venner fra de andre gymnasieklasser. Derved får de ikke data, der er repræsentative for alle danskere mellem 15 og 18 år,« siger Hans Christian Petersen.

Faldgrube 4: Tal uden kontekst

Et problem, man også ofte kan støde på, er, at der bliver meldt nogle tal ud, som ikke siger noget i sig selv, fordi de ikke er sat i forhold til noget.

»Helt banalt kan man illustrere problemet ved, at du blot får at vide, at jeg tjener 10.000 kroner. Men er det om dagen, om måneden, gentagne gange over flere måneder eller for at udføre et bestemt stykke arbejde? Det skal man så gætte på som læser,« forklarer Hans Christian Petersen.

Og når man gætter, kan man nemt gætte forkert. 

rygning alkohol statistik

Før man stoler blindt på tallene, må man bruge sin sunde fornuft og viden omkring biologiske og sociologiske faktorer. Livsstilsfaktorer som rygning, alkohol, fedme og manglende trivsel kan for eksempel spille ind på mange forskellige undersøgelsesresultater. (Foto: Shutterstock)

Hvis du for eksempel læser, at 2.000 færre er på dagpenge, kan du nemt tro, at disse 2.000 så er kommet i arbejde. Men det kan lige så vel betyde, at disse personer er faldet ud af dagpengesystemet, eller at de er begyndt at studere, fordi de ikke kunne få job.

Faldgrube 5: Man glemmer mellemled

Man kan også komme til at drage forkerte årsagssammenhænge, fordi man glemmer at tage højde for alle de faktorer, der kan spille ind på resultatet. Hans Christian Petersen forklarer, at dette problem ofte opstår inden for sundhedsforskningen.

»I en undersøgelse så det ud, som om der var øget risiko for lungekræft, hvis man drak meget alkohol. Men da man så tog højde for, om deltagerne var rygere, forsvandt effekten af alkohol, og det var kun rygning, der betød noget. Nogle fænomener hænger altså kun sammen, fordi de i virkeligheden hænger sammen med noget tredje,« siger han.

Hvis man vil måle, hvor stærk sammenhængen mellem for eksempel alkohol og kræft er, må man tage højde for nogle biologiske og sociologiske mekanismer, der ikke har noget med matematik at gøre – i dette tilfælde, hvorfor alkohol i mavesækken skulle give kræft.

Faldgrube 6: Tekst stemmer ikke overens med figur

En sidste faldgrube er figurer, diagrammer og tabeller, der viser noget andet end selve undersøgelsen.

Man kan eksempelvis støde på et søjlediagram over en meningsmåling, der viser, at DF står til 20 procent af stemmerne, og Venstre står til 15 procent, men alligevel er DF’s søjle dobbelt så høj som Venstres.

Tjek derfor altid, om de visuelle elementer stemmer overens med tallene.

Lyt på Videnskab.dk!

Hver uge laver vi digital radio, der udkommer i form af en podcast, hvor vi går i dybden med aktuelle emner fra forskningens verden. Du kan lytte til den nyeste podcast i afspilleren herunder eller via en podcast-app på din smartphone.

Har du en iPhone eller iPad, kan du finde vores podcasts i iTunes og afspille dem i Apples podcast app. Bruger du Android, kan du med fordel bruge SoundClouds app.
Du kan se alle vores podcast-artikler her eller se hele playlisten på SoundCloud