Annonceinfo

Biologer forstår ikke deres egne metoder

I mødet med stadig mere komplicerede data kommer biologernes evne til at analysere dem ofte til kort. I værste fald kan det føre forskningen på gale veje.

Forstår man ikke statistikken, kan der ske fejl, som for eksempel da forskere påstod, at påfuglens fjerpryd ikke er et resultat af seksuel selektion. (Foto: Colourbox)

Biologi er ikke bare faget, hvor du ser på, hvilke farver giraffen har eller hvor den bor. Det er også læren om, hvor mange giraffer der findes på et sted, eller hvilke ændringer girafferne har haft i pletterne i pelsen gennem de sidste 50 år.

Med andre ord: tal, matematik og statistik er vigtige værktøjer, også for en biolog. Men her er manglerne store.

Silje Skår er uddannet biostatistiker fra NTNU (Norges teknisk-naturvitenskapelige universitet i Trondheim) og er phd.-studerende ved Institutt for skog og landskap. Hun mener, situationen er alvorlig:

»Jeg ser jo, at biologer snakker om statistik, men alt for ofte er det tydeligt, at de er på tynd is,« siger hun til forskning.no.

»Nogle gange har det ikke så meget at skulle have sagt, men i værste fald kan det give store udslag på resultaterne.«

Biologer bruger forkerte eller for simple modeller

»Generelt kan du sige, at de modeller, som biologerne bruger til at analysere deres data, nogle gange ikke er lavet til den type information, de har samlet ind,« siger Silje Skår.

Til hverdag arbejder hun med at analysere data, der samles ind i et forskningsprojekt, som ser på potentialet for bioenergi fra norske skove. En af hendes målsætninger er at få sat fokus på det, hun mener er et stort problem inden for biologien.

»Modellerne bruges jo i god tro, men hvis man ser på kriterierne for at bruge dem, ser man, at dataene ikke passer. Der kan for eksempel være et for lavt antal observationer i forhold til, hvad der kræves,« siger Silje Skår.

»Mange biologer bruger for avancerede eller for simple modeller. Ofte har de bare fået et tip fra en kollega om, hvilken model de bør bruge, og så bruger de den ukritisk.«

Silje Skår understreger, at hun som statistiker har respekt for det arbejde, der kræves for at indsamle biologiske data, og at det er let at sidde på kontoret og klage over manglende observationer – uden selv at have været ude i felten.

»Men så bliver det desto mere vigtigt at bruge modellerne rigtigt, så man får mulige pålidelige resultater ud af det materiale, man rent faktisk har,« siger hun.

Også fejl i disputatser

Nils Christian Stenseth, leder for Centre for Ecological and Evolutionary Synthesis (CEES) ved Universitetet i Oslo, er enig i Silje Skårs diagnose.

»Det er klart, at der er vældig stor variation, men der er generelt for dårlig viden om matematik og statistik. Det er et almindeligt problem, som jeg ser næsten hver dag,« siger han.

Trods alt har de færreste biologer valgt biologi som karriere, fordi de synes, at matematik og regressionsanalyse er enormt morsomt – så vælger man i stedet at blive statistiker eller matematiker.

Problemerne dukker op, når biologerne alligevel har brug for statistiske og matematiske værktøjer i deres analyser. Hvis viden om de grundlæggende forudsætninger for, hvordan man kan analysere det datamateriale, man har indsamlet, mangler, kan det hurtigt gå galt.

»Der er desværre nok for mange, der tror, at man kan være biolog uden at have gode statistikkundskaber, men det bliver sværere og sværere,« siger Nils Christian Stenseth.

Biologi er ikke bare pels, tænder og leveområder længere. Stadig mere handler om analyser af svære datasæt, som for eksempel gentest. Så er der brug for matematik og statistik, men der falder mange fra, mener de forskere, som forskning.no har snakket med. (Foto: Colourbox)

»Så forsøger man at rette op på det med at lave programmer, som kan gennemføre analyserne for dig. Det er jo for så vidt godt, men man må fortsat forstå, hvad det er, der gøres. Hvis ikke risikerer man at bruge programmerne helt forkert og misforstå, hvad de egentlig har regnet ud,« siger han.

Nils Christian Stenseth vil ikke nævne navne, men siger, at han ser eksempler på forkert brug af statistik både til seminarer, til konferencer og i doktorgradsdisputaser.

»Der er en god del publicerede resultater derude, som ikke nødvendigvis er holdbare på grund af fejl i metodebrug,« siger Nils Christian Stenseth.

Påfuglens hale påvirker – ikke?

Et klassisk eksempel på dette finder man nævnt i et studie i Quaterly Review of Biology, skrevet af blandt andet Nils Christian Stenseths kollega Thomas Hansen.

Thomas Hansen er teoretisk evolutionsbiolog ved CEES (Centre for Ecological and Evolutionary Synthesis på Universitetet i Oslo). I studiet omtaler han og en gruppe kolleger en berømt biologirapport, som omhandler påfuglens hale som et eksempel til skræk og advarsel:

Er det sådan, at påfugle med den flotteste hale får flest damer? Det er jo en klassisk evolutionær antagelse, og japanske forskere bestemte sig derfor for at teste denne hypotese.

Simpelt forklaret antog de derfor, at jo flere ”øjne” i halen, jo bedre, og at parringssuccesen derfor burde være bedst for de påfugle med fleste øjne.

For at finde ud af det, må du foretage en statistisk analyse, som viser, hvordan antal parringer ændrer sig med antal øjne. Er svaret noget andet end nul, har du en effekt – enten påvirker det positivt, hvis svaret er mere end nul, eller negativt, hvis svaret er mindre end nul.

I dette tilfælde blev effekten målt til at være 0,03 parringer per øje – altså, at der blev tre procent flere parringer for hvert ekstra øje påfuglen havde på halen.

Blandet effekt og signifikans

Det resultat var imidlertid ikke statistisk signifikant, fordi datamaterialet var så begrænset, at man ikke kunne være sikker på, at den målte effekt ikke skyldtes for eksempel tilfældigheder.

Det var her, at det gik galt for japanerne:

De blandede disse to mål sammen i analysen – effekten af påvirkningen på den ene side, og usikkerheden om, om effekten er rigtig eller ikke på den anden side. I statistik udtrykkes usikkerhed som en p-værdi, og hvis den er større end 0,05, regnes resultatet for ’ikke signifikant’ eller meget usikkert.

Her var p-værdien på 0,18 – og studiet fik derfor titlen ’Pea hens do not prefer peacocks with more elaborate trains’, altså at påfuglehøns ikke foretrækker hanfugle med en finere hale.

»Resultatet var altså konsistent med, at hunnerne godt kan lide halen, men det er et usikkert resultat. En mere korrekt titel ville have været ’Pea hens seem to prefer peacocks with more elaborated trains, but we do not have much evidence’,« påpeger Thomas Hansen.

»Men studiet ville jo selvfølgelig ikke have fået lige så meget opmærksomhed med en sådan titel.«

Thomas Hansen og hans kolleger bestemte sig for at regne ud, hvad en tre procents forbedring per øje havde at sige for parringssuccesen for de to påfugle med henholdsvis flest og færrest øjne på halen . Den analyse viste, at den mest iøjefaldende påfugl ville få hele fire gange så mange parringer, som den påfugl med færrest øjne.

Meningerne er mange – nogle forskere mener, at der er brug for at biologer lærer mere matematik og statistik. Andre mener, at biologerne skal have større selvtillid til ikke kun at læne sig op ad statistikken og tallene, men lave mere selvstændige analyser. (Foto: Colourbox)

Det vil de fleste sige, er en ganske drastisk forbedring, og det hænger godt sammen med teorien om, at påfuglens hale er et resultat af seksuel selektion.

For meget statistik, ikke for lidt

Men selv om brugen af statistik her er forkert, er Thomas Hansen ikke nødvendigvis enig i, at det er for dårlige statistikkundskaber, der er årsagen til fejlen:

»Jeg er enig i, at vi har et problem, og det er, at man har alt for stor respekt for statistik og bruger det for meget. Fejlen er, at man bruger statistik for at finde svaret, i stedet for som en hjælp, et redskab, på vejen hen mod svaret.«

»I biologien mangler man en teori om mening. Det er fundamentalt at vide, hvordan det, du måler, hænger sammen med de underliggende realiteter – for eksempel, hvordan tallene i en IQ-test repræsenterer noget, som kan kaldes intelligens.«

En sådan debat findes ikke i biologien, mener Thomas Hansen.

»Man bruger statistik, som man lærer på kurser, har lært visse tests eller metoder, som man presser dataene ind i, og tror, at det har en mening. Det sker, uden at man reflekterer over, hvad det er, der måles i modellen,« mener Thomas Hansen.

»Man må tolke for at finde resultaterne, man forstår ikke, at statistikken kun giver råmaterialet, som kan tolkes for at komme frem til svaret. Det er muligt, at en del biologer ville have været bedre til at tolke den biologiske mening af deres fund, hvis de ikke var så forblændet af statistikken.«

Meget matematik giver få citater

Norge er ikke det eneste land med dette problem. Et nyt studie fra University of Bristol i Storbritannien har afsløret, at de biologiske videnskabelige artikler, som har flest formler og mest matematik i teksten, bliver citeret halv så meget, som de med kun lidt eller ingen matematik.

Nu er det ikke kun matematik, der gør en artikel værd at citere – måske mere tværtimod. Nils Christian Stenseth er enig med Thomas Hansen i, at det nogle gange tipper over til den anden side, mod for meget statistikbrug:

»Det er klart, at det går begge veje. Det er ikke altid nødvendigt at bombardere artikler med tekniske detaljer om udregninger og regressionsanalyser – de kan vedlægges i bilagene, hvis man mener, det er nødvendigt. For mange læner sig nok op ad statistikken og forklarer ikke, hvad der rent faktisk er resultaterne,« siger Nils Christian Stenseth.

Ikke hvordan, men hvad og hvorfor

Uanset om det er for meget statistikkundskab, der skaber problemer, eller for lidt, er konklusionen alligevel den sammen: Det skaber problemer.

Løsningsforslagene bliver imidlertid forskellige. Thomas Hansen efterlyser større selvtillid blandt biologer til at foretage analyser uden statistik som en krykke.

Nils Christian Stenseth mener, at der er brug for bedre matematik- og statistikviden – i hvert fald på det helt grundlæggende niveau:

»Man behøver ikke at kunne alt, men man skal have en vis evne til at forstå, hvad der er forudsætninger, antagelser og grundlag for at bruge de metoder, man bruger. Du har ikke brug for at foretage analysen selv, du behøver ikke engang selv at være i stand til at gøre det, men du må forstå hvad, der gøres og hvorfor,« siger han.

© forskning.no Oversættelse: Julie M. Ingemansson

Misforståelse

"Er det sådan, at påfugle med den flotteste hale får flest damer?"

Svaret er at det ikke er halen alene som giver parringerne, men at halen er en vigtig del af parrings-spillet. Hannen skal også svinge rundt med halen og sitre med den. Der til kommer måske at den flotteste han får de bedste hunner først. Men i det kunstrige miljø så bliver de store hanner måske trætte, og så kan de mindre hanner komme til.

Alternative spørgsmål:

"Er det sådan, at påfugle med den flotteste hale får de bedste damer?"

"Er det sådan, at påfugle med den flotteste hale får de bedste damer først?"

"Er det sådan, at de mest ivrigste påfugle med den flotteste hale får de bedste damer først?"

Andre faggrupper

Det er ikke kun blandt biologer, der er problemer med at bruge matematik korrekt.
For ikke så lang tid siden var der en forsker fra KU, der fandt 150(så vidt jeg husker) videnskabelig godkendte artikler om kemi, hvor der var brugt en matematisk formel, som ikke kunne bruges i den aktuelle situation.
Her på videnskab har der været nævnt, at der bruges ikke retfærdiggjort statistik i PISA testene.
Jeg har selv været indblandet i sager, hvor etnologer, ingeniører og en fysiker, har brugt uanvendelig, uegnet eller misforstået statistik

Seneste fra Miljø & Naturvidenskab

Annonceinfo

Det læser andre lige nu

Annonceinfo

Annonceinfo

Abonner på vores nyhedsbrev

Når du tilmelder dig, deltager du i konkurrencen om lækre præmier.
Annonceinfo

Seneste kommentarer

Seneste blogindlæg