Annonceinfo

Når forskere bedømmer forskere

Peer review eller fagfællebedømmelse, som det hedder på dansk, består i nogle få, ret enkle metoder til at evaluere videnskabelige meritter.

Peer review bliver fortrinsvis brugt i vurderingen af videnskabelige artikler og forskningsansøgninger.

Eftersom publikationer og bevillinger er altafgørende for at fremme forskeres egen videnskabelige karriere, er peer reviewet af helt grundlæggende betydning for forskningen og for forskerne.

1.000 arbejdsår hver uge

Det er som regel forskerne selv, der varetager peer review. Meningen er, at forskere skal udsætte deres arbejde og ideer i form af artikler og ansøgninger for kritisk vurdering blandt deres fagfæller. Derved opnår man i princippet en retfærdig kvalitetssikring og fælles højnelse af forskningsniveauet.

Peer review er yderst ressourcekrævende. Et af de mest udbredte citationsværkstøjer, ISI Web of Science, registrerer hver uge 24.200 nye artikler inden for naturvidenskab (19.000), samfundsvidenskab (2.900) og humaniora (2.300). Omkring halvdelen af alle indsendte artikler afvises som følge af peer review, og det betyder, at mere end 50.000 artikler skal gennem peer review ugentligt.

Typisk involverer et peer review to-tre faglige bedømmere plus mindst én person i tidsskriftets redaktion. Hvis vi løseligt anslår, at de tilsammen bruger en uges arbejde, "koster" peer review 50.000 videnskabelige arbejdsuger eller godt 1.000 arbejdsår - om ugen!

Virker det?

De fleste forskere priser peer review, ofte som det mindst ringe kvalitetssikringssystem. Mange vil dog også anerkende, at der er problemer forbundet med peer review.

Der findes mange undersøgelser af kvaliteten af peer review (se oversigt i DeVries, Marschall & Stein 2009). Nogle forskere har kigget på udvalgte artikler før og efter, de har været gennem peer review. Her er den generelle konklusion, at artiklerne rent faktisk bliver bedre på en række punkter.

I andre undersøgelser indgår der artikler, der allerede har været publiceret, og som bliver genindsendt uændret eller med indsatte fejl til tidsskrifter. En undersøgelse foretaget med tolv uændrede artikler, som er trykt i anerkendte tidsskrifter inden for psykologi, viste, at 89 % af artiklerne blev afvist ved genindsendelse, blandt andet på grund af alvorlige metodefejl.

En anden undersøgelse indsendte en konstrueret artikel indeholdende ti større og tretten mindre fejl til en medicinsk artikeldatabase. Her overså alle bedømmere (i alt 199) omtrent 2/3 af artiklens fejl.

Nepotisme og kønsdiskrimination

Ydermere kan man også vurdere peer review ved at se på enighed mellem forskellige bedømmere inden for samme fagområde. Det er selvfølgeligt umuligt at opnå fuldkommen enighed i en bedømmelse.

Faktisk har det vist sig, at der generelt hersker meget lav enighed blandt bedømmerne af samme artikel. Graden af enighed befinder sig i mange undersøgelser kun lige over, hvad man ville have fundet, hvis bedømmelserne havde været rent tilfældige.

Endelig kan man også undersøge peer reviewets systematiske fejl. En nylig svensk undersøgelse af ansøgninger til det medicinske forskningsråd påviste en vis nepotisme i bedømmelserne. De ansøgninger, som var underskrevet af forskningsledere med en relation til bedømmerne, opnåede statistisk set 15 % højere score end andre ansøgninger.

Undersøgelsen påviste også, at ansøgninger fra kvindelige forskningsledere fik 10 % bonus i forhold til ansøgninger skrevet af mandlige forskningsledere (Sandström & Hällsten 2008).

Hvor kommer det fra?

Den første dokumenterede anvendelse af noget, der har mindelser om moderne peer review, finder man i en bog om lægeetik skrevet af den arabiske forfatter Ishap bin Ali Al Rahwi. Han levede år 854-931.

Bogen angiver retningslinjer for, hvordan læger bør udlevere kopier af noter og diagnoser til det lokale lægeråd, som efterfølgende kan gennemføre en faglig bedømmelse af lægernes arbejde (Spier 2002).

Brug af peer review i forbindelse med videnskabelige tidsskrifter opstod i Storbritannien i det 17. og 18. århundrede. Redaktøren af tidsskriftet Philosophical Transactions of the Royal Society, Henry Oldenburg, anvendte fra og med oprettelsen i 1665 faglig bedømmelse af alle artikler.

Bedømmelse blev dog primært foretaget af Oldenburg selv og de fagfolk, hvis hjælp han selv mente, det var hensigtsmæssigt at opsøge.

I 1731 indførte Royal Society of Edinburgh et udvalgt korps af faglige bedømmere, hvis kritiske bedømmelser skulle være vejledende for redaktøren i udgivelsen af artikler. Samtidigt var det et krav, at bedømmerne skulle være anonyme for artiklens forfatter(e). Det var starten på peer review, som vi kender det i dag.

Hvad er det?

Som nævnt finder peer review anvendelse i forskellige sammenhænge. Nogle former for peer review foregår helt anonymt (hverken forfatter eller bedømmer kender hinanden), mens andre kun involverer anonymisering af den ene part.

Peer review er både en faglig og en kollektiv proces. Inden for videnskabssociologi er peer review ofte blevet beskrevet som en procedure, hvorigennem der etableres en distributiv retfærdighed og enighed i forhold til, hvad der gælder som god videnskab.

Det betyder, at forskere i det store hele får den bedømmelse for deres arbejde, som de forventer. Og det betyder i sidste ende, at standarden for, hvad god videnskab er, afhænger af, hvad det samlede forskersamfund mener.

Ideen om, at peer review skulle være anvendelsen af fælles, accepterede regler for god videnskab, er dog nok lidt for ideel. En interviewundersøgelse af 81 fagfællebedømmere inden for samfundsvidenskab og humaniora har påpeget, at bedømmerne foretager deres bedømmelse ud fra en vurdering af, hvilke standarder, de mener, passer bedst til det foreliggende videnskabelige arbejde.

Der foretages altså hele tiden en konkret tilpasning af de faglige standarder i forbindelse med peer review. Der findes ikke et sæt alment accepterede regler for, hvordan det skal gøres.

Ikke altid anonymisering

Dobbelt anonymisering er helt sikkert en fordel, for det kan være med til at fjerne enhver tvivl om kønsdiskrimination. Man kan dog ikke altid anonymisere fagfællebedømmelsen, fx når det gælder jobansøgninger. Her er der dog for nylig fundet ny evidens for, at køn ikke spiller en rolle i bedømmelsen, se:
http://blogs.nature.com/peer-to-peer/2009/06/no_gender_bias_identified_in_p_1.html

Godt mod kønsdiskrimination

Nepotismen vil man desværre nok aldrig kunne aflive – især ikke i meget små forskningsmiljøer. Men fagfællebedømmelse er stadig den ”mindst ringe” løsning.
Måske ville man kunne undgå noget af bøvlet ved at gøre ansøgerne anonyme, så bedømmerne ikke ved hvem de er?
Det har i hvert fald hjulpet betragteligt på grimme tilfælde af kønsdiskrimination overfor kvindelige artikelforfattere indenfor biovidenskaberne.
Budden og kolleger offentliggjorde sidste år et interessant studie, der viste at der aktivt diskrimineres mod artikler skrevet af kvinder (Budden et al. 2009). Diskrimineringen ophørte i det øjeblik, bedømmerne ikke kunne se, hvem der havde skrevet artiklen. Kort fortalt lavede forfatterne en statistisk baseret undersøgelse af hvad indførsel af forfatteranonymitet i 2001 på tidsskriftet Behavioral Ecology betød for kønsfordelingen blandt de udgivne artikler. De undersøgte hvor mange artikler, der havde en kvinde som førsteforfatter for perioden 1997-2000 (før indførsel af forfatteranonymitet) og 2002-2005 (efter indførslen). Som uafhængig kontrol i deres undersøgelse brugte de et andet tidsskrift indenfor adfærdsøkologi, Behavioral Ecology and Sociobiology, der ikke anonymiserede forfatterne under bedømmelsen.
Deres resultater viste en kraftig og statistisk signifikant stigning i antallet af udgivne artikler med en kvinde som førsteforfatter på hele 7,9 % (syv-komma-ni procent!) i Behavioral Ecology efter ændringen i bedømmelsessystemet. I kontroltidsskriftet Behavioral Ecology and Sociobiology skete der ingen ændring. Samtidig viste statistiske undersøgelse af fire andre tidsskrifter indenfor samme fagområde, at der ikke skete nogen overordnet ændring i mængden af kvindelige forfattere i samme periode.
Den triste konklusion er, at hvis bedømmeren *ikke* kender førsteforfatterens køn, så har artikler skrevet af kvinder nemmere ved at blive godkendt til udgivelse. En personlig, subjektiv tolkning er, at der desværre sidder en flok mandschauvinistiske klaphatte, der per rygrad aktivt modarbejder deres kvindelige kollegers publikationer.
Og så kan man jo spekulere på om det samme sker indenfor andre fag…
Videre læsning:
Budden, A.E., Tregenza, T., Aarssen, L.W., Koricheva, J., Leimu, R. & Lortie, C.J. (2008): Double-blind review favours increased representation of female authors. TRENDS in Ecology and Evolution 23 (1), s. 4-6
 

Log ind eller opret konto for at skrive kommentarer

Seneste blogindlæg

Udgiv indhold
  • Overdrivelse fremmer forståelsen

    Journalister er gode til at give deres historier samfunds- og personlig relevans, til at inddrage flere meninger om samme sag og til at...
  • Forskningskommunikation 2.0

    Det er snart syv år siden, at Videnskabsministeriets Tænketank vedrørende forståelse for forskning barslede med en...
  • Forskningsansøgninger – hvordan bedømmes de bedst?

    Peer review (dansk: fagfællebedømmelse) bliver ofte anset for at være videnskabernes gyldne standard. Forskningsartikler...
  • Videnskabens rette plads

    I sin 2009-tiltrædelsestale sagde præsident Obama, at han ville “restore science to its rightful place”. Han...

Kristian H. Nielsen

Blogger om:

Jeg interesserer mig for forholdet mellem forskning og samfund. I det fremspirende vidensamfund er det vigtigt, at vi forstår og værdsætter forskningens centrale betydning for stort set alle samfundsområder. Jeg skriver om den historiske udvikling af forskningens rolle i samfundet, og jeg undersøger måder, hvorpå vi kan analysere forskning, samfund og forskningskommunikation i dag.

Du kan læse mere om min forskning her.

Andre bloggere i Teoribloggen:
Mikkel Willum Johansen
Claus Emmeche