Man kan finde svar på snart sagt alt, hvis man går på opdagelse i de enorme mængder data, som findes i informationens tidsalder. Big data, kaldes det, og det er guld værd for organisationer, lande, virksomheder, forskere og andet godtfolk.
Man bruger for eksempel data til at finde ud af, hvad der truer klodens biodiversitet. Store globale datasæt, som rummer informationer om invasive arter, skovfældning, krybskytteri og andre trusler. Men hvor brugbar er den data egentlig?
Det har et hold internationale forskere undersøgt, og resultatet er netop udgivet i det meget anerkendte tidsskrift Science.
Konklusionen er desværre ret nedslående.
Kun fem procent af de 290 datasæt, forskerne har undersøgt, lever op til den guldstandard, som forskerne har defineret.
»Vi er overraskede over, at så få datasæt lever op til det, vi mener er nødvendigt for at opnå guldstandarden. Vi lever i en tid med ’big data’, men vi famler reelt set i blinde, når det drejer sig om at forstå, hvad der truer biodiversiteten,« udtaler studiets hovedforfatter Lucas Joppa, miljøforskningsleder i Microsoft Research, i en pressemeddelelse.
Fem kriterier for guldstandarden
For at leve op til guldstandarden skal datasættene opfylde fem kriterier. Datasættene skal være:
Biodiversitet kan defineres som mangfoldigheden af naturens levende organismer.
Begrebet henviser både til diversiteten af arter inden for et afgrænset område og til den genetiske diversitet blandt arter.
Biodiversiteten er truet af masseudryddelser, da færre arter betyder mindre biodiversitet.
I Science-artiklen vurderes det, at udryddelsen i øjeblikket foregår omkring 1.000 gange hurtigere end den naturlige hastighed for arters uddøen på grund af menneskelig indgriben i naturen.
1. Offentligt tilgængelige.
2. Produceret inden for de sidste 10 år.
3. I passende detaljegrad - for eksempel pixelstørrelsen på geografiske kort.
4. Videnskabeligt gentaget mindst én gang.
5. Valideret for nøjagtighed.
De kriterier kunne kun 14 af de 290 datasæt klare.
Nu er det nødvendigt at understrege, at guldstandarden er defineret af forskerne selv. Måske har de for høje forventninger til, hvad et datasæt skal kunne?
Nej, mener Jonas Geldmann, som udførte studiet som postdoc ved Center for Makroøkologi, Evolution og Klima på Københavns Universitet og i dag er research fellow ved Cambridge Universitet:
»Standarden er sat højt, men ikke for højt. Selv med datasæt, der lever op til guldstandarden, er der uendeligt mange nødvendige og relevante spørgsmål om trusler mod biodiversiteten, vi stadig ikke kan svare på.«
Mange datasæt ejes af private firmaer
De globale datasæt er alle geografiske og omhandler mange forskellige trusler mod biodiversiteten. Det kan for eksempel være data, der viser, hvor invasive arter befinder sig, og hvordan de bevæger sig i landskabet. Eller hvordan landskaber ændrer sig som følge af bebyggelse.
Netop de to er faktisk et par af de trusler mod biodiversiteten, som er dårligt belyst i de eksisterende datasæt. Derudover er der mangelfuld data om træfældning, krybskytteri og ulovlig handel med dyr.
Der er flere årsager til, at kvaliteten af datasættene halter.
Et af de helt store problemer er, at mange ikke er tilgængelige for forskere.
»Mange datasæt udvikles af private aktører, for eksempel mine- og oliefirmaer, som bruger dem til egne formål og måske ikke er interesserede i at gøre dem offentligt tilgængelige. Der findes desværre mange private datasæt, som kan bruges til at løse nogen af verdens store problemer, men som forskere ikke får adgang til,« forklarer Jonas Geldmann.
Et andet stort problem er, at meget få datasæt bliver gentaget.
»Årsagen er, at de personer, der producerer datasættene, måske ikke har lyst til at udføre det samme arbejde igen. De vil gerne arbejde med noget nyt. Men for at kunne lave naturbevarelse er det nødvendigt med nye, og gerne flere, gentagelser af målinger, fordi vi har brug for mere end blot et øjebliksbillede af tingenes tilstand,« siger Jonas Geldmann.
Brug for mere samarbejde om data
Det kommer ikke bag på Henrik Balslev, professor ved Aarhus Universitets Institut for Bioscience, at så få datasæt lever op til forskernes guldstandard:
»Det er næppe overraskende, da datasættene er indsamlet uafhængigt af hinanden i en række centre rundt om i verden, uden at de på forhånd kendte eller anvendte de kriterier, som forskerne her har opstillet.«
»Men de har en god pointe i, at det ville være fint, om datasættene kunne koordineres. Undersøgelsen her er meget nyttig, da den peger på områder, der skal udforskes yderligere, og hvor data i højere grad skal gøres sammenlignelige. Så hvis den kan hjælpe på det plan, har den gjort fin gavn,« siger Henrik Balslev, der ikke har været involveret i det nye studie.
Sådan kan kvaliteten af data forbedres
Forskerne bag det nye studie kommer med en række forslag, der skal forbedre kvaliteten af datasættene.
For det første er der brug for et bedre samarbejde mellem forskningsinstitutioner:
»Vi har brug for ensartede datasæt, og dertil er det nødvendigt med bedre kommunikation og koordinering mellem forskningsinstitutionerne. Ikke mindst mellem de, der producerer datasættene og de, der skal bruge dem til naturbevarelse,« siger Jonas Geldmann.
»Dernæst er det vigtigt, at de private aktører, som samler meget af denne viden ind, bliver bedre til at løfte deres samfundsansvar ved at dele deres data.«
Endelig peger studiet på, at mange eksisterende datasæt kan løftes til guldstandarden ved hjælp af mere finansiering.
Vanskeligt at forbedre datasættene
Løsningerne lyder dog en smule dyre og omfattende, mener Henrik Balslev:

Der er allerede initiativer i gang, som skal forbedre vores viden om truslerne mod biodiversitet. For eksempel arbejder FN-organisationen United Nations Environment Programme – World Conservation Monitoring Centre (UNEP-WCMC) sammen med WWF Verdensnaturfonden om at producere data om både legal og illegal handel med vilde dyr, hvilket er et at de områder, der mangler viden om. (Foto: Colourbox)
»De bygger på en idé om, at verdenssamfundet løfter i samlet flok og har fælles mål og kriterier. Sådan er verden jo ikke. Det koster alt sammen penge, og indsamling af data er derfor afhængig af kriterier, som sættes af donorer og fonde. Det ville være fint at få det koordineret, men det er ikke nogen let opgave.«
Jonas Geldmann er mere optimistisk:
»Det er rigtig nok vanskeligt og jo, det er dyrt, men jeg tror ikke, det er uoverstigeligt. Man skal også huske på, at det skal understøtte målsætninger, vi har forpligtet os til internationalt,« siger han og henviser til FN’s konvention om biodiversitet, der indeholder en række mål for, hvordan biodiversiteten skal være forbedret i 2020.
Initiativer er i gang
Der er allerede samarbejde i gang, som skal forbedre vores viden om truslerne mod biodiversitet.
For eksempel arbejder FN-organisationen United Nations Environment Programme – World Conservation Monitoring Centre (UNEP-WCMC) sammen med WWF Verdensnaturfonden om at producere data om både legal og illegal handel med vilde dyr, hvilket er et at de områder, der mangler viden om.
UNEP-WCMC har også en aftale med den private datavirksomhed IHS om at få adgang til data om olie- og gasaktivitet, som udgør trusler mod biodiversiteten.
Forskerne håber på, at undersøgelsen af kvaliteten af datasættene kan sætte skub i udviklingen.
»Analysen kan bidrage til at forny tilgangen til indsamling og bearbejdning af data om trusler mod truede dyrearter og økosystemer. Det er meget vigtigt, hvis vi for eksempel skal forstå, hvorfor nogle bestande af tigre og elefanter klarer sig bedre end andre,« udtaler Jon Hutton, direktør i UNEP-WCMC.