Mens ebola-epidemien var på sit højeste i 2014, kæmpede big data-forskere for at få adgang til data fra lokale mobiltelefoner i en række af de ramte lande. Mange teleselskaber strittede imod. De ville ikke bare udlevere deres kunders private oplysninger.
Men teleselskabet Orange Telecom udleverede anonyme oplysninger fra 150.000 mobilbrugere i Senegal og forskere kunne ved hjælp af folks private geo-data se, hvor folk i de ebola-ramte områder bevægede sig hen.
»Det var en fascinerende historie. Det var en af de første gange, mobildata blev brugt til at kontrollere en epidemi og det var ret effektivt,« fortæller Effy Vayena, forsker i biomedicinsk etik på Universität Zürich i Schweiz. Når forskerne kunne se, hvor folk tog hen fra de ramte områder, kunne de hjælpe med at forudsige, hvor der var mest brug for nødhjælpsarbejdernes begrænsede ressourcer, eller hvor der var behov for at indføre rejseforbud.
Datasæt er blevet tilgængelige overalt
Dilemmaet, der opstod i Vestafrika mellem folks ret til privatliv og hensynet til at bekæmpe en epidemi, er blot et af flere spørgsmål, der er opstået i kølvandet på big data-forskningen, mener Effy Vayena.
I en ny artikel i tidsskriftet PLOS Computational Biology beskriver hun sammen med en række kollegaer de særlige udfordringer, som opstår, når big data – kæmpe datasæt der indsamles om os alle sammen – skal bruges til at bekæmpe epidemier (se hvordan big data har været brugt i faktaboksene).
»Datasæt er blevet tilgængelige overalt, og vi kan bruge dem til at opdage udbrud af sygdomme. Det er meget brugbart, for hvis vi er hurtige til at identificere en sygdom, så kan vi forhåbentlig også være hurtigere til at adressere problemet og gøre noget ved det. Samtidig kan man bruge dataen til at forudsige, hvordan sygdomme vil udvikle sig, og hvis du ved, hvor sygdommen bevæger sig hen, kan du være klar til, at den kommer,« siger Effy Vayena.
Big data – enorme datasæt bestående af vores mobildata, data fra vores browsere, vores kreditkort-handler og meget andet – bliver i stigende grad brugt inden for marketing, byplanlægning og sundhedsvæsnet. Forskere arbejder også på at bruge big data til at forudsige og bekæmpe epidemier.
Mulighederne for at bruge data til at bekæmpe epidemier er opstået, fordi kæmpe datasæt nu bliver indsamlet samtidig med at big data-forskningen de seneste år har været i rivende udvikling. Så rivende, mener forskerne bag artiklen, at lovgivningen og den offentlige debat om mulighederne – og dilemmaerne – ikke har kunnet følge med.
»Vi har fået en god ressource, og vi bør bruge den af hensyn til folkesundheden. Men vi kan ikke bare kaste os ud i det. Vi er nødt til at være opmærksomme på en række ting, og derfor er big data-diskussionen meget vigtig. Det er et nyt felt, og vi har ikke en masse erfaring,« siger Effy Vayena.
Politikere: Et svært dilemma
Men hvilke muligheder og begrænsninger skal der være for forskerne? Det har Videnskab.dk spurgt forskningsordførerne fra landets tre største partier om. Hverken Socialdemokraterne eller Dansk Folkeparti har klare svar på big data-forskningens dilemmaer, mens Venstres forskningsordfører, Esben Lunde Larsen, skriver i en kortfattet mail, at han ikke har nogen kommentarer 'i øjeblikket'.
»Det er et tema, som vi bliver nødt til at tage alvorligt, for hvordan kan vi have adgang til dataen, samtidig med at vi også har den sikkerhed for privatlivet, vi gerne vil have? Det er noget af et dilemma,« siger Jens Henrik Thulesen Dahl, der er uddannelses- og forskningsordfører for Dansk Folkeparti.
Det er Effy Vayena enig i.
»Politikerne har et virkeligt svært job: Big data er på én gang en stor mulighed og et stort problem. De vil være nødt til at finde en balance, der sikrer, at big data ikke dikterer alt, for så mister vi vores frihed og privatliv, samtidig med skal det være muligt at forske. Det er en problemstilling, politikerne ikke har løst endnu, men de bliver nødt til at forhold sig til den snart,« siger Effy Vayena.

Big data er på én gang en stor mulighed og et stort problem. Man vil være nødt til at finde en balance, der sikrer, at big data ikke dikterer alt. (Foto: Shutterstock)
Videnskab.dk har bedt politikerne om at forholde sig til tre af de dilemmaer, som Effy Vayena og hendes kollegaer peger på i artiklen i PLOS Computational Biology:
- Hvor skal grænsen gå mellem privatlivets fred og hensynet til folkesundheden?
- Skal virksomheder, der ejer data, tvinges til at dele den med forskere?
- Hvad skal der ske, når big data-forskerne tager fejl og udpeger de forkerte som syge?
Dilemma 1: Skal forskere have lov at bruge folks private data?
Da teleselskaber i Vestafrika i 2014 ikke ville udlevere data fra mobiltelefoner til forskere, skyldtes det, at dataen var deres kunders private informationer. De havde oplysninger om, hvem der havde talt og sms'et med hvem, og hvor de havde opholdt sig. Oplysninger der normalt er private. Spørgsmålet er, om udbruddet af en epidemi bør ændre på det.
Politikerne er endnu ikke klar til at trække en klar grænse mellem privatliv og offentlighedens interesse i, at forskerne får adgang. Men Jeppe Bruus, der er uddannelses- og forskningsordfører for Socialdemokraterne, mener, at åbenhed er afgørende:
»Der er nødt til at være åbenhed om, hvilke data man får adgang til, og hvordan man bruger dem. Det må ikke være sådan, at befolkningen kommer i tvivl om, hvilken sammenhæng dataen i virkeligheden kan blive brugt i. For den tvivl skaber utryghed. Men afvejning mellem samfundshensyn og hvad der er privat, er et dilemma, som vi er nødt til at diskutere,« siger Jeppe Bruus.
Heller ikke Dansk Folkeparti er klar til at udstikke en klar retning for forskningsfeltet.
»Det er et rigtigt godt spørgsmål, som jeg ville ønske, jeg havde et helt klart svar på, for der er meget for og imod. Hvis du tager den helt ekstreme situation, hvor man har ebola på vej ud over hele verden, så er jeg tilbøjelig til at sige, selvfølgelig skal man da have adgang. Men dilemmaet er, hvis man åbner sådan en adgang, hvor stopper det så? Hvornår helliger målet midlet? Det er helt klart noget, vi er nødt til at diskutere,« siger Jens Henrik Thulesen Dahl.
Google har med svingende held forsøgt at forudsige influenza-epidemier ved hjælp af Google Flu, der følger, hvor ofte der bliver søgt på influenza-symptomer i bestemte områder. Forskere fra Harvard Medical Center har siden udviklet en mere præcis metode, der forudsiger influenza-udbrud ud fra, hvor mange der læser Wikipedia-artikler om influenza og sundhed i et område. Mens traditionel sundhedsovervågning typisk opdager influenza-udbrud med to ugers forsinkelse, kunne forskerne følge udbrudene næsten i realtid.
Dataen, som Orange Telecom stillede til rådighed i Senegal, var ganske vist anonymiseret, men som Videnskab.dk har beskrevet før, har forskere vist, at det er let at finde ud af, hvem personer er i et anonymt datasæt. Anonymisering er derfor ikke en nem løsning på dilemmaet.
»Når man vil tjene penge på big data, er der bestemte regler for privatliv, der er i kraft. Men når vi har en trussel mod folkesundheden, er konteksten en anden. Spørgsmålet er, om vi bør have andre privatlivsforpligtelser, end når formålet er kommercielt?« siger Effy Vayena.
»Hvis en person har en sygdom, fortæller vi ham, at han skal blive hjemme, selvom man ikke har retten til at fortælle en person det, med mindre han er fængslet. Men vi gør det alligevel for at beskytte samfundet. Den slags overvejelser har vi altid haft inden for folkesundhed, og nu har vi brug for, at det bliver overført til en big data-sammenhæng. Men uden at fjerne privatliv, for privatliv er stadig meget vigtigt,« siger Effy Vayena.
Dilemma 2: Skal dataejere tvinges til at udlevere data til forskere?
Kampen mod ebola i Vestafrika i 2014 peger på et andet dilemma, som Effy Vayena bringer op: Den data, forskerne har brug for, hvis de skal kunne forudsige en sygdoms udbrud og spredning, er ofte ejet af private virksomheder som for eksempel teleselskaberne i Vestafrika.
»Meget af den brugbare data er ejet af virksomheder, og de stiller den ikke til rådighed for folkesundheds-forskere, med mindre vi betaler for den,« siger Effy Vayena. Hun understreger, at der er behov for at have klare retningslinjer for adgang til data, før krisen bryder ud.
»Vi opererer i nødsituationer. Hvis vi har et udbrud af en sygdom, haster det ofte. Det adskiller sig fra forskning i andre ting, hvor man kan vente på at få data. Her er vi nødt til at handle hurtigt,« siger Effy Vayena.
Efter jordskælvet i Haiti i 2010 kunne forskere ved hjælp af data fra to millioner mobiltelefoner følge flygtningestrømmene og folks bevægelser under det efterfølgende udbrud af kolera. Dermed kunne de hjælpe nødhjælpsarbejderne med at prioritere deres ressourcer.
Mobildata har også været brugt i Kenya og Namibia til at forudsige, hvordan malaria ville sprede sig.
I Dansk Folkeparti er Jens Henrik Thulesen Dahl tilbageholdende med at give forskerne mulighed for at kræve data udleveret når som helst.
»Det er en balance i forhold til katastrofens størrelse. Jeg mener som udgangspunkt, at vi må have ret til at styre vores egen data, men det er super, super svært,« siger Jens Henrik Thulesen Dahl. Men han mener, det er vigtigt at finde svaret på spørgsmålet:
»Jeg er enig med forskerne i, at vi er nødt til at diskutere det, og vi er nødt til at finde vej til at håndtere dem, så vi ikke den dag, vi står med en ny ebola eller noget tilsvarende, skal bruge en masse tid på at diskutere, hvordan man så gør,« siger Jens Henrik Thulesen Dahl.
Jeppe Bruus fra Socialdemokraterne er til gengæld klar til at tvinge virksomheder til at udlevere data i tilfælde af en lurende katastrofe.
»Hvis du står i en nødsituation, hvor hele befolkningens liv er på spil, så er det klart, at staten skal have mulighed for at påtvinge private virksomheder at aflevere relevante oplysninger, de sidder med. Der må hensynet til samfundets bedste vægte højest. Men det rejser spørgsmålet om, hvor meget der skal til? Det er svært at lave en regel for,« siger Jeppe Bruus fra Socialdemokraterne.
Dilemma 3: Hvad skal der ske, hvis forskerne tager fejl?
Det tredje dilemma, Effy Vayena peger på, handler om de algoritmer, der gør det muligt at trække brugbare resultater ud af datasæt. Ofte er datasættene så enorme, at man ikke har computerkraft til at gå hvert eneste punkt i dataen igennem – og må nøjes med at analysere et udpluk. I processen er der stadig risiko for fejlkilder.
Under Mexicos udbrud af svineinfluenza i 2009 blev mobildata brugt til at følge, hvordan befolkningen reagerede på myndighedernes advarsler.
Heller ikke her har politikerne en klar løsning på, hvordan problemet skal gribes an.
»Vi må være ærlige og åbent sige at, ja, det kan være, der bliver begået fejl, og det kan være, der er nogle, der uretmæssigt bliver kastet mistanke over. Det kan få konsekvenser for de mennesker. Så må man afveje, hvordan de omkostninger skal fordeles mellem de ramte og staten, og det synes jeg er svært at sætte på formel,« siger Socialdemokraternes Jeppe Bruus.
Også Dansk Folkeparti er åben over for at kompensere folk, der bliver fejlagtigt udpeget af algoritmer.
»Hvis situationen tilsiger, at vi er nødt til at handle på baggrund af halve data, så må vi selvfølgelig også som samfund efterfølgende kompensere i det omfang, det er rimeligt. Spørgsmålet er, hvad kompensationen skal bestå af og hvor meget og hvor lidt det skal være,« siger Jens Henrik Thulesen Dahl.
Risikoen for fejl betyder dog, ifølge Jeppe Bruus, ikke at forskerne skal afholde sig fra at bruge den nye teknologi i nødsituationer.
»I den slags situationer er der behov for, at vi går lidt på kompromis med den sikkerhed, vi normalt stiller som krav. Alternativet er, at vi ikke får afprøvet noget, som kunne have en stor effekt og som kunne være med til at redde rigtigt mange menneskeliv,« siger Jeppe Bruus.
Effy Vayena understreger, at forskningsfeltet er for nyt til, at der kan stilles nogen garantier.
»Inden for big data er det svært at undgå fejl. Hvis vi som samfund er villige til at løbe risikoen for at begå dem, så skal vi også være klar til at rette disse fejl og gøre det muligt for folk at rette information om dem og søge kompensation,« siger Effy Vayena.
Forskerne advarer særligt mod, at big data-resultater kommer til at stå alene – selvom det er her, man kan få de hurtigste resultater – når det skal afgøres, om der skal indføres rejseforbud, hvor lægeindsatser skal sættes ind, om turister skal advares mod at tage til et område, eller om en landmands besætning skal slås ned.
»Det er et nyt felt under udvikling. Vi har bevis for, at det virker godt, men vi har også bevis for, at det stadig kræver fintuning, og det giver os ekstra grund til at være meget forsigtige,« siger Effy Vayena.