»Det er absolut nødvendigt og absolut utilstrækkeligt!«
Sådan udtaler professor i molekylær- og cellulær biologi på Harvard University i USA Florian Engert sig om big data.
Han provokerer andre forskere i feltet med sine kontroversielle synspunkter om, at de store big data-projekter, der lige nu er i gang for at kortlægge hver enkelt neuron i hjernen, fokuserer på de forkerte mål.
Ifølge ham skulle fokuset ikke være på at indsamle big data, men på at producere mindre, mere brugbare dataset.
LÆS OGSÅ: Forskere skal afsløre farerne ved 'big data'
Big data gør arbejde spildt
Big data dækker over indsamling, opbevaring, analyse og fortolkning af enorme mængder data.
»Big data er alt det, der ikke kan være på en bærbar computer, og som man ikke kan bære rundt på i ens lomme. Det er et begreb i bevægelse - hvad vi anså som big data for 20 år siden er idioti nu,« siger Florian Engert i videoen.
Nogle af dem, der har med virkelig store mængder data at gøre, er Google, Facebook, geologer, meterologer og neurologer.
Begrebet bruges ofte i forbindelse med virksomheder og myndigheders indsamling af personinformationer. Eksempelvis bliver din søgehistorik på nettet indsamlet til store databaser, som både kan bruges til konstruktive tiltag men også udgøre enorme risici, hvis dataen lækkes.
I videoen oven for ses et live-interview, ScienceNordic har lavet med Florian Engert til den store hjerneforskningskonference FENS, der blev afholdt i Bella Center København i juli 2016.
Her forklarer han, at et af problemerne ved at indsamle enorme mængder af data for at kortlægge hjernen er, at meget af det indsamlede rådata vil blive smidt væk, og der derfor vil være en masse spildt arbejde.
»Hele indsatsen omkring at forberede verden på at kunne indsamle disse massive datastrømninger, synes jeg, er dårligt prioriteret. Hvad, vi i stedet burde gøre, er at bruge en lille del af denne indsats på at optimere udvindingen og bearbejdningen af dataen,« siger Florian Engert i videoen.
LÆS OGSÅ: Big data giver gladere børn og bedre busruter
Big data er unødvendigt
Ifølge Florian Engert er det altså nytteløst at indsamle så meget data som overhovedet muligt om hjernen, hvis man ikke kan omdanne dataen til viden.
Faktisk burde man så hurtigt som muligt gøre den brugbare data mindre, når man har indsamlet den, før den distribueres ud til folk.
»Det er derfor, jeg ikke synes, vi har brug for big data – fordi det kun er små dele af den, der indeholder relevant information og er nødvendig at distribuere ud til folk,« siger han.
LÆS OGSÅ: Cloud computing: Er dine data sikre nok?
To store big data-projekter
Florian Engert ledte det forskerteam, der for første gang producerede et fuldt billede af neuroners aktivitet i hjernen. Ikke i den menneskelige hjerne, men i hjernen på en gennemsigtig baby-zebrafisk. Et studie, der i 2012 blev publiceret i det anerkendte tidsskrift Nature.
Det bemærkelsesværdige er, at Florian Engert lige nu selv arbejder for to af de store forskningsprojekter, der indsamler big data til en kortlægning af hjernen. Projekterne er:
-
The Open Connectome Project. Dette projekt sigter mod at producere et ’ledningsdiagram’ over hjernen for at forstå forbindelsen og kommunikationen mellem neuronerne. Der udvikles algoritmer, der kan identificere hjernens 100 billioner synapser, hvilket ville være umuligt at gøre manuelt.
-
The BRAIN initiative. Dette projekt fokuserer på at udvikle den teknologi og de redskaber, der skal til for at måle neuroners aktivitet – ideelt set i levende, vågne subjekter med normal adfærd.
En måde at forstå sammenhængen mellem de to projekter lidt bedre er ved at forestille sig, at ’Open Connetome Project’ laver et kort over vandrørene i et hus, og at ’BRAIN Initiative’ beregner, hvor meget vand, der distribueres rundt i huset.
LÆS OGSÅ: Politikerne er handlingslammede: Big data-forskning har overhalet lovgivningen
Når metoden bliver optimeret, vil big data uddø
Men Florian Engert har en vision om at optimere disse big data-projekter. I en videnskabelig artikel med hans kritik af big data, publiceret i tidsskriftet Neuron, skriver han:

Florian Engert skiller sig ikke bare ud i forskningsverdenen med sin kritiske holdning til big data. Da han i 2009 skulle tale offentligt om sin forskning, rådede en kollega ham til at droppe sin muskel-tanktop og tage noget mere formelt på. Det gjorde han så - han iførte sig lædershorts og knæstrømper. »Det her er er den formelle dragt hos bayerske stammer,« sagde han, da han indtog scenen. (Foto: Privat)
»Den essentielle ingrediens, der laver et ubrugeligt kort om til en uvurderlig ressource, er det eksperimentelle design over, hvordan den underliggende data indsamles og analyseres.«
Hele metoden for, hvordan man udvinder den information, man har brug for fra det rå datamateriale, bør altså optimeres, mener han.
LÆS OGSÅ: Danske forskere bag verdens største genom-projekt
Som det ser ud nu, bliver dataens størrelse nemlig reduceret med en faktor ti til hundrede tusind, så snart man har udvundet den information, man vil have fra det rå datamateriale: For eksempel kommunikation mellem celler eller neuroners adfærd.
»Når vi en dag har optimeret udvindingsprocessen - og automatisk får information om neuroners adfærd og ’ledningsdiagrammer’ ud af elektronmikroskoperne – vil der ikke længere være noget, der hedder big data,« siger Florian Engert i videoen.