Big data giver gladere børn og bedre busruter
Nye databaser og enorme arkiver gør det nemmere at hjælpe udsatte børn, at lave bedre cykelruter og busplaner og åbner århundreders aviser for sprogforskere.

Big data er håndteringen af enorme datamængder på en skala, der ikke tidligere har været mulig. De nye data kan hjælpe med alt fra at gennemsøge mikrofilm til at sende skolebørn i seng til tiden. (Foto: Shutterstock)

En af datalogiens helt store landvindinger i disse år er 'big data', hvilket vil sige de enorme dataarkiver, der giver nye muligheder for forskere, læger, forretningsfolk, bankrådgivere – og dig.

Big data kan bruges til at sikre olieledninger på havbunden, til at forbedre hofteoperationer og til at forhindre oversvømmelser.

Sådan lyder nogle af de mange nye muligheder, der præsenteres på en konference om big data i Aarhus i dag, torsdag 13. november.

På konferencen 'Big Data – Big Impact' vil en række forskere fortælle om, hvordan de i samarbejde med virksomheder skaber nye muligheder med de store datamængder.

»Vi begynder at kunne røre ved nye muligheder. Det er stadig på visionsniveau, men det er bare et spørgsmål om, at der går nogle år, før vi kan gå op i fuld skala,« siger Carsten Obel, der er professor på Institut for Folkesundhed på Aarhus Universitet, hvor han er en del af en gruppe, der forsker i børns trivsel.

Han er en af tre forskere, som Videnskab.dk har talt med forud for dagens konference for at få bud på, hvordan big data er i gang med at forandre vores verden.

Kan vi forbedre børns trivsel?

Carsten Obel og Aarhus Universitet arbejder sammen med 20 kommuner og it-firmaet Opus Consult om projektet Skolesundhed.dk, hvor der indsamles data om børns trivsel for at forbedre den.

»Vi forsøger at forstå, hvilke ting der betyder noget i børns liv for deres trivsel, og om der er nogle af de ting, vi kan justere på,« siger Carsten Obel.

I projektet indsamler han systematisk data om børns trivsel sammen med kommunerne: Børn og forældre indrapporterer selv på hjemmesiden www.skolesundhed.dk, hvordan børnene synes, de har det både fysisk og psykisk, og det kombineres med oplysninger fra sundhedsplejersker.

Data skal hjælpe udsatte børn

Datamængden gør det nemmere at sammenligne klasser og kommuner og finde ud af, hvor en indsats for at stoppe mobning, hjælpe skilsmissebørn eller få teenageeleverne i seng til tiden virker.

»For at tage et eksempel, så er den mentale trivsel for skilsmissebørn ringere end for andre børn i næsten alle de kommuner, vi samarbejder med. Men så er der en enkelt kommune, hvor der ikke er nogen forskel.«

»Her er det som forsker interessant at se på, hvad den kommune gør anderledes som inspiration for et forskningsprojekt, der kan ændre praksis i andre kommuner,« siger Carsten Obel.

Kan sende skoleklasser i seng

Ifølge Carsten Obel er fordelen ved brug af big data i forhold til børns trivsel langt fra kun, at forskerne får mere og bedre data at arbejde med.

Det handler i lige så høj grad om, at sundhedsplejersker – og snart også socialrådgivere og læger – der indsender oplysninger til systemet, får data tilbage igen fra systemets database.

»Når man indrapporterer til nationale registre som for eksempel fødselsregistret, er det envejskommunikation. Men her får du noget tilbage med det samme, som kan bruges i det daglige arbejde. Hvis du vurderer et særligt udsat barns trivsel, vil du have mulighed for at sammenligne med det generelle niveau blandt andre børn både lokalt og nationalt,« siger Carsten Obel.

Vi kan sætte tidligere ind ved de uheldige konsekvenser

Carsten Obel påpeger, at muligheden for at sammenligne, hvordan børn har det, også gør det lettere at sætte målrettet ind, hvor der er behov for det helt ned på klasseniveau – det kan være et redskab i forhold til en indsats over for mobning, hvis mange børn har det skidt.

Det kan også være sundhedspædagogisk, hvis man kan se i dataene, at eleverne i en klasse får meget mindre søvn i dagligdagen end andre klasser.

»På lang sigt kommer arbejdet med data til at skabe mulighed for at knytte viden meget tættere til handling. Vi tror virkelig på, at tidlig investering i mental sundhed hos børn er noget, der kan generere meget for samfundet, fordi man vil kunne sætte tidligere ind ved nogle af de uheldige konsekvenser for børn, der over lang tid ikke trives,« siger Carsten Obel, der håber at kunne udbrede projektet til mange flere kommuner over de næste år.

Enormt avisarkiv giver forskere nye muligheder

Et andet projekt, der kan opleves på konferencen i dag, er et massivt arbejde med at digitalisere millioner af avissider.

Projektet udføres af Statsbiblioteket, som allerede har digitaliseret tre millioner avissider, og om tre år vil nå op på 32 millioner.

Tonny Skovgård Jensen, der er områdedirektør for nationalbiblioteksområdet på Statsbiblioteket, forklarer, at de scannede billeder af avissider bliver analyseret af OCR-software.

Det er programmer, der kan genkende ord på et billede og omdanne billederne, som kun kan læses af mennesker, til tekst, der kan søges i af søgemaskiner.

»Det særlige ved big-data-perspektivet er, at du kan bruge andre metoder til at søge. Hvis du sætter dig på læsesalen og kigger på mikrofilm, er det kun muligt at nå igennem et ret begrænset materiale. Men ved at få adgang til en database er det pludseligt muligt at få svar på helt nye spørgsmål,« siger Tonny Skovgård Jensen.

Håber, at forskere vil gøre brug af enormt tekstkorpus

Tonny Skovgård Jensen ser en række perspektiver for forskere, der vil bruge materialet.

Man vil kunne lave politiske analyser af, hvordan holdningen til for eksempel abort har ændret sig i avisspalterne over årene, og forskere inden for lingvistik og sprogvidenskab vil kunne bruge datamængden til at lave analyser af, hvordan sproget har udviklet sig.

»Vi har aviser tilbage til 1668, og selvom der er relativt få tekster fra den periode, så har vi en betydelig mængde tekst, når vi når frem til 1800-tallet og 1900-tallet. Det er noget, som for sprogforskere vil kunne give anledning til forskningsprojekter,« siger Tonny Skovgård Jensen.

Han påpeger, at dataloger også kan bruge den meget store datamængde til at blive klogere på, hvordan man bedst muligt kategoriserer data, og forskere, der arbejder med OCR-teknikken, kan udvikle teknikken, der stadig ikke er perfekt.

»Vi håber at kunne tiltrække forskere, som kan se et perspektiv i at bruge det enorme tekstkorpus, der kommer ud af det, til at forske i,« siger han.

Trafikken kan planlægges ud fra smartphone-data

I Herning er det ikke gamle aviser, men nye smartphones, der leverer data. Her indsamler forskere store mængder data om herningensernes cykelvaner som led i cykelkampagnen 'Herning cykler til månen t/r' – byens borgere kan downloade en app til deres telefon, der registrerer deres cykelruter anonymt.

»Vi kan se, hvor og hvor meget folk cykler i Herning, og vi kan se, hvor folk vælger ikke at cykle – det kan beslutningstagere i kommunen bruge til at vurdere, om der kan laves bedre muligheder for at cykle i de områder,« siger Kaj Grønbæk, der er professor på Institut for Datalogi på Aarhus Universitet og en del af projektet.

Appen indsamler data om telefonens placering og kan dermed følge folks cykelruter. Målinger på telefonen af GPS-position og af acceleration og vibrationer er med til at fastslå, om der er tale om en cykeltur eller en tur i bilen, og algoritmer på en server analyserer derefter det hele og sorterer bilture fra cykelture.

På den ene side gør indsamlingen det muligt at engagere folk i cykelkampagnen, på den anden side skaber det ny viden for kommunens trafikplanlæggere.

»De samme metoder, som vi bruger her, kan bruges til mange andre trafikanalyser. For eksempel kan man bruge metoderne til at planlægge busruter, for man kan sende en app ud og få et datagrundlag på, hvor folk bruger busserne, og hvor de ikke gør. På den måde kan man få idéer til at lægge nye busruter,« siger Kaj Grønbæk.

Big data ændrer vores liv

Kaj Grønbæk ser også potentiale for at bruge telefondata til planlægning på nationalt niveau, fordi de fleste altid har en telefon på sig – den eneste forudsætning er, at man kan motivere folk til at downloade en app, der sender oplysninger til forskerne, som man har kunnet i forbindelse med cykelkampagnen i Herning.

Kaj Grønbæk mener, at potentialet for nye løsninger, der bruger big data, vil påvirke både virksomheder og alle os andre i fremtiden.

»Big data kommer til at ændre den måde, vi lever på, for vi samler og bruger mere data om os selv, om vores miljø, sundhed og motion. Samtidig vil virksomheder kunne udbyde produkter, der lærer at tilpasse sig brugernes behov på helt nye måder,« siger Kaj Grønbæk.

Kaj Grønbæks forskning er sammen med Carsten Obels og Tonny Skovgård Jensens projekter blandt en lang række præsentationer på 'Big Data – Big Impact'-konferencen i Aarhus i dag.

Du kan læse mere om konferencen og de forskellige forsker-præsentationer ved at klikke her.

Big data er meget store datasæt, som det i stigende grad bliver muligt at indsamle for myndigheder, virksomheder og forskere, der opbevarer og analyserer alt fra data om vores købsvaner til data fra vores mobiltelefoner, fra vores hjerterytme til vores privatøkonomi.

Det særlige ved big data er, at datasættene ofte er så store, at computere ikke bare kan gå igennem hvert eneste stykke data, når man skal søge på noget – og datamængden vokser fortsat hurtigere end computerkraften gør det. Der er derfor brug for avancerede algoritmer udviklet af dataloger for at trække data ud af datasættene.

Når man har data om et meget stort antal mennesker, køb eller banklån, bliver det muligt at sammenligne en situation, man er i, med hvad der er sket i lignende situationer. Har en læge en patient med en ukendt sygdom, kan man sammenligne symptomerne med andre patienter, der har haft samme symptomer, og få svar på, hvad de fejlede, og hvad der hjalp dem. Køber du en bog på 

Lyt på Videnskab.dk!

Hver uge laver vi digital radio, der udkommer i form af en podcast, hvor vi går i dybden med aktuelle emner fra forskningens verden. Du kan lytte til den nyeste podcast i afspilleren herunder eller via en podcast-app på din smartphone.

Har du en iPhone eller iPad, kan du finde vores podcasts i iTunes og afspille dem i Apples podcast app. Bruger du Android, kan du med fordel bruge SoundClouds app.
Du kan se alle vores podcast-artikler her eller se hele playlisten på SoundCloud