Big Data: Danske forskere udvikler værktøj, der sorterer i datajunglen
14 oktober 2015

KORT NYT FRA DANMARK:

Hvert sekund gemmer internettet trillioner af små databidder om dig og mig, men al denne data giver ingen mening, hvis man ikke ved, hvordan man skal sortere i den. Nu præsenterer forskere fra SDU et redskab, der kan hjælpe andre forskere med at sortere i data-junglen. Det skriver de i en pressemeddelelse.

Forestil dig for eksempel, at du forsker i overvægt, og at du har enorme mængder data gemt på en server om, hvad overvægtige spiser, hvornår de spiser, og hvordan de sover.

Her kan du for eksempel bede computeren om at sammenligne ændringer i vægt med antallet af spiste sandwich, og herefter en ny sammenligning - og endnu en. På den måde kan du indsamle en stor mængde sammenhænge til din forskning.

Eller: Du kan gøre det hele meget hurtigere - og på en måde, der får dig til at opdage sammenhænge, som du ikke selv havde tænkt på. For eksempel, hvis patienter, der spiser sandwich med gouda ost, taber sig hurtigere end patienter, der spiser cheddar.

Det er netop, hvad metoden kaldet ‘clustering’ ifølge forskerne fra SDU er i stand til. Her beder man nemlig computeren selv om at gruppere objekter, der deler fælles træk.

»I dag er der hundredevis af forskellige ‘clustering’-værktøjer derude, men hver af dem kræver en meget specifik opsætning og ofte en dyb forståelse af algoritmen, som ligger bag. Der er ikke noget overblik over, hvad der findes derude, hvad der bør bruges hvornår, og der er ingen objektiv sammenligning af mulighederne,« forklarer professor ved Practical Computer Science and Bioinformatics på SDU, i en pressemeddelelse.

Derfor har han og hans kolleger udviklet et værktøj, der giver et overblik over de eksisterende cluster-værktøjer så forskere nemmest kan afgøre, hvilke værktøjer, de skal bruge.

Det nye værktøj hedder ClustEval og kan findes her.

Læs også:

Politikerne er handlingslammede: Big data-forskning har overhalet lovgivningen

Forskere skal afsløre farerne ved 'big data'

Ovenstående er udvalgt og resumeret af Videnskab.dk, men redaktionen har ikke udført selvstændig research. Gå til den oprindelige kilde for flere detaljer.
ams

Ovenstående er udvalgt og resumeret af Videnskab.dk, men redaktionen har ikke udført selvstændig research. Gå til den oprindelige kilde for flere detaljer.