Internationalt Melodi Grand Prix bliver dansk kulturarv
Danske forskere er i gang med at høste al information om årets internationale Melodi Grand Prix fra nettet og gemme det i et arkiv over dansk kulturarv. Målet er at sikre god historisk forskning – men forskerne er faktisk også ved at lære at forudsige vinderen flere måneder før finalen.

Voila - et styk dansk kulturarv, serveret af Aram MP3, det armenske bidrag til årets Eurovision, også kaldet det internationale Melodi Grand Prix, i Danmark. (Foto: Jakob Boserup, DR)

Hvis du gerne vil tjene gode skejser hos bookmakerne i forbindelse med et internationalt Melodi Grand Prix, vil du nok blive en smule varm ved tanken om den forskning, der i øjeblikket bliver lavet ved Det Kongelige Bibliotek og Statsbiblioteket.

I København og Aarhus sidder forskere og kuratorer og gennemtrawler alt – vitterligt alt – der bliver lagt ud på internettet, som vedrører den største mediebegivenhed på dansk grund i årevis:

  • hver eneste besked på Twitter
  • åbne Facebook-konti og andre sociale medier
  • hver en hjemmegjort YouTube-video, hvor fans har lagt lydsporet fra en sang ind over en video
  • fansider og blogs
  • bookmaker-odds og
  • nyheder, der bliver sendt ud på rejse i verdens informationshav

Armenske videoer bliver en del af dansk kulturarv

Vi taler altså indhold, der bliver lagt ud over hele kloden. Og det bliver alt sammen lagret og samlet på Netarkivet.dk – en kæmpe arkiv over den danske digitale kulturarv.

Jep, den danske kulturarv dækker åbenbart også alt det indhold, der bliver lavet i andre dele af verden, for eksempel når en armener laver en mashup-video over temaet Vampire Diaries til tonerne af det armenske bidrag til årets Eurovision, som afvikles i Danmark.

Det bliver i hvert fald som et forsøg betragtet som dansk kulturarv i det igangværende projekt, fortæller den ansvarlige forsker, Henrik Smith Sivertsen.

Historieskrivning er kun så god som kilderne, den bygger på

»Vi har kæmpet lidt med de sædvanlige afgrænsninger af, hvad der er dansk. I denne sammenhæng er det den største internationale begivenhed, der finder sted på dansk grund, og vi ved ikke, hvem der vinder eller hvad der har afgørende betydning for, hvem der vinder. Og hvis vi ikke indsamler alt, hvad vi kan om vindermelodien, som vi jo ikke kender, ville det være ærgerligt for forskere, der om 50 år går tilbage for at analysere begivenheden, at vi har udelukket en del af internettet.«

»Det er så svært at afgrænse, hvad der er dansk, tysk, svensk og internationalt, for det hele flyder sammen. Derfor tager vi så meget som muligt med,« beretter Henrik Smith Sivertsen, forskningsbibliotekar ved Det Kongelige Bibliotek.

»Som kulturarvsinstitution er vi forpligtet til at sørge for kildemateriale, så man kan forske i, hvad der er sket på et bestemt tidspunkt i historien. Historien bliver ikke bedre, end de kilder der er til rådighed. Hvis vi ikke har et ordentligt grundlag, er det kun samtiden, der kan skrive om, hvad der foregår. Og vi ved fra historiefaget, at vi ikke altid i samtiden opdager, hvad der er vigtigt,« siger Henrik Smith Sivertsen.

Kan man forudsige vinderen langt tid før finalen i Eurovision?

Fakta

Forskellige metoder til at høste informationer fra nettet

Helt overordnet benytter forskerne sig af forskellige måder at suge informationer ud af nettet på.

Normalt vil man lave en ’tværhøstning’ – hvor man bredt forsøger at trawle nettet og hiver en masse dansk indhold op.

I dette tilfælde laver forskerne en ’begivenhedshøstning’, hvor man går mere i dybden og får flere detaljer med.

Du kan læse lidt mere om metoden på Netarkivet.dk

Han nævner som eksempel, at forskere måske vil finde ud af, at vinderen i Melodi Grand Prix reelt bliver fundet flere måneder, før selve finalen finder sted.

Mistanken hviler på et lidt løst, men også empirisk grundlag.

I 2013 besluttede Henrik Smith Sivertsen sig for at begynde at samle internetaktivitet om Melodi Grand Prix sammen i netarkivet over den danske kulturarv, fordi han begyndte at fornemme på livet på internettet, at danske Emmelie de Forest måske ville løbe med sejren i Eurovision i Sverige.

Op til finalen talte man meget om sangen på de sociale medier, folk lavede deres egne videoversioner, og bookmakernes odds faldt på dansk sejr.

»Bookmakernes betydning forekommer evident, for folk spiller på den sang, de tror vinder, og det er nok også den, de stemmer på til sidst. Det ville jeg i hvert fald gøre.«

»Men jeg kunne godt tænke mig at sammenholde odds med YouTube-visninger, de enkelte bidrag på de sociale medier og omtale på internettet generelt og se, om de fortæller, hvor tingene ender på finaledagen,« siger Henrik Smith Sivertsen, der i sin forskning blandt andet har ladet sig inspirere af gode råd fra folk på hjemmesider, der er dedikeret til at give spilletips til Melodi Grand Prix.

Vil homo-udtalelse påvirke resultatet af Melodi Grand Prix?

I år, fortæller Henrik Smith Sivertsen, pegede alt på, at Armenien ville løbe med sejren – men så kom Aram MP3, som Armeniens sanger Aram Sargsyan kalder sig, med en uheldig udtalelse, hvor han kaldte Østrigs deltager Conchita Wursts drag-liv for ’unaturligt’. Det affødte en storm af kritik mod Armeniens deltager.

»I stedet for at cruise frem mod sejren, er det pludselig andre ting, han har skullet forholde sig til, så det er blevet afsindigt mudret. Det, der lignede et selvforstærkende system på nettet, er mere eller mindre slået i stykker. Men han er stadig favorit, og pengene er jo spillet på ham, så det bliver spændende at se, om hans udtalelse får nogen indflydelse,« siger Henrik Smith Sivertsen.

Bud fra forsker: Basim vinder næppe Melodi Grand Prix

Jeg glæder mig, til det er overstået.

Henrik Smith Sivertsen

Henrik Smith Sivertsen har ikke haft tid til at kigge andet end overfladisk på andre tendenser i materialet. Men han fornemmer, at vi skal forberede os på en lille skuffelse, hvis målet er en dansk sejr.

»Hvis aktiviteterne på de sociale medier og YouTube holder stik, skal vi ikke regne med, at Danmark vinder for andet år i træk. Selvom Basim er pænt aktiv og populær på de sociale medier, og videoen er blevet set små to millioner gange, er der ikke mange, der har forholdt sig direkte til den. Der er relativt få kommentarer og stort set ingen fan-videoer. Faktisk står DR selv bag hovedparten af de videoer, der har den karakter,« bemærker Henrik Smith Sivertsen.

Stort arbejde at trawle hele internettet

Sammen med de øvrige medarbejdere i Netarkivet.dk sidder Henrik Smith Sivertsen hver dag og overvåger indsamlingen af internet-informationer, som robotter er sat til at lave.

Det er et kæmpearbejde af flere årsager:

  1. Robotter fanger ikke alt, hvad der sker på internettet, så der er brug for uafhængige søgninger og research for at stykke det hele sammen – og selv det, robotterne samler, er ikke altid brugbart, så forskerne skal løbende sørge for at frasortere oplysninger
     
  2. Brugere af sociale medier, især Twitter, har det med at slette tidligere beskeder. Derfor er det vigtigt at forsøge løbende at fange alle nye beskeder, nærmest i det øjeblik de bliver lagt ud – for de kan være forsvundet senere, og dermed har man ikke længere det rette billede af livet på nettet op til og under Melodi Grand Prix. »Hvis vi først høster noget en time eller døgnet efter, har vi et stort informationstab. Det er superspændende, men også en stor udfordring,« konstaterer Henrik Smith Sivertsen.
     
  3. Forskerne har ifølge Henrik Smith Sivertsen teknologiske udfordringer. Programmer til at indsamle information bygger på en tid, før man indlejrede YouTube-videoer, citater og kommentarer fra højre og venstre på sit eget site. Det gør det meget vanskeligt at gemme indholdet fra websites, hvor indholdet kommer fra et væld af andre kilder.

»Projektet er på den måde også ment som en test på, hvad det kan lade sig gøre at hente og hvor meget manuelt arbejde, det kræver. Vi håber for eksempel, at det gør en forskel, at en forsker løbende sidder og vælger ud, hvad der skal gemmes, men vi ved det ikke,« siger Henrik Smith Sivertsen.

Den danske kulturarv er lukket for offentligheden

Forskeren tilføjer, at dataindsamlinger af det her omfang næppe bliver en fast øvelse i forbindelse med begivenheder året rundt. (Se i øvrigt faktaboksen til højre om metoder til at indsamle data på internettet.)

»Jeg har brugt fire måneder på det her, og selvom mit døgn og min arbejdstid ikke er til at være på hele tiden, så er det jo netop pointen med at fange tidsbilledet lige nu. Så jeg glæder mig, til det er overstået,« bemærker han.

Du har desværre ingen mulighed for at kigge forskerne over skuldrene, mens de arbejder. Netarkivet.dk er ganske vist en del af den danske kulturarv, men da det sammenkører store mængder data – også personlige data – er det omfattet af persondataloven og skal holdes lukket for offentligheden.

Du er nødt til i stedet at holde øje med, hvad forskernes finder ud af. Endnu en god grund til at læse Videnskab.dk så tit som muligt.

Lyt på Videnskab.dk!

Hver uge laver vi digital radio, der udkommer i form af en podcast, hvor vi går i dybden med aktuelle emner fra forskningens verden. Du kan lytte til den nyeste podcast i afspilleren herunder eller via en podcast-app på din smartphone.

Har du en iPhone eller iPad, kan du finde vores podcasts i iTunes og afspille dem i Apples podcast app. Bruger du Android, kan du med fordel bruge SoundClouds app.
Du kan se alle vores podcast-artikler her eller se hele playlisten på SoundCloud

Det sker