Kunstig intelligens skal redde det bornholmske sprog: »Om et par generationer er det uddødt«
Arbejdet er en del af et ordbogsprojekt, der skal sikre dialekten for eftertiden.

Okay. Det er ikke helt sådan, det ser ud, når den kunstige intelligens lærer at oversætte fra bornholmsk til rigsdansk. (Foto: Shutterstock)

Okay. Det er ikke helt sådan, det ser ud, når den kunstige intelligens lærer at oversætte fra bornholmsk til rigsdansk. (Foto: Shutterstock)

»Hon e en go pibel. Jâ mener majed om na.« 

»Kjættan e sjøg. Jâ troer a vi bler nøtt te å dânka na.«

Skønne bornholmske sætninger som disse skal man nyde, for de kan være forsvundet fra det talte sprog inden længe (du kan lære betydningen af sætningerne i bunden af artiklen). 

Til gengæld vil man forhåbentligt stadig kunne læse, oversætte og arbejde med bornholmsk.

Det kæmper Alex Speed Kjeldsen, adjunkt Institut for Nordiske Studier og Sprogvidenskab på Københavns Universitet, i al fald for.  

Sammen med Leon Derczynski, adjunkt på IT Universitetet i København og medlem af forskningsgruppen Natural Language Processing, har han udviklet en forløber for en slags Google Translate, der kan oversætte fra bornholmsk til dansk og omvendt.

Meningen er, at det sprogteknologiske værktøj skal puste liv i et ellers dødsdømt sprog.  

»Tanken bag projektet er, at sprog i vores digitale tidsalder vil forsvinde helt, hvis ikke man kan arbejde med dem digitalt,« forklarer Alex Speed Kjeldsen til Videnskab.dk.  

Oversættelsesprogrammet, der tidligst er klar til brug inden et par år, er ét led i et projekt, der går ud på at udvikle en større bornholmsk sprogportal, der skal »give det bornholmske sprog et boost,« tilføjer han.

Du kan se et par af maskinens oversættelser i bunden af artiklen.

LÆS OGSÅ: Computere skal lære menneskets sprog

Det bornholmske sprog uddør

Danske sprogforskere er generelt enige om, at mange danske dialekter synger på sidste vers. 

Derfor forsvinder dialekterne

Flere studier har i de seneste mange år konkluderet, at de danske dialekter har trænge kår.

Ifølge forskerne skyldes det blandt andet:

  • Globalisering og medier. På de sociale medier og internettet er man i kontakt med 'hele verden', og her bliver den lokale dialekt altså ikke sat i spil.
  • Social status. Nogle undersøgelser viser, at man bliver opfandet som mindre intelligent, hvis man taler med dialekt. 

Kilde: DRKristeligt Dagblad, mfl.

Det står dog ekstra grelt til for den bornholmske dialekt.  

»Problemet med bornholmsk er, at det er gået meget hurtigt tilbage, og det er navnligt accelereret inden for de seneste 20 år,« forklarer Alex Speed Kjeldsen og tilføjer:

»En af de vigtigste grunde til, at vi skal i gang nu, er, at der om 10 til 20 år ikke er flere informanter tilbage, som vi kan trække på ved kortlægningen af traditionelt bornholmsk. Det mere traditionelle bornholmsk kommer til at uddø inden for de næste par generationer,« vurderer Alex Speed Kjeldsen, der selv er født og opvokset på Bornholm.

Han har i øjeblikket godt 30 frivillige bornholmere tilknyttet projektet, der alle behersker bornholmsk i mere traditionel form. Gennemsnitsalderen blandt dem er lige over 70 år.   

»Jeg er i 40’erne, og jeg er nok en del af den sidste generation, hvor nogle taler nogenlunde traditionelt bornholmsk. Blandt de yngre generationer bliver det mere og mere udvandet,« uddyber Alex Speed Kjeldsen. 

LÆS OGSÅ: Lingvister har brug for sprogbevaring for at studere sprog som menneskeligt fænomen

Skal sikre bornholmsk for eftertiden

Formålet med den bornholmske sprogmaskine er da heller ikke alene at give kunstigt åndedræt til et sprog, der er på vej til at forsvinde. Den skal også bruges til at sikre det for eftertiden - før det er for sent.

»Vores maskine kan ikke i sig selv forhindre bornholmsk i at uddø, og den kan ikke få de unge til at tale traditionelt bornholmsk, men den kan hjælpe os til at bevare det traditionelle bornholmske som en sproglig kulturarv, fordi den kan indgå som et vigtigt hjælpeværktøj i det bornholmske ordbogsarbejde,« forklarer Alex Speed Kjeldsen. 

Pia Quist, der også er lektor og dialektforsker ved Københavns Universitet, men ikke er en del af projektet, hilser initiativet velkommen. 

»Der mangler i dén grad beskrivelser og systematiske registreringer af bornholmsk,« siger hun og fortsætter: 

»Når det gælder dialektordbøger, har Aarhus Universitet taget sig af de jyske dialekter, og vi i København (på Københavns Universitet, red.) har taget os af Sjælland, Fyn og øerne, men ikke Bornholm.«

LÆS OGSÅ: Sprogteknologi skal sikre dansk mod digital udryddelse

Videreførelse af gammelt projekt

Der er tidligere gjort flere forsøg på at bevare og registrere det særegne bornholmske sprog, men det har tilsyneladende været en hård nød at knække. 

De seneste 70 år har forskningen i bornholmsk næsten været gået helt i stå, fortæller Alex Speed Kjeldsen.

Udsnit af Bornholms Tidende den 24. januar 1981, der konstaterer, at forskningen af den bornholmske dialekt er gået i stå. (Bornholms Tidende)

Der findes en mindre Bornholmsk Ordbog fra 1908, der blev udarbejdet af dialektforskeren Johan Christian Subcleff Espersen. Den var dog allerede forældet ved udgivelsestidspunktet, pointerer Alex Speed Kjeldsen.

I 1920’erne og -30'erne blev der så taget initiativ til et større bornholmsk ordbogsprojekt, der skulle føre til 4 store bind. 

Ordbogsprojektet gik dog helt i stå i 1940’erne, og det var faktisk det projekt, som Alex Speed Kjeldsen besluttede sig for at genoptage for godt et år siden

Dengang var formålet at lave en digital Bornholmsk Ordbog.

LÆS OGSÅ: »Vi må skal dreje her«: Er dialekter dårligt dansk?

»Sygt tilfældigt« 

Tilfældet ville, at adjunkt Leon Derczynski, der arbejder med sprogteknologi ovre på IT Universitetet, og som er englænder, i samme periode var blevet nysgerrig på det bornholmske sprog. 

»Som englænder var jeg ikke bekendt med bornholmsk. Men jeg snakkede med nogle kolleger om, at der var noget, de beskrev som en art af svensk, der havde tre køn og en helt anderledes grammatik,« forklarer han.

Sproget var bornholmsk, og det viste sig, da Leon Derczynski undersøgte det nærmere, at der var meget lidt data om det - i hvert fald på internettet. 

»Det er meget interessant at se, hvor langt man kan nå med en lille mængde data, når man arbejder med kunstig intelligens,« påpeger han. 

Derfor tog Leon Derczynski kontakt til Alex Speed Kjeldsen, der allerede sad inde med en hel del materiale, som var ved at blive digitaliseret.

Sådan blev ordbogsprojektet udvidet med en oversættelsesmaskine.

»Det var sygt tilfældigt,« husker Leon Derczynski, der håber, at deres arbejde også kan vække danskernes nysgerrighed for det bornholmske.

»Det kan give danskerne en lettere adgang til Bornholm på en måde, de ikke har haft før, og så kan det forhåbentligt skabe noget mere opmærksomhed omkring et sprog, der er ved at uddø,« siger Leon Derczynski.  

LÆS OGSÅ: Hør selv: Uddøde danske dialekter vækkes til live

Sprogteknologi?

Sprogteknologi er også kendt som Natural Language Processing (NLP).

Det er et tværfelt mellem datalogi, kunstig intelligens og lingvistik.

Maskinoversættelse er kun én del af sprogteknologien, der for eksempel også går ud på at lære maskiner at læse bøger eller genkende tale.

Grundlæggende handler sprogteknologi om at lære maskiner at forstå sprog. 

Hvorfor ikke bare en ordbog?

Det lyder jo meget smart og moderne med sprogteknologi og oversættelsesmaskiner, men hvorfor kan man ikke bare nøjes en digital ordbog? 

»Det vigtigste argument er nok, at oversættelsesteknologi virker begge veje,« forklarer Alex Speed Kjeldsen.

»Det er meget vanskeligt, hvis ikke umuligt, at anvende en Bornholmsk-Dansk ordbog for folk som ikke allerede har et godt forhold til traditionelt bornholmsk. Den bornholmske sprogverden bliver dermed en lukket verden - ikke blot for danskere, men også for yngre bornholmere,« tilføjer Alex Speed Kjeldsen.   

I sidste ende vil det medvirke til det bornholmske sprogs forsvinden, hvis man ikke får gjort det mere tilgængeligt, vurderer Alex Speed Kjeldsen. 

LÆS OGSÅ: Unge vestjyder bruger hjemstavnens dialekt, når de spiller kiksede

180.000 ord 

Projektet har været igang i et års tid nu, og selve oversættelsesmaskinen er stadig på prototypestadiet. 

I skrivende stund baserer maskinen sine oversættelser på små 180.000 ord fra bornholmske tekster. Den er blandt andet blevet fodret med oversættelser fra bogen ‘Bornholmske folkeeventyr og dyrefabler’, som J. P. Kuhre skrev i 1938, samt gamle bornholmske ordbøger.

Til sammenligning baserer Google Translate sine oversættelser på 200 millioner ord, når den oversætter fra engelsk til dansk. 

Leon Derczynski står for programmeringsdelen i projektet, og han vil gerne op på, at maskinens oversættelser baserer sig på mindst en million ord, inden han vil lade andre gøre brug af den.

Derfor søger Leon Derczynski og Alex Speed Kjeldsen i øjeblikket bevillinger hos diverse fonde til et treårigt projekt, så det kan lade sig gøre. 

LÆS OGSÅ: Vi dømmer hinanden på sproget

Giver ikke mening med andre dialekter

Mens man venter på, at det sker, kan man jo gå og fantasere sig til, om ikke andre danske sprogforskere ville slå pjalterne sammen med en datalog, så man i fremtiden kan oversætte direkte fra rigsdansk til andre danske dialekter og omvendt. 

Men den interesse ser ikke ud til at være der. 

»Lige nu tænker jeg kun, at det giver mening at lave sådant et værktøj til bornholmsk eller måske sønderjysk. Så store er forskellene heller ikke på rigsdansk og andre sjællandske og jyske dialekter,« siger lektor og dialektforsker Pia Quist.

Videnskab.dk kontakter også lektor ved Institut for Nordiske Studier og Sprogvidenskab på Københavns Universitet, Malene Monka, der forsker i sprogforandringer i Sønderjylland, og spørger, om hun ikke kunne være interesseret i at lave en sønderjysk oversættelsesmaskine.

Det afviser hun høfligt. 

»Der ligger nok uforholdsmæssigt meget arbejde i det. Der er rigtig mange ordbøger på sønderjysk, så jeg tror ikke, at det ville have lige så stor gevinst, som det har på bornholmsk, hvor det kan være med til at opbygge et tilstrækkeligt stort tekstkorpus, så der kan laves en ny og vigtig ordbog over dialekten,« svarer Malene Monka.

Katten er syg og pigen er god

Og nu, hvor du har cyklet dig hele vejen gennem artiklen, får du en lille belønning. For hvad betød de to indledende sætninger?

Var det noget med en pibe og en kætter? Ikke helt.

»Hon e en go pibel. Jâ mener majed om na.« Kan oversættes til noget i retning »Hun er en god pige. Jeg synes rigtig godt om hende.«

»Kjættan e sjøg. Jâ troer a vi bler nøtt te å dânka na.« Kan oversættes til »Katten er syg. Jeg tror, vi bliver nødt til at aflive den.«

Bum-bum. Så blev du det klogere.

Er din indre sprognørd ikke mættet endnu? Så brug lidt tid på Dialektkortet her. 

Dialektkortet er blevet til på baggrund af et samarbejde med Nordisk Forskningsinstitut og materiale fra dialekt.ku.dk, samt Peter Skautrup Centret for Jysk Dialektforskning.   

LÆS OGSÅ: 8.475 sprog findes – og nye kommer til

LÆS OGSÅ: Forsker: Sproglig slankekur har givet os dovne sprogører

LÆS OGSÅ: Han, hun eller hen? Brug af ordet 'hen' resulterede i mere inkluderende holdninger

Sådan oversætter maskinen fra dansk til bornholmsk

Leon Derczynski og Alex Speed Kjeldsen har også skrevet et paper på baggrund af deres arbejde. 

Her har de præsenteret nogle af oversættelserne, som deres maskine har lavet. 

Dansk: der stod en lys sky pa en mørk baggrund.

Maskinens oversættelse: dær sto en art sjy pa ejn âzstæl.

Den korrekte oversættelse: dær sto et lyst sjy pa ejn morkjer bâggrujnn.

 

Dansk: Vil du have lidt brød

Maskinens oversættelse: Vil du hâ lid brø

Den korrekte oversættelse: Ve du hâ lid brø

 

Dansk: bliver der så at de alle kan komme op og køre?

Maskinens oversættelse: bler dær så a di ajle ver opp å kjöra?

Den korrekte oversættelse: bler dær sa di ajle kajn komma opp å âga?

 

Dansk: hesten satte bagkoden så hårdt i stenen, at der er mærke efter det endnu.

Maskinens oversættelse: hæstijn satte bâgkodan så hårt i stenijn, at dær e mærke ætte dæjn len.

Den korrekte oversættelse: hæstijn satte bâgkodan så hårt i stenijn, at dær e mærke ætte ’d inu.

 

Dansk: Hvor står mit klapbord

Maskinens oversættelse: Vor fâr minj dâuestola

Den korrekte oversættelse: Vor star mit flojbor

... Eller følg os på Facebook, Twitter eller Instagram.

Videnskab.dk Podcast

Lyt til vores seneste podcast herunder eller via en podcast-app på din smartphone.


Se den nyeste video fra Tjek

Tjek er en YouTube-kanal om videnskab og sundhed henvendt til unge.

Indholdet på kanalen bliver produceret af Videnskab.dk's Center for Faglig Formidling med samme journalistiske arbejdsgange, som bliver anvendt på Videnskab.dk.