Dåsedansk er et forunderligt sprog, som kun kan forstås, hvis hjernen lægger vejen forbi engelsk. Her forvandles meningsløse ordrækker som ‘du dåse kalde’ og ‘håndtag med bekymring’ til de mere forståelige udsagn: You can call og Handle with care.
For dåsedansk er faktisk engelsk, der har været udsat for en mislykket maskinoversættelse, og vi støder oftest på det i brugsanvisninger, på hjemmesider og i varedeklarationer, hvor den udenlandske afsender hverken har villet ofre tid eller penge på at få en rigtig oversættelse til dansk.
I en global verden, hvor kommunikation på tværs af sprog og kulturer er en del af dagligdagen, er der nemlig stort behov for hurtige oversættelsesværktøjer – men langt fra alle leverer kompetente resultater.
Glemmer aldrig ord
»En maskine har den store fordel, at den aldrig glemmer et ord, at den kan rumme store datamængder, og at den kan lære fra sproget i de tekster, som den har adgang til i andre sammenhænge. Men det kniber for den at forstå konteksten, og flertydigheder forvirrer den, så oversættelsen af et eller flere ord kan ramme så meget ved siden af, at hele teksten bliver uforståelig,« siger Eckhard Bick.
Han er forskningslektor på Institut for Sprog og Kommunikation på Syddansk Universitet og har arbejdet med maskinoversættelse i over 20 år. Han har således udviklet et oversættelsesprogram, som betegnes som et af de mest overbevisende softwareprogrammer inden for automatisk oversættelse.
»Langt de fleste maskinoversættelser baserer sig på statistik, og de dårligste oversætter ord for ord. Men der er jo 10.000 små regler, der afgør, hvordan et ord skal oversættes, for at sætningen kan give den rette mening.«
»Et ord som at regne har for eksempel mange forskellige betydninger alt efter konteksten – hun regner, det regner, man regner med, man regner ham for -.og derfor er der mange fejlmuligheder, hvis oversættelsen ikke bygger på en god sproglig analyse,« siger Eckhard Bick.
Afvigelser bygges ind
\ Fakta
De to store hovedspor inden for automatisk oversættelse er den regelbaserede og den statistiske. Sidste år i marts lancerede søgemaskinen Google en oversættelsesfunktion mellem dansk og engelsk, og den baserer sig på statistik.
»En statistisk oversættelse kan være god til firmaer, der har masser af oversatte tekster i forvejen, f.eks. tekniske manualer, og skal have noget, der ligner dem. For oversættelsesprogrammet vil blive trænet i disse tekster og bruge det hyppigst anvendte ord på bekostning af andre mulige oversættelser. Men i andre sammenhænge eksempelvis hjemmesider og nyhedstekster, er der brug for større variation og større dybde i analysen,« siger Eckhard Bick.
Hans oversættelsesprogram mellem dansk og engelsk er det første regelbaserede program, som ikke er specialiseret inden for et bestemt fagområde.
Det dækker bredt og kan derfor anvendes i mange sammenhænge.
Eckhard Bick lagde således ud med at lave en omfattende analyse af dansk grammatik og sprogbrug, og den analyse er bygget ind i programmet, så det også kan fange de mange afvigelser fra reglerne, som er så vigtige for forståelsen og dermed oversættelsen.
Perfekt eller blot forståelig
»Den oversættelsesservice, vi i dag tilbyder universitetet, bliver efterredigeret af et menneske, så det bliver så perfekt som muligt. Men man kan sagtens tænke sig løsninger, hvor man kun forlader sig på maskinen. Spørgsmålet er jo, hvad teksten skal bruges til.«
»Hvis man for eksempel går ind på en dansk hjemmeside for at søge information, vil man sagtens kunne fange indholdet, selv om den engelske maskinoversættelse skulle halte lidt i grammatikken.
Typisk vil en maskinoversættelse først oversætte en dansk tekst til engelsk og derfra oversætte videre til det sprog, der ønskes, for eksempel svensk eller norsk. Det giver rigtig mange fejlmuligheder
Forskningslektor Eckhard Bick
Så i det tilfælde kan den meget hurtige og måske ikke helt perfekte oversættelse være at foretrække,« mener Eckhard Bick.
Esperanto som mellemsprog
Han lavede sin første maskinoversættelse helt tilbage i 1986, hvor han oversatte dansk til kunstsproget esperanto. Det var inspireret af et større internationalt oversættelsesprojekt, DLT, hvor det var meningen, at en række sprog først skulle oversættes til esperanto.
Derfra kunne man så oversætte til det sprog, man havde brug for.
Men projektet løb tør for penge, så det blev ikke rigtig til noget.
»Projektet kunne være blevet en fordel for et lille sprogområde som Danmark, hvor der ikke findes ret mange gode programmer, der oversætter direkte fra dansk til et andet sprog. Typisk vil en maskinoversættelse først oversætte en dansk tekst til engelsk og derfra oversætte videre til det sprog, der ønskes, for eksempel svensk eller norsk. Det giver rigtig mange fejlmuligheder,« siger Eckhard Bick.
Hvis alle sprog blev oversat til og fra ét internationalt hjælpesprog (en interlingua) med den fornødne præcision og fleksibilitet og altså ikke til og fra engelsk, som har mange flertydigheder og uregelmæssigheder – vil der blive større konsistens i oversættelserne, og det vil være lettere at udvikle dem til en stadig højere kvalitet.
Men sådan er virkeligheden altså ikke blevet, og derfor bliver en af Eckhard Bicks næste udfordringer at lave en direkte maskinoversættelse mellem dansk og tysk, mens han reserverer interlingua-løsningen til nært beslægtede sprog som de skandinaviske.
Lavet i samarbejde med magasinet Ny Viden, Syddansk Universitet
\ Oversættelsesprogrammet
Institut for Sprog og Kommunikation på Syddansk Universitet har for nylig etableret en intern oversættelsesenhed, IT Translations Services, som tilbyder oversættelse til engelsk af alle typer af danske tekster, herunder ikke mindst oversættelse af hjemmesider, som i særdeleshed udgør en stor udfordring for SDU.
Oversættelsesprogrammet, der er udviklet af dr.phil. Eckhard Bick, betegnes som et af de mest overbevisende softwareprogrammer inden for automatisk oversættelse.
Eckhard Bick er forskningslektor på instituttet og indehaver af firmaet Grammar Soft aps., der beskæftiger sig med sprogteknologi.