Snart kan computere tyde din tipoldemors kragetæer
Et program, der kan genkende håndskrift fra gammel tid, bliver snart tilgængeligt i Danmark. »Revolutionerende« og »fantastisk,« lyder det fra historiker.
transkribus kan aflæse gammel håndskrift historikere forskere transskribere

Et program, der kan genkende gammel håndskrift, er ved at blive klargjort, så man let kan skanne og aflæse gamle tekster. Programmet er i første omgang møntet på forskere. (Foto: Shutterstock)

Det er måske ikke hver dag, du har brug for at læse en tekst fra 1800-tallet. Men skulle du alligevel blive nysgerrig efter, hvad man talte om i Aarhus' byrådssal 100 år før din fødsel, eller hvad der står i dagbogen fra din gamle tipoldemor, så kan det formentlig snart blive mere end blot en sjov tanke.

Et computerprogram kaldet Transkribus kan allerede nu aflæse gamle håndskrevne tekster på blandt andet engelsk og norsk. Nu er en dansk historiker i fuld gang med at få opfindelsen til at fungere på dansk.

»Det kan være revolutionerende for forskningsverdenen, hvis vi får det til at virke optimalt herhjemme. Jeg synes, det er ret fantastisk,« siger Søren Bitsch Christensen, der er stadsarkivar i Aarhus Kommune og tidligere forsker i byhistorie. Han er initiativtageren og lederen bag projektet i Danmark, der netop er blevet præsenteret for 500 fagfæller på konferencen Nordisk Historikermøde i Aalborg

Kan få stor betydning i forskningsverdenen

Når redskabet bliver færdigudviklet, kommer det både til at fungere som tekstgenkendelsesprogram og som en database. Her vil man kunne søge efter gamle skrifter fra danske sogneråd og byrådsmøder.

transkribus søren bitsch christensen stadsarkivar

Søren Bitsch Christensen har mobiliseret frivillige landet over, der skal være med til at få Transkribus til at virke på dansk (Foto: Søren Bitsch Christensen)

Det er ikke blot Søren Bitsch Christensen, der er begejstret for redskabet. Ved Nordisk Historikermøde blev en af de lokale arrangører, som også er historiker, nysgerrig på initiativet. Han glæder sig til, at det bliver muligt at anvende det hollandske program i praksis:

»Det kan have stor betydning for forskningen, da den her database med gamle håndskrifter kan give andre og flere resultater, end dem man selv ville kunne grave sig frem til,« siger Bo Poulsen, der er lektor og historiker ved Institut for Kultur og Globale Studier på Aalborg Universitet.

Han brugte selv 11 måneder af sin ph.d.-afhandling på at transskribere gamle tekster:

»Historie er et forskningsfelt, som heldigvis rammes af digitalisering og globalisering. Det kan potentielt have betydning for den forskning, der bliver lavet, fordi man på globalt plan vil kunne søge på danske skrifter, hvilket kan lede til bedre forskningsresultater,« siger Bo Poulsen.

»Det kunne være interessant at søge på, hvilke varer der blev fragtet i de skibe, der sejlede forbi Helsingør i 1400-tallet. Det var dengang, den danske konge pålagde told på alle skibsfartøjer – den såkaldte Øresundstold – og her ville man let kunne aflæse, hvornår sydfrugterne kom til Danmark, og hvad der var de mest almindelige fragtvarer,« siger Bo Poulsen.

Kræver mange mandetimer at få i gang

Transkribus er baseret på eksisterende teknologi, der kan genkende tekster. I dag er der et marked for maskinlæsning af moderne håndskrift, men Transkribus sigter efter maskinlæsning af historiske håndskrifter.

Der findes et lignende program
  • I dag kan man bruge databasen www.soundtoll.nl til at søge efter blandt andet handel i Øresund, men alt er indtastet manuelt.
     
  • Med løsninger som Transkribus kan man i fremtiden skyde genvej til at generere store databaser, forklarer Bo Poulsen.

Jo flere gamle tekster der bliver skrevet ind i databasen, des større sammenligningsgrundlag har programmet til at kunne genkende nye tekster. På den måde kan programmet både anvendes som søgemaskine og til at transskribere gamle skrifter, så de bliver forståelige.

»Programmet er ikke klogere end det materiale, man putter ind i det, og det kræver rigtig mange tusinde eksempler, før det kan genkende forskellige skrifttyper,« fortæller Søren Bitsch Christensen, der tidligere har forsket i land, by- og økonomisk historie.

Han har allerede nu et samarbejde med frivillige fra blandt andet stads- og lokalarkiver landet over, der kan læse gammel håndskrift og skrive teksterne ind i databasen. Teksterne består af protokoller fra byråd og sogneråd i årene mellem 1840 og 1945.

Programmet har eksisteret i omkring fem år, men det er først nu, det begynder at producere resultater:

»Jeg har et enkelt tal fra Transkribus i forhold til pålideligheden af programmet. Det er en analyse af en norsk dagbog fra 1800-tallet, og der har programmet analyseret 3.500 ord med en fejlrate på otte procent. Sagt med andre ord har den en succesrate på 92 procent, hvilket jo er ret godt,« siger Søren Bitsch Christensen.

Tidshorisonten er usikker

Projektets økonomi for fremtiden er endnu ikke afklaret. Lige nu støttes Transkribus af EU, hvor Innsbruck Universitet i Østrig leder projektet.

transkribus kan transskribere oversætte skrifter tekster fra håndskrift

Når flere tekster forfattes digitalt, kan det fremover blive sværere for mennesker at genkende forældres og bedsteforældres håndskrift, mener Søren Bitsch Christensen. (Foto: Shutterstock)

Søren Bitsch Christensen håber, at der er flere danske interessenter, der kan se fordelen i programmet, som har lyst til at støtte det:

»Vi håber at kunne rejse flere penge til det, som skal bruges på at have medarbejdere, der kan drive projektet, så vi kan opnå en større database og introducere frivillige i at bruge programmet,« siger han.

Han tilføjer, at det er en kombination af økonomi og mandetimer, der skal til, for at programmet kommer til at virke ordentligt:

»Jeg kan endnu ikke sige noget om, hvor længe der går, før programmet bliver anvendeligt. Det afhænger af, hvor meget de frivillige får skrevet ind,« siger Søren Bitsch Christensen.

I første omgang er værktøjet møntet på institutioner og forskere, men med tiden håber Søren Bitsch Christensen, at programmet kan tilgås af alle.

Så hvis du har en gammel dagbog med kragetæer fra tipoldemor, vil den formentlig i fremtiden kunne blive transskriberet med få klik.

Lyt på Videnskab.dk!

Hver uge laver vi digital radio, der udkommer i form af en podcast, hvor vi går i dybden med aktuelle emner fra forskningens verden. Du kan lytte til den nyeste podcast i afspilleren herunder eller via en podcast-app på din smartphone.

Har du en iPhone eller iPad, kan du finde vores podcasts i iTunes og afspille dem i Apples podcast app. Bruger du Android, kan du med fordel bruge SoundClouds app.
Du kan se alle vores podcast-artikler her eller se hele playlisten på SoundCloud