Computere skal lære menneskets sprog
En specialestuderende fra IT-Universitetet fået en idé til, hvordan man kan lære maskinerne at kommunikere på vores præmisser. Løsningen har ført til et tilbud om job hos amerikansk topforsker.

Uløselige problemer vil blive løst, når mennesker og computere engang kommer på bølgelængde, spår forskere. (Foto: Colourbox)

Forestil dig, at du surfer på computeren med håb om at finde en bestemt sang ved hjælp af søgemaskinen Google. Du kan ikke huske sangens titel og har ingen anelse om, hvem, der sang den. Du kan til gengæld tydeligt mærke den knugende fornemmelse i maven, kærlighedssangen giver dig – det føles, som om alt er regnvejr inden i.

Din gode ven Søren ville lige præcis vide, hvilken sang, du snakker om. Google fatter derimod ikke en brik. Den foreslår til din store frustration den fornøjede sang ”I’m singing in the rain”.

Computere og mennesker er ikke altid lige på bølgelængde, fordi vi kommunikerer helt forskelligt. Men det problem har en nyudklækket cand. it. fra IT-Universitetet i København en idé til at løse.

I sit speciale har han sammenholdt den måde, som computere og mennesker opfatter et sprog på. På den baggrund kommer han med et nyt banebrydende forslag til, hvordan maskiner kan komme til at kommunikere på menneskets præmisser i stedet for at insistere på, at alt skal foregå efter deres hoved.

»Hemmeligheden er at udstyre computeren med en model for, hvordan verden er struktureret, som minder meget om den, der er programmeret ind i menneskets hjerne. Modellen skal altså så at sige være menneskets og maskinens fælles referenceramme,« siger Erik David Johnson, der netop har høstet et flot 12-tal ved sit specialeforsvar på ITU.

Mennesket har en krop

En forudsætning for, at mennesker og maskiner kan få en fælles referenceramme er, at de tager udgangspunkt i samme model for, hvordan verden er opbygget – en såkaldt ’ontologi’.

Erik David Johnsons ambition er, at konstruere sådan en model, på samme måde, som en ingeniør designer en bro, og det er forklaringen på, at forskningsfeltet kaldes for ’ontology engeneering’. Han lader sig inspirere af forsker og forfatter George Lakoff og hans teori om ’sprogets metaforiske systematik’. Grundtanken er, at sproget ikke i sig selv kan skabes ud fra en flok døde ord. Et sprog opstår i et tæt samspil mellem menneskets krop og bevidsthed.

Modellen bryder med den teori, som var fremherskende i gamle dage, der gik ud på at opfatte hjernen som adskilt fra kroppen. Man forestillede sig, at hjernen kommunikerede ved at sammensætte symboler, der i sig selv kunne opfattes som sprogets mindste uopbrydelige dele. Man forsøgte så at sige at opbygge sproget nedefra. 

Fakta

Erik David Johnson er ikke som studerende er flest på ITU. Udover at have læst kognitiv semantik og analytisk sprogfilosofi, har han også en bachelorgrad i engelsk, og har desuden kombineret sin specialisering i avanceret kunstig intelligens på ITU med en række tekniske fag fra Københavns center for sprogteknologi (cst.dk).

»I mit speciale bruger jeg analytisk sprogfilosofi og George Lakoffs teorier til at vise, at den gammeldags opfattelse er helt forkert. Det er lidt som at forsøge at nå til tops uden en plan, fordi det ignorerer den åbenlyse kompleksitet, der findes i menneskets tankeprocesser,« siger Erik David Johnson.

Oppefra og ned er vejen frem

Faktum er, at menneskets hjerne og krop ikke er adskilt, fortæller han. Vi opfatter omverdenen gennem vores krop, og den måde at se verden på, har gennem tiderne nedfældet sig i vores sprog.

Han kaster sig ud i et eksempel ved at fortælle om en baby, som ser en kop blive fyldt op igen og igen. Barnets center for ’vertikalitet’ bliver aktiveret, samtidigt med en stimulering af et andet hjerneområde for ’mængde’. Når barnet ser sådanne hændelser tilstrækkeligt mange gange, bliver der skabt en kobling mellem de to begreber i hjernen, så de giver hinanden mening, og det har bl.a. ført til følgende vendinger: ”Antallet af publicerede bøger stiger”. ”Min indkomst faldt sidste år”.

På den måde kommer de allermest basale begivenheder i vores dagligdag til at fremelske begrebsstrukturer i vores hjerner.

»Lad mig give dig et andet eksempel: Så længe en person er oprejst og kan spankulere hen ad vejen, opfatter vi det som om, alt er i orden. Falder en person derimod om og ligger bevidstløs på jorden, er det åbenlyst for os, at der er noget galt. Den slags sammenhænge smitter af på sproget og har ført til vendinger som ’op med humøret’, eller ’ jeg er lidt nede i dag’. Alle sprog er gennemsyret af den slags ’metaforer’,« siger Erik David Johnson.

Vi spejler os i hinanden

Fakta

Når små børn oplever nærhed er det igennem kropskontakt, som også giver varme. Det har ført til udtryk som "Han er sådan en varm person”.

I eksperimenter på Yale University i USA lod man en gruppe testpersoner holde en kold eller varm drik i hånden inden de gav hånd til andre testpersoner, som så skulle bedømme hvor imødekommende og varme personligheder disse havde. Personer, der tidligere havde holdt en varm kop, viste sig at have en målbart højere score end dem, der havde holdt en kold kop.

For at kunne give computerne vores sprog, må vi vide, hvordan sprogene er opstået, og ny forskning viser, at de efter alt at dømme er dannet som en efterligning af ens egne eller andres kropsbevægelser. 

Hjernen kan ud fra fakterne suge ny viden til sig via hjernens ’spejlneuroner’, der blev opdaget af en italiensk forsker tilbage i 1990’erne. Forskerne satte i sin tid nogle målere på en flok aber, der overvågede aktiviteten i dyrenes hjerner, og her viste det sig, at bestemte områder i hjernen blev aktiveret, hvad enten aben selv udførte handlingen, eller blot iagttog en anden abe.

Noget tilsvarende sker med mennesker, når vi kommunikerer, og denne aktivitet er koncentreret om vores sprogcenter i hjernen. Det demonstrerer, at det ikke er nok for os at have navne på ting her i verden. Metaforerne er tvingende nødvendige at have med.

»Det afgørende for, at vi mennesker kan bruge sprog til at kommunikere med er, at vi alle oplever omverdenen gennem en krop – vi har så at sige en fælles livsform i form af vores fysiske miljø. Selv tyngdekraften er et fælles livsvilkår,« siger Erik David Johnson.

Computerne skal også have en krop

Bogstaver og ord er altså ifølge Erik David Johnsons studie ikke sprogets mest basale elementer. Det fundamentale er metaforerne, altså hvordan vi strukturerer input fra vores sanser i kraft af vores krop og tænkning. Denne struktur viser sig som en systematik i sproget, som forskerne kan kortlægge og aflure.

Hvis jeg kunne realisere det alene, så ville jeg blive større end Bill Gates. Men det er umuligt, fordi opgaven er ekstremt kompleks

Erik David Johnson

»Vi opfatter i bund og grund vores verden igennem et rør. Det hele er farvet og formet af vores fysiske omstændigheder. Metaforerne er aflejret i sproget og kan ikke adskilles derfra, så derfor er det helt forkert at påstå, at man kan opbygge et sprog nedefra og op – man må tværtimod gå oppefra og ned,« siger han.

En forudsætning for, at computere og mennesker kan komme til at tale bedre sammen, er altså at finde en måde hvorpå man kan systematisere sprogene, så computerne kan håndtere det. Man skal have fat i de metaforer, der er aflejret i sproget.

»I mit speciale drister jeg mig til at sige noget om, hvordan man konkret kan gøre det. Mit forslag er at benytte ’neurale netværk’, som er en primitiv simulering af den menneskelige hjerne. Sådan en simulering kan ikke bruges til at fremstille en hjerne, der tænker ved hjælp af metaforer. Men man kan bruge den til at genkende de mønstre i sproget, som metaforerne danner,« siger han.

Stiler mod et job ’over there’

Erik David Johnson understreger, at der er lang vej endnu, før mennesker og computere kan tale sammen som bedste venner. Specialet tager kun første skridt på vejen ved at beskrive en metode til at opbygge en fælles referenceramme.

Men godt begyndt er halvt fuldendt, og mange fremtrædende forskere har allerede vist interesse for hans forslag.

Hele mit studie har båret hen imod at finde en ny måde, hvorpå man kan få maskiner til at beherske det menneskelige sprog.

Erik David Johnson

Én af disse forskere er George Lakoff selv. Han har fulgt projektet nøje, fordi den unge dansker allerede tidligt i forløbet tog kontakt med ham for at få ham til at vurdere, om der overhovedet var videnskabeligt grundlag for et speciale.

Lakoffs svar kom prompte og beskeden var klar: Specialets centrale indhold og pointe svarede fuldstændigt til det teoretiske udgangspunkt for et endnu ikke offentliggjort 5-års forskningsprojekt på Berkeley Universitet, som begynder i 2012.

Specialet har været med til at skabe et godt teoretisk udgangspunkt for den amerikanske forskergruppes arbejde. Nu, hvor Erik David Johnson har afsluttet sit speciale, leger han med idéen om at blive en del af Lakoffs hold efter opfordring fra den anerkendte forsker.

»Perspektiverne i forskningen er fantastiske, for hvis det virkelig skulle lykkes os at skabe en fælles referenceramme for computere og mennesker, har det potentiale til at kunne revolutionere hele den måde, vi bruger computere på,« siger han og slutter:

»Hvor vi i dag skal lære at tale computernes sprog, vil maskinerne i fremtiden kunne snakke med os om løst og fast på vores egne præmisser. Fra at være en død maskine, som skal have meget firkantede beskeder, kan den pludselig sætte sig ind i dine inderste følelser og finde den helt rigtige sang til dig, som slår den rette stemning an.«

 

 

Lyt på Videnskab.dk!

Hver uge laver vi digital radio, der udkommer i form af en podcast, hvor vi går i dybden med aktuelle emner fra forskningens verden. Du kan lytte til den nyeste podcast i afspilleren herunder eller via en podcast-app på din smartphone.

Har du en iPhone eller iPad, kan du finde vores podcasts i iTunes og afspille dem i Apples podcast app. Bruger du Android, kan du med fordel bruge SoundClouds app.
Du kan se alle vores podcast-artikler her eller se hele playlisten på SoundCloud