Annonceinfo

Computere skal lære menneskets sprog

En specialestuderende fra IT-Universitetet fået en idé til, hvordan man kan lære maskinerne at kommunikere på vores præmisser. Løsningen har ført til et tilbud om job hos amerikansk topforsker.

Uløselige problemer vil blive løst, når mennesker og computere engang kommer på bølgelængde, spår forskere. (Foto: Colourbox)

Forestil dig, at du surfer på computeren med håb om at finde en bestemt sang ved hjælp af søgemaskinen Google. Du kan ikke huske sangens titel og har ingen anelse om, hvem, der sang den. Du kan til gengæld tydeligt mærke den knugende fornemmelse i maven, kærlighedssangen giver dig – det føles, som om alt er regnvejr inden i.

Din gode ven Søren ville lige præcis vide, hvilken sang, du snakker om. Google fatter derimod ikke en brik. Den foreslår til din store frustration den fornøjede sang ”I’m singing in the rain”.

Computere og mennesker er ikke altid lige på bølgelængde, fordi vi kommunikerer helt forskelligt. Men det problem har en nyudklækket cand. it. fra IT-Universitetet i København en idé til at løse.

I sit speciale har han sammenholdt den måde, som computere og mennesker opfatter et sprog på. På den baggrund kommer han med et nyt banebrydende forslag til, hvordan maskiner kan komme til at kommunikere på menneskets præmisser i stedet for at insistere på, at alt skal foregå efter deres hoved.

»Hemmeligheden er at udstyre computeren med en model for, hvordan verden er struktureret, som minder meget om den, der er programmeret ind i menneskets hjerne. Modellen skal altså så at sige være menneskets og maskinens fælles referenceramme,« siger Erik David Johnson, der netop har høstet et flot 12-tal ved sit specialeforsvar på ITU.

Mennesket har en krop

Fakta

Erik David Johnson er ikke som studerende er flest på ITU. Udover at have læst kognitiv semantik og analytisk sprogfilosofi, har han også en bachelorgrad i engelsk, og har desuden kombineret sin specialisering i avanceret kunstig intelligens på ITU med en række tekniske fag fra Københavns center for sprogteknologi (cst.dk).

En forudsætning for, at mennesker og maskiner kan få en fælles referenceramme er, at de tager udgangspunkt i samme model for, hvordan verden er opbygget – en såkaldt ’ontologi’.

Erik David Johnsons ambition er, at konstruere sådan en model, på samme måde, som en ingeniør designer en bro, og det er forklaringen på, at forskningsfeltet kaldes for ’ontology engeneering’. Han lader sig inspirere af forsker og forfatter George Lakoff og hans teori om ’sprogets metaforiske systematik’. Grundtanken er, at sproget ikke i sig selv kan skabes ud fra en flok døde ord. Et sprog opstår i et tæt samspil mellem menneskets krop og bevidsthed.

Modellen bryder med den teori, som var fremherskende i gamle dage, der gik ud på at opfatte hjernen som adskilt fra kroppen. Man forestillede sig, at hjernen kommunikerede ved at sammensætte symboler, der i sig selv kunne opfattes som sprogets mindste uopbrydelige dele. Man forsøgte så at sige at opbygge sproget nedefra. 

»I mit speciale bruger jeg analytisk sprogfilosofi og George Lakoffs teorier til at vise, at den gammeldags opfattelse er helt forkert. Det er lidt som at forsøge at nå til tops uden en plan, fordi det ignorerer den åbenlyse kompleksitet, der findes i menneskets tankeprocesser,« siger Erik David Johnson.

Oppefra og ned er vejen frem

Faktum er, at menneskets hjerne og krop ikke er adskilt, fortæller han. Vi opfatter omverdenen gennem vores krop, og den måde at se verden på, har gennem tiderne nedfældet sig i vores sprog.

Fakta

Når små børn oplever nærhed er det igennem kropskontakt, som også giver varme. Det har ført til udtryk som "Han er sådan en varm person”.

I eksperimenter på Yale University i USA lod man en gruppe testpersoner holde en kold eller varm drik i hånden inden de gav hånd til andre testpersoner, som så skulle bedømme hvor imødekommende og varme personligheder disse havde. Personer, der tidligere havde holdt en varm kop, viste sig at have en målbart højere score end dem, der havde holdt en kold kop.

Han kaster sig ud i et eksempel ved at fortælle om en baby, som ser en kop blive fyldt op igen og igen. Barnets center for ’vertikalitet’ bliver aktiveret, samtidigt med en stimulering af et andet hjerneområde for ’mængde’. Når barnet ser sådanne hændelser tilstrækkeligt mange gange, bliver der skabt en kobling mellem de to begreber i hjernen, så de giver hinanden mening, og det har bl.a. ført til følgende vendinger: ”Antallet af publicerede bøger stiger”. ”Min indkomst faldt sidste år”.

På den måde kommer de allermest basale begivenheder i vores dagligdag til at fremelske begrebsstrukturer i vores hjerner.

»Lad mig give dig et andet eksempel: Så længe en person er oprejst og kan spankulere hen ad vejen, opfatter vi det som om, alt er i orden. Falder en person derimod om og ligger bevidstløs på jorden, er det åbenlyst for os, at der er noget galt. Den slags sammenhænge smitter af på sproget og har ført til vendinger som ’op med humøret’, eller ’ jeg er lidt nede i dag’. Alle sprog er gennemsyret af den slags ’metaforer’,« siger Erik David Johnson.

Vi spejler os i hinanden

For at kunne give computerne vores sprog, må vi vide, hvordan sprogene er opstået, og ny forskning viser, at de efter alt at dømme er dannet som en efterligning af ens egne eller andres kropsbevægelser. 

Hjernen kan ud fra fakterne suge ny viden til sig via hjernens ’spejlneuroner’, der blev opdaget af en italiensk forsker tilbage i 1990’erne. Forskerne satte i sin tid nogle målere på en flok aber, der overvågede aktiviteten i dyrenes hjerner, og her viste det sig, at bestemte områder i hjernen blev aktiveret, hvad enten aben selv udførte handlingen, eller blot iagttog en anden abe.

citatHvis jeg kunne realisere det alene, så ville jeg blive større end Bill Gates. Men det er umuligt, fordi opgaven er ekstremt kompleks
- Erik David Johnson

Noget tilsvarende sker med mennesker, når vi kommunikerer, og denne aktivitet er koncentreret om vores sprogcenter i hjernen. Det demonstrerer, at det ikke er nok for os at have navne på ting her i verden. Metaforerne er tvingende nødvendige at have med.

»Det afgørende for, at vi mennesker kan bruge sprog til at kommunikere med er, at vi alle oplever omverdenen gennem en krop – vi har så at sige en fælles livsform i form af vores fysiske miljø. Selv tyngdekraften er et fælles livsvilkår,« siger Erik David Johnson.

Computerne skal også have en krop

Bogstaver og ord er altså ifølge Erik David Johnsons studie ikke sprogets mest basale elementer. Det fundamentale er metaforerne, altså hvordan vi strukturerer input fra vores sanser i kraft af vores krop og tænkning. Denne struktur viser sig som en systematik i sproget, som forskerne kan kortlægge og aflure.

»Vi opfatter i bund og grund vores verden igennem et rør. Det hele er farvet og formet af vores fysiske omstændigheder. Metaforerne er aflejret i sproget og kan ikke adskilles derfra, så derfor er det helt forkert at påstå, at man kan opbygge et sprog nedefra og op – man må tværtimod gå oppefra og ned,« siger han.

En forudsætning for, at computere og mennesker kan komme til at tale bedre sammen, er altså at finde en måde hvorpå man kan systematisere sprogene, så computerne kan håndtere det. Man skal have fat i de metaforer, der er aflejret i sproget.

citatHele mit studie har båret hen imod at finde en ny måde, hvorpå man kan få maskiner til at beherske det menneskelige sprog.
- Erik David Johnson

»I mit speciale drister jeg mig til at sige noget om, hvordan man konkret kan gøre det. Mit forslag er at benytte ’neurale netværk’, som er en primitiv simulering af den menneskelige hjerne. Sådan en simulering kan ikke bruges til at fremstille en hjerne, der tænker ved hjælp af metaforer. Men man kan bruge den til at genkende de mønstre i sproget, som metaforerne danner,« siger han.

Stiler mod et job ’over there’

Erik David Johnson understreger, at der er lang vej endnu, før mennesker og computere kan tale sammen som bedste venner. Specialet tager kun første skridt på vejen ved at beskrive en metode til at opbygge en fælles referenceramme.

Men godt begyndt er halvt fuldendt, og mange fremtrædende forskere har allerede vist interesse for hans forslag.

Én af disse forskere er George Lakoff selv. Han har fulgt projektet nøje, fordi den unge dansker allerede tidligt i forløbet tog kontakt med ham for at få ham til at vurdere, om der overhovedet var videnskabeligt grundlag for et speciale.

Lakoffs svar kom prompte og beskeden var klar: Specialets centrale indhold og pointe svarede fuldstændigt til det teoretiske udgangspunkt for et endnu ikke offentliggjort 5-års forskningsprojekt på Berkeley Universitet, som begynder i 2012.

Specialet har været med til at skabe et godt teoretisk udgangspunkt for den amerikanske forskergruppes arbejde. Nu, hvor Erik David Johnson har afsluttet sit speciale, leger han med idéen om at blive en del af Lakoffs hold efter opfordring fra den anerkendte forsker.

»Perspektiverne i forskningen er fantastiske, for hvis det virkelig skulle lykkes os at skabe en fælles referenceramme for computere og mennesker, har det potentiale til at kunne revolutionere hele den måde, vi bruger computere på,« siger han og slutter:

»Hvor vi i dag skal lære at tale computernes sprog, vil maskinerne i fremtiden kunne snakke med os om løst og fast på vores egne præmisser. Fra at være en død maskine, som skal have meget firkantede beskeder, kan den pludselig sætte sig ind i dine inderste følelser og finde den helt rigtige sang til dig, som slår den rette stemning an.«

 
Svar fra forfatteren

Her følger mine svar på spørgsmål der indtil videre er stillet. Jeg opfordrer i øvrigt til at følge gruppen Computational Linguistics DK på LinkedIn, hvor min forskning også debatteres, og hvor jeg har svaret på en del spørgsmål allerede.

Jeg vil også gerne opfordre til at læse mit speciale og stille spørgsmål til det i stedet for at spørge til selve artiklen (der er et direkte link til det i artiklen).Selvom journalisten som har skrevet artiklen har gjort et bemærkelsesværdigt fint stykke arbejde med at gøre mit speciale tilgængeligt uden at forsimple tingene alt for meget, er det klart at visse aspekter af min forskning, som ikke nævnes i artiklen herom skal tages med for at få det fulde billede.

Andreas Thiele>>
Jeg har brugt et fully connected feed-forward artificial neural network med Sigmoid aktiveringsfunktion. En simpel implementering, som udelukkende bruges til at lave proof-of-concept der illustrerer princippet i mine ideer, uden at have fundet en god repræsentationsform for den kognitive semantik. Pointen er netop at det er denne som fremtidig forskning skal fokusere på, udover at undersøge potentialet for forskellige typer af mønstergenkendelse, såsom self-organizing maps, etc. Dette er hermed også mit svar til dig mht. netværkets struktur og måden hvorpå den forbindes til forsk. ord.

Dit spørgsmål om hvorledes ord med flere forskellige meninger håndteres vidner, med al respekt, om at du ikke helt har forstået min vigtigste pointe vedr. det at starte med world knowledge og arbejde sig nedad. Jeg har skrevet en serie af artikler til det danske sprogmuseum, som kommer ud i løbet af nogle dage. Dem vil jeg opfordre dig til at læse, hvis ikke du har tid til at læse selve specialet.

Bo Axelsen>>
Nej, jeg er ikke bekendt med Hubert Dreyfus og hans værker, men det virker både relevant og interessant. I øvrigt vil jeg mene at det at de forskningsmæssige retningslinier jeg etablerer, i den grad svarer til dem der har dannet udgangspunkt for det i artiklen nævnte forskningsprojekt ved Berkeley universitet, i høj grad frikender min forskning for den type af fantasteri nogen ville mene at du insinuerer når du advarer mig og andre imod at tage ”…fat på et stjernekrigsprojekt der lover guld og grønne skove”.
->
*RETTELSE: Bo Axelsen og jeg har diskuteret sagen i en kort korrespondance, og det viser sig at hans kommentar var baseret udelukkende på artiklen, og helt uden egentligt kendskab til min forskning som den er beskrevet i mit speciale. Jeg venter nu på revideret kritik fra Bo Axelsen, som i stedet er baseret på selve specialet og ikke kun den læsevenlige korte artikel.

Thomas Anker Carlsen>>
Det er en interessant tankegang, men i mine øjne misforstået. Google ejer ikke vores naturlige sprog. Din sprogforståelse lægger selv under for den type af ontologi som den tidlige Wittgenstein var tilhænger af, og som jeg kritiserer i mit speciale, hvilket jeg vil opfordre dig til at læse. Tænk over hvordan vores fælles livsform udmønter sig i vores sprog i form af en kognitiv semantik, ud fra vores fælles kognitive mønstre. I teorien kan vi, vha. værktøjer til mønstergenkendelse såsom kunstige neurale netværk, approksimere de mønstre der konkret er udmøntet ved neurale forbindelser i den menneskelige hjerne, fordi de igen udmønter sig direkte i kognitive mønstre, som vi deler i kraft af vores fælles livsform, og som derfor også kommer til udtryk på en ensartet måde i vores sprog.

Derved kan et nøgleelement i simuleringen af den menneskelige bevidsthed siges allerede at ligge i vores sprog og dets evolution. Dette er en af hovedpointerne ved det nye udgangspunkt for den sprogteknologiske side af kunstig intelligens, som jeg foreslår i mit speciale.

Struktur af netværk

Nu ved jeg ikke, om du, Erik, læser med her, men jeg satser og skyder et par spørgsmål afsted.

Here goes:
- Hvilken struktur bruges til de forskellige netværks opgaver i modellen?
- Hvordan formår modellen teknisk at forbinde ord med forskellige "minder"?
- Hvordan håndterer modellen ord med flere meninger?

Hubert Dreyfus

Kære Erik

Har du læst noget af Hubert Dreyfus - f.eks. What Computers Still Can't Do (1979), Mind Over Machine (1986), On the Internet (2001) - og evt @BentFlyvbjerg som har interviewet Dreyfus-brødrene ("Sustaining Non-Rationalized Practices: Body-Mind, Power, and Situational Ethics. An Interview with Hubert and Stuart Dreyfus." Praxis International, vol. 11, no. 1, April 1991, pp. 93-113. Se også bind 1 af hans doktordisputats Rationalitet og Magt)?
Dreyfus-brødrenes konklusion (og specielt Hubert Dreyfus' brug af Merleau-Ponty) minder lidt om din, nemlig at vi ikke kan adskille sprog, tanke og viden fra menneskekroppen, MEN deres pointe er at det derfor er et næsten UMULIGT projekt. Flere har prøvet forgæves - har forsøgt at bygge ontologier og netværk og lignende som skulle hjælpe maskiner med at "forstå" (se f.eks. kapitel 3 "Artificial Intelligence: From High Hopes to Sober Reality" i Mind Over Machine)
Problemet er al den menneskelige intuitive viden (Dreyfus) og tavse viden (Polanyi m.fl.) som ikke kan ekspliciteres, og når viden ikke kan ekspliciteres, kan den ikke formuleres som regler som en computer kan bruge.
Og så er der al den viden som i TEORIEN kan ekspliciteres, men som kræver mange tusinder, måske millioner, mandetimer (m/k) at fodre maskinerne med. Lad os sige det er muligt/realistisk at fodre en maskine med al den kropsafhængige viden der skal til for at forstå at et udsagn som "Læg dig her, og snup en cola" rummer nogle kropslige begrænsninger/udfordringer. Dels skal maskinen fodres med viden om at cola er noget der kan drikkes, og at vendingen "snup en cola" derfor er en af mange måder at formulere at man indtager cola, dels at der oftest er brus i cola, dels at det er svært eller ubehageligt at drikke når man ligger ned (næsen er næsten på linje med mund og spiserør i forhold til når man står eller sidder, og derfor kan man få brus i næsen). Denne konklusion kan et menneske nå meget hurtigt fordi det har den (krops)viden det har. En computer kan måske nå samme konklusion lige så hurtigt - eller hurtigere - men det forudsætter vel noget der minder om det møjsommelige arbejde det er at opdrage og socialisere et menneske.
Maskinen skal desuden ikke kun have en viden der svarer til hvad ét menneske har tilegnet sig gennem opvækst og socialisering; den skal både vide hvad du og Søren har af fælles viden om regn og musik OG hvad I ikke er enige om.
Når alt det er sagt, er man jo nødt til at begynde et sted hvis man vil have computere til at "forstå" input i et eller andet omfang, men mon ikke det er godt at tage udgangspunkt i en bevidsthed om begrænsningerne, så man ikke (og det er en af Dreyfus & Dreyfus' pointer, bl.a. i kapitel 3 i Mind Over Machine) tager fat på et stjernekrigsprojekt der lover guld og grønne skove?
Glæder mig til at følge Lakoffs team, og håber at du kan bidrage på den ene eller anden måde. God vind.

Problemet med ontologier

Problemet er at alle har deres egen - og en del at min er kendskabet til din.
- og mit kendskab til dit kendskab til min og...

Jeg har en rimelig idé om hvad du overhovedet KAN finde på at sige.
Af samme årsag kan det være svært for unge og ældre at forstå hinanden.
De unge er, som bekendt, vrøvlende, voldelige og perverse, hørt i bussen.

I internetsammenhæng vil forekellene være enorme - uoverstigelige.
Medmindre!

OntologiEN fortsat er computerens (ok, Googles) ejendom.
I stedet for at prøve at forstå hvad en ordblind 11-årig pige fra Andra Pradesh "mener" (komplet umuligt)
kunne løsningen være at personens babysprog først oversættes lokalt, af brugerens egen computer/browser,
til det globale big-brother-speak - før det sendes afsted.

Ens computer/browser bliver altså en MEGET personlig sag, som skal trænes af brugeren selv
- løbende gennem hele livet.

Med, mildt sagt, skræmmende risici (ok, konsekvenser) ift. "privacy".

Og risikoen for at folk driver endnu længere fra hinanden end allerede nu..
- helt mister incitamentet til at forsøge at gøre sig forståelige for hinanden.

Log ind eller opret konto for at skrive kommentarer

Seneste fra Teknologi

  • Her er fremtidens telefon

    Du ser ikke bare et ansigt, men hele personen du taler i telefon med - og du kan gå rundt om ham eller hende. Se videoen med fremtidens telefon.
  • Oplev den danske økoræs-triumf

    To danske hold havde både op- og nedture til Shell Eco-marathon. Her kan du i billeder og video opleve, hvordan det gik.
  • Magnetisk køleskab halverer elregningen

    Når kulde skabes ved hjælp af magnetisme, bruges der ikke meget energi. Samtidig kan man bruge vand i stedet for skadelige drivhusgasser til at transportere varme og kulde.
    Bringes i samarbejde med Det Strategiske Forskningsråd

Det læser andre lige nu

Spørg Videnskaben

Abonner på vores nyhedsbrev

Når du tilmelder dig, deltager du i konkurrencen om lækre præmier.

Mest sete video

Seneste kommentarer

Seneste blogindlæg