Computer har menneskelignende evner - opfinder nye skrifttegn

Computere har længe kunnet overgå mennesker: De regner hurtigere, kan søge informationer hurtigere og kan slå både almindelige mennesker og verdensmestre i skak. Algoritmer kan genkende ansigter og kan regne ud, hvad der er det næste, vi vil købe online.

En ting kan vi mennesker dog stadig glæde os over: Det computerne er gode til, er som regel noget, programmørerne har lært dem. At lære nyt, er vi stadig overvældende overlegne til.

Men nu har en gruppe forskere i USA og Canada taget et væsentligt skridt mod en maskine, der lærer på sammen måde som menneskehjernen. De tre forskere fra Massachusetts Institute of Technology, New York University og University of Toronto har udviklet en algoritme (altså den kode, der får computeren til at beregne på en bestemt måde), der gør en computer i stand til at lære sig at håndskrive alverdens skriftsprog. Vel at mærke, uden at forskerne har lært den det. Resultatet er netop offentliggjort i tidsskriftet Science.

»Vores arbejde har to formål: Vil vil gerne forstå, hvordan folk lærer, og for os har det betydet at finde ud af hvordan læring virker i den menneskelige hjerne. Samtidig vil vi også bygge maskiner, der lærer på en mere menneskelig måde. Vi ser de to projekter som tæt forbundne, og vi tror på, at vi har nået et vigtigt skridt her,« siger Joshua Tenenbaum, der er professor i Cognitive Science and Computation på Massachusetts Institute of Technology (MIT) og medforfatter til artiklen på en telekonference for videnskabsjournalister forud for offentliggørelsen af forskningsresultatet.

»For forskere, der som jeg studerer sindet, er forskellen på maskiners og menneskers evne til at lære enorm. Vi vil udviske den forskel, og det er vores langsigtede mål,« siger Joshua Tenenbaum.

Gætter på, hvordan verden hænger sammen

De tre forskere har i deres arbejde forsøgt at lære af mennesket og kopiere det. For mens deep learning-systemer, der er blandt de mest avancerede systemer til maskinlæring i dag, kan lære at genkende billeder, ansigter, dyr, symboler, stemmer og meget andet, så kræver det ofte, at de ser hundreder eller tusinder af billeder af løver, før de kan genkende en løve på et billede.

Annonce:

Mennesker skal derimod ofte bare se en ny ting én eller nogle få gange, før vi kan genkende den.

»I århundreder har filosoffer været fascineret af hvad de kalder induktionsproblemet: Hvordan og hvornår kan vi inducere et generelt koncept fra et enkelt eller nogle få eksempler? Menneske-børn er mestre i at inducere, mens maskiner i bedste fald er novicer,« siger Joshua Tenenbaum.

Forskerne kombinerer flere førende metoder i et system, de kalder Bayesian Program Learning. Eller mere mundret BPL. Her forsøger man at kopiere menneskehjernens evne til at generalisere ud fra meget lidt data. BPL vurderer sandsynligheden for, at det eksempel, den ser, hænger sammen på en bestemt måde med bayesiansk sandsynlighed (efter statistikeren Thomas Bayes, deraf også navnet Bayesian Program Learning).

Inde i BPL’s algoritmer gør maskinlæringssystemet det samme, som forskerne forestiller sig, at menneskehjernen gør: Når man for eksempel ser en flok turister komme drønende på segwayer for første gang, deler man segwayen op i de dele, vi tror, den består af: to hjul, en smal strang, et håndtag. Det kan godt være, der er flere dele, men vi vurderer, at det er sandsynligt, at hjul, stang og håndtag skal være der, for at der er tale om en segway.

Og man deler delene op i delelementer: Hjulene består af dæk og hjulkapsler. Endelig registrerer man mellemrummet mellem delene og delelementerne.

Det samme gør BPL: Den registrerer dele, delelementer og mellemrum i de ting, systemet ser, og ud fra tolkningen af disse informationer skaber den kategorier, på samme måde som vi mennesker skaber en sproglig kategori, når vi kalder den to-hjulede himstregims for en ‘segway’.

Bedre til at genkende skrifttegn end mennesker

For at teste systemet, satte Joshua Tenenbaum og hans kolleger BPL til at se på 1.623 skrifttegn fra 50 forskellige skriftsprog. Ifølge forskerne er håndskrevne skrifttegn gode forsøgtobjekter, fordi de både består af dele (streger), delelementer (dele af stregerne) og mellemrum (afstand mellem stregerne). Samtidig er det at håndskrive et skrifttegn, man har lært, en opgave, der er simpel nok til at computeren ville have en chance for at konkurrere med mennesker, sådan at forskerne kunne sammenligne menneske og maskine.

Annonce:

Både BPL og menneskelige forsøgspersoner blev vist et skrifttegn fra et af skriftsprogene. Derefter blev de vist 20 tegn fra samme skriftsprog, hvor kun ét var det samme som det første skrifttegn, men skrevet af en anden person. BPL og forsøgspersonerne blev derefter bedt om at udpege skrifttegnet.

Men hvor deep learning-systemer ville skulle se skrifttegnet hundredevis af gange for overhovedet at kunne genkende det, delte BPL det op i dele, delelementer og mellemrum og vurderede sandsynligheden for, at den havde gjort det korrekt. På den måde kunne systemet ofte genkende skrifttegnet efter kun at have set det én gang og havde en fejlmargin på 3,3 procent. De menneskelige forsøgspersoner tog fejl 4,4 procent af gangene.

»Det fører til evnen til at genkende en enkelt visning på menneskeligt niveau, som ingen anden algoritme, vi testede, var i stand til at matche,« siger Joshua Tenenbaum.

En kreativ computer

Det er nærmest umuligt at se forskel på menneske og maskine. Computeren og et menneske har hver tegnet ni udgaver af et givent tegn. Maskinen har tegnet række: B,A, A, B, A, B (Illustration: Brenden Lake)

Men Joshua Tenenbaum og de øvrige forskere ønskede også at teste, om BPL kunne skabe nyt. Kreativitet er stadig en af de store udfordringer for kunstig intelligens, og forskerne viste derfor både BPL og forsøgspersonerne nogle få skrifttegn fra et skriftsprog og bad dem derefter om lynhurtigt at opfinde et nyt tegn, der kunne være en del af sproget.

Måden at måle, om kunstig intelligens rent faktisk er intelligent, er ofte den såkaldte Turing-test, opkaldt efter den legendariske matematiker Alan Turing. I den oprindelige test skulle et menneske og en maskine føre en samtale. En person, der ikke vidste, hvem der var hvem, skulle se en udskrift af samtalen og vurdere, hvem der var maskinen. Kunne personen ikke se på det sagte, hvem der var mennesket, havde maskinen bestået testen.

»For de mere kreative opgaver, hvor man beder nogen om at tegne noget eller at skabe noget, de ikke har set før, kan jeg ikke komme i tanke om en bedre test – det var formentlig derfor Turing forslog testen, for han ville teste de mere kreative, fleksible dele af den menneskelige hjerne,« siger Joshua Tenenbaum.

Forskerne brugte en visuel Turing-test, hvor forsøgspersoner blev bedt om at vurdere, om de nyopfundne skrifttegn var lavet af et menneske eller en maskine. I et af forsøgene lykkedes det forsøgspersonerne at identificere BPL korrekt i 49 procent af tilfældene – altså lige omkring, hvad der ville komme ud af et tilfældigt gæt.

Annonce:

Da forskerne gjorde kravet til kreativitet større og bad BPL og forsøgspersonerne om at opfinde et skrifttegn, der ikke skulle minde om noget bestemt skriftsprog, klarede BPL sig dog dårligere. Her blev maskinen genkendt i 57 procent af tilfældene.

Med styrke følger også svaghed

Men forsøget på at lære fra menneskehjernen rejser også spørgsmål. For samtidig med, at vores evne til at skabe en hel kategori inde i hovedet ud fra bare et enkelt eksempel er en del af årsagen til vores uovertrufne evne til at lære enorme mængder af viden, skaber mennesker af samme grund også fejlslutninger og stereotyper.

»Vi er meget opmærksomme på menneskets bemærkelsesværdige evne til at forstå verden, men vores evne til at misforstå den er også virkeligt slående. Inden for vores forskningsfelt ligner det to sider af samme sag. Men når vi ser på dette fra en ingeniørs synsvinkel, er vi mest interesserede i at forstå, hvordan vi forstår verden på den rigtige måde – hvordan selv et lille barn kan være klogere end et hvilket som helst maskinlæringssystem, der nogensinde er bygget,« siger Joshua Tenenbaum.

Joshua Tenenbaum mener samtidig, at det rejser vigtige spørgsmål, at datalogerne og de kognitive forskere nu er begyndt at bygge computere, der lærer mere ligesom mennesker.

»Det er et interessant spørgsmål, om vi ønsker, at maskiner skal arve vores svagheder sammen med vores styrker. Og om det overhovedet er muligt for dem at have styrkerne uden svaghederne,« siger han.

Foreløbigt ser forskerne potentiale for at udvide BPL fra at kunne skrive skrifttegn til også at kunne lære at genkende stemmer, genkende bevægelser og lignende.

Forsker: Kan kombineres med deep learning

På DTU Compute på Danmarks Tekniske Universitet (DTU) mener Ole Winther, at forskningsprojektet bidrager med interessant nyt. Han er lektor på afdelingen for kognitive systemer og forsker selv i maskinlæring.

Annonce:

»De prøver at lave en model, som i princippet kan drømme nye data op,« siger Ole Winther.

»Inden for machine learning kan man – når man har trænet sin model – lade den drømme og se, om den kan generere nyt data, der ligner rigtigt data. Det, de får ud, ligner rigtige skrifttegn, men de er ikke identiske med dem fra træningssættet, så den har lært at trække essenesen ud af skrifttegnene,« siger han.

Ole Winther ser potentiale for, at forskergruppens model kan kombineres med de eksisterende deep learning-metoder, der kræver meget store data-mængder for at fungere. Samtidig kunne det være en måde at forhindre nogle af fejlslutningerne, der er en risiko, når man bygger konklusioner på et lille datamateriale.

»Mens deep learning bruger en masse, masse data på en hurtig computer for at komme op på menneskelige præstationsevner, har de bygget en simpel model, der prøver at efterligne den måde, mennesker genererer læring. Der er ikke noget til hinder for, at man bruger modellen kombineret med deep learning, så man slår modellen oven i hovedet med deep learning, hvis man identificerer nogle stereotyper, den har lært,« siger Ole Winther.