Superchatbotten ChatGPT har bestået avancerede advokat– og lægeeksamener, skrevet universitetsopgaver og været medforfatter på en videnskabelig artikel.
Nu indtager den berygtede chatbot-teknologi nyt land:
Søgemaskine-giganter som Google, Bing og kinesiske Baidu er nemlig alle på vej med ny teknologi, der gør brug af AI-drevne chatbots, når du søger på nettet.
\ Kampen om at blive ‘det nye Google’ er i gang
Lige nu kappes flere store tech-virksomheder om at udvikle den chatbot-drevne søgemaskine, der kan blive ‘det nye Google’.
Kapløbet tog fart, da Microsoft sammen med skaberne af ChatGPT 6. februar 2023 præsenterede en helt ny version af deres søgemaskine Bing, der i årtier har stået i skyggen af Google.
Dagen efter – 7. februar – præsenterede Google verden for en ny chatbot-dreven søgemaskine kaldet ‘Bard’ – et andet ord for ‘stor poet’.
Samme dag lancerede den store kinesiske søgemaskine Baidu deres chatbot-søgemaskine ‘Ernie’.
Ingen af de tre nye søgemaskiner er lanceret i sit fulde omfang. Men alt tyder på, at det sker inden for de kommende uger.
Måske lyder det ikke som en forandring, der vil vende op og ned på din hverdag, men spørger man professor i interaktionsdesign Peter Dalsgaard, er det en nyhed, der vil påvirke os alle på sigt.
»Jeg er sikker på, at det vil få stor betydning, fordi alle vil komme til at bruge det her. Det vil skabe en gradvis ændring i, hvordan vi alle tilgår information i vores hverdag,« lyder vurderingen fra Peter Dalsgaard, der forsker ved Afdeling for Digital Design og Informationsvidenskab på Aarhus Universitet.
I sin essens betyder det, at fremtidens Google – og Bing – ikke bare vil præsentere dig for lange lister af søgeresultater, som du selv skal orientere dig i og klikke ind på, når du søger svar på et spørgsmål.
I stedet for at søge ud fra de ord, du skriver, vil de nye søgemaskiner forsøge at ‘forstå’ dit spørgsmål. Og i stedet for at sende dig en lang liste med links, vil chatbotten lave et hurtigt sammenkog af de ‘bedste’ svar til dig.
Hvis du har prøvet ChatGPT, har du nok en god idé om, hvordan det fungerer.
Forskere frygter dog for, at teknologien vil være fordummende og øge graden misinformation. Det kan du læse mere om senere i artiklen.
Letter vores arbejde
Google og andre søgemaskiner er blevet så naturlig en del af vores hverdag, at Dansk Sprognævn i 2008 optog ordet ‘at google’ i den danske ordbog.
»I dag er der stadig en del arbejde overladt til os selv, når vi bruger en søgemaskine. Søgemaskinen viser en række links, hvor du selv skal gå ind og finde svar og lave en sammenligning mellem forskellige kilder,« forklarer Peter Dalsgaard.
Hvis du eksempelvis spørger Google, om ‘der bor flest mennesker i Amsterdam eller København’, vil Google give dig 10 links til hjemmesider, som du så kan klikke dig ind på en ad gangen:
Denne feature med listen af links, vil bestå. Men den nye chatbot vil skubbe listerne med kilder længere ned og gøre dem sekundære.
Derfor ses chatfunktionen som en seriøs udfordrer til den ‘gamle’ algoritme, der gav Google totalt dominans på markedet for søgemaskiner – se faktaboksen.
\ PageRank-algoritmen gav Google verdensherredømmet
Den lange liste med referencer, kilder og links, som vi kender det fra Google i dag, baseres blandt andet på en algoritme, der kaldes PageRank.
PageRank-algoritmen, som Google-skaberne Sergey Brin og Larry Page selv står bag og præsenterede i en videnskabelig artikel i 1998, rangerer de bedste kilder øverst i en googlesøgning.
Selvom det lyder simpelt og næsten som en selvfølge, har algoritmen defineret vores måde at bruge internettet på og inden for et årti gjort Google til en af klodens største og mest magtfulde virksomheder.
Chatbots vil fjerne den del af arbejdet, der tit resulterer i, at man åbner 10 forskellige faner, og skimmer mere eller mindre troværdige blogs for at få svar på et simpelt spørgsmål (hvis du vil læse mere om, hvor dårligt det kan fungere, så læs boksen i bunden af artiklen).
»Så hvis du skal til Berlin og skal bo i Prenzlauerberg, vil den nemt kunne give dig en overskuelig liste med de bedste hoteller og restauranter, der også ligger tæt på en legeplads for eksempel.«
»På den måde vil den lette en del af research-arbejdet, der ligger på vores skuldre,« fortæller Peter Dalsgaard.
Smart? Ja. Men ikke helt uden problemer.
Selvsikre chatbots tager ofte fejl
Chatbotten kan blive en praktisk hjælper, hvis du skal finde ud af, hvor længe kartoflerne skal koge (cirka 15 minutter).
Men den kan hurtigt skabe problemer, hvis du vil finde et godt svar på ‘hvorfor Rusland angreb Ukraine?’ eller finde fakta om Israel-Palæstina konflikten.
Ét kendt problem med AI-drevne chatbots – og kunstig intelligens helt generelt – er, at de har hang til at være lidt for skråsikre i deres svar, påpeger professor Søren Hauberg, der forsker i kunstig intelligens på Danmarks Tekniske Universitet (DTU):
»AI har en tendens til at oversælge og være helt ekstremt selvsikre. Det er meget svært at få dem til at udtrykke en form for usikkerhed,« siger Søren Hauberg, der netop forsker i, hvordan kunstig intelligens kan blive mindre skråsikre:
»Det er en indlejret del af måden, vi har bygget og trænet kunstig intelligens på. En kunstig intelligens har en opfattelse af, at det allerbedst kan svare sig for den at stå fast på sine svar. Også selvom de er forkerte,« siger Søren Hauberg.
»Helt banalt er det et problem, fordi den ganske ofte tager fejl,« tilføjer han.
\ Derfor er kunstig intelligens trænet til at være skråsikre
Om det handler om medicinske prognoser eller sprogmodeller, så har kunstig intelligens en tendens til at være skråsikre og ikke oplyse usikkerhed i sine svar.
Årsagen til dette, skal findes i måden, vi historisk set har trænet kunstig intelligens på. Her kommer en forsimplet forklaring:
Når en kunstig intelligens i sin træningsfase opbygges fra at vide ingenting overhovedet til at kunne svare på spørgsmål, fungerer det ved, at den fodres med et datasæt. Det kan handle om kræftceller eller det danske kongehus.
Når den kunstige intelligens skal trænes i at svare på spørgsmål på baggrund af dette datasæt, sker det ved, at den stilles et spørgsmål, som den kunstige intelligens kan svare ‘ja’ eller ‘nej’ til.
- Hvis den kunstige intelligens svarer korrekt på et spørgsmål, belønnes den med et point.
- Hvis den til gengæld svarer ‘både og’ eller med en usikkerhed på et spørgsmål, så får den kun et halvt point.
Dermed lærer den kunstige intelligens, at det er ‘dumt’ at svare med en usikkerhed.
Når den kunstige intelligens kommer ud af træningsfasen og bruges ude i den virkelige verden, vil den altså hellere give et skråsikkert ‘ja’ eller ‘nej’-svar end et ‘både-og’-svar.
Den proces giver et bias mod, at det bedre kan betale sig at stå fast på sine svar, selvom de er forkerte.
Kilde: Søren Hauberg
Det gode eksempel på det bidrog Google selv med, da de ved præsentationen af deres chatbot Bard bad den om at forklare, hvilke nye opdagelser fra James Webb-teleskopet, man kunne fortælle sin 9-årige om.
Bard svarede blandt andet, at James Webb tog det første billede af en planet uden for vores eget solsystem – en såkaldt exoplanet. Men det var forkert, for det billede blev taget allerede i 2004 af en gruppe astrofysikere fra European Southern Observatory i Chile.
Efter fejlen i præsentationen dykkede Googles værdi med cirka 100 milliarder dollars på aktiemarkedet.
Ikke bruges til fakta
Peter Dalsgaard er helt enig i, at eksisterende chatbots har store begrænsninger, når det har med fakta at gøre.
»For ofte finder de jo bare på ting. Det gør den til en enormt overbevisende ‘bullshit artist’. Men hvis jeg gerne vil finde et hotel i Berlin, vil jeg jo gerne have, at det hotel findes i virkeligheden,« siger han.
Han fortæller, at han har selv har oplevet, at ChatGPT har fundet på bøger og forskningsartikler fra forskere, »der lyder som noget, forskerne kunne have skrevet om, men som ikke fandtes i virkeligheden«:
»Hvis vi skal ind og faktatjekke chatbotten hver eneste gang, vi bruger den, så kan det ikke svare sig, for så er vi jo lige vidt,« tilføjer Peter Dalsgaard, der dog er sikker på, at chatbots med tiden blive bedre til at vise usikkerhed og ikke bare finde på.
En forudsigelse, som Søren Hauberg er enig i:
»Jeg er sikker på, at vi nok skal få sprogmodeller, der er nuancerede og har selvrefleksion på et tidspunkt. Men jeg kan godt være bekymret for, hvornår det kommer til at ske.«
Ifølge Søren Hauberg er sprogmodellerne, som chatbots bygger på, en af de grene af kunstig intelligens, hvor arbejdet med at indbygge usikkerhed er »allermest underudforsket«.
»Der har været ret lidt opmærksomhed i den retning. Fokus har været at udvikle på noget, der virker overbevisende i sine svar, men ikke noget, der giver sikre svar,« forklarer han.
Kan puste til ulighed
Selv hvis chatbotterne bliver modne og lægger deres bullshit-tendenser på hylden, vil de stadig skulle behandles med en stor portion kildekritik.
Professor og filosof Anders Søgaard forsker i sprogmodeller og maskinlæring. Ifølge ham skal vi »passe på, at chatbotterne ikke kommer til at puste til uligheden i samfundet« :
»På den måde, som nye teknologi altid har gjort det, kommer det først de mennesker til gode, der allerede har lettest adgang til teknologien og allerede har et fortroligt forhold til den,« siger professoren fra Datalogisk Institut på Københavns Universitet.
Det vil sige unge, velstillede, storbyboere fra den vestlige del af verden, der i øvrigt også oftest er mænd. Problemet i det opstår i, at maskinlæring-teknologier som chatbots udvikles og påvirkes af den feedback, de får, når de bruges ude i den virkelige verden.
»Det vil sige, at det er dem, der hurtigst giver feedback til sprogmodellen, der til en vis grad træner den. På den måde sniger der sig en bias ind i sprogmodellen, hvis det primært er et ungt urbant publikum, der bruger den,« forklarer Anders Søgaard.
Tilbage i 2016 introducerede Microsoft deres chatbot Tay på Twitter. Tay overlevede dog kun i små 16 timer, før Microsoft trak den tilbage. Internettrolde havde nemlig lynhurtigt lært den at være »mandschauvinistisk og racistisk«.
Samme problematik ses lige nu med ChatGPT, der blandt andet beskyldes for at være ‘woke’ og liberal (i amerikansk forstand) dermed anti-konservativ. ChatGPT nægter eksempelvis at skrive et hyldestdigt til Donald Trump, men skriver gerne en ode til Joe Biden.

Fakta har altid været til debat
Hele problematikken i bias er ikke ny for Google. Siden søgemaskinernes gennembrud har spørgsmålet om ‘søgeneutralitet’ været til debat.
»Misinformation og disinformation er et kæmpe problem. Det vil det også være, når vi får den her nye type søgemaskiner. Men det er en udfordring, som vi kender til i forvejen,« pointerer Anders Søgaard.
Han minder om, at det altid har været til debat, hvad der kan betragtes som fakta eller solid viden, og hvordan denne viden er blevet til:
»Når man har udgivet encyklopædier, håndbøger eller kulturkanoner, vil der altid være en underliggende diskussion af, hvem eller hvad der har fået lov at være med her. Der har altid været kamp om pladserne i den slags udgivelser«.
Samme tendens ser vi på Wikipedia. Ifølge en amerikansk undersøgelse fra 2019 var 90 procent af alle Wikipedia-sider således redigeret af mænd. Kvinder blev chikaneret, når de redigerede på internet-encyklopædien, fortalte forskerne bag undersøgelsen.
»En af de Wikipedia-sider, der bliver ændret allermest på, er den, som handler om Israel-Palæstina-konflikten. Så kildekritik kommer til at være lige så vigtig med denne teknologi, som den har været med alle andre tidligere teknologier,« siger Anders Søgaard.
Kan gavne ordblinde og ældre
En positiv side af det nye chatbot-søgemaskine-ægteskab er, at – den trods frygt for bias – kan have demokratiserende effekter på nogle befolkningsgrupper, påpeger Anders Søgaard:
»I grunden er det jo ikke en ny teknologi. Det er en videreudvikling af den teknologi, som vi kender fra Siri og Alexa, der også er baseret på sprogmodeller. Det, vi har set med den teknologi, er, at de har åbnet muligheder for grupper, der ikke har så nemt ved teknologi. For eksempel ældre, blinde og ordblinde, som synes, internettet er svært at navigere rundt.«
»Den gruppe af mennesker, mener jeg også, at chatbot-teknologien kan komme til gode.«
»Ser det som et fremskridt«
Så bliver de nye chatbot-drevne søgemaskiner en forbedring eller forringelse af vores hverdag?
»Jeg ser det klart som et fremskridt,« lyder det fra Peter Dalsgaard:
»Der er udfordringer og problemstillinger og potentielle konflikter relateret til det. Men kigger man på den måde, som det kan lette vores hverdag på og eliminere en del af arbejdet, der ellers påligger os, når vi søger efter information på nettet, så tror jeg, at de fleste nok vil se det som et fremskridt«.
For tidligt ude
Søren Hauberg er mere loren i sin dom.
Han påpeger, at chatbot-ræset lige nu er drevet af »at komme først« med de bedste chatbots og sprogmodeller. Men ingen tænker på, hvor hensigtsmæssige de egentlig er for samfundet.
Spørger man ham, er teknologien udrullet en postgang for tidligt.
»Denne generation af sprogmodeller slog først rigtig igennem i 2017. Det vil sige, at vi kun har haft et par års tid til at overhovedet at vænne os til det her i forskningslaboratorierne. Nu er det allerede ude som produkt. Det, synes jeg, er lidt tidligt,« siger Søren Hauberg.
Hvis Google – som der er lagt op til – inden længe udruller en ny måde at søge information på nettet, frygter han, at det kan gøre skade og virke fordummende på de skoleelever, der ubevidst fungerer som testkaniner for produktet.
»Det er selvfølgelig spekulativt, for vi ved ikke præcis, hvad Google kommer med. Men jeg kunne godt se et problem i, at de her sprogmodeller træner skoleelever i dum skråsikkerhed i et par år, inden de bliver helt gode.«
»Det kan jo påvirke et par ungdomsårgange, men det er dælme også meget.«
\ En kedelig fortælling om at fare vild på Google
Hvor mange googlesøgninger finder sted hvert sekund?
Et simpelt spørgsmål, som det bør være lige til at google sig til. Det skulle man i al fald tro.
Da Videnskab.dk’s journalist googler sig frem til det simple svar, der skulle fungere som den gode indledning til denne artikel, ender jagten efter fakta nemlig hurtigt med en vildfarelse i internettets mørke jungle.
Google kvitterer med svimlende 261.000.000 søgeresultater. Ingen af de øverste søgeresultater linker til kendte hjemmesider, og inden længe er man endt på sider som firstsiteguide.com, oberlo.com og techjury.net.
Blogs skrevet af skribenter som Maryam Mohsin, Aleksandar S. og Ogi Djuraskovic, der i øvrigt alle give vidt forskellige svar, selvom deres indlæg alle er skrevet indenfor det seneste år.
- Maryam Mohsin fra oberlo.com fortæller mig, at Google »ifølge seneste data behandler 99.000 søgninger per sekund.«
- Ifølge Ogi Djuraskovic fra firstsiteguide.com »går der ikke et eneste sekund, uden at Google behandler omkring 40.000 søgninger.«
- Endelig mener Aleksandar S fra techjury.net, at Google – meget præcist – varetager 104,895 søgninger hvert eneste sekund.
Til gengæld henviser de allesammen til tal fra hjemmesiden internetlivestats.com, der måske lugter lidt af en faktuel og lødig kilde. Men internetlivestats.com vil ikke loade siden, der skulle fortælle, hvor mange googlesøgninger, der finder sted hvert sekund.
10-15 minutter senere er ingen blevet klogere.
Pointen med kedelige historie er at vise, hvordan simple internetsøgninger hurtigt kan ende for rigtig mange mennesker i dag. Med et utal af åbne faner, tvivlsomme kilder og sidste ende vidt forskellig bud på fakta.