AI kan identificere forbryderen, men vi ved ikke, hvordan den gør
Når politiet står med en DNA-suppe på gerningsstedet, kan kunstig intelligens udpege forbryderen. Vi kender bare ikke dens metode. Og om den har ret.
Når politiet står med en DNA-suppe på gerningsstedet, kan kunstig intelligens udpege forbryderen. Vi kender bare ikke dens metode. Og om den har ret.

Et knækket hårstrå, et enkelt fingeraftryk, eller måske et nys, der ramte bordet og ikke ærmet.
Det er den type spor, politiet i dag bruger, når de skal på sporet af en forbryder.
Fintfølende analyseteknikker, der er udviklet gennem de sidste 20 år, betyder, at politiet nu kan opdage små spor af DNA på et gerningssted eller på et bevis.
Men spor fra en gerningsmand er ofte blandet med spor fra mange andre uskyldige personer.
Spor, der er blevet overført til prøvestedet, for eksempel via et håndtryk, og har ført til, at de forkerte folk er blevet uskyldigt dømt.
Det problem er nu ved at blive løst med hjælp fra AI - kunstig intelligens. Men desværre er historien ikke så lys, som den lyder.
For hvordan kommer AI’en frem til sine svar? Og hvordan ved vi, den ikke også tager fejl?
Jeg forsker i bevisret, og har udgivet en videnskabelig artikel om DNA og kunstig intelligens i de jurastuderendes tidsskrift ’Retskraft’ på Københavns Universitet. Det vil jeg fortælle om herunder.
Hvad gør kunstig intelligens ved vores samfund? AI bliver brugt i mobiltelefoner, ChatGPT, selvkørende biler, røntgenundersøgelser og meget, meget mere.
Men tager AI vores arbejde, eller kan AI hjælpe os til et bedre samfund? Skal vi være fascinerede, begejstrede eller nervøse? Hvilke dilemmaer følger med udbredelsen af AI?
De næste uger og måneder angriber en række forskere AI fra hver deres forskningsfelt her på Videnskab.dk's 'Forskerne formidler'.
I 2010’erne udviklede forskere algoritmer til at adskille den DNA-suppe, der kan være på gerningssteder.
Algoritmerne kunne også måle de relative mængder af hver persons DNA i en prøve.
Metoden kaldes ’sandsynlig genotype-bestemmelse’.
Den har gjort det muligt at angive, med hvilken sandsynlighed et DNA-spor fra gerningsstedet tilhører den skyldige.
Man får viden om, at ét DNA fra ’suppen’ på gerningsstedet med høj sandsynlighed tilhører en uskyldig person, mens et andet DNA har en langt højere sandsynlighed for at tilhøre den skyldige.
Beviser afledt af ’sandsynlig genotype-bestemmelse’ løb dog meget hurtigt ind i udfordringer.
Hvor nøjagtige var resultaterne, og hvad var den kendte fejlrate? Hvordan fungerede softwaren præcist, og kunne den rumme hypoteser, der forsvarede den anklagede?
Var resultaterne virkelig så pålidelige, at en jury sikkert kunne dømme?
Det er et grundlæggende princip i loven, at beviser skal være åbne for kontrol.
Juryen kan ikke stole på påstande, der er fremsat uden beviser, uanset hvem der fremsætter dem, og hvad deres ekspertise er.
Men ejerne af softwaren bag beregningerne har altid argumenteret for, at algoritmerne var deres beskyttede intellektuelle ejendom, og at det ikke burde offentliggøres, hvordan de fungerede.
En kamp fulgte, der involverede brugen af nye domstolsprocedurer, for at give forsvarshold mulighed for privat at undersøge, hvordan softwaren fungerede, uden at algoritmerne blev offentligt tilgængelige.
Til sidst besluttede domstolene dog at overtrumfe virksomhedernes ønske om at holde koderne hemmelige, så der kom fuld adgang til kildekoden for forsvarsadvokaten.
Det, mente de, var nødvendigt, ikke mindst for at teste andre hypoteser end dem, som anklagemyndigheden havde fremført.
Det var naturligvis et skub i den rigtige retning, i forhold til at kunne tjekke, om algoritmerne regnede rigtigt, men det løste ikke de problemer, der var med selve softwaren.
Vi vidste stadig ikke med sikkerhed, om DNA'et i en prøve kom direkte fra en person eller var blevet overført til gerningsstedet.
Og udfordringen blev kun mere kompliceret af, at forskellige mennesker udskiller DNA i forskellige hastigheder - et fænomen som hedder ’shedder-status’ på engelsk (se boks herunder).
Eksempelvis kan en prøve taget fra et mordvåben indeholde mere DNA fra en person, der ikke har rørt det, end fra den person, der faktisk er morderen. Folk er blevet uskyldigt dømt på grund af dette.
Hastigheden afhænger dog ikke kun af det enkelte individ, DNA-udskillelsen hænger også sammen med typen af overflader, man er i berøring med, og miljøforhold.
Det kan blive næsten umuligt at vide præcist, hvor DNA i en prøve kommer fra, og problemet viser, hvor usikkert det kan være at bruge DNA som afgørende bevis i retssager.
Shedder-status betyder tilbøjeligheden til at efterlade DNA.
En persons shedder-status er blevet identificeret som en væsentlig faktor, der regulerer DNA-overførsel fra et menneske til et gerningssted.
Det er kendt, at nogle individer har tendens til at udskille mere DNA end andre, men mekanismerne bag shedder-status er stort set ukendte.
Person A med lav shedder-status giver hånd til person B med høj shedder-status. Så håndterer person A en kniv. Der er herefter mere af person B’s DNA på kniven end af person A, selvom person B aldrig rørte kniven direkte. Det er effekten af 'shedder-status'.
AI har potentialet til at analysere DNA-spor og bruge resultaterne til at angive, hvordan DNA’et er havnet på gerningsstedet.
Derfor vil man meget gerne udvikle mere sofistikerede kunstige intelligens-teknikker til at udtrække DNA-profiler.
Derved kan man finde ud af, om en DNA-prøve kommer direkte fra en person, der var på gerningsstedet, eller blot er blevet uskyldigt overført, eksempelvis via håndtryk.
Det kunne jo lyde meget godt, at AI kan hjælpe os med at dømme færre uskyldigt, og fange de rigtige forbrydere, ved at løse de udfordringer, de tidligere algoritmer havde.
Men hvis AI-teknologien lykkes, kan den introducere et problem, vi allerede stødte på, med de tidligere algoritmer: I øjeblikket er det umuligt at forstå præcis, hvordan AI’en når sine konklusioner.
Hvordan kan vi stole på, at teknologien leverer afgørende beviser, hvis vi ikke kan afgøre, hvordan den producerer beviserne?
Det har potentialet til at åbne vejen for flere sager, hvor uskyldige dømmes.
Denne mangel på gennemsigtighed kan være en barriere for teknologiens brug i retsmedicinske undersøgelser.
Men AI som retsmedicinsk analysesoftware har et endnu større gennemsigtighedsproblem end algoritmerne bag det gamle ’sandsynlig genotype-bestemmelse’, som jeg beskrev længere oppe.
Et problem, der er grundlæggende for den måde, det fungerer på:
Den nøjagtige måde, softwaren fungerer på, er ikke kun en forretningshemmelighed – hvordan AI fungerer er uklart, selv for softwareudviklerne.
AI bruger matematiske algoritmer til at udføre opgaver såsom at matche et ansigtsudtryk til et bestemt sæt følelser.
Men altafgørende, så er teknologien i stand til at lære gennem en proces med forsøg og fejl. Den kan ændre sin egen konfiguration for at blive mere effektiv.
Det er denne manipulations- og forandringsproces, der ikke er gennemsigtig. Softwaren foretager sine ændringer utroligt hurtigt i henhold til sin egen uudgrundelige logik.
Det kan give forbløffende effektive resultater, men vi kan ikke sige, hvordan AI’en gjorde det. Det fungerer som en ‘black box’, der tager input og giver output, men de indre funktioner er usynlige.
Programmører kan undersøge AI-koden og forklare udviklingsprocessen, og hvordan AI’en fungerer, men det er langsommeligt og mindre effektivt.
Dette problem med gennemsigtighed påvirker en bred vifte af anvendelser af kunstig intelligens indenfor retssystemet og politiets arbejde.
For eksempel bliver det meget vanskeligt at rette op på AI-systemer, hvis beslutninger viser en racemæssig eller kønsmæssig skævhed.
AI’s med den type bias, bruges blandt andet i USA til at forudsige hvilke områder og hvornår der er størst risiko for kriminalitet, og til at genkendte ansigter.
Så skal vi overhovedet bruge denne uigennemskuelige teknologi til at bedømme, om et menneske har været en del af en forbrydelse, eller blot ved tilfælde har efterladt sit DNA på gerningsstedet?
Forsvarsadvokater kunne lovligt udfordre brugen af AI i retssalen. Så kan brugen af kunstig intelligens begrænses til efterforskning i stedet for at levere retsforfølgelses-beviser i retssalen.
Medmindre spørgsmålet om gennemsigtighed tages op tidligt i teknologiens udvikling, ender det med, at vi ikke kan bruge det, vi lærer i retten, når vi bruger AI til at analysere spor og beviser efter en forbrydelse.
Hvordan kan vi tackle disse udfordringer?
En mulighed kan være at vælge de mindre effektive, begrænsede former for kunstig intelligens, hvor vi ved, hvordan de regner sig frem til svarene.
Men hvis formålet med kunstig intelligens er at udføre de opgaver, vi selv ikke ønsker eller er dårlige til, så kan det være en dårlig løsning at reducere effektiviteten.
Uanset hvilken form for kunstig intelligens vi vælger at bruge til at efterforske og dømme forbrydelser, skal der være mulighed for gennemgang af teknologiens koder og arbejdsprocesser.
Det er nødvendigt for at forbedre automatiserede beslutninger, og for tredjeparter til at give en utvetydig validering af AI.
I sidste ende er dette ikke blot et teknisk problem, men et presserende etisk problem i hjertet af vores strafferetlige systemer.
På spil er retten til en retfærdig, åben og gennemsigtig rettergang.
Dette er et grundlæggende krav, som skal løses, før vi kan bruge AI i retssystemet.