Hvis du kunne få at vide, om du vil dø mellem dit 40. og 65. år, ville du så takke ja til spådommen?
Dén situation er faktisk ikke helt hypotetisk længere, for forskere fra Danmarks Tekniske Universitet har udviklet en ‘livs-forudsigende’ algoritme i et nyt studie.
Oplært på data på over 3 millioner danskeres liv fra Danmarks Statistik kan den nye model, ‘life2vec’, forudsige en persons tidlige død eller udviklingen af ens personlighed med cirka 78 procents nøjagtighed.
At præcist kunne kortlægge vigtige udfald i borgeres liv har på sigt stor interesse for eksempelvis beslutningstagere eller sundhedssystemet.
Men først og fremmest håber forskerne, at algoritmen kan gøre os klogere på, hvad computermodeller kan forudsige, og hvad de ikke kan.
»Vi har fundet en helt ny måde at analysere mennesker og data på. Det kan forhåbentlig gøre os klogere på, hvordan vi forudser et menneskeliv,« siger Sune Lehmann, professor i kompleksitet- og netværksvidenskab på Danmarks Tekniske Universitet og hovedforfatter til den videnskabelige artikel.
\ Hvem kan bruge modellen?
- Hvis du ligefrem får lyst til at bruge modellen selv, må du blive skuffet: Den er i sikker forvaring hos Danmarks Statistik og er ikke til brug udover forskning.
- Grunden er at den bygger på mange personfølsomme oplysninger og desuden kun er en videnskabelig prototype.
- Forskerne bag modellen understreger, at modellen i dens nuværende tilstand ikke er beregnet til opgaver i den virkelige verden.
- Selv hvis den hypotetisk skulle bruges til beslutningstagning på regerings-niveau eller i sundhedssystemet, skulle den gennem mange prøver for at sikre, at dens vurdering af enkeltpersoners liv ikke er misvisende på nogen måde.
Kilder: Sunde Lehmanns profil (DTU)
Prøvede noget nyt: Byggede algoritmen ud fra en sprog-model som ChatGPT
Der er interesse i at bruge algoritmer til at forudsige alt fra terror til proteiners adfærd til hvilken Netflix-serie, du har lyst til at se efter den, du er i gang med nu.
Men at forudsige et helt menneskeliv, hvis det overhovedet kan lade sig gøre, er et svært problem.
Selv maskinlærings-modeller fodret med data om personers uddannelses-niveau, familie, sundhed og forhold har svært ved at finde mønstre i det.
\ Maskinlærings-modeller
- Maskinlæring er en slags kunstig intelligens, der prøver at efterligne, hvordan mennesker lærer.
- En maskinlærings-model tager altså store datasæt ind, som den prøver at finde mønstre i. Så laver den forudsigelser baseret på, hvad den har lært.
- Ét eksempel er den Netflix-algoritme, der anbefaler dig nye film og serier, baseret på hvad du tidligere har set.
Kilder: IBM
Derfor valgte forskerne at bruge en lidt anden type model: En stor sprog-model som den, der ligger bag ChatGPT.
Simpelt forklaret fungerer sprog-modeller sådan, at de ser en sætning som en sekvens med led (ord, bøjninger og lignende). Trænet på en masse tekst kan de så forudsige, hvilke led der kommer efter hvilke. Sådan kan de bygge sætninger og skrive for os.
Life2vec er trænet til at se menneskeliv som en sekvens af led, altså begivenheder.
»Menneskers liv har jo en del strukturelle ligheder med sætninger i et sprog. Ligesom ord følger hinanden i en sætning, så følger fødsel, uddannelse, forhold og død hinanden i et menneskeliv. Det er den slags mønstre, sprog-modeller er gode til at forudse,« forklarer Sune Lehmann.
Modellen var trænet med data fra over 3 millioner danskere på 38 til 65 år, indsamlet i 2008-2015. Dataen dækker mange forskellige emner, såsom patient-data fra hospitalsbesøg, hvor personernes indkomst er kommet fra, pensions-data.
Den blev så sat til at fokusere specifikt på 100.000 tilfældigt udvalgte personer af de, den havde data på, og så forudsige hvilke af de personer, der ville dø frem mod 2020. I disse forudsigelser havde den ret i 78 procent af tilfældene.
Den var også god til at bedømme udvikling i folks personligheder gennem livet. For eksempel hvor tilfreds personen er med sig selv, om de ser sig selv som upopulære, eller er gode til at sige deres mening, selv i store grupper.
»Modellen er stadig ikke super-præcis, men vi har bevist, at den virker, og at man kan bruge sprog-modeller sådan her. Næste skridt er så at bruge den til noget fornuftigt, ,« siger Sune Lehmann.
Der er grænser for algoritmens forudsigelser
Grænserne for den her slags algoritme skal undersøges nærmere, men indtil videre har forskerne med det nye studie kun fastslået, at den kan forudsige en håndfuld ting.
»Man skal IKKE tro, at algoritmer som den her nu betyder, at vi pludselig kan forudsige alting, der kan ske med et menneske i livet,« påpeger Matthew Salganik, professor i sociologi på Princeton University, der har læst studiet for Videnskab.dk.
Det er også vigtigt at fastslå, at algoritmen har et nogenlunde greb om tidlig død omkring de 38 til 65 år. Det er altså ikke en spådoms-maskine, der bare ved, hvornår man dør.
Beregneren har dog opnået virkelig flotte resultater sammenlignet med andre forsøg, så den åbner for fremtidig forskning i dens grænser, hvor præcis den kan blive, og hvad den kan forudsige.
»Mere præcise modeller som den her kan føre til, at vi også bliver klogere på de helt store spørgsmål som, hvor grænserne går for forudsigelser,« mener Matthew Salganik:
»Man kan derfor se den her algoritme lidt som en ny satellit, vi kan bruge til at se fjerne stjerner fra nye vinkler med.«
\ Livs-forudsigelse og privatliv
- Det kan måske lyde bekymrende at høre om studier der bruger store mængder data fra mange privatpersoner og prøver at forudsige folks liv, noget som Sune Lehmann godt ved.
- Hvad angår den nye model, er dataen lagret hos Danmarks Statistik, anonymiseret og kan ikke tilgås via internettet.
- »Faktum er også, at den her form for dataindsamling til forudsigelse allerede sker hos techgiganter som for eksempel Google og Meta, med detaljerede data indsamlet gennem vores brug af sociale medier og lignende,« forklarer han.
- »Derfor er det vigtigt med åben forskning som det her studie. Den slags forskning gør at vi kender grænserne og kan sige 'Hey, det her kan vi bruge folks data til nu'. Så kan vi tage stilling til, hvad vi finder os i og ikke finder os i i samfundet.«
Kilder: Sune Lehmanns profil (DTU)
Livs-forudsigelse interessant i mange kroge af samfundet
Computer-modeller er allerede i brug hos læger, hvor de kan bidrage til diagnoser, og i banker, hvor man er ivrig efter at kunne forudsige kunders penge-vaner.
Men algoritmer, der kan se betydningsfulde øjeblikke i vores liv, inden de sker, ville kunne give en bredere forståelse af, hvordan folks liv udvikler sig og hvorfor.
»Inden for sociologien mener vi, at visse forløb fører til bedre eller værre liv, og nogle af disse forløb kan vi måske forudse og forhindre med de rette midler,« siger Matthew Salganik.
Udover videnskabelig indsigt kan modeller som life2vec være meget interessante for beslutningstagere i forhold til at opbygge samfundet sådan, at det fører til bedre liv.
»Den her type model er en vild ny måde at tænke på data og mennesker på, og vi glæder os til at finde ud af, hvad den kan blive til,« siger Sune Lehmann.































