Ikke to patienter er ens. Men når hundredtusindvis af danskere har en kronisk sygdom, er det ofte nødvendigt at opstille ensartede undersøgelsesprogrammer og behandlinger for at sikre god og lige behandling til alle.
\ Historien kort
- Maskinlæring handler om, hvordan computere løser opgaver bedre og bedre ved at se mønstre i data og lære af selvskabte erfaringer
- I Danmark har vi i årtier indsamlet sundhedsdata i forbindelse med receptindløsninger, indlæggelser og besøg ved egen læge
- Disse data vil kunne omsættes til præcise forudsigelser af alvorlige sygdomme og bedre organisation af sundhedsvæsenet
Hvad hvis jeg fortalte dig, at teknologien til at gøre dette mere individuelt og præcist allerede findes i dag? Og at den teknologiske udvikling på dette område vil være i en rivende udvikling langt op i næste årti?
I dagspressen fyger det med ord som ‘maskinlæring’, ‘artificial intelligence’ og ‘deep learning’. Men hvad betyder de ‘big data’-termer, og hvordan kan de hjælpe os med at forbedre individuelle behandlingsforløb?
Det vil jeg redegøre for her ved at gennemgå mit eget arbejde med maskinlæring og give mit bud på, hvad vi kan forvente os i det næste årti.
Jeg brugte maskinlæring til at forudsige brækkede knogler, og det samme vil man kunne gøre med blodpropper, hjerte-kar-sygdomme og kræftsygdomme.
Men det kan også bruges til at effektivisere sundhedsvæsenet ved at forudsige, hvilke patienter der udebliver fra en aftale, og hvor mange senge der er ledige på en given dag.
Hvor godt kan man forudsige brækkede knogler?
Min egen baggrund i maskinlæring kom under mit ph.d.-forløb om knogleskørhed.
Udgangspunktet var simpelt: Hvis vi tager samme tilgang til vores sundhedsdata, som forsikringsbranchen tager til deres data – dvs. fokuserer 100 procent på evnen til at forudsige – hvad kan vi så opnå, og hvad kan det få af betydning for vores evne til at forudsige knoglebrud i hoften?
Motivationen for at begynde denne proces kom, da jeg læste om aktuarers brug af maskinlæring. Deres tilgang var en kontrast til det, jeg oplevede som svagheder i mange medicinske artikler.
Her undersøger man ofte bestemte risikofaktorers betydning for at udvikle bestemte sygdomme.
Et eksempel kunne være hjertekarsygdomme: hvilke faktorer øger ens risiko for at blive ramt af en blodprop i hjertet?
De fleste i Danmark kan remse rygning, overvægt, forhøjet kolesterol og arvelighed op som risikofaktorer.
Den forståelse er typisk kommet fra studier, hvor man ud fra eksisterende studier, egne erfaringer og mulige kausale sammenhænge modellerer et antal risikofaktorer til et ‘Ja/Nej’ svar på, om man udvikler en bestemt sygdom over en tidshorisont.
\ Læs mere
Hvad hvis vi kan give den enkelte en præcis risikoprofil?
Problemet er, at man typisk fokuserer relativt mere på associationernes styrke frem for selve præcisionen i at forudsige hjertekarsygdom. Du ser tit en avisoverskrift med titlen ‘Rygning øger risikoen for blodpropper’, men aldrig ‘Forskere kan forudsige hjertekarsygdomme med 74 procent præcision’.
Men hvad er vigtigst: at fortælle en patient, at vedkommende skal tabe sig og ryge mindre for generelt at undgå hjertekarsygdomme eller at kommunikere en konkret risikoprofil til den enkelte patient?
Hvad hvis rygning for én patient betyder en blodprop som 35-årig, mens en anden kan leve et langt og uproblematisk rygerliv? Og hvad med alle de faktorer såsom genetik, miljøpåvirkninger og arbejdsliv, som aldrig inddrages?
Grundstenen i mit projekt blev et spejl heraf: Først ville jeg kunne forudsige hoftebrud så præcist som muligt og først derefter udtrække de vigtigste risikofaktorer.
Fokus på morgendagens patient, ikke gårsdagens
Første og vigtigste skridt i denne tilgang er at adskille data, man bruger til skabe sine forudsigelsesmodeller, og data, man bruger til at teste sine modeller på.
Man ‘gemmer’ så at sige en andel af patienterne til allersidst. Det sker efter devisen, at modellen skal vurderes på, hvor god den er til at forudsige, hvem der bliver ’morgendagens’ patient.
Jo mere kompleks en forudsigende model er, jo mere præcist vil den håndtere patienterne, som den bygger på.
Mindre kendt er det, at man veksler denne højere ‘interne’ præcision med desto højere usikkerhed på de næste 100, man bruger modellen på (læs mere herom i boksen under artiklen).
Netop derfor er det så vigtigt at fokusere modellen på morgendagens frem for gårsdagens patient.

‘Big data’: Hvad gør man med 75.000 stykker information?
For at opbygge datasættet forsøgte jeg at klemme så mange dråber ud af de tilgængelige data som muligt.
For data om receptindløsninger nøjedes jeg ikke kun med ‘Ja/Nej’ for bestemte medicintyper, men også afledte stykker information: Samlede udgifter og samlede antal piller for hver patient og medicintype.
Alle tørre og grå data kom også med: Udgifter og antal besøg ved patienternes egen læge, tandlæge, vagtlæge, fysioterapi etc.
Resultatet virkede i første omgang uoverkommeligt. I alt indgik 75.000 stykker information. Men ved at anvende en udtømmende liste over modeltyper i det anvendte statistiksoftware, åbnede der sig nye muligheder for at tøjle så tætte data.
Visse modeller kan automatisk filtrere irrelevante oplysninger fra. Andre kan komprimere flere stykker information, mens en tredje type kan genere nye og abstrakte stykker information.
Først præcision, så risikofaktorer
Køreplanen for projektet var klar: Først skulle datasættet generes, så skulle modellerne laves, og så skulle den endelige test vise, hvad processen kunne føre til i den virkelige verden.
Hvornår noget er godt og skidt inden for maskinlæring kan fortolkes med en AUC-værdi.
AUC optræder universelt i maskinlæring-forskning og repræsenterer, hvor god en model er til at sige ‘Ja’ eller ‘Nej’ til tilfælde, som faktisk ender med at være henholdsvis ‘Ja’ og ‘Nej’. Siger modellen i for stor grad ‘Ja’, hvor tilfældene bliver ‘Nej’, og omvendt, er det et udtryk for grundlæggende svagheder i modellen.
En AUC-værdi på 1 er perfekt. Rammer du en AUC på .50, er det lige så effektivt at slå plat eller krone. Resultatet af mit projekt blev en AUC på .92 for at forudsige hoftebrud hos kvinder i løbet af fem år. Hvis man anvender modellen på 1.000 kvinder, uanset alder, vil man kun gætte forkert på et lille mindretal.
En dyr blodprøve eller fast gang hos egen læge?
Efter at have sikret disse resultater trak jeg en rangeret liste over de vigtigste risikofaktorer ud. Det viste en blanding af to klare tendenser.
Knoglescanninger var stadig af stor betydning, som det er i klinisk praksis i dag. Men derudover opdagede vi også helt nye faktorer, som viste sig at have uhørt stor betydning.
Noget så simpelt som ofte at gå til egen læge og tandlæge var vigtigere, end hvorvidt man fik indløst sin knogleskørhedsmedicin eller havde episoder med faldtendens.
Avancerede blodprøver for leversygdomme, nyresygdomme etc. betød også kun relativt mindre end at gå til læge ofte og at have en enkelt knoglescannings data.
Matematisk giver det mening (en masse tal gør det muligt at segmentere i flere grupper; ‘Ja/Nej’ spørgsmål kan kun to), og klinisk ligeså: går man ikke så ofte til lægen, kan det være på grund af socioøkonomiske årsager, en anden sundhedsbevidsthed og mobilitets- eller mentale hensyn.
Den alment praktiserende kan bedre rådgive om behandling, livsstil, inddrage fysioterapi etc. Man kan kalde egen-læge-udgifter for en sammensat faktor, der dækker over både positive og negative tilstande.
Det er i dét punkt, hvor matematikken og klinikken samstemmer, at jeg ser maskinlærings enorme potentiale.
Et eksempel på kunstig intelligens, som kan laves på ens egen computer er vist herunder. Et program genererer tilfældige billeder og får gradvist at vide, hvor god den er til at lave tallene 1-9. Efter tusindvis af læringspas (nederst th.) har programmet til sidst ‘lært’ at lave 1-9 så godt, at man ikke kan skelne rigtige fra computergenerede billeder.

Hvorfor ikke også forudsige udeblivelser?
Det var spændende fund, og jeg blev meget optimistisk for brugen af danske sundhedsdata. Både for kendte og uopdagede sygdomme.
Man kan let justere systemet til også at lære mønstrene bag hjertekarsygdomme og kræftsygdomme.
Men hvorfor stoppe der? Hvorfor ikke lade computere trevle utallige diagnoser igennem og få kortlagt, hvad vi kan og ikke kan forudsige med automatisk indsamlede data?
- Foruden sygdomme kan vi også bruge teknologien til at forudsige emner inden for organisation af sundhedsvæsenet. Hvor mange indlæggelser kan der i værste fald ske denne dag eller uge? Med den viden kan man justere antallet af planlagte indlæggelser og flytte nogle af dem.
- Hvem vil være interesserede i at deltage i forskningsprojekter for at styrke dansk forskning i en international sammenhæng?
- Hvem er i risiko for at melde afbud, og hvor meget tid vil en undersøgelse tage for den enkelte? Herved kan man udfylde udfylde afbudstider.
‘Drømmer læger om elektriske får’?
Visionerne om ét stort computerstyret samfund giver helt naturligt associationer til den afdøde sciencefictionforfatter Philip K. Dicks bøger om dystopiske overvågningssamfund.
Desto vigtigere er det, at netop læger aktivt deltager i diskussionen og udbredelsen af ‘big data’. Lægeløftets 200 år gamle lære om at opsøge ny viden og ej gøre forskel på rig og fattig flugter med de anvendelsesmuligheder, som teknologien har.
\ ForskerZonen
Denne artikel er en del af ForskerZonen, som er stedet, hvor forskerne selv kommer direkte til orde.
Her skriver de om deres forskning og forskningsfelt, bringer relevant viden ind i den offentlige debat og formidler til et bredt publikum.
ForskerZonen er støttet af Lundbeckfonden.
Alene over de næste ti år vil perspektiverne være:
- Tidlig opsporing af alvorlige sygdomme og dermed mildere behandlingsforløb
- Risikovurderinger for utilsigtede hændelser og hospitalsinfektioner
- Mindre sygeliggørelse med telemedicin og individualiserede, ambulante forløb
- Større tryghed i hjemmet for ældre mennesker ved hjælp af sensorer, armbåndsteknologi og andre komponenter af ‘Internet of Things’, hvor enheder kan kommunikere via indbygget internet (sensorer, der registrerer fald/lavt blodsukker/lav puls/dehydrering; energimålere, der rapporterer hvis lyset ikke er slukket på vante tidspunkter)
- Datastøttet planlægning af dagsprogrammer for større arbejdsglæde
Det er muligt at implementere maskinlæring og big data i sundhedsvæsenet og dermed forbedre den individuelle behandling. Og til dem, der måtte foretrække en erfaren læge frem for big data, vil jeg sige følgende:
Som læge kan man ikke huske hver eneste patient, og man kommer aldrig til at se tre millioner patienter eller alle de nuancer, der kan være af en sygdom.
Computeren kan lede lægen på sporet af sammenhænge, som han eller hun enten bliver bekræftet i eller ikke har været opmærksom på.
Derfor er der brug for en faglig og politisk samtale om, hvordan man bedst og mest etisk kan arbejde med den slags værktøjer – uden at der går sci-fi-dystopi i den.
\ Læs mere
\ Kilder
- Christian Kruses profil (AAU)
- “Machine Learning Principles Can Improve Hip Fracture Prediction”, Calcified Tissue International (2017) DOI:
- “Clinical fracture risk evaluated by hierarchical agglomerative clustering”, Osteoporosis International (2017) DOI: 10.1007/s00198-016-3828-8
- “The New Possibilities from “Big Data” to Overlooked Associations Between Diabetes, Biochemical Parameters, Glucose Control, and Osteoporosis”, Current Osteoporosis Reports (2018) DOI: 10.1007/s11914-018-0445-9
\ Modellen skal tage højde for relevante forskelle
Som nævnt er det væsentligt at kunne forudsige morgendagens frem for gårsdagens patient.
I den virkelige verden kan man havne i en situation, hvor en model gætter 99,9 procent rigtigt på 100 personer, som indgår i modellen, men kun på 25 procent af de efterfølgende.
Det er alt andet lige ikke optimalt.
Et eksempel på den korrekte fremgangsmåde er en model, der udvikles på jyske patienter og testes på københavnske eller europæiske patienter.
Der findes eksempelvis en kommerciel forudsigelsesmodel for hoftebrud, FRAX®, som er bygget op af flere europæiske lande og testet på en blanding af andre lande.
Det er den rigtige måde, der tager højde for de faktorer, der kan være forskellige fra land til land: betydningen af overvægt, betydningen af rygning, men også lavpraktiske ting som blodtryksmålingers præcision, lægernes rolle og sundhedsvæsenets opbygning. Behandlingen af sygdomme ændrer sig løbende, og det skal man også indregne.
Dog ses det langt fra altid, at denne valideringsproces finder sted i medicinske risikofaktorstudier. Man kan finde mange studier, hvor præcisionsstatistikken ikke oplyses, og i andre tilfælde også at modelleringsprocessen er meget sparsomt beskrevet.
Argumentet for at styrke denne fremgangsmåde er i bund og grund simpel: hvis to forskere siger, at rygning er en risikofaktorer baseret på to modeller, A og B, hvor den ene er 54 procent præcis og den anden 84 procent, hvem har intuitivt størst vægt bag deres argumenter?