Hvad har banebrydende videnskabelige tilgange til opdagelse af lægemidler og chokoladebrownies til fælles?
Mere end man måske umiddelbart ville tro!
Vi har alle været i situationer, hvor vi står over for forskellige måder at løse et problem på, som har direkte effekt på tidsforbruget og kvaliteten af resultatet.
Forestil dig for eksempel, at du graver efter guld. Hvordan bestemmer du, hvilken dybde du skal grave i?
Hvis du ønsker at bage den bedst mulige brownie, så er mængden af hver enkelt ingrediens, ovntemperaturen og bagetiden vigtige inputdetaljer.
Ud fra disse to eksempler kan vi konceptualisere opgaver med et klart mål (f.eks. mest muligt guld eller den bedst smagende brownie), som afhænger af inputdetaljerne (udgravningens dybde eller opskriften på kagen).
Der er mange af denne slags såkaldte ‘optimeringsproblemer’ i naturvidenskaben og teknikken, og det er ofte af stor interesse at optimere mål som eksempelvis reduceret tidsforbrug, øget fortjeneste eller kvalitet.
Et nyt skelsættende paradigme for, hvordan man løser optimeringsproblemer, er nu ved at vinde frem i forskningen.
I denne artikel kan du lære hvad, hvordan og hvorfor det er tilfældet – og ikke mindst, hvordan dette nye paradigme kan hjælpe dig i dit daglige liv.
Et nyt videnskabeligt paradigme
Der er mange forskellige tilgange til optimering.
Vi kan anvende erfaring, videnskabelig domæneviden og intuition sammen med eksplicitte matematiske modeller for at forbedre resultaterne af et givet problem.
Men selvom denne menneskedrevne tilgang har leveret mange gode resultater inden for videnskab og teknik, lider den under iboende fejl:
For det første behovet for generalisering og forenkling. Verden beskrives i videnskabelige modeller ved hjælp af begreber med en vis grad af generalisering som konsekvens af vanskeligheden ved at håndtere verdens skræmmende kompleksitet.
Denne forenkling er ofte afhængig af antagelser, der kun er delvist sande, og som dermed kan stå i vejen for, at vigtige sammenhænge bliver opdaget.
For det andet kan grundlaget for menneskelig erfaring føre til personlige bias, som at foretrække visse metoder som følge af tradition eller personlige interesser, hvilket kan være knap så optimalt for visse problemer.
Problemet med menneskelig bias og antagelser er blevet vist i konkurrencer mellem videnskabelige eksperter og maskinlæring, der forudsiger samspillet mellem proteiner, og er endda blevet brugt til at generere videnskabelige hypoteser til produktionen af batterier.
Godt arbejde! Kan du gentage det 196 gange?
Selvom henholdsvis computere og mennesker har forskellige ting at byde ind med, når de designer eksperimenter, er robotter og computere uden tvivl bedre, når det kommer til strukturerede, gentagne opgaver både i forhold til hastighed og udholdenhed.
På et tidspunkt skal en forsker hjem for at spise middag eller sove, og når de til dels har optimeret problemet, er de tilbøjelige til at stoppe og være tilfredse med resultatet og dermed gå glip af potentielle forbedringer.
Ulemper som disse er blandt andet årsag til, at et nyt paradigme i tilgangen til videnskabelig opdagelse er ved at opstå. Det er kombinationen af to hurtigt voksende videnskabelige områder har muliggjort denne tilgang.
Det første er automatisering af videnskabelige eksperimenter. Det betyder, at eksperimenter kan køres i ‘high throughput’ (altså, de kan gentages rigtig mange gange!) og kan styres fra en computer. Det andet er fremskridt i at modellere vores verden ved hjælp af algoritmer (det kaldes også
‘machine learning’).
Kombinationen af disse færdigheder giver ikke alene mulighed for en opsætning, der er fuldautomatisk, men også adaptiv læring (algoritmerne tilpasser sig løbende til de inputdetaljer, som f.eks. om brownies smager godt eller dårligt, de modtager). Disse tilgange vinder indpas, fordi de omgår problemerne med den menneskelige eksperttilgang.
Derfor har de nye tilgange potentiale til at gå ud over menneskelig kognition, være enormt arbejdsbesparende samt udføre ensformige opgaver, man ikke kan forvente, at et menneske skal udføre.
Desuden leverer de potentielt bedre resultater, mens de samtidig supplerer forskeren, så hun kan nå hurtigere i mål (det være sig et kvalitativt eller et kvantitativt mål).
\ Prøv det selv derhjemme!
Hvis du vil optimere noget i dit daglige liv – det kan være bogstaveligt talt, hvad som helst – kan du selv prøve en Bayesiansk Optimizer.
For instruktioner og et eksempel med optimering af en virtuel katapult, som du kan prøve derhjemme nu, kan du klikke på dette link.
Open-source python-pakke med Bayesiansk optimering kan findes her. Du kan lære mere her.
Optimering i lukket kredsløb – mens vi drikker kaffe!
Det lyder jo alt sammen meget godt, men hvordan kan det gøres på en effektiv måde?
Et eksempel på at bruge en automatiseret datadrevet tilgang til løsning af forskningsproblemer findes i konceptet ‘Closed-loop Bayesian Optimization’.
Lad os glemme den ‘bayesianske’ del for nu og starte med at løfte sløret for lukket kredsløb-optimering (Closed-loop Optimization).
Først udfører vi en række indledende eksperimenter for at kaste lys over effekten af de forudvalgte funktioner (mel, sukker og så videre i brownie-eksemplet). Så måler vi output og giver en score (baseret på, hvad vi ønsker at opnå).
Til sidst bruger vi disse oplysninger til at designe det næste eksperiment, der skal afprøves. Alt dette gøres uden menneskelig indgriben – alle dele af processen foregår i et ‘lukket’ kredsløb.
Black box-funktion
Problemet, der skal optimeres, beskrives ofte som en ‘black box-funktion’, fordi:
Det kræver flere inputfunktioner (eksempelvis mængden af ingredienser og temperaturindstilling af ovnen). De leverer en outputværdi (en brownie), som kan evalueres for at give en score.
Funktionen er en ‘black box’ (et komplekst system eller en enhed, hvis interne funktion er skjult eller ikke let forstås, red.), fordi den ikke er let at fremstille som et matematisk udtryk, men ikke desto mindre afhænger outputtet af inputfunktionerne.
Det lukkede kredsløb er forklaret i figur 1 med en chokoladebrownie som eksempel. Husk, at det kun er et lukket kredsløb, hvis bagningen og smagningen også kan foregå automatisk.

Eksempler fra den virkelige verden
Som du måske har gættet, er optimering i et lukket kredsløb en effektiv strategi, og derfor anvendes den i forbindelse med en lang række problemer, som optimering af opladning af elbiler, salg på websider, differentiering af stamceller, droneflyvning og meget andet.
Interessant nok løses optimeringen af disse meget forskellige problemer i bund og grund af den samme algoritme!
Lukket kredsløbsoptimering er implementeret hos Novo Nordisk A/S i optimeringen af kemiske reaktioner, for at hjælpe med at opdage nye behandlingsmetoder.
Her er ‘brownie-ingredienserne’ kemikalierne i reaktionen, og ovnen er en ‘pipetteringsrobot’ (en automatiseret enhed, der flytter små mængder væske), der udfører reaktionerne.
Reaktioner, hvor det ønskede produkt er farverigt, er særligt velegnet til optimering i et lukket kredsløb, da intensiteten af produktfarven let kan måles som en succesmetrik.
Optimeringen kører helt uden menneskelig indgriben, og algoritmen kommer stadig tættere på en optimal opskrift på reaktionen.
Men hvordan bestemmer algoritmen, hvad det næste eksperiment skal være?
(Hvordan) Tænker algoritmen?
Spoiler alert: Algoritmen ‘tænker’ ikke. Det er en maskinlæringsalgoritme, der bruger en smart implementering af statistik.
Lad os illustrere konceptuelt, hvordan algoritmen fungerer uden at vælte nogen omkuld med formler.
Forestil dig optimering af guldudgravning med én input-funktion: Dybden af gravningen, og en score: koncentrationen af guld (gram guld per ton jord og sten).
Som det ses i figur 2 nedenfor, eksisterer en funktion, der beskriver forholdet mellem input og output (vist med røde stiplede linjer), men denne funktion er vi ikke bekendt med i den virkelige verden.
Vi har observeret guldkoncentrationen i flere dybder, vist med røde punkter. Baseret på disse punkter forudsiger den Bayesianske optimeringsalgoritme en funktion af den forventede mængde guld i alle dybder (guldlinjen), og hvor usikker denne forudsigelse er (det guldfarvede område).
Denne modellering er lavet ud fra to antagelser:
- At guldkoncentrationen er den samme i to dybder, der også ligner hinanden, så hvis vi kender koncentrationen af guld i én dybde, har vi også information om koncentrationen i en lignende dybde.
- At funktionen, der beskriver guldkoncentrationen, er jævn med runde vendinger.

Udnyttelse og udforskning
Og nu kommer det magiske: For at forudsige, i hvilken dybde der skal graves for at finde mest guld, ser algoritmen på to ting.
- Hvor er den forventede værdi højest?
- Hvor er vi mest usikre (stort guldfarvet område) omkring den forventede guldkoncentration (fordi det er gunstigt at udforske det område).
Udgravning, hvor den forventede værdi er høj, kaldes udnyttelse (af nuværende viden), og udgravning i områder med usikkerhed kaldes udforskning.
Vi har brug for udforskningen, da forudsigelsen kan være helt forkert i områder med høj usikkerhed, som det ses omkring x = 12,5 i figur 2.
Om modellen hovedsaglig er udnyttende eller udforskende, er tunet af videnskabsmanden, og det kan være afgørende for resultatet af optimeringen.
I gif’en i figur 3 ser du, hvordan guldgravning ved hjælp af Bayesiansk optimering fungerer. Se nærmere forklaring i billedteksten til figur 2 ovenover.
Prøv det derhjemme
Evnen til at optimere problemer i et lukket kredsløb ved hjælp af algoritmer har et stort potentiale i forskningen.
Algoritmen ‘tænker’ anderledes end en menneskelig forsker, og robotterne kan arbejde døgnet rundt.
For en del optimeringer har den Bayesianske optimeringstilgang vist sig at udkonkurrere videnskabelige eksperter. Men det interessante her er ikke konkurrencen.
Det er derimod, hvodan automatisering og algoritmer begynder at bistå forskerne i veldefinerede opgaver, hvilket frigør tid til mere komplekse opgaver, som mennesker udmærker sig ved.
Derudover er Bayesiansk optimering et interessant eksempel på en ny videnskabelig tilgang til at opnå indsigt ved hjælp af en begrænset mængde data fra processer med mange uafhængige funktioner (som den lange liste af potentielle kombinationer af ingredienser i en kage).
Koblingen mellem omhyggeligt konstruerede eksperimenter og avanceret dataanalyse kan sammenlignes med traditionel hypotesetestning af én faktor ad gangen inden for forskningen.
Læs denne artikel på engelsk på vores søstersite ScienceNordic. Oversat af Stephanie Lammers-Clark.