I næsten 50 år har forskere kæmpet med at løse én af naturens mest forvirrende udfordringer; proteinfoldning.
Men i år er der altså sket et gennembrud: Forskere har vist, at AI-drevet software (kunstig intelligens, red.) kan forudsige nøjagtige proteinstrukturer i tusindvis. Derfor har Science netop udnævt AI-drevet proteinforudsigelse som årets gennembrud 2021.
To projekter løber med æren: AlphaFold og RoseTTA-fold.
\ Årets andre store gennembrud
Tidsskriftet Science hædrer også ni andre af årets store gennembrud. Læs om dem i boksen i bunden af artiklen.
At proteinfoldning er blevet kåret som årets gennembrud, kan Ole Winther, professor i data science på DTU og genomisk bioinformatik ved Københavns Universitet, godt forstå. For det er »et rigtig, rigtig svært problem«. Og forskerne har brugt mange år – ja, omkring 50 – på at finde en måde at forudsige proteinernes tredimensionelle strukturer.
»Der er også mange andre, men jeg kan helt klart godt forstå, det her er et gennembrud. Der har været meget hype om AI, Machine Learning og Deep Learning de seneste 5 til 10 år. Men det er virkelig første gang, man ser, at AI leverer et så stort bidrag til et naturvidenskabeligt gennembrud,« siger Ole Winther.
Den samme begejstring deler Daniel Otzen, der forsker i proteiners foldning, fejlfoldning og aggregering ved iNANO ved Aarhus Universitet.
»Det er fuldt berettiget. AlphaFold og RoseTTA-fold har lært at bruge de her kendte strukturer – op til 100.000 – som vi har kendt i mange år, til at kunne finde mønstre og forudsige så godt som alle andre proteiner. De har bygget på et helt enormt eksperimentelt arbejde, som det menneskelige forskerfællesskab har målt på de sidste 50 år,« fortæller Daniel Otzen, der også har skrevet en leder om AlphaFold og RoseTTA-fold i tidsskriftet J. Mol. Biol.
Proteiner er ufatteligt vigtige
Proteiner er cellernes arbejdsheste; de får ilt til at fungere i praksis, de får molekyler til at udføre alle mulige opgaver, de sørger for, at kemiske reaktioner forløber, så vi får omsat mad til energi. Desuden sørger de for at bygge nye materialer i cellerne og for at hjælpe cellerne til at formere sig i det hele taget. Det forklarer Daniel Otzen.
»De laver alt, man kan forestille sig og mere til. Grunden til det er, at de fleste har en bestemt tredimensionel struktur. De store koder er sat sammen af 20 forskellige aminosyrer, som har forskellige fysisk-kemiske egenskaber,« siger han og uddyber:
»Fidusen er, at proteiner består af sekvenser af aminosyre-rester sat sammen i en bestemt rækkefølge. Kun 20 naturlige aminosyrer sættes sammen i mange kombinationer – i en nærmest uendelighed af mulige protein-sekvenser.«
Den præcise sammensætning af rækkefølgen bestemmer, hvorvidt og hvordan proteinerne folder sig op som en bestemt struktur.
»Strukturen er det, vi kalder basis for aktivitet. Struktur giver funktion. Forskere har arbejdet med det her, siden man blev klar over, at proteiner havde bestemte strukturer,« siger Daniel Otzen.
\ Om proteiner
- Proteiner er livsnødvendige bestanddele af alle levende organismer. De er med til at opbygge alt fra organer til hud samt udføre en række opgaver inde i cellerne.
- Antistoffer er også et slags protein.
- Forskerne har identificeret omkring 200 millioner proteiner, men de kender kun formen på en lille del af dem.
- Ved at se på gener, som koder for proteiner, kan forskere bestemme rækkefølgen af de aminosyrer, de består af.
- Men proteiner er ikke bare udstrakte tråde. De kan også krølle og folde sig i komplicerede strukturer. Det er først, når proteinerne har fundet deres form, at deres egenskaber kommer frem.
- I teorien kan proteinet folde sig på astronomisk mange forskellige måder. Men hvad der styrer, hvordan proteinet tager form, vides ikke fuldt ud. Men kunstig intelligens har evnen til at se mønstre, der hidtil har været skjulte for os.
Læs også: Computer løste 50 år gammelt protein-problem: Sådan vil det ændre forskningen
Én af biologiens hellige graler
Proteinfoldning handler om at kunne forudsige et proteins tredimensionelle struktur ud fra en simpel aminosyresekvens. Det er én af biologiens mange hellige graler ifølge Ole Winther.
»Proteiners form og struktur er afgørende for de fleste af menneskekroppens processer, men proteinstrukturer er ikke kun afgørende for at forstå biologiske fænomener,« forklarer han og uddyber:
»Vi kan bruge proteinfoldning til at forstå biologi bedre. Biologi handler om, hvordan proteiner fungerer. De har en struktur, bestemte dele sidder på overfladen og interagerer med andre proteiner, molekyler og DNA. Det kan man forudsige nu. Så det giver os bedre værktøjer til at designe og forstå biologiske processer,« forklarer Ole Winther.
Gennembrud på to fronter
Ifølge Science er det et gennembrud på to fronter:
For det første løser det et videnskabeligt problem, der har været på to do-listen i 50 år. For det andet er det en nytænkende teknik, der vil fremskynde videnskabelig opdagelse.
»Gennembruddet inden for proteinfoldning er et af de største nogensinde, både hvad angår den videnskabelige præstation og muligheden for fremtidig forskning,« skriver Sciences chefredaktør, H. Holden Thorp, i en lederartikel.
Engang var det en tidskrævende og kostbar proces at bestemme et proteins struktur, der krævede komplicerede laboratorieanalyser.
Og mens forsøg på at udvikle computermodeller, der er i stand til at løse proteinfoldningsproblemet, har været i gang i årtier, har præcis proteinforudsigelse udfordret forskerne, indtil to banebrydende artikler, der blev udgivet samtidigt i Nature og Science, præsenterede henholdsvis AlphaFold og RoseTTA-fold.
Googles DeepMind revolutionerede CASP-konkurrencen
Begge projekter har deltaget i CASP-konkurrencen. CASP står for Critical Assessment of Structure Prediction. Det er en konkurrence, der siden 1994 hvert andet år har taget temperaturen på forskeres evne til at folde proteiner via en computer. Det er gået fremad, men det var først i 2018, der for alvor skete noget, der fik opmærksomhed.
I 2018 deltog DeepMind, ejet af Google, for første gang i konkurrencen med deres AlphaFold-metode. Det blev set som et stort fremskridt, mener Ole Winther.
»I 2020 blev det, som mange af os havde forventet, endnu vildere, da DeepMind nu præsenterede deres AlphaFold2, som ifølge CASPs målestok kan siges at have løst proteinfoldningsproblemet,« forklarer Ole Winther.
Det blev set som et gennembrud inden for proteinfoldning, fordi det på sigt kan blive brugt som et værktøj til at designe molekyler og dermed være med til at revolutionere medicin.
Effekten kan være større end troet
DeepMinds AI-forskningsmetode kan dog vise sig at have endnu større effekt på den måde, man forsker, og spørgsmålet er, om forskningens verden er klar til at forløse det potentiale. Det skrev Ole Winther en artikel om i Science News i marts 2021.
»Som du kan se, har jeg jo været totalt på forkant her,« siger han stolt.
I en artikel på Videnskab.dk skrev vi også om, hvordan en computer løste 50 år gammelt protein-problem, og hvordan det vil ændre forskningen. Det blev kaldt for »et fantastisk fremskridt« og »en revolution for forskningsfeltet«.
»Nu kan en computer beregne med stor sandsynlighed – større end før – hvordan proteiner ser ud, bare man har sekvensen. Sekvensen er nem at finde. Hver gang, du for eksempel sekventerer en coronavirus, bestemmer du samtidig sekvensen af proteinerne,« forklarer Daniel Otzen og tilføjer:
»DeepMind har fundet ud af benytte sig af Googles enorme regnekraft og kombineret det med smarte netværksmetoder til at analyse strukturer og så lige pludselig kunne forudsige mere nøjagtigt, hvordan proteinstrukturer så ud.«
Men hvorfor er det et Googleejet firma, der knækker det biologiske problem, der har udfordret forskere i mange år?
Svaret er simpelt, mener Ole Winther. For Google har de rette forudsætninger til at løse det. Forudsætninger, som forskningsverdenen endnu ikke har.
»Det kan ikke udelukkes, at Google kan genbruge indsigterne indenfor deres kerneforretningsområder som søgning, men når Google bruger penge på det her, er det i høj grad for hæderen og respekten, der følger med dette videnskabelige gennembrud,« siger Ole Winther.
Mindst lige så imponeret over RoseTTA
RoseTTA-fold deltog også i konkurrencen som et af de prominente hold. De var på et tidligt tidspunkt rigtig dygtige, men de sad fast i bestemte metoder: de tog fragmenter af små bidder af proteiner og satte dem sammen i deres forudsigelse, forklarer Ole Winther.
»Men så kom DeepMind med deres metode ind fra siden. De konkurrerede sidste og forrige gang. DeepMind var meget bedre, men lige efter konkurrencen offentliggjorde de kun deres metode i grove træk. RoseTTA fik travlt med at reserve engineere, hvad DeepMind lavede. Det var et ræs mod tiden,« forklarer Ole Winther.
I samme uge, hvor DeepMind offentliggjorde deres metode i Nature, fik RoseTTA deres i Science.
Daniel Otzen er dog også ret imponeret over RoseTTA.
»Det er to konkurrenter, der bruger samme teknik. AlphaFold fortjener credit for at være først til at springe rammerne. Men RoseTTA er en ‘life time achievement’ af David Baker og hans kolleger – for uden samme massive computerkræfter at have arbejdet gennem årtier på at få det til at fungere. Så jeg er mindst lige så importeret over RoseTTA,« understreger han.
En fager ny verden
Vi er på vej ind i en »fager ny verden med medicin,« mener Ole Winther.
»Medicinal-firmaer og -industrien har altid kigget på to computerskærme, for at se hvordan proteiner så ud. Altså manuelt set på, hvordan bestemt potentiel medicin sætter sig ind i proteiner. Alle de her metoder kan du gøre bedre nu. For det er datadrevet. Det er ikke mennesker, der skal se, om det passer. Der er mange processer, vi kan automatisere,« siger Ole Winther.
»Det vil ændre meget, hvordan man laver medicin, og hvordan man laver materialer, så batterier holder bedre. Alle de her AI-metoder vil virkelig ændre meget omkring videnskab og teknologi,« tilføjer han. Det er Daniel Otzen enig i.
»Vi er kommet noget tættere på. Vores viden om vores verden omkring os, den er rykket et nyk. Det vil gennemsyre vores indsigt og viden i den kommende tid,« siger han og tilføjer:
»Det er et fantastisk redskab. En goodiebag. Man ved ikke, hvor man skal starte. Forestil dig, du finder et nyt bakterie på havets dyb, du ikke aner noget som helst om. Det første, du gør, er at sekventere genom, så du ved, hvad det er for proteiner og strukturer. Her kan du, uden at have observeret bakterien i levende live, forudsige, hvordan den opfører sig.«
\ Kilder
- Ole Winthers profil (KU og DTU)
- Daniel Otzens profil (AU)
- “Proteins, proteins everywhere”, Science (2021), lederartikel af H. Holden Thorp, DOI: 10.1126/science.abn5795
- “Highly accurate protein structure prediction with AlphaFold”, Nature (2021), DOI: 10.1038/s41586-021-03819-2
- “Accurate prediction of protein structures and interactions using a three-track neural network”, Science (2021), DOI: 10.1126/science.abj8754
\ Boblerne: Ny DNA-teknik, MDMA mod PTSD og Covid-19-tabletter
Hvert år kårer det anerkendte tidsskrift Science årets største videnskabelige gennembrud.
Ved kåringen hædres en række af de næststørste gennembrud også. Flere af forskningsresultaterne har Videnskab.dk skrevet om tidligere. Læs mere om dem i linkene herunder.
- Ny teknik gør det muligt for forskere at ‘kæmme’ tre huler med 25.000 år gammel jord for DNA fra mennesker og dyr.
- Forskere er kommet et skridt nærmere at kunne producere fusionsenergi, og det kan være en ny start for energiformen, der kræver enorme mængder varme.
- Nye tabletter kan reducere risikoen for et alvorligt sygdomsforløb med COVID-19.
- Ny undersøgelse peger på, at det psykedeliske stof MDMA kan reducere symptomerne hos patienter med PTSD.
- Kunstige antistoffer, der er fremstillet i et laboratorie, kan tæmme infektionssygdomme såsom COVID-19 og på sigt blive et våben mod fremtidige pandemier.
- Ny data fra NASA giver forståelse af Mars’ indre og såkaldte ‘marsquakes’ – jordskælv på Mars.
- Forskere bliver klogere på ny elementarpartikel, og det kan rykke ved fysikkens standardmodel. Forskere fra det amerikanske Fermi National Accelerator Laboratory er kommet på sporet af den mulige, ukendte partikel ved at studere en anden partikel kaldet en myon.
- Genteknologi bringes op på nyt niveau. CRISPR-teknologien er for første gang blevet sprøjtet direkte ind i patienter og forbedret synet hos patienter, der har har nedarverede synsproblemer.
- For første gang nogensinde er det lykkedes forskere at gro musefostre i længere end 3 til 4 dage – uden for moderens krop. Det kan bidrage til forståelsen af de tidlige stadier af udvikling af mennesker.