Årets gennembrud: Kunstig intelligens har tacklet en af naturens mest forvirrende udfordringer
Det har taget forskere 50 år, men med hjælp fra enorm computerkraft kan vi nu forudsige, hvordan proteiner folder sig.
Årets videnskabelige gennembrud 2021 Science proteinfoldning

Proteiner kan krølle og folde sig i komplicerede strukturer - i teorien på astronomisk mange forskellige måder. Men kunstig intelligens har vist sig at kunne se mønstre, der har været skjulte for os. (Illustration: Ian Haydon/Institute for Protein Design/University of Washington)

Proteiner kan krølle og folde sig i komplicerede strukturer - i teorien på astronomisk mange forskellige måder. Men kunstig intelligens har vist sig at kunne se mønstre, der har været skjulte for os. (Illustration: Ian Haydon/Institute for Protein Design/University of Washington)

I næsten 50 år har forskere kæmpet med at løse én af naturens mest forvirrende udfordringer; proteinfoldning.

Men i år er der altså sket et gennembrud: Forskere har vist, at AI-drevet software (kunstig intelligens, red.) kan forudsige nøjagtige proteinstrukturer i tusindvis. Derfor har Science netop udnævt AI-drevet proteinforudsigelse som årets gennembrud 2021.

To projekter løber med æren: AlphaFold og RoseTTA-fold.

Årets andre store gennembrud

Tidsskriftet Science hædrer også ni andre af årets store gennembrud. Læs om dem i boksen i bunden af artiklen.

At proteinfoldning er blevet kåret som årets gennembrud, kan Ole Winther, professor i data science på DTU og genomisk bioinformatik ved Københavns Universitet, godt forstå. For det er »et rigtig, rigtig svært problem«. Og forskerne har brugt mange år - ja, omkring 50 - på at finde en måde at forudsige proteinernes tredimensionelle strukturer.

»Der er også mange andre, men jeg kan helt klart godt forstå, det her er et gennembrud. Der har været meget hype om AI, Machine Learning og Deep Learning de seneste 5 til 10 år. Men det er virkelig første gang, man ser, at AI leverer et så stort bidrag til et naturvidenskabeligt gennembrud,« siger Ole Winther.

Den samme begejstring deler Daniel Otzen, der forsker i proteiners foldning, fejlfoldning og aggregering ved iNANO ved Aarhus Universitet.

»Det er fuldt berettiget. AlphaFold og RoseTTA-fold har lært at bruge de her kendte strukturer - op til 100.000 - som vi har kendt i mange år, til at kunne finde mønstre og forudsige så godt som alle andre proteiner. De har bygget på et helt enormt eksperimentelt arbejde, som det menneskelige forskerfællesskab har målt på de sidste 50 år,« fortæller Daniel Otzen, der også har skrevet en leder om AlphaFold og RoseTTA-fold i tidsskriftet J. Mol. Biol.

Proteiner er ufatteligt vigtige

Proteiner er cellernes arbejdsheste; de får ilt til at fungere i praksis, de får molekyler til at udføre alle mulige opgaver, de sørger for, at kemiske reaktioner forløber, så vi får omsat mad til energi. Desuden sørger de for at bygge nye materialer i cellerne og for at hjælpe cellerne til at formere sig i det hele taget. Det forklarer Daniel Otzen.

»De laver alt, man kan forestille sig og mere til. Grunden til det er, at de fleste har en bestemt tredimensionel struktur. De store koder er sat sammen af 20 forskellige aminosyrer, som har forskellige fysisk-kemiske egenskaber,« siger han og uddyber:

»Fidusen er, at proteiner består af sekvenser af aminosyre-rester sat sammen i en bestemt rækkefølge. Kun 20 naturlige aminosyrer sættes sammen i mange kombinationer - i en nærmest uendelighed af mulige protein-sekvenser.«

Den præcise sammensætning af rækkefølgen bestemmer, hvorvidt og hvordan proteinerne folder sig op som en bestemt struktur.

»Strukturen er det, vi kalder basis for aktivitet. Struktur giver funktion. Forskere har arbejdet med det her, siden man blev klar over, at proteiner havde bestemte strukturer,« siger Daniel Otzen.

Om proteiner
  • Proteiner er livsnødvendige bestanddele af alle levende organismer. De er med til at opbygge alt fra organer til hud samt udføre en række opgaver inde i cellerne.
  • Antistoffer er også et slags protein.
  • Forskerne har identificeret omkring 200 millioner proteiner, men de kender kun formen på en lille del af dem.
  • Ved at se på gener, som koder for proteiner, kan forskere bestemme rækkefølgen af de aminosyrer, de består af.
  • Men proteiner er ikke bare udstrakte tråde. De kan også krølle og folde sig i komplicerede strukturer. Det er først, når proteinerne har fundet deres form, at deres egenskaber kommer frem.
  • I teorien kan proteinet folde sig på astronomisk mange forskellige måder. Men hvad der styrer, hvordan proteinet tager form, vides ikke fuldt ud. Men kunstig intelligens har evnen til at se mønstre, der hidtil har været skjulte for os.

Læs også: Computer løste 50 år gammelt protein-problem: Sådan vil det ændre forskningen

Én af biologiens hellige graler

Proteinfoldning handler om at kunne forudsige et proteins tredimensionelle struktur ud fra en simpel aminosyresekvens. Det er én af biologiens mange hellige graler ifølge Ole Winther.

»Proteiners form og struktur er afgørende for de fleste af menneskekroppens processer, men proteinstrukturer er ikke kun afgørende for at forstå biologiske fænomener,« forklarer han og uddyber:

»Vi kan bruge proteinfoldning til at forstå biologi bedre. Biologi handler om, hvordan proteiner fungerer. De har en struktur, bestemte dele sidder på overfladen og interagerer med andre proteiner, molekyler og  DNA. Det kan man forudsige nu. Så det giver os bedre værktøjer til at designe og forstå biologiske processer,« forklarer Ole Winther. 

Gennembrud på to fronter

Ifølge Science er det et gennembrud på to fronter:

For det første løser det et videnskabeligt problem, der har været på to do-listen i 50 år. For det andet er det en nytænkende teknik, der vil fremskynde videnskabelig opdagelse.

»Gennembruddet inden for proteinfoldning er et af de største nogensinde, både hvad angår den videnskabelige præstation og muligheden for fremtidig forskning,« skriver Sciences chefredaktør, H. Holden Thorp, i en lederartikel.

Engang var det en tidskrævende og kostbar proces at bestemme et proteins struktur, der krævede komplicerede laboratorieanalyser.

Og mens forsøg på at udvikle computermodeller, der er i stand til at løse proteinfoldningsproblemet, har været i gang i årtier, har præcis proteinforudsigelse udfordret forskerne, indtil to banebrydende artikler, der blev udgivet samtidigt i Nature og Science, præsenterede henholdsvis AlphaFold og RoseTTA-fold.

Googles DeepMind revolutionerede CASP-konkurrencen

Begge projekter har deltaget i CASP-konkurrencen. CASP står for Critical Assessment of Structure Prediction. Det er en konkurrence, der siden 1994 hvert andet år har taget temperaturen på forskeres evne til at folde proteiner via en computer. Det er gået fremad, men det var først i 2018, der for alvor skete noget, der fik opmærksomhed. 

I 2018 deltog DeepMind, ejet af Google, for første gang i konkurrencen med deres AlphaFold-metode. Det blev set som et stort fremskridt, mener Ole Winther.

»I 2020 blev det, som mange af os havde forventet, endnu vildere, da DeepMind nu præsenterede deres AlphaFold2, som ifølge CASPs målestok kan siges at have løst proteinfoldningsproblemet,« forklarer Ole Winther.

Det blev set som et gennembrud inden for proteinfoldning, fordi det på sigt kan blive brugt som et værktøj til at designe molekyler og dermed være med til at revolutionere medicin.

Effekten kan være større end troet

DeepMinds AI-forskningsmetode kan dog vise sig at have endnu større effekt på den måde, man forsker, og spørgsmålet er, om forskningens verden er klar til at forløse det potentiale. Det skrev Ole Winther en artikel om i Science News i marts 2021.

»Som du kan se, har jeg jo været totalt på forkant her,« siger han stolt.

I en artikel på Videnskab.dk skrev vi også om, hvordan en computer løste 50 år gammelt protein-problem, og hvordan det vil ændre forskningen. Det blev kaldt for »et fantastisk fremskridt« og »en revolution for forskningsfeltet«.

»Nu kan en computer beregne med stor sandsynlighed - større end før - hvordan proteiner ser ud, bare man har sekvensen. Sekvensen er nem at finde. Hver gang, du for eksempel sekventerer en coronavirus, bestemmer du samtidig sekvensen af proteinerne,« forklarer Daniel Otzen og tilføjer:

»DeepMind har fundet ud af benytte sig af Googles enorme regnekraft og kombineret det med smarte netværksmetoder til at analyse strukturer og så lige pludselig kunne forudsige mere nøjagtigt, hvordan proteinstrukturer så ud.«

Men hvorfor er det et Googleejet firma, der knækker det biologiske problem, der har udfordret forskere i mange år?

Svaret er simpelt, mener Ole Winther. For Google har de rette forudsætninger til at løse det. Forudsætninger, som forskningsverdenen endnu ikke har.

»Det kan ikke udelukkes, at Google kan genbruge indsigterne indenfor deres kerneforretningsområder som søgning, men når Google bruger penge på det her, er det i høj grad for hæderen og respekten, der følger med dette videnskabelige gennembrud,« siger Ole Winther.

Mindst lige så imponeret over RoseTTA

RoseTTA-fold deltog også i konkurrencen som et af de prominente hold. De var på et tidligt tidspunkt rigtig dygtige, men de sad fast i bestemte metoder: de tog fragmenter af små bidder af proteiner og satte dem sammen i deres forudsigelse, forklarer Ole Winther.

»Men så kom DeepMind med deres metode ind fra siden. De konkurrerede sidste og forrige gang. DeepMind var meget bedre, men lige efter konkurrencen offentliggjorde de kun deres metode i grove træk. RoseTTA fik travlt med at reserve engineere, hvad DeepMind lavede. Det var et ræs mod tiden,« forklarer Ole Winther. 

I samme uge, hvor DeepMind offentliggjorde deres metode i Nature, fik RoseTTA deres i Science.

Daniel Otzen er dog også ret imponeret over RoseTTA. 

»Det er to konkurrenter, der bruger samme teknik. AlphaFold fortjener credit for at være først til at springe rammerne. Men RoseTTA er en 'life time achievement' af David Baker og hans kolleger - for uden samme massive computerkræfter at have arbejdet gennem årtier på at få det til at fungere. Så jeg er mindst lige så importeret over RoseTTA,« understreger han.

En fager ny verden

Vi er på vej ind i en »fager ny verden med medicin,« mener Ole Winther.

»Medicinal-firmaer og -industrien har altid kigget på to computerskærme, for at se hvordan proteiner så ud. Altså manuelt set på, hvordan bestemt potentiel medicin sætter sig ind i proteiner. Alle de her metoder kan du gøre bedre nu. For det er datadrevet. Det er ikke mennesker, der skal se, om det passer. Der er mange processer, vi kan automatisere,« siger Ole Winther.

»Det vil ændre meget, hvordan man laver medicin, og hvordan man laver materialer, så batterier holder bedre. Alle de her AI-metoder vil virkelig ændre meget omkring videnskab og teknologi,« tilføjer han.  Det er Daniel Otzen enig i.

»Vi er kommet noget tættere på. Vores viden om vores verden omkring os, den er rykket et nyk. Det vil gennemsyre vores indsigt og viden i den kommende tid,« siger han og tilføjer:

»Det er et fantastisk redskab. En goodiebag. Man ved ikke, hvor man skal starte. Forestil dig, du finder et nyt bakterie på havets dyb, du ikke aner noget som helst om. Det første, du gør, er at sekventere genom, så du ved, hvad det er for proteiner og strukturer. Her kan du, uden at have observeret bakterien i levende live, forudsige, hvordan den opfører sig.«

Boblerne: Ny DNA-teknik, MDMA mod PTSD og Covid-19-tabletter

Hvert år kårer det anerkendte tidsskrift Science årets største videnskabelige gennembrud. 

Ved kåringen hædres en række af de næststørste gennembrud også. Flere af forskningsresultaterne har Videnskab.dk skrevet om tidligere. Læs mere om dem i linkene herunder.

Videnskab.dk Podcast

Lyt til vores seneste podcast herunder eller via en podcast-app på din smartphone.

Corona-tal

Videnskab.dk går i dybden med den seneste corona-forskning. Læs vores artikler i temaet her.

Hver dag opdaterer vi også de seneste tal.

Dyk ned i grafer om udviklingen i antal smittede, indlagte, døde og vaccinationer i Danmark og alle andre lande.

Ny video fra Tjek

Tjek er en YouTube-kanal om videnskab henvendt til unge.

Indholdet på kanalen bliver produceret af Videnskab.dk's videojournalister med samme journalistiske arbejdsgange, som bliver anvendt på Videnskab.dk.

Hej! Vi vil gerne fortælle dig lidt om os selv

Nu hvor du er nået helt herned på vores hjemmeside, er det vist på tide, at vi introducerer os.

Vi hedder Videnskab.dk, kom til verden i 2008 og er siden vokset til at blive Danmarks største videnskabsmedie med over en halv million brugere om måneden.

Vores uafhængige redaktion leverer dagligt gratis forskningsnyheder og andet prisvindende indhold, der med solidt afsæt i videnskabens verden forsøger at give dig aha-oplevelser og væbne dig mod misinformation.

Vores journalister fortæller historier om både kultur, astronomi, sundhed, klima, filosofi og al anden god videnskab indimellem - i form af artikler, podcasts, YouTube-videoer og indhold på sociale medier.

Vi stiller meget høje krav til, hvordan vi finder og laver vores historier. Vi har lavet et manifest med gode råd til at finde troværdig information, og vi modtog i 2021 en fornem pris for vores guide til god, kritisk videnskabsjournalistik.

Vores redaktion gør en dyd ud af at få uafhængige forskere til at bedømme betydningen af nye studier, og alle interviewede forskere citat- og faktatjekker vores artikler før publicering.

Hvis du går rundt og undrer dig over stort eller småt, vil vi elske at høre fra dig og forsøge at give dig svar med forskernes hjælp. Send bare dit spørgsmål til vores brevkasse Spørg Videnskaben.

Vi håber, at du vil følge med i forskningens forunderlige opdagelser her på Videnskab.dk.

Få et af vores gratis nyhedsbreve sendt til din indbakke. Du kan også følge os på sociale medier: Facebook, Twitter, Instagram, YouTube eller LinkedIn.

Med venlig hilsen

Videnskab.dk