Algoritme vouwt 365.000 eiwitten in drie dimensies

Van de meeste eiwitten – een belangrijke bouwstof voor alles wat leeft – is onbekend hoe ze eruit zien. Een computeralgoritme brengt daar nu verandering in door de structuren van eiwitten in 3D te voorspellen. Dat schreven onderzoekers van het bedrijf DeepMind (overgekocht door Google) die het algoritme AlphaFold ontwikkelden, half en eind juli in het vakblad Nature.

Eiwitten maken leven mogelijk. Ze geven structuur aan cellen en spelen een belangrijke rol in de communicatie tussen cellen en chemische reacties. De meeste medicijnen werken doordat ze eiwitten beïnvloeden. En soms zijn eiwitten zelf het medicijn: denk aan insuline dat diabetespatiënten inspuiten.

Eiwitten ontlenen hun werking aan hun driedimensionale structuur. Het is voor het ontwikkelen van medicijnen belangrijk om de structuur van een eiwit te kennen. Maar sinds de opheldering van de eerste eiwitstructuur, is van de bekende eiwitten slechts zo’n 1 op de 2.000 structuren door wetenschappers onthuld. Eiwitten zijn zo klein dat je ze onder een lichtmicroscoop niet kan zien. Door een kristal te maken van een eiwit en het met röntgenstralen door te lichten is er een scherpe afbeelding van te maken. Maar het maken van zuivere kristallen is bewerkelijk en lukt lang niet altijd.

Voorspellen als uitweg

Een uitweg is om de structuur te voorspellen op basis van de aminozuurvolgorde. Aminozuren zijn de bouwstenen van eiwitten. In het menselijke lichaam worden twintig verschillende aminozuren gebruikt, elk met hun eigen chemische eigenschappen. Maar tot nu toe waren de voorspellingen door computeralgoritmes niet accuraat genoeg.

AlphaFold heeft nu voor bijna alle menselijke eiwitten een 3D-afbeelding van de structuur voorspeld en openbaar gemaakt. Ook van zo’n 20 andere organismen zijn er nu voorspellingen van de structuren voor de meeste eiwitten, zoals de muis „en ook de bacterie die tuberculose veroorzaakt zit erbij”, vertelt structureel bioloog Raimond Ravelli (Universiteit Maastricht) enthousiast. Hij ontrafelde recent na anderhalf jaar experimenteel onderzoek een tuberculose-eiwit waarvan hij de structuur nog niet naar buiten heeft gebracht. „Die heb ik direct in de databank van AlphaFold opgezocht, en ze hebben hem akelig goed.”

Gerard Kleywegt, teamleider moleculaire en cellulaire structuur bij het Europese Bioinformatica Instituut, werd door DeepMind benaderd voor het opzetten van de databank voor de nieuw voorspelde eiwitstructuren. Hij hoort van alle kanten dat biologen als Ravelli massaal op de nieuwe databank gedoken zijn. „Neem een eiwit waar niet meer van bekend was dan een hele vage afbeelding van een klodder. Daar is nu een voorspelde vorm van die precies in die klodder past.”

In totaal voorspelde AlphaFold 365.000 eiwitstructuren, bijna zeven keer meer dan het aantal unieke eiwitten waarvan tot nu toe de vorm bekend was. Voor het einde van het jaar willen ze dit hebben uitgebreid tot 130 miljoen voorspellingen, wat zou betekenen dat voor ongeveer alle verschillende eiwitten een voorspelling van de vorm beschikbaar is. Ook maakte DeepMind de code van het algoritme openbaar, zodat iedereen eiwitstructuren kan berekenen. „Tot nu toe had ik nooit hele hoge verwachtingen van computerprogramma’s die eiwitstructuren voorspelden”, zegt Ravelli. „Dit is een grote stap vooruit voor de biologie. Als je weet hoe het eiwit eruit ziet, kun je een medicijn ontwikkelen die daar op past. Voor vaccins geldt dat net zo.” Corona is hier volgens Ravelli een goed voorbeeld van. „De kennis van de structuur over het spike-eiwit van het coronavirusdeeltje was voor de ontwikkeling van vaccins cruciaal.”

Donut met kurk

Voor elke eiwitstructuur die AlphaFold gemaakt heeft, wordt aangegeven hoe zeker de voorspelling is. De delen van de vorm die hoogstwaarschijnlijk kloppen, hebben een blauwe kleur. Onzekere delen zijn geel, oranje of rood. Kleywegt waarschuwt dat het belangrijk is om te weten hoe je een voorspelling moet interpreteren. „Een van de voorspelde eiwitten ziet eruit als een donut met een kurk in het midden. Maar die kurk is onzeker en kan zich op een andere plek bevinden of er niet eens uitzien als een kurk.” Ook komt een eiwit vaak voor in meer dan één structuur, maar het algoritme maakt er één per eiwit.

AlphaFold voorspelt hoe een eiwit met een onbekend uiterlijk eruit ziet aan de hand van eiwitstructuren die wel bekend zijn. Eerst wordt een neuraal netwerk achter AlphaFold ‘getraind’. Dit houdt in dat het algoritme veel voorbeelden van eiwitten voorgeschoteld kreeg. Zo verzamelde het informatie over wanneer een stukje van een eiwit, bestaand uit een keten van aminozuren, samenvouwt tot bijvoorbeeld een helix, krul of wikkel. Aan de hand van deze informatie maakt het een schets van hoe een eiwit met een onbekend uiterlijk een aaneenschakeling van helixen, krullen en wikkels vormt. „Tot hier is het een klassieke manier van eiwitstructuren voorspellen, die al decennia gebeurt.”, zegt Jonas Teuwen, groepsleider Kunstmatige Intelligentie in het Antoni van Leeuwenhoekziekenhuis.

Maar daar doet AlphaFold nu „een aantal interessante innovaties” bovenop. Met een ‘transformer’ wordt bepaald welke informatie het belangrijkste is voor de uiteindelijke vorm van het eiwit. Het vertaalt de aaneenschakeling van groepjes aminozuren die helixen, krullen en wikkels vormen tot één geheel – het eiwit. „Je kan het vergelijken met het vertalen van Nederlands naar Engels. Je vertaalt woord voor woord, maar je moet ook de volgorde van woorden veranderen voor een goede Engelse zin”, legt Teuwen uit. Een transformer kan die vertaalslag maken.

Het algoritme gebruikt ook extra voorkennis over eiwitstructuren. Een computer weet bijvoorbeeld niet dat een vorm die er aan twee kanten verschillend uitziet, dezelfde structuur kan zijn. „Het is ingewikkeld om dat soort voorkennis in een neuraal netwerk te stoppen.”, zegt Teuwen. „En dat hebben ze heel goed gedaan.”

Source