IRCNF

AlphaFold 3 hat es vorhergesagt. Jetzt nutzen Biologen es, um Medikamente zu finden.

Teilen:
AlphaFold 3 hat es vorhergesagt. Jetzt nutzen Biologen es, um Medikamente zu finden.

Als DeepMind 2020 AlphaFold 2 veröffentlichte, löste es eine 50 Jahre alte große Herausforderung in der Biologie: die Vorhersage, wie eine Kette von Aminosäuren zu einer dreidimensionalen Proteinstruktur faltet. Die wissenschaftliche Gemeinschaft nannte es einen Wendepunkt. Ganze Forschungsprogramme, die einst Jahre der Röntgenkristallographie oder Kryo-Elektronenmikroskopie erforderten, konnten nun in Stunden rechnerisch versucht werden. Bis 2022 enthielt die AlphaFold-Proteinstrukturdatenbank vorhergesagte Strukturen für praktisch jedes Protein im menschlichen Proteom und Hunderte Millionen weitere im gesamten Leben auf der Erde.

Dann, im Mai 2024, veröffentlichte DeepMind AlphaFold 3 – und änderte die Frage vollständig.

Was AlphaFold 3 tatsächlich hinzugefügt hat

AlphaFold 2 war außergewöhnlich gut darin, Proteinstrukturen isoliert vorherzusagen. AlphaFold 3 erweiterte diese Fähigkeit auf das gesamte molekulare Ökosystem: DNA, RNA, niedermolekulare Liganden, Ionen und chemische Modifikationen, alle gemeinsam mit Proteinen in einem einzigen einheitlichen Modell vorhergesagt. Dies ist keine marginale Verbesserung – es ist eine grundlegende Verschiebung dessen, was Strukturvorhersage für die Wirkstoffforschung bedeuten kann.

Die architektonische Änderung war ebenso bedeutend. AlphaFold 3 ersetzte das Evoformer-Rückgrat durch eine diffusionsbasierte Architektur und entlehnte Techniken von Bildgenerierungsmodellen, um 3D-Atomkoordinaten iterativ aus Rauschen zu verfeinern. Im PoseBusters-Benchmark – einem anspruchsvollen Test physikalisch plausibler wirkstoffähnlicher Molekülposen in Proteinbindungsstellen – erzielte AlphaFold 3 eine Verbesserung von mehr als 50 % gegenüber früheren hochmodernen Methoden. Für Wirkstoffjäger ist diese Zahl wichtig: Die genaue Vorhersage, wie ein niedermolekularer Ligand in die aktive Stelle eines Proteins andockt, ist eines der ältesten und rechenintensivsten Probleme in der pharmazeutischen Forschung.

Die Pharma-Wette

Die kommerziellen Implikationen blieben der Industrie nicht verborgen. Isomorphic Labs, DeepMinds Schwesterfirma, die sich auf KI-gesteuerte Wirkstoffforschung konzentriert, gab im Januar 2024 eine wegweisende Partnerschaft mit Eli Lilly bekannt, die mit bis zu 1,7 Milliarden US-Dollar bewertet wurde – einer der größten KI-Pharma-Deals der Geschichte. Die Zusammenarbeit konzentriert sich speziell auf die Anwendung fortschrittlicher Strukturvorhersage- und Moleküldesign-Tools auf Lillys Wirkstoff-Pipeline.

Recursion Pharmaceuticals hat AlphaFold-Vorhersagen in seine biologische Hochdurchsatz-Screening-Plattform integriert und verwendet strukturelle Daten, um zu priorisieren, welche Verbindungen synthetisiert und getestet werden sollen. Bei CASP16 – dem zweijährlichen Critical Assessment of Structure Prediction-Wettbewerb Ende 2024 – dominierten KI-basierte Methoden zum ersten Mal die RNA-Strukturvorhersage, eine Kategorie, mit der frühere Tools stark zu kämpfen hatten. Die Fähigkeit, RNA-Konformationen genau zu modellieren, öffnet Türen zu völlig neuen Zielklassen, einschließlich der RNA-gerichteten Medikamente, die zu einem wichtigen Bereich pharmazeutischer Investitionen geworden sind.

Die Zugangskontroverse

DeepMinds Veröffentlichungsstrategie für AlphaFold 3 zog sofortige Kritik aus der akademischen Gemeinschaft auf sich. Im Gegensatz zu AlphaFold 2, dessen Gewichte vollständig quelloffen waren und ein ganzes Ökosystem von Tools ermöglichten, wurden die Modellgewichte von AlphaFold 3 zunächst unter stark restriktiven Bedingungen veröffentlicht – verfügbar für akademische Forschung, aber nicht für kommerzielle Anwendungen, und mit Einschränkungen, die die Integration in offene Pipelines erschwerten.

Der Gegenwind war scharf. Forscher argumentierten, dass die Einschränkung der Gewichte eines Modells, das wesentlich auf öffentlich finanzierter Wissenschaft aufbaut, einen unfairen Vorteil für gut ausgestattete Pharmaunternehmen schaffe. DeepMind bewegte sich anschließend in Richtung einer großzügigeren Lizenzvereinbarung für nicht-kommerzielle akademische Nutzung, obwohl kommerzielle Beschränkungen bestehen blieben.

Die Kontroverse beschleunigte die Entwicklung offener Alternativen. RoseTTAFold All-Atom vom Baker-Labor an der University of Washington bietet eine gemeinsame Protein-Ligand-Nukleinsäure-Vorhersage mit vollständig offenen Gewichten. Chai-1, 2024 von Chai Discovery veröffentlicht, erreicht die Leistung von AlphaFold 3 in mehreren Benchmarks und ist unter einer großzügigen Forschungslizenz verfügbar. Boltz-1 vom MIT bietet eine weitere offene Implementierung. Zusammen haben diese Tools sichergestellt, dass die Forschungsgemeinschaft Zugang zu hochmoderner Strukturvorhersage behält, ohne von einem einzigen Unternehmenswächter abhängig zu sein.

Was die Modelle noch nicht können

Strukturvorhersage hat einen Engpass gelöst, während andere intakt geblieben sind. Die grundlegendste Einschränkung ist, dass diese Modelle statische Schnappschüsse vorhersagen – eine einzelne Konformation mit niedrigster Energie – anstatt des dynamischen Ensembles von Strukturen, das ein Protein bei physiologischer Temperatur abtastet. Biologie läuft auf Bewegung: Enzyme ändern ihre Form, um Reaktionen zu katalysieren, Rezeptoren biegen sich, um Signalmoleküle zu binden, intrinsisch ungeordnete Proteine funktionieren gerade deshalb, weil ihnen eine feste Struktur fehlt. Schätzungsweise 30 bis 40 Prozent des menschlichen Proteoms bestehen aus intrinsisch ungeordneten Regionen, die AlphaFold und seine Nachfolger schlecht handhaben, was sich in niedrigen pLDDT-Konfidenzwerten für diese Segmente widerspiegelt.

Membranproteine stellen eine separate Herausforderung dar. Diese Targets – die etwa 60 % der zugelassenen Medikamente ausmachen – existieren in einer Lipiddoppelschichtumgebung, die schwer genau zu simulieren ist, und ihre vorhergesagten Strukturen tragen eine höhere Unsicherheit als lösliche Proteine. Die Modelle haben auch Schwierigkeiten mit großen Konformationsänderungen, die durch Ligandenbindung induziert werden, der Art von Induced-Fit-Dynamik, die entscheidend für das Verständnis der Wirkstoffselektivität und von Off-Target-Effekten ist.

Das offene Ökosystem jenseits von DeepMind

Das Feld ist zu einem reichen offenen Ökosystem herangereift. Metas ESMFold, basierend auf dem ESM-Sprachmodell, das eher auf evolutionären Sequenzdaten als auf multiplen Sequenzalignments trainiert wurde, bietet eine dramatisch schnellere Inferenz – nützlich für groß angelegte Screening-Anwendungen, bei denen Geschwindigkeit wichtiger ist als Präzision. OpenFold bietet eine vollständig offene Neuimplementierung von AlphaFold 2, die Forscher auf benutzerdefinierten Datensätzen neu trainieren und feinabstimmen können.

Evolutionary Scales ESM3, 2024 veröffentlicht, verfolgt einen ehrgeizigeren Ansatz: ein multimodales generatives Modell, das gemeinsam über Proteinsequenz, -struktur und -funktion nachdenkt. Wo AlphaFold Struktur aus Sequenz vorhersagt, kann ESM3 neuartige Sequenzen generieren, die sich in Zielstrukturen falten – und beginnt so den Kreislauf zwischen Vorhersage und Design zu schließen.

Die Datenbankinfrastruktur hat Schritt gehalten. Die Protein Data Bank enthält jetzt über 220.000 experimentell bestimmte Strukturen, die über fünf Jahrzehnte Arbeit angesammelt wurden. Die AlphaFold-Datenbank, gemeinsam von DeepMind und EMBL-EBI betrieben, ist auf über 200 Millionen vorhergesagte Strukturen angewachsen, die die meisten bekannten Proteine in allen Lebensbereichen abdecken. Diese Kombination aus experimenteller Grundwahrheit und rechnerischer Abdeckung in großem Maßstab hat das, was in der vergleichenden Strukturbiologie möglich ist, verändert.

Ein Engpass entfernt, nicht die Biologie gelöst

Zwei Jahre nach der Veröffentlichung von AlphaFold 3 ist die ehrliche Einschätzung diese: Es hat einen echten und bedeutenden Engpass in der Wirkstoffforschungs-Pipeline entfernt, aber es hat die Wirkstoffforschung nicht einfach gemacht. Strukturvorhersage war einer von mehreren geschwindigkeitsbestimmenden Schritten – neben Targetvalidierung, ADMET-Profilierung, klinischer Translation und der grundlegenden Unvorhersagbarkeit der menschlichen Biologie in vivo. Ihre Lösung mit hoher Genauigkeit hat die frühen Phasen des strukturbasierten Wirkstoffdesigns beschleunigt und Targetklassen eröffnet, die zuvor unzugänglich waren.

Die kommerziellen Deals, die offenen Alternativen, das Datenbankwachstum und der anhaltende Vorstoß in Dynamik und generatives Design signalisieren alle, dass sich das Feld in einem echten Übergang befindet. Aber die Lücke zwischen einer wunderschön vorhergesagten Bindungspose und einem Medikament, das bei Patienten wirkt, bleibt enorm – und gefüllt mit Biologie, die noch kein Modell vorherzusagen weiß.

Teilen:
AlphaFold 3 hat es vorhergesagt. Jetzt nutzen Biologen es, um Medikamente zu finden. | IRCNF - Intelligent Reliable Custom Next-gen Frameworks