AlphaFold 3 lo predijo. Ahora los biólogos lo están usando para encontrar fármacos.

Cuando DeepMind publicó AlphaFold 2 en 2020, resolvió un gran desafío de 50 años en biología: predecir cómo una cadena de aminoácidos se pliega en una estructura tridimensional de proteína. La comunidad científica lo llamó un momento histórico. Programas de investigación completos que antes requerían años de trabajo con cristalografía de rayos X o microscopía crioelectrónica ahora podían realizarse computacionalmente en horas. Para 2022, la Base de Datos de Estructuras de Proteínas AlphaFold contenía estructuras predichas para prácticamente todas las proteínas del proteoma humano y cientos de millones más en toda la vida en la Tierra.
Luego, en mayo de 2024, DeepMind lanzó AlphaFold 3 — y cambió la pregunta por completo.
Lo que AlphaFold 3 realmente añadió
AlphaFold 2 era excepcional prediciendo estructuras de proteínas de forma aislada. AlphaFold 3 extendió esa capacidad a todo el ecosistema molecular: ADN, ARN, ligandos de moléculas pequeñas, iones y modificaciones químicas, todos predichos conjuntamente con las proteínas en un único modelo unificado. Esto no es una mejora marginal — es un cambio fundamental en lo que la predicción de estructuras puede significar para el descubrimiento de fármacos.
El cambio arquitectónico fue igualmente significativo. AlphaFold 3 reemplazó la columna vertebral Evoformer con una arquitectura basada en difusión, tomando prestadas técnicas de modelos de generación de imágenes para refinar iterativamente coordenadas atómicas 3D a partir del ruido. En el benchmark PoseBusters — una prueba desafiante de poses de moléculas similares a fármacos físicamente plausibles en sitios de unión de proteínas — AlphaFold 3 logró una mejora de más del 50% sobre los métodos de vanguardia anteriores. Para los cazadores de fármacos, ese número importa: predecir con precisión cómo un ligando de molécula pequeña se acopla en el sitio activo de una proteína es uno de los problemas más antiguos y computacionalmente más exigentes en la investigación farmacéutica.
La apuesta farmacéutica
Las implicaciones comerciales no pasaron desapercibidas para la industria. Isomorphic Labs, la empresa hermana de DeepMind centrada en el descubrimiento de fármacos impulsado por IA, anunció una asociación histórica con Eli Lilly en enero de 2024 valorada en hasta 1.700 millones de dólares — uno de los mayores acuerdos de IA-farmacéutica en la historia. La colaboración se centra específicamente en aplicar herramientas avanzadas de predicción de estructuras y diseño molecular al pipeline de fármacos de Lilly.
Recursion Pharmaceuticals ha integrado las predicciones de AlphaFold en su plataforma de cribado biológico de alto rendimiento, utilizando datos estructurales para priorizar qué compuestos sintetizar y probar. En CASP16 — la competición bienal de Evaluación Crítica de Predicción de Estructuras celebrada a finales de 2024 — los métodos basados en IA dominaron la predicción de estructuras de ARN por primera vez, una categoría en la que las herramientas anteriores habían tenido grandes dificultades. La capacidad de modelar con precisión conformaciones de ARN abre las puertas a clases de objetivos completamente nuevas, incluidos los fármacos dirigidos a ARN que se han convertido en un área importante de inversión farmacéutica.
La controversia del acceso
La estrategia de lanzamiento de DeepMind para AlphaFold 3 atrajo críticas inmediatas de la comunidad académica. A diferencia de AlphaFold 2, cuyos pesos eran completamente de código abierto y permitieron un ecosistema completo de herramientas, los pesos del modelo de AlphaFold 3 se lanzaron inicialmente bajo términos altamente restrictivos — disponibles para investigación académica pero no para ninguna aplicación comercial, y con restricciones que dificultaban la integración en pipelines abiertos.
La reacción fue fuerte. Los investigadores argumentaron que restringir los pesos de un modelo construido sustancialmente sobre ciencia financiada con fondos públicos creaba una ventaja injusta para las compañías farmacéuticas con buenos recursos. DeepMind posteriormente se movió hacia un acuerdo de licencia más permisivo para uso académico no comercial, aunque las restricciones comerciales permanecieron.
La controversia aceleró el desarrollo de alternativas abiertas. RoseTTAFold All-Atom, del laboratorio Baker de la Universidad de Washington, ofrece predicción conjunta de proteína-ligando-ácido nucleico con pesos completamente abiertos. Chai-1, lanzado por Chai Discovery en 2024, iguala el rendimiento de AlphaFold 3 en varios benchmarks y está disponible bajo una licencia de investigación permisiva. Boltz-1, del MIT, proporciona otra implementación abierta. Juntas, estas herramientas han asegurado que la comunidad investigadora mantenga el acceso a la predicción de estructuras de vanguardia sin depender de un único guardián corporativo.
Lo que los modelos aún no pueden hacer
La predicción de estructuras ha resuelto un cuello de botella mientras deja otros intactos. La limitación más fundamental es que estos modelos predicen instantáneas estáticas — una única conformación de energía mínima — en lugar del conjunto dinámico de estructuras que una proteína muestrea a temperatura fisiológica. La biología funciona con movimiento: las enzimas cambian de forma para catalizar reacciones, los receptores se flexionan para unir moléculas de señalización, las proteínas intrínsecamente desordenadas funcionan precisamente porque carecen de una estructura fija. Se estima que entre el 30 y el 40 por ciento del proteoma humano consiste en regiones intrínsecamente desordenadas que AlphaFold y sus sucesores manejan mal, como se refleja en las puntuaciones de confianza pLDDT bajas para esos segmentos.
Las proteínas de membrana presentan un desafío aparte. Estos objetivos — que representan aproximadamente el 60% de los fármacos aprobados — existen en un entorno de bicapa lipídica que es difícil de simular con precisión, y sus estructuras predichas conllevan una mayor incertidumbre que las proteínas solubles. Los modelos también tienen dificultades con grandes cambios conformacionales inducidos por la unión del ligando, el tipo de dinámicas de ajuste inducido que son críticas para comprender la selectividad de los fármacos y los efectos fuera del objetivo.
El ecosistema abierto más allá de DeepMind
El campo ha madurado hasta convertirse en un rico ecosistema abierto. ESMFold de Meta, basado en el modelo de lenguaje ESM entrenado con datos de secuencias evolutivas en lugar de alineamientos de secuencias múltiples, ofrece una inferencia dramáticamente más rápida — útil para aplicaciones de cribado a gran escala donde la velocidad importa más que la precisión. OpenFold proporciona una reimplementación completamente abierta de AlphaFold 2 que los investigadores pueden reentrenar y ajustar en conjuntos de datos personalizados.
ESM3 de Evolutionary Scale, lanzado en 2024, adopta un enfoque más ambicioso: un modelo generativo multimodal que razona conjuntamente sobre la secuencia, estructura y función de las proteínas. Donde AlphaFold predice la estructura a partir de la secuencia, ESM3 puede generar nuevas secuencias que se pliegan en estructuras objetivo — comenzando a cerrar el ciclo entre predicción y diseño.
La infraestructura de bases de datos ha seguido el ritmo. El Protein Data Bank ahora contiene más de 220.000 estructuras determinadas experimentalmente acumuladas durante cinco décadas de trabajo. La Base de Datos de AlphaFold, mantenida conjuntamente por DeepMind y EMBL-EBI, ha crecido a más de 200 millones de estructuras predichas que cubren la mayoría de las proteínas conocidas en todos los dominios de la vida. Esta combinación de verdad experimental y cobertura computacional a escala ha transformado lo que es posible en biología estructural comparativa.
Un cuello de botella eliminado, no la biología resuelta
Dos años después del lanzamiento de AlphaFold 3, la evaluación honesta es esta: eliminó un cuello de botella real y significativo en el pipeline de descubrimiento de fármacos, pero no hizo que el descubrimiento de fármacos fuera fácil. La predicción de estructuras fue uno de varios pasos limitantes de la velocidad — junto con la validación de objetivos, el perfilado ADMET, la traducción clínica y la imprevisibilidad fundamental de la biología humana in vivo. Resolverlo con alta precisión ha acelerado las primeras etapas del diseño de fármacos basado en estructuras y ha abierto clases de objetivos que antes eran inaccesibles.
Los acuerdos comerciales, las alternativas abiertas, el crecimiento de las bases de datos y el continuo avance hacia la dinámica y el diseño generativo indican que el campo está en una transición genuina. Pero la brecha entre una pose de unión bellamente predicha y un fármaco que funciona en pacientes sigue siendo enorme — y está llena de biología que ningún modelo sabe aún cómo predecir.