IRCNF

AlphaFold 3 previu. Agora, biólogos estão a usá-lo para descobrir medicamentos.

Compartilhar:
AlphaFold 3 previu. Agora, biólogos estão a usá-lo para descobrir medicamentos.

Quando a DeepMind publicou o AlphaFold 2 em 2020, resolveu um grande desafio de 50 anos em biologia: prever como uma cadeia de aminoácidos se dobra numa estrutura tridimensional de proteína. A comunidade científica chamou-lhe um momento de viragem. Programas de investigação inteiros que antes exigiam anos de cristalografia de raios-X ou trabalho de criomicroscopia eletrónica podiam agora ser tentados computacionalmente em horas. Em 2022, a Base de Dados de Estruturas de Proteínas AlphaFold continha estruturas previstas para praticamente todas as proteínas do proteoma humano e centenas de milhões mais em toda a vida na Terra.

Depois, em maio de 2024, a DeepMind lançou o AlphaFold 3 — e mudou a questão por completo.

O que o AlphaFold 3 realmente acrescentou

O AlphaFold 2 era excecional a prever estruturas de proteínas isoladamente. O AlphaFold 3 estendeu essa capacidade a todo o ecossistema molecular: ADN, ARN, ligandos de moléculas pequenas, iões e modificações químicas, todos previstos em conjunto com proteínas num único modelo unificado. Isto não é uma melhoria marginal — é uma mudança fundamental no que a previsão de estruturas pode significar para a descoberta de medicamentos.

A mudança arquitetónica foi igualmente significativa. O AlphaFold 3 substituiu a espinha dorsal Evoformer por uma arquitetura baseada em difusão, emprestando técnicas de modelos de geração de imagens para refinar iterativamente coordenadas atómicas 3D a partir de ruído. No benchmark PoseBusters — um teste desafiante de poses de moléculas semelhantes a medicamentos fisicamente plausíveis em locais de ligação de proteínas — o AlphaFold 3 alcançou mais de 50% de melhoria em relação aos métodos de ponta anteriores. Para os caçadores de medicamentos, esse número importa: prever com precisão como um ligando de molécula pequena se encaixa no local ativo de uma proteína é um dos problemas mais antigos e computacionalmente exigentes na investigação farmacêutica.

A aposta farmacêutica

As implicações comerciais não passaram despercebidas à indústria. A Isomorphic Labs, empresa irmã da DeepMind focada na descoberta de medicamentos impulsionada por IA, anunciou uma parceria histórica com a Eli Lilly em janeiro de 2024 avaliada em até 1,7 mil milhões de dólares — um dos maiores acordos entre IA e farmacêutica da história. A colaboração está especificamente centrada na aplicação de ferramentas avançadas de previsão de estruturas e design molecular ao pipeline de medicamentos da Lilly.

A Recursion Pharmaceuticals integrou previsões do AlphaFold na sua plataforma de rastreio biológico de alto rendimento, usando dados estruturais para priorizar quais compostos sintetizar e testar. No CASP16 — a competição bienal Critical Assessment of Structure Prediction realizada no final de 2024 — os métodos baseados em IA dominaram a previsão de estruturas de ARN pela primeira vez, uma categoria onde as ferramentas anteriores tinham tido dificuldades. A capacidade de modelar com precisão conformações de ARN abre portas a classes de alvos inteiramente novas, incluindo os medicamentos direcionados ao ARN que se tornaram uma grande área de investimento farmacêutico.

A controvérsia do acesso

A estratégia de lançamento da DeepMind para o AlphaFold 3 atraiu críticas imediatas da comunidade académica. Ao contrário do AlphaFold 2, cujos pesos foram totalmente disponibilizados em código aberto e permitiram um ecossistema inteiro de ferramentas, os pesos do modelo AlphaFold 3 foram inicialmente lançados sob termos altamente restritivos — disponíveis para investigação académica, mas não para qualquer aplicação comercial, e com restrições que dificultavam a integração em pipelines abertos.

A reação foi forte. Os investigadores argumentaram que restringir os pesos de um modelo construído substancialmente com ciência financiada publicamente criava uma vantagem injusta para empresas farmacêuticas com muitos recursos. A DeepMind subsequentemente moveu-se para um acordo de licenciamento mais permissivo para uso académico não comercial, embora as restrições comerciais tenham permanecido.

A controvérsia acelerou o desenvolvimento de alternativas abertas. O RoseTTAFold All-Atom, do laboratório Baker na Universidade de Washington, oferece previsão conjunta de proteína-ligando-ácido nucleico com pesos totalmente abertos. O Chai-1, lançado pela Chai Discovery em 2024, iguala o desempenho do AlphaFold 3 em vários benchmarks e está disponível sob uma licença de investigação permissiva. O Boltz-1, do MIT, fornece outra implementação aberta. Juntas, estas ferramentas garantiram que a comunidade de investigação mantém acesso a previsão de estruturas de ponta sem depender de um único guardião corporativo.

O que os modelos ainda não conseguem fazer

A previsão de estruturas resolveu um gargalo enquanto deixou outros intactos. A limitação mais fundamental é que estes modelos preveem instantâneos estáticos — uma única conformação de energia mais baixa — em vez do conjunto dinâmico de estruturas que uma proteína amostra à temperatura fisiológica. A biologia funciona em movimento: as enzimas mudam de forma para catalisar reações, os recetores flexionam-se para ligar moléculas sinalizadoras, as proteínas intrinsecamente desordenadas funcionam precisamente porque lhes falta uma estrutura fixa. Estima-se que 30 a 40 por cento do proteoma humano consiste em regiões intrinsecamente desordenadas que o AlphaFold e os seus sucessores tratam mal, como refletido nas pontuações baixas de pLDDT para esses segmentos.

As proteínas de membrana apresentam um desafio separado. Estes alvos — que representam cerca de 60% dos medicamentos aprovados — existem num ambiente de bicamada lipídica que é difícil de simular com precisão, e as suas estruturas previstas carregam maior incerteza do que as proteínas solúveis. Os modelos também lutam com grandes mudanças conformacionais induzidas pela ligação do ligando, o tipo de dinâmicas de ajuste induzido que são críticas para entender a seletividade de medicamentos e efeitos fora do alvo.

O ecossistema aberto para além da DeepMind

O campo amadureceu num rico ecossistema aberto. O ESMFold da Meta, baseado no modelo de linguagem ESM treinado em dados de sequências evolutivas em vez de alinhamentos de múltiplas sequências, oferece inferência dramaticamente mais rápida — útil para aplicações de rastreio em larga escala onde a velocidade importa mais do que a precisão. O OpenFold fornece uma reimplementação totalmente aberta do AlphaFold 2 que os investigadores podem retreinar e ajustar em conjuntos de dados personalizados.

O ESM3 da Evolutionary Scale, lançado em 2024, adota uma abordagem mais ambiciosa: um modelo generativo multimodal que raciocina conjuntamente sobre sequência, estrutura e função de proteínas. Onde o AlphaFold prevê estrutura a partir da sequência, o ESM3 pode gerar novas sequências que se dobram em estruturas alvo — começando a fechar o ciclo entre previsão e design.

A infraestrutura de bases de dados acompanhou o ritmo. O Protein Data Bank contém agora mais de 220.000 estruturas determinadas experimentalmente acumuladas ao longo de cinco décadas de trabalho. A Base de Dados AlphaFold, mantida conjuntamente pela DeepMind e EMBL-EBI, cresceu para mais de 200 milhões de estruturas previstas cobrindo a maioria das proteínas conhecidas em todos os domínios da vida. Esta combinação de verdade experimental e cobertura computacional à escala transformou o que é possível em biologia estrutural comparativa.

Um gargalo removido, não a biologia resolvida

Dois anos após o lançamento do AlphaFold 3, a avaliação honesta é esta: removeu um gargalo real e significativo no pipeline de descoberta de medicamentos, mas não tornou a descoberta de medicamentos fácil. A previsão de estruturas foi um dos vários passos limitantes — juntamente com a validação de alvos, perfilagem ADMET, tradução clínica e a imprevisibilidade fundamental da biologia humana in vivo. Resolvê-la com alta precisão acelerou as fases iniciais do design de medicamentos baseado em estruturas e abriu classes de alvos que antes eram inacessíveis.

Os acordos comerciais, as alternativas abertas, o crescimento das bases de dados e o avanço contínuo para dinâmicas e design generativo sinalizam que o campo está numa transição genuína. Mas a lacuna entre uma pose de ligação lindamente prevista e um medicamento que funciona em pacientes permanece enorme — e preenchida com biologia que nenhum modelo ainda sabe como prever.

Compartilhar:
AlphaFold 3 previu. Agora, biólogos estão a usá-lo para descobrir medicamentos. | IRCNF - Intelligent Reliable Custom Next-gen Frameworks