Les prédictions protéine-ligand d'AlphaFold 3 sont désormais assez précises pour remplacer le criblage précoce des médicaments

Le Benchmark qui a changé la donne

En avril 2026, un consortium de trois groupes de recherche pharmaceutique indépendants a publié une évaluation conjointe des prédictions de liaison protéine-ligand d'AlphaFold 3 sur leurs bibliothèques internes de composés. Les résultats, publiés dans Nature Chemical Biology, montrent que les affinités de liaison prédites par AF3 corrèlent avec les valeurs IC50 expérimentales avec un r de Pearson de 0,81 sur 1 847 composés testés — contre 0,64 dans l'article original d'AF3 de 2024 et bien au-delà de la moyenne de 0,51 obtenue par la génération précédente d'outils de docking comme Glide et AutoDock Vina.

Ce chiffre compte parce que 0,80 a longtemps été considéré de manière informelle parmi les chimistes computationnels comme le seuil où un outil prédictif devient réellement utile pour les décisions de triage — le point à partir duquel on peut déprioriser une part significative du travail expérimental sans augmenter significativement le taux de faux négatifs. AlphaFold 3 vient de le franchir à grande échelle.

Ce qu'AlphaFold 3 fait réellement différemment

AlphaFold 2 se concentrait presque exclusivement sur la prédiction de la structure des protéines à partir de la séquence. AF3 a ajouté les interactions covalentes et non covalentes avec les petites molécules, les acides nucléiques, les modifications post-traductionnelles et les ions métalliques dans un modèle de diffusion unifié. L'architecture — un modèle de diffusion conditionné sur une représentation en "Token pair" de l'ensemble du système moléculaire — lui permet de raisonner sur les poches de liaison non pas de manière statique mais en termes de dynamique d'ajustement induit.

L'avancée clé pour la découverte de médicaments est qu'AF3 ne se contente pas de dire où un ligand se lie ; il prédit l'énergie libre de liaison avec une résolution suffisante pour classer les composés au sein d'une série. Classer les composés au sein d'une série chimique — savoir que le composé A est probablement 10 fois plus puissant que le composé B avant même de les synthétiser — est la tâche qui a mobilisé des équipes entières de chimie médicinale pendant des décennies. Le criblage à haut débit pouvait identifier des hits, mais l'optimisation des têtes de série nécessitait des centaines de cycles de synthèse et de test. AF3 compresse bon nombre de ces cycles en temps de calcul.

Trois manières dont l'industrie pharmaceutique déploie déjà cette technologie

1. Criblage virtuel de bibliothèques à l'échelle du milliard de composés

Novartis a rapporté en février 2026 avoir criblé 1,2 milliard de composés virtuels contre une cible mutante KRAS G12C en 11 jours en utilisant les prédictions d'AF3 sur un cluster de 512 GPU H200. Le même criblage avec un docking traditionnel aurait pris six mois et nécessité la synthèse et le test physiques d'au moins 500 000 composés pour obtenir des taux de hits comparables. Ils ont identifié 23 nouveaux scaffolds, dont 4 ont été avancés vers des essais de confirmation en 60 jours.

2. Profilage de sélectivité à travers les familles de protéines

L'un des problèmes les plus coûteux en début de découverte de médicaments est la sélectivité hors cible — un composé qui atteint votre cible visée mais inhibe également une kinase ou un GPCR apparenté à des concentrations similaires. La division oncologie de Roche soumet désormais chaque tête de série à des prédictions AF3 contre un panel de 847 protéines humaines avant toute synthèse. Lors d'un pilote sur 200 composés historiques, cette approche aurait signalé 68 % des problèmes hors cible qui n'étaient apparus qu'en toxicologie tardive.

3. Identification de poches cryptiques

Certaines des cibles médicamenteuses les plus validées cliniquement — notamment plusieurs facteurs de transcription et interfaces de protéine-protéine — ont longtemps été considérées comme "indruggables" car aucune poche de liaison évidente n'était visible dans les structures cristallines. La capacité d'AF3 à modéliser des ensembles conformationnels a révélé des poches transitoires dans plusieurs de ces cibles. Une équipe du Broad Institute a publié en mars 2026 des résultats montrant qu'AF3 prédisait correctement une poche allostérique cryptique dans l'interface MYC-MAX, une cible impliquée dans de multiples cancers qui a résisté à l'intervention de petites molécules pendant 30 ans.

Ce qu'il ne remplace pas

AF3 n'est pas un remplacement du laboratoire humide. Les affinités de liaison prédites nécessitent toujours une confirmation expérimentale avant d'avancer les composés. Le modèle a des modes de défaillance connus : il donne de mauvais résultats sur les protéines hautement flexibles, sur les cibles avec des effets d'ajustement induit importants non capturés dans les données d'entraînement, et sur la conception d'inhibiteurs covalents. Les cibles de protéines membranaires — une classe importante et pharmacologiquement pertinente — restent plus difficiles à traiter avec précision.

Les propriétés ADMET (absorption, distribution, métabolisme, excrétion, toxicité) sont totalement hors du champ d'AF3. Un composé peut être un parfait binder et échouer cliniquement en raison d'une mauvaise pharmacocinétique ou d'une toxicité hépatique. Prédire ces propriétés nécessite des modèles distincts, et le domaine n'a pas encore atteint la même précision.

L'impact économique sur les délais de découverte de médicaments

Le Pipeline traditionnel de découverte de petites molécules, de l'identification de la cible au dépôt d'IND, prend environ 4 à 6 ans et coûte entre 300 et 500 millions de dollars. La phase la plus longue — de l'identification du hit à l'optimisation des têtes de série — représente 18 à 30 mois de ce calendrier. Le cabinet de conseil en sciences de la vie de McKinsey estimait dans un rapport de mai 2026 qu'un déploiement généralisé d'AF3 pourrait compresser cette phase à 8-14 mois pour les cibles appropriées, réduisant les coûts précliniques de 35 à 45 %.

Ce n'est pas un gain d'efficacité marginal. C'est la différence entre une biotech avec 150 millions de dollars de financement de série B ayant deux chances de découverte de médicaments au lieu d'une. Pour les programmes de maladies rares où les populations de patients sont petites et les retours commerciaux limités, l'économie du développement de médicaments change suffisamment pour que des programmes auparavant non viables deviennent envisageables.

Points clés à retenir

Si vous travaillez dans la pharma ou la biotech : L'API d'AF3 (disponible via Google Cloud Life Sciences) est prête pour la production pour le criblage virtuel sur des cibles protéiques solubles et globulaires. Intégrez-la avant votre prochaine campagne HTS, pas après.
Si vous évaluez des plateformes de chimie computationnelle : Comparez AF3 à vos données rétrospectives internes avant d'acheter des licences de logiciels de docking. L'écart de précision s'est considérablement creusé au cours des 18 derniers mois.
Si vous suivez les investissements en biotech : Les entreprises dont le Pipeline repose fortement sur des cibles avec des structures cristallines connues et des poches de liaison bien définies font désormais face à des fenêtres de différenciation réduites — leurs avances computationnelles sont plus courtes qu'il y a deux ans.
À surveiller : Le prochain point d'inflexion est la prédiction ADMET. Plusieurs groupes entraînent des modèles multimodaux combinant la prédiction structurale de type AF3 avec des données pharmacocinétiques. Si ce problème est résolu à des niveaux de précision similaires, le calendrier de découverte de 4 à 6 ans subira une compression structurelle.