L'IA Mythos d'Anthropic — conçue pour trouver des exploits zero-day — arrive bientôt pour le public | IRCNF - Intelligent Reliable Custom Next-gen Frameworks

Anthropic a confirmé cette semaine que ses modèles d'IA de classe Mythos seront déployés auprès de tous ses clients dans les semaines à venir. Cette annonce coïncide avec le lancement de Claude Opus 4.8 et marque une escalade significative dans ce que les systèmes d'IA sont autorisés à faire de manière autonome.

Ce que Mythos peut faire

Lorsqu'Anthropic a présenté la préversion Mythos en avril 2026, elle a différé sa sortie générale pour une raison bien précise : le modèle peut découvrir et exploiter de manière autonome des vulnérabilités zero-day dans les principaux systèmes d'exploitation, navigateurs web et logiciels critiques — plus rapidement que les chercheurs en sécurité humains. À lui seul, Mozilla Firefox avait déjà intégré plus de 200 correctifs identifiés par la préversion Mythos pendant la période d'accès restreint.

Anthropic a averti qu'à court terme, une diffusion imprudente pourrait profiter aux attaquants avant que les défenseurs ne rattrapent leur retard. L'entreprise a restreint l'accès au Project Glasswing — un groupe soigneusement sélectionné d'organisations de cybersécurité utilisant le modèle strictement à des fins défensives : trouver et corriger les vulnérabilités dans les infrastructures critiques avant une diffusion plus large.

Pourquoi le déploiement a lieu maintenant

Anthropic affirme avoir réalisé des progrès rapides sur les garde-fous de sécurité suffisants pour empêcher une utilisation abusive à grande échelle. L'annonce publique dans le billet de blog sur Claude Opus 4.8 indique que les évaluations internes de sécurité ont franchi le seuil requis pour une diffusion plus large.

Le modèle Mythos montre des améliorations majeures dans le raisonnement de code et l'autonomie par rapport à Opus 4.8. Il est brièvement apparu pour certains utilisateurs dans l'interface Claude Code avant d'être retiré, ce qui suggère que des tests par étapes sont en cours.

L'équation sécuritaire

La diffusion plus large d'un modèle capable de découverte autonome d'exploits présente un véritable défi à double usage. Du côté défensif, la capacité de sonder continuellement les bases de code pour détecter les vulnérabilités avant leur publication est extrêmement précieuse. Du côté offensif, la même capacité entre de mauvaises mains pourrait compresser le délai de développement d'exploits fonctionnels contre des logiciels non corrigés.

La position d'Anthropic est que les défenseurs bénéficieront en fin de compte plus que les attaquants — mais la fenêtre intermédiaire entre la diffusion large et le patchage universel est la période de plus grand risque. Les équipes de sécurité devraient considérer les semaines à venir comme une raison d'accélérer les cycles de correctifs.

Source : BleepingComputer, blog d'Anthropic