Anthropic lanza al público su Mythos AI, diseñado para hallar exploits zero-day

Anthropic confirmó esta semana que sus modelos de IA clase Mythos llegarán a todos los clientes en las próximas semanas. El anuncio acompañó el lanzamiento de Claude Opus 4.8 y supone una escalada significativa en lo que los sistemas de IA pueden hacer de forma autónoma.

Qué puede hacer Mythos

Cuando Anthropic presentó la vista previa de Mythos en abril de 2026, retuvo el lanzamiento general por una razón: el modelo puede descubrir y explotar de forma autónoma vulnerabilidades zero-day en los principales sistemas operativos, navegadores web y software crítico, más rápido que los investigadores de seguridad humanos. Solo Mozilla Firefox ya había incorporado más de 200 correcciones identificadas por la vista previa de Mythos durante el período de acceso restringido.

Anthropic advirtió que, a corto plazo, un lanzamiento imprudente podría beneficiar a los atacantes antes de que los defensores se pongan al día. La empresa restringió el acceso al Proyecto Glasswing, un grupo seleccionado de organizaciones de ciberseguridad que utilizan el modelo estrictamente con fines defensivos: encontrar y parchear vulnerabilidades en infraestructuras críticas antes de una publicación más amplia.

¿Por qué el despliegue ahora?

Anthropic afirma que ha avanzado rápidamente en las barreras de seguridad suficientes para evitar el uso indebido a gran escala. El anuncio público en la entrada del blog de Claude Opus 4.8 indica que las evaluaciones internas de seguridad han superado el umbral necesario para un lanzamiento más amplio.

El modelo Mythos muestra mejoras importantes en razonamiento de código y autonomía por encima de Opus 4.8. Apareció brevemente para algunos usuarios en la interfaz de Claude Code antes de ser retirado, lo que sugiere que se han estado realizando pruebas por etapas.

El cálculo de seguridad

El lanzamiento general de un modelo capaz de descubrir exploits de forma autónoma presenta un auténtico desafío de doble uso. En el lado defensivo, la capacidad de sondear continuamente bases de código en busca de vulnerabilidades antes de su publicación es enormemente valiosa. En el lado ofensivo, la misma capacidad en manos equivocadas podría comprimir el tiempo para desarrollar exploits funcionales contra software sin parchear.

La posición de Anthropic es que los defensores se beneficiarán más que los atacantes, pero la ventana intermedia entre el lanzamiento generalizado y la aplicación universal de parches es el período de mayor riesgo. Los equipos de seguridad deberían considerar las próximas semanas como una razón para acelerar los ciclos de parches.

Fuente: BleepingComputer, Blog de Anthropic