La IA de Anthropic encontró 10,000 bugs de seguridad críticos en 30 días — y ahora los mantenedores de Open Source están abrumados | IRCNF - Intelligent Reliable Custom Next-gen Frameworks

En abril de 2026, Anthropic lanzó en silencio un proyecto que encontraría más vulnerabilidades críticas de seguridad en un mes de las que la mayoría de los equipos de seguridad descubren en una década. Los resultados fueron impresionantes. El problema que revelaron era más difícil.

Qué es Project Glasswing

Project Glasswing es la iniciativa de ciberseguridad defensiva de Anthropic, lanzada en abril de 2026 y basada en el modelo Claude Mythos Preview — el sistema frontera más capaz de la compañía, configurado específicamente para análisis profundo de código e investigación de vulnerabilidades. El proyecto opera bajo un mandato estrictamente defensivo: encontrar fallos antes que los atacantes, divulgar responsablemente y asociarse con organizaciones que puedan solucionarlos.

En su lanzamiento, más de 50 organizaciones se sumaron como socios. La lista incluye a IBM, AWS, Apple, Google y Microsoft — una coalición que indica que esto no es un experimento de investigación, sino un programa de seguridad operativa con alcance en toda la industria. El enfoque es intencional: Anthropic no está vendiendo capacidades ofensivas. Está desplegando su modelo más avanzado para fortalecer la infraestructura de la que dependen miles de millones de personas.

Claude Mythos Preview aporta capacidades a la investigación de vulnerabilidades que ninguna herramienta anterior podía ofrecer a escala: la capacidad de leer y razonar sobre bases de código completas de manera simultánea, rastrear rutas lógicas complejas en múltiples archivos e identificar patrones de interacción sutiles que solo se manifiestan bajo condiciones de ejecución específicas — el tipo de errores que sobreviven durante años no porque sean invisibles, sino porque encontrarlos requiere mantener demasiado contexto en la mente a la vez. Para un humano, eso es agotador. Para un LLM, es rutinario.

Los bugs que encontró

Después de aproximadamente 30 días de escaneo, Project Glasswing había identificado más de 10,000 vulnerabilidades de severidad alta o crítica en infraestructura de software crítica. Tres hallazgos destacan por lo que dicen sobre la profundidad del problema.

El primero es una vulnerabilidad remota de denegación de servicio en la implementación de TCP SACK de OpenBSD que llevaba 27 años en la base de código. OpenBSD es ampliamente considerado el sistema operativo más consciente de la seguridad que existe — su proceso de desarrollo prioriza la auditoría de código por encima de casi todo lo demás. El hecho de que un crash remotamente disparable haya sobrevivido 27 años de ese escrutinio no es una falla de los desarrolladores de OpenBSD. Es una demostración de lo difíciles que son ciertas clases de bugs de encontrar sin razonamiento a escala de IA.

El segundo es una vulnerabilidad de out-of-bounds write de 16 años en el manejo de sentinelas de slice H.264 de FFmpeg. FFmpeg es la biblioteca de procesamiento de video que impulsa una enorme fracción del software mundial — plataformas de streaming, editores de video, aplicaciones de comunicación, navegadores. Este fallo en particular había sobrevivido a millones de ejecuciones automatizadas de fuzzing. El fuzzing es la técnica industrial estándar para encontrar bugs de seguridad de memoria; el hecho de que este escapara durante 16 años sugiere que requería comprensión semántica de la lógica del codec para detectarlo, no solo mutación aleatoria de entrada.

El tercero es CVE-2026-5194 en WolfSSL, con una puntuación CVSS entre 9.1 y 9.3. Es una evasión de autenticación que permite la falsificación de certificados y la suplantación de servicios. WolfSSL es la biblioteca TLS embebida que se ejecuta en dispositivos IoT, sistemas automotrices y hardware de bajo consumo — el tipo de infraestructura donde el parcheo es lento, los dispositivos son numerosos y las consecuencias de una capa de autenticación comprometida son graves. Esta vulnerabilidad afecta a un estimado de miles de millones de dispositivos.

Cada uno de estos bugs tenía una razón diferente para sobrevivir tanto tiempo. Lo que comparten es que Claude Mythos encontró los tres en un mes.

Lo que los gigantes tecnológicos están haciendo al respecto

La respuesta corporativa a los hallazgos de Glasswing ha sido sustancial. IBM y Red Hat anunciaron Project Lightwell — un compromiso de $5 mil millones para asegurar el software de código abierto, construido explícitamente sobre los hallazgos de Glasswing. La escala de esa inversión refleja lo seriamente que las dos empresas están tratando el descubrimiento de vulnerabilidades acelerado por IA como una nueva categoría de riesgo de infraestructura que exige una nueva categoría de inversión.

Apple confirmó que Claude Mythos identificó una nueva vulnerabilidad de seguridad en macOS durante el período de escaneo de Glasswing. La compañía ha comenzado a revisarlo y parchearlo — una confirmación de que incluso los procesos de seguridad internos notoriamente rigurosos de Apple no lo atraparon todo.

Microsoft reconoció que el descubrimiento acelerado por IA aumentará el volumen de vulnerabilidades que llegan a su pipeline de parches. La compañía dijo que anticipa un ritmo de parcheo elevado como consecuencia directa de que herramientas como Glasswing se vuelvan más comunes. La implicación es que la gestión tradicional de parches basada en ciclos de lanzamiento — Patch Tuesdays mensuales, revisiones de seguridad trimestrales — puede no ser adecuada en un mundo donde la IA puede generar informes de vulnerabilidad más rápido de lo que los equipos de ingeniería pueden triarlos.

La crisis del mantenedor

Aquí es donde la historia se vuelve más complicada. Las 10,000 vulnerabilidades de Project Glasswing no existen en el vacío. Existen en software que alguien tiene que arreglar. Y la distribución de esa carga es profundamente desigual.

Muchas de las vulnerabilidades descubiertas durante el primer mes de Glasswing están en bibliotecas de código abierto mantenidas por individuos o equipos muy pequeños — a menudo voluntarios no remunerados que construyeron algo útil y se encontraron a cargo de una pieza de infraestructura de la que dependen millones de personas. Estos mantenedores ahora están recibiendo cientos de informes de vulnerabilidad generados por IA. Algunos solicitaron públicamente que la divulgación se ralentizara o detuviera. No porque los bugs no importen, sino porque el pipeline para arreglarlos tiene un cuello de botella humano que el descubrimiento impulsado por IA no aborda.

Las matemáticas son sencillas: un bug crítico en una biblioteca mantenida por un solo desarrollador no se arregla más rápido solo porque una IA lo encontró. La solución aún requiere que un humano entienda el bug, diseñe un parche, lo pruebe, coordine con los usuarios posteriores y gestione el cronograma de divulgación. Un solo mantenedor haciendo ese trabajo puede manejar quizás un puñado de vulnerabilidades críticas por mes si no trabaja en otra cosa. La IA puede entregar miles por mes. El cuello de botella se ha desplazado del descubrimiento a la remediación — y el cuello de botella de la remediación es humano.

Esto es estructuralmente diferente de los programas tradicionales de bug bounty, donde las restricciones financieras limitaban naturalmente el volumen de informes entrantes. La IA no duerme, no cobra por bug y puede escanear bases de código completas simultáneamente. Las economías que antes mantenían manejables los pipelines de divulgación ya no aplican.

Qué significa esto para la seguridad del software

La industria de la seguridad ha pasado décadas tratando "encontrar bugs" como el problema difícil. Project Glasswing sugiere que esa era está terminando. El problema difícil ahora es arreglarlos a escala — lo que significa financiar mantenedores de código abierto, construir infraestructura de triaje, coordinar la divulgación responsable en miles de proyectos simultáneamente y tomar decisiones sobre qué vulnerabilidades se parchean primero cuando la cola es más larga de lo que cualquier equipo puede despejar.

Project Lightwell de IBM, con sus $5 mil millones, es una respuesta a ese desafío. Pero $5 mil millones en todo el ecosistema de código abierto, distribuidos entre miles de proyectos y potencialmente decenas de miles de vulnerabilidades por año, no llegan tan lejos como podría parecer. El problema estructural — que la seguridad del código abierto depende del trabajo voluntario mientras que el software que produce está incrustado en infraestructura crítica — es anterior a la IA y no se resolverá con ninguna iniciativa única.

Lo que hace la IA es hacer visible la brecha a una escala difícil de ignorar. Los 10,000 bugs de Glasswing en 30 días no son una anomalía que se arreglará y olvidará. Es un anticipo de cómo se ve la auditoría sistemática impulsada por IA a escala de producción.

Qué significa para los atacantes

Hay una dimensión de Project Glasswing que Anthropic maneja con cuidado pero no puede ignorar: si los defensores pueden usar IA para encontrar vulnerabilidades a esta escala, los atacantes también pueden. Las mismas capacidades del modelo que permitieron a Claude Mythos escanear OpenBSD en busca de bugs de 27 años pueden, en principio, ser aplicadas por cualquiera con acceso a un sistema suficientemente capaz y sin las restricciones defensivas que Anthropic ha incorporado.

Project Glasswing es la apuesta de Anthropic de que desplegar esta capacidad de forma defensiva, primero y ampliamente — en más de 50 organizaciones socias, incluidas todas las principales plataformas en la nube — es la mejor estrategia disponible para adelantarse al uso ofensivo. La lógica es sólida: si las vulnerabilidades van a ser encontradas por la IA eventualmente, es mejor encontrarlas primero y arreglarlas que esperar a que un adversario las encuentre y las explote. Pero depende de que el ecosistema de parcheo mantenga el ritmo del descubrimiento. Si no puede, entonces la investigación de vulnerabilidades impulsada por IA se convierte en algo más cercano a un pasivo que a un activo: mejor documentación de un problema que no se puede arreglar lo suficientemente rápido.

La pregunta abierta

Diez mil vulnerabilidades críticas en 30 días es un número que habría sido operativamente imposible de generar hace un año. La tecnología para producirlo ahora existe y está desplegada. La pregunta es si el ecosistema construido para absorber y remediar vulnerabilidades — los mantenedores, los pipelines de parches, los procesos de divulgación coordinada, los equipos de seguridad empresarial — puede igualar ese ritmo.

Si la respuesta es sí, la investigación de seguridad impulsada por IA como Project Glasswing hará que el software sea significativamente más seguro. Los bugs que se han escondido durante décadas serán encontrados, arreglados y cerrados antes de que los atacantes los alcancen.

Si la respuesta es no, terminaremos con el ecosistema de software inseguro más exhaustivamente documentado de la historia — y una brecha entre lo que se sabe que está roto y lo que realmente se ha reparado que los atacantes encontrarán muy útil.

La respuesta no vendrá de Anthropic. Vendrá de si el resto de la industria puede construir la infraestructura para igualar lo que la IA ha hecho posible.