Project Glasswing: El Modelo de IA (Mythos) Demasiado Peligroso para Lanzar al Público — Y Por Qué Anthropic Lo Usó Igual

Grego · 8 Abril, 2026 12:29

El 7 de abril de 2026, Anthropic hizo algo inusual: anunció un modelo de frontera nuevo sin lanzarlo. Claude Mythos Preview existe, funciona, y ya encontró miles de vulnerabilidades críticas. Pero no vas a poder usarlo. Y esa decisión dice todo lo que necesitás saber sobre el estado actual de la seguridad en la era de la IA.

Un modelo que se filtró antes de existir oficialmente

La historia de Mythos ya tenía capítulos antes del anuncio de ayer. En marzo, Anthropic reveló accidentalmente información sobre el modelo en una base de datos pública. Semanas después, un borrador de blog filtrado describía al modelo como “actualmente por delante de cualquier otro modelo de IA en capacidades de ciberseguridad” — y advertía que “presagia una próxima ola de modelos que pueden explotar vulnerabilidades a un ritmo que supera los esfuerzos de los defensores.”

No era hipérbole de marketing. Era una advertencia interna que se escapó.

Qué es Project Glasswing

Project Glasswing es la respuesta de Anthropic al dilema que ese modelo crea: si Mythos Preview puede encontrar y explotar vulnerabilidades mejor que casi cualquier humano, ¿qué hacés con él?

La coalición incluye a Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, NVIDIA, y Palo Alto Networks — 12 socios principales, más más de 40 organizaciones adicionales que construyen o mantienen infraestructura de software crítica.

Anthropic comprometió hasta $100M en créditos de uso para Mythos Preview en estos esfuerzos, más $4M en donaciones directas a organizaciones de seguridad de código abierto.

El nombre lo dice todo: la mariposa glasswing tiene alas transparentes. Las vulnerabilidades de software son, en su mayoría, relativamente invisibles — están ahí, pero nadie las ve. Hasta que alguien las ve.

Lo que el modelo ya encontró

En las últimas semanas, Anthropic usó Claude Mythos Preview para identificar miles de vulnerabilidades zero-day — es decir, fallas previamente desconocidas para los desarrolladores del software — muchas de ellas críticas, en todos los sistemas operativos principales y todos los navegadores web principales.

Tres ejemplos concretos que Anthropic pudo divulgar porque ya fueron parcheados:

OpenBSD: Mythos encontró una vulnerabilidad de 27 años en OpenBSD — uno de los sistemas operativos más reconocidos por su seguridad, usado en firewalls e infraestructura crítica. La falla permitía a un atacante crashear remotamente cualquier máquina que lo corriera con solo conectarse a ella.

FFmpeg: Descubrió una vulnerabilidad de 16 años en FFmpeg — la librería que innumerables aplicaciones usan para codificar y decodificar video — en una línea de código que las herramientas de testing automatizado habían ejecutado cinco millones de veces sin detectar el problema.

Linux kernel: El modelo encontró y encadenó de forma autónoma varias vulnerabilidades en el kernel de Linux — el software que corre la mayoría de los servidores del mundo — para permitirle a un atacante escalar desde acceso de usuario ordinario hasta control completo de la máquina.

Un cuarto caso, documentado en el blog técnico de Anthropic: Mythos identificó de forma completamente autónoma — sin intervención humana después del request inicial — una vulnerabilidad de ejecución de código remoto de 17 años en FreeBSD que permite a cualquiera obtener acceso root en una máquina corriendo NFS. Ese bug fue catalogado como CVE-2026-4747.

La parte que más impacta de estos hallazgos no es la cantidad — es la antigüedad. Bugs que sobrevivieron décadas de revisión humana y millones de tests automatizados. El modelo no solo es más rápido que un humano buscando vulnerabilidades. En algunos casos, está encontrando cosas que los humanos estructuralmente no podían encontrar.

El benchmark que lo confirma

En CyberGym — el benchmark de reproducción de vulnerabilidades de ciberseguridad — Mythos Preview alcanzó 83.1%, contra 66.6% de Claude Opus 4.6. Una brecha de casi 17 puntos entre el modelo anterior y el nuevo. Para referencia: Opus 4.6 ya era considerado uno de los modelos más capaces en tareas de seguridad.

Mythos Preview mejoró tanto que prácticamente satura los benchmarks existentes. Por eso Anthropic desplazó su foco hacia tareas de seguridad reales y novedosas — las vulnerabilidades zero-day permiten distinguir capacidad genuina de simple memorización de soluciones conocidas.

El dilema que no tiene solución fácil

Anthropic no está lanzando Mythos Preview al público general. Pero tampoco puede hacer que esa capacidad desaparezca.

La empresa ya advirtió privadamente a funcionarios gubernamentales de alto rango que Mythos hace los ciberataques a gran escala significativamente más probables este año. Esas conversaciones incluyeron a CISA y al Center for AI Standards and Innovation.

La postura de Anthropic es directa: “Dado el ritmo del progreso de la IA, no pasará mucho tiempo antes de que estas capacidades proliferen, potencialmente más allá de actores comprometidos a desplegarlas de forma segura. El impacto — para las economías, la seguridad pública, y la seguridad nacional — podría ser severo.”

En otras palabras: alguien va a tener este nivel de capacidad. La pregunta es si los defensores llegan primero.

Project Glasswing es la apuesta de que sí pueden.

Por qué esto importa para los desarrolladores

Si escribís código que corre sobre Linux, sobre cualquier navegador, o que usa FFmpeg para procesar video — y eso incluye a prácticamente toda la industria de software — las vulnerabilidades que Mythos encontró vivían en tu stack. Ya fueron parcheadas. Pero la pregunta que queda es: ¿cuántas más hay, y quién las va a encontrar primero?

Jim Zemlin, CEO de la Linux Foundation, señaló la asimetría fundamental que ha plagado la seguridad de código abierto por décadas: “La experiencia en seguridad ha sido un lujo reservado para organizaciones con grandes equipos de seguridad. Los mantenedores de código abierto — cuyo software sustenta gran parte de la infraestructura crítica del mundo — históricamente han tenido que resolver la seguridad por su cuenta.”

Project Glasswing, con $4M en donaciones directas a proyectos como Apache y OpenSSF, es un intento de cambiar esa ecuación. Para el ecosistema latinoamericano de desarrollo — que mayoritariamente construye sobre capas de open source mantenidas por voluntarios — esto no es noticia abstracta.

El tablero cambió

Lo más importante de Project Glasswing no es el modelo. Es lo que su existencia implica: que la carrera ofensiva/defensiva en ciberseguridad acaba de dar un salto de velocidad que los procesos actuales de parcheo, auditoría y respuesta no estaban diseñados para absorber.

Un modelo que encuentra bugs de 27 años en sistemas operativos de manera autónoma no es una mejora incremental. Es un cambio de régimen.

Las reglas del juego cambiaron ayer. El código que escribiste la semana pasada fue escrito en el mundo anterior.

Tema	Respuestas	Vistas
Claude Opus 4.7: El Mejor Modelo Público de Coding — Y el Primero Construido con los Frenos Puestos Claude Code inteligenciaartifici , claude , desarrollo , ciberseguridad , iaparadevs	49	18 Abril 2026
OpenAI Lanza Daybreak: La Carrera Armamentista de la IA Se Traslada a la Ciberseguridad Cybersecurity cybersecurity , openai , codex , devsecops , gpt-5.5 , vulnerability_detect	33	16 Mayo 2026
2026: El año en que la IA rompió el modelo de defensa Cybersecurity ia , ciberseguridad , vulnerabilidades , cve , supply-chain-securit , chainguard	10	24 Mayo 2026
Mythos para Todos: Qué Significa Fable 5 para tu Stack (y Cuánto te Va a Costar) Claude Code claude , anthropic , agentes , modelos-ia , fable-5 , mythos	22	11 Junio 2026
Everything Claude Code (ECC): El Scanner que Audita tu Setup de IA Antes de que lo Haga un Atacante AI Dev Tools — General open-source , claude-code , seguridad , prompt-injection , aidevtools , agentshield	28	19 Mayo 2026