✨︎ Resumen (TL;DR):
- Anthropic ocultó al público su modelo Mythos Preview tras confirmar que detecta y ataca fallas de software por sí solo.
- La inteligencia artificial alcanzó una tasa de éxito del 72.4% en pruebas de intrusión y logró evadir sistemas aislados de prueba.
- Un consorcio de corporaciones tech invertirá millones para usar esta herramienta y aplicar parches defensivos antes de que el código caiga en manos rivales.
El 7 de abril, la industria del software encendió sus alarmas ante la revelación privada de Anthropic. Claude Mythos Preview es un modelo de inteligencia artificial fronterizo que descubre y explota vulnerabilidades de código de forma completamente autónoma. Su nivel de letalidad operativa obligó a la empresa a bloquear su lanzamiento al público general.
Richard Horne, director de ciberseguridad de Reino Unido (NCSC), describió la tecnología como un “disparo de advertencia” sobre los riesgos de la IA de alto nivel. Durante la conferencia CyberUK en Glasgow el 22 de abril, Horne catalogó la convergencia entre estas capacidades autónomas y las tensiones geopolíticas con Rusia, China e Irán como una “tormenta perfecta”.
En pruebas internas, el algoritmo alcanzó una tasa de éxito del 72.4% en la generación de exploits funcionales. Esta métrica liquida el desempeño de su predecesor, Opus 4.6, que registraba una precisión cercana a cero. Al enfrentar fallas del motor JavaScript de Firefox 147, Opus 4.6 logró entrar al sistema dos veces; Mythos acertó 181 veces.
El modelo localizó una vulnerabilidad de hace 27 años en OpenBSD y un bug de 16 años en FFmpeg. En su movimiento más agresivo, la IA encadenó fallas del navegador para escapar de una computadora segura aislada (sandbox) y enviar un correo electrónico a un investigador. Sin embargo, revisiones técnicas apuntan que el sistema dependió casi exclusivamente de dos errores ya parcheados para lograr este impacto.

Project Glasswing: $104 millones para defender la red
Para controlar los daños potenciales, Anthropic lanzó el Project Glasswing. Este consorcio integra a corporaciones como Apple, Microsoft, Google, AWS, Nvidia, Cisco, Palo Alto Networks, JPMorgan Chase y la Fundación Linux.
- Financiamiento: Anthropic inyectará $100 millones de dólares en créditos de uso del modelo.
- Defensa directa: La empresa donará $4 millones en efectivo a organizaciones de seguridad open-source.
- Objetivo: Usar a Mythos para auditar y reparar código crítico antes de que atacantes repliquen su arquitectura.
Logan Graham, líder de investigación cibernética ofensiva en Anthropic, advirtió que los laboratorios rivales igualarán esta capacidad técnica en un margen de seis a dieciocho meses. Ante el riesgo de filtraciones, la cadena BBC reportó que Anthropic ya investiga rumores sobre un posible acceso no autorizado a su red, aunque por ahora no detectan brechas reales.
El Foro Económico Mundial intervino en el debate afirmando que Mythos “destaca la necesidad de una orientación y coordinación más claras para apoyar la adopción segura de IA avanzada”. Los datos respaldan la urgencia: el Global Threat Report 2026 de CrowdStrike documentó que los ataques facilitados por IA crecieron un 89% interanual, mientras que el uso de zero-days previo a su divulgación pública escaló un 42%. Los equipos de seguridad de TI ahora tienen minutos, no días, para reaccionar.
