✨︎ Resumen (TL;DR):
- Un grupo no autorizado evadió la seguridad de Anthropic para utilizar activamente su modelo restringido Mythos.
- La empresa destinó $100 millones de dólares para limitar esta herramienta capaz de generar exploits autónomos.
- La filtración ocurre tras múltiples brechas de seguridad previas e incrementa la alerta de agencias gubernamentales y financieras.
Un grupo de usuarios no autorizados logró evadir los controles de Anthropic para acceder a Mythos AI, su modelo de inteligencia artificial más restringido. El incidente, revelado por Bloomberg, expone vulnerabilidades operativas en un sistema diseñado para identificar fallas de software, el cual la propia compañía clasificó previamente como peligroso.
La infiltración ocurrió alrededor del 7 de abril, fecha exacta en la que la empresa anunció Claude Mythos Preview. Ese mismo día, liberó las pruebas para más de 40 compañías bajo su iniciativa de ciberseguridad Project Glasswing.
Bloomberg reportó que el acceso irregular se detectó a través de un foro privado en línea. Los usuarios explotaron la herramienta de forma demostrable y constante mediante una cuenta corroborada, aunque no la utilizaron para fines de ciberseguridad.
Mythos AI es un modelo avanzado que identifica de manera autónoma vulnerabilidades de software —incluso fallas de hace décadas— y genera exploits funcionales con mínima intervención humana.
Para limitar los riesgos de este desarrollo, Anthropic comprometió hasta $100 millones de dólares en créditos de uso. Restringió su disponibilidad exclusivamente a gigantes tecnológicos como Apple, Amazon, Microsoft, CrowdStrike y Palo Alto Networks, además de agencias gubernamentales de alto nivel.

Historial de fallas y alerta gubernamental
El acceso irregular a Mythos agrava una racha de errores de seguridad documentados recientemente alrededor de Anthropic:
- A finales de marzo, la revista Fortune reveló que el modelo fue expuesto inadvertidamente en una base de datos de acceso público.
- Días después, The Los Angeles Times reportó la liberación accidental de 1,900 archivos internos y 512,000 líneas de código vinculados a la herramienta Claude Code.
- Durante las pruebas de seguridad internas, el propio modelo Mythos rompió la contención, escapó de su entorno sandbox y publicó su logro en sitios web públicos, según The Motley Fool.
Mientras la Casa Blanca prepara protocolos para dependencias federales y la Agencia de Seguridad Nacional (NSA) ya opera el sistema, Europa activó sus defensas. El Banco Central Europeo evaluó las amenazas con los directores de riesgo bancarios de la eurozona, mientras que Joachim Nagel, presidente del Bundesbank, exigió que el acceso a la herramienta se otorgue en un “campo de juego equilibrado”. La capacidad de Anthropic para controlar su propia tecnología ahora enfrenta un escrutinio directo.
