Claude Mythos: filtran la IA más poderosa de Anthropic

Un error expuso documentos de Anthropic revelando a Claude Mythos, una poderosa IA que enciende alarmas de ciberataques.

Por Humberto Toledo el 3 abril, 2026 a las 00:08 PDT

Seguir en

Resume con:

✨︎ Resumen (TL;DR):

Un fallo en el gestor de contenidos de Anthropic expuso miles de documentos internos sobre su nuevo y más avanzado modelo de IA.

Jamie Dimon, CEO de JPMorgan Chase, advirtió que la herramienta podría potenciar ataques cibernéticos a nivel global.

Anthropic reconoció el riesgo de la tecnología y confirmó que actualmente la prueba con un grupo reducido de especialistas.

Un error de configuración en el gestor de contenido de Anthropic expuso cerca de 3,000 archivos internos, revelando la existencia de Claude Mythos, su modelo de inteligencia artificial más avanzado. Este fallo técnico desató alertas inmediatas en el sector financiero y de ciberseguridad tras quedar en evidencia las enormes capacidades ofensivas del sistema.

Claude Mythos es un modelo de inteligencia artificial que representa un salto técnico en razonamiento, programación y ciberseguridad. Conocido bajo el nombre clave “Capybara”, los documentos revisados por Fortune lo catalogan como “el modelo de IA más poderoso que hemos desarrollado” y destacan que está “muy por delante de cualquier otro modelo de IA en capacidades cibernéticas”.

El hallazgo inicial provino de los investigadores Roy Paz, de LayerX Security, y Alexandre Pauwels, de la Universidad de Cambridge. Tras la filtración, Jamie Dimon, CEO de JPMorgan Chase, alertó en entrevista con Axios sobre el nivel de amenaza. Dimon aseguró que esta tecnología podría “aumentar dramáticamente la capacidad de hackers o adversarios extranjeros para llevar a cabo ataques potencialmente catastróficos”.

“La IA hace que lo cibernético —y estos [agentes de IA] hacen que lo cibernético— sea mucho peor”, sentenció el directivo financiero.

Te podría interesar:
Apple lanza parche urgente en iOS 18 contra DarkSword

La amenaza de la inteligencia armada

El impacto en la industria es inmediato. Nikesh Arora, CEO de Palo Alto Networks, publicó el ensayo “Inteligencia convertida en arma”, donde aclaró que las capacidades de los modelos de frontera “ya no son teóricas”. Arora advirtió que “un solo actor malintencionado ahora podrá ejecutar campañas que antes requerían equipos enteros”.

La filtración de este modelo ocurre en un contexto de vulnerabilidades críticas para la compañía desarrolladora:

Un segundo error expuso 500,000 líneas de código fuente de la herramienta Claude Code a través de un paquete público de npm.
Anthropic confirmó previamente que un grupo patrocinado por el Estado chino utilizó Claude Code para infiltrarse en cerca de 30 organizaciones tecnológicas y gubernamentales.
El fallo original se debió a que el CMS de la empresa dejaba los activos digitales como públicos por defecto.

El propio documento filtrado por Anthropic acepta la gravedad de su desarrollo, señalando que “presagia una próxima ola de modelos que pueden explotar vulnerabilidades de formas que superan con creces los esfuerzos de los defensores”.

“Al prepararnos para lanzar Claude Capybara, queremos actuar con precaución adicional y comprender los riesgos que plantea, incluso más allá de lo que aprendemos en nuestras propias pruebas”, indicaba el texto interno. El consenso entre los líderes tecnológicos es definitivo: el ecosistema digital debe prepararse, pues los atacantes ya poseen el software ofensivo para redefinir el conflicto cibernético.