✨︎ Resumen (TL;DR):
- Una iteración reciente de Mythos AI completó una simulación de hackeo corporativo en 6 de cada 10 intentos.
- El gobierno británico calcula que la capacidad ofensiva de estas IA de frontera se duplica cada cuatro meses.
- La brecha genera tensión corporativa por el acceso exclusivo a herramientas defensivas y peticiones de gobiernos extranjeros.
El modelo restringido Mythos AI de la empresa Anthropic demostró una capacidad mejorada para detectar y explotar vulnerabilidades de software. Según una evaluación publicada este martes por el Instituto de Seguridad de IA del Reino Unido (AISI), la herramienta completó simulaciones de ataques a redes corporativas con el doble de eficacia que en pruebas anteriores.
El AISI detalló en su publicación que un checkpoint reciente del modelo completó una prueba de 32 pasos en 6 de 10 intentos, frente a los 3 de 10 registrados durante el mes de abril.
“Los saltos notables de capacidad no siempre requieren nuevos lanzamientos de modelos: iteraciones posteriores del mismo modelo también pueden cambiar significativamente nuestras estimaciones”, advirtió el instituto.
Durante su primera evaluación, la tecnología de Anthropic se posicionó como el primer sistema capaz de ejecutar un ataque corporativo autónomo de principio a fin. El gobierno británico estima que un experto humano requiere 20 horas para completar la misma tarea.
Las nuevas métricas del AISI indican que la capacidad de ciberataque de frontera se duplica aproximadamente cada cuatro meses. Este ritmo de avance acelera la estimación anterior de siete meses proyectada para finales de 2025.

Riesgo de contención y asimetría defensiva
El crecimiento técnico expone los problemas de Anthropic para contener el modelo. En abril, usuarios no autorizados accedieron a la IA a través del entorno de un proveedor externo, un hecho reportado por Bloomberg. La compañía respondió que no existe evidencia de afectaciones en sus sistemas centrales.
El interés internacional también presiona a los desarrolladores. El diario The New York Times reveló este lunes que un representante de un think tank chino solicitó a ejecutivos de Anthropic acceso a Mythos para el gobierno de Beijing. La empresa rechazó la petición durante la reunión celebrada en Singapur, pero el intercambio generó preocupación directa en el Consejo de Seguridad Nacional de Estados Unidos.
Para enfrentar estas amenazas, Anthropic lanzó el Project Glasswing con el objetivo de otorgar acceso temprano a sus capacidades defensivas. Los socios seleccionados incluyen a:
- Apple
- Microsoft
- Amazon
- Nvidia
Los investigadores advierten que este acuerdo privado crea un sistema de dos niveles. Las organizaciones fuera de este consorcio corporativo quedan expuestas a las capacidades del modelo sin acceso a sus beneficios de protección.
Spencer Whitman, director de producto en la firma de seguridad Gray Swan, analizó el impacto estructural de la brecha asimétrica para la revista Fortune.
“Cuando esa capacidad esté ampliamente disponible, y la propia gente de Anthropic habla de seis a 18 meses, las organizaciones que ya estaban atrasadas no solo se quedan más atrás. El modelo sobre el que construyeron sus programas deja de funcionar por completo”, sentenció Whitman.
