Claude Fable 5 llega al público con límites anticiberataques

Claude Fable 5 llega al público con límites anticiberataques

Anthropic lanza Claude Fable 5 y Mythos 5 con estrictos filtros automatizados para prevenir ciberataques.

Por Humberto Toledo el 9 junio, 2026 a las 13:28 PDT

✨︎ Resumen (TL;DR):

  • Anthropic lanzó Claude Fable 5 para el público general y Claude Mythos 5 con acceso exclusivo para socios verificados.
  • Ambos modelos cuestan 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida.
  • El sistema desvía solicitudes de ciberseguridad o biología a Claude Opus 4.8 para prevenir el uso indebido de su tecnología.

Anthropic lanzó el 9 de junio de 2026 sus nuevos modelos de inteligencia artificial, Claude Fable 5 para usuarios generales y Claude Mythos 5 para socios certificados. El movimiento busca equilibrar el acceso a capacidades avanzadas con la mitigación de riesgos de ciberataques y abuso científico en áreas críticas.

Claude Fable 5 es un modelo de IA generativa de la clase Mythos que procesa tareas complejas de desarrollo de software bajo un entorno restringido para evitar el abuso tecnológico. Este sistema cuenta con clasificadores avanzados para bloquear o redirigir solicitudes consideradas peligrosas.

Por su parte, Claude Mythos 5 utiliza el mismo modelo base pero levanta ciertas restricciones para grupos verificados de ciberdefensa, infraestructura crítica y desarrollo científico.

La diferencia real entre ambas herramientas reside exclusivamente en los sistemas de control y seguridad que se aplican a las solicitudes.

Anthropic pide pausa global en desarrollo de IA avanzada
Te podría interesar:
Anthropic pide pausa global en desarrollo de IA avanzada
Fotos de stock gratuitas de aéreo, agua, aislamiento
Foto: Pok Rie / Pexels

Filtros de seguridad y redirección automática

Anthropic reconoce el peligro potencial de liberar un modelo con este nivel de capacidades sin controles estrictos. De hecho, la empresa declaró formalmente que “Sin salvaguardas, las capacidades de Fable 5 en áreas como ciberseguridad podrían usarse indebidamente para causar daños graves.”

Para evitar este escenario, el sistema analiza las solicitudes de forma automatizada. Si el clasificador detecta una petición relacionada con ciberseguridad, biología, química o destilación, el sistema desvía la consulta. En lugar de procesarla con Fable 5, el usuario recibe una respuesta de Claude Opus 4.8.

Esta desviación automática ocurre en menos del 5% de las sesiones, según las métricas de la firma. No obstante, la configuración altamente conservadora de estos filtros puede provocar que solicitudes legítimas también terminen siendo redirigidas por error.

Esto genera una situación particular para las empresas, ya que un usuario que paga la tarifa completa de Fable 5 podría recibir respuestas provenientes del modelo Opus 4.8 en tareas que activen las alertas de seguridad.

Costos y la estrategia de cara a una IPO

Los nuevos modelos se posicionan en la gama alta del catálogo de Anthropic. El precio de acceso para ambos se fijó en 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida.

Aunque el costo de salida es elevado, la empresa asegura que el costo final por tarea puede ser menor si las capacidades avanzadas del modelo reducen la cantidad de intentos necesarios para completarla de forma exitosa.

Los usuarios de los planes Pro, Max, Team y corporativos basados en el usuario podrán probar Fable 5 de forma gratuita entre el 9 y el 22 de junio de 2026. A partir del 23 de junio de 2026, el uso se cobrará bajo el esquema estándar de la API o del plan empresarial correspondiente.

El anuncio de estos modelos coincide con la presentación secreta de la solicitud de cotización en bolsa de Anthropic ante la SEC, a través de un borrador confidencial de IPO S-1. El lanzamiento de tecnología de este calibre envía una señal contundente al mercado financiero antes de su debut público.

Expansión de Project Glasswing y la prueba de fuego

La tecnología detrás de Mythos ya ha sido probada en entornos cerrados. Anthropic anunció la expansión de Project Glasswing a unas 150 organizaciones distribuidas en más de 15 países. Estas instituciones se centran en sectores críticos como salud, energía, agua, comunicaciones y hardware.

El software permite a los equipos de ciberdefensa acelerar la localización y reparación de vulnerabilidades críticas. El dilema ético reside en que, sin las debidas restricciones, estas mismas capacidades podrían facilitar a actores maliciosos la explotación de fallas a un costo operativo drásticamente menor.

Anthropic completó más de 1,000 horas de pruebas y recurrió a firmas externas para realizar ejercicios de simulación de ataques. Hasta ahora, reportan que no han encontrado métodos de evasión universales para eludir la seguridad de Fable 5 en tareas complejas.

La efectividad real de Claude Fable 5 se medirá fuera del laboratorio, cuando la comunidad global intente vulnerar sus filtros de seguridad en el uso cotidiano.

Fuentes: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

+ Temas Relacionados

Más de AI

Feed