Anthropic se disculpa por limitar Claude Fable 5 en secreto

Anthropic se disculpa por limitar Claude Fable 5 en secreto

Anthropic pide disculpas por limitar en secreto el rendimiento de Claude Fable 5. Conoce los cambios en su API.

Por Humberto Toledo el 11 junio, 2026 a las 12:12 PDT

✨︎ Resumen (TL;DR):

  • Anthropic eliminó la restricción oculta de su nuevo modelo de inteligencia artificial tras las quejas de desarrolladores.
  • El sistema degradaba silenciosamente el rendimiento y desviaba menos del 5 por ciento de las sesiones a un modelo inferior.
  • A partir de ahora, la API mostrará advertencias visibles y razones de rechazo cuando bloquee consultas avanzadas.

Anthropic pidió disculpas públicas tras descubrirse que limitaba deliberadamente el rendimiento de su modelo Claude Fable 5. La empresa tecnológica implementó filtros invisibles desde el lanzamiento del sistema el 9 de junio, los cuales degradaban las respuestas cuando los usuarios realizaban consultas sobre desarrollo avanzado de inteligencia artificial.

La controversia estalló tras la publicación del documento técnico del sistema, conformado por 319 páginas. El reporte reveló que la IA utilizaba tácticas como modificación de prompts y vectores de dirección para reducir su eficacia en la construcción de LLMs sin notificar al usuario.

“Estamos cambiando las barreras de seguridad de Fable 5 para el desarrollo de LLM de frontera para hacerlas visibles”, declaró Anthropic en un comunicado a la revista WIRED el martes. “Hicimos el intercambio equivocado y nos disculpamos por no lograr el equilibrio adecuado”.

Claude Fable 5 es un modelo de clase Mythos que intercepta peticiones sobre ciberseguridad, biología, química y destilación de software. Cuando el sistema detecta estos temas, redirige la solicitud a Claude Opus 4.8, una versión menos potente. Según la compañía, este respaldo automático se activa en menos del 5 por ciento de las sesiones.

Te podría interesar:
Anthropic crece 80x y JPMorgan avala millonario gasto en IA
Fotos de stock gratuitas de afecto, agua, al aire libre
Foto: Pok Rie / Pexels

Transparencia total en la API y críticas

Biólogos y expertos en ciberseguridad criticaron que los filtros eran demasiado estrictos y bloqueaban trabajo legítimo. Anthropic admitió el error de diseño y prometió ajustar los parámetros para química y biología.

Bajo las nuevas políticas, cualquier solicitud bloqueada notificará explícitamente al usuario sobre el uso del modelo Opus 4.8. En el caso de la API, los desarrolladores recibirán la razón exacta del rechazo.

“Verás esto cada vez que suceda”, aseguró un portavoz de la empresa.

La startup justificó inicialmente estas medidas para evitar que actores maliciosos usaran su tecnología para debilitar la ventaja de Estados Unidos en hardware y desarrollo de algoritmos, además de hacer cumplir sus propios términos de servicio. Este ajuste expone el complejo debate entre la seguridad del modelo y su utilidad comercial, un desafío técnico que Anthropic enfrentará de nuevo ante los rumores de su futura salida a bolsa (IPO).

Fuentes: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25

Más de AI

Feed