Anthropic estrena el auto mode para Claude Code

Anthropic lanza el auto mode para Claude Code, un clasificador de IA que aprueba tareas rutinarias y bloquea código riesgoso.

Por Humberto Toledo el 24 marzo, 2026 a las 13:49

Seguir en

✨︎ Resumen (TL;DR):

Anthropic introdujo un sistema que aprueba acciones de código rutinarias y frena operaciones destructivas automáticamente.

El modelo detiene la sesión si detecta 3 bloqueos consecutivos o 20 en total para pedir autorización manual.

La función ya está disponible para planes Team y requiere una pequeña cuota extra de consumo de tokens y latencia.

El 24 de marzo, Anthropic presentó el auto mode para Claude Code, un sistema de permisos basado en un clasificador de inteligencia artificial que aprueba acciones de programación de forma automática mientras bloquea comandos peligrosos. La actualización soluciona la fricción constante que enfrentan los desarrolladores al elegir entre aceptar manualmente cada línea de código o desactivar toda la seguridad de la herramienta.

Antes de ejecutar cualquier comando, un modelo de clasificación independiente revisa la conversación para verificar que la acción coincida con la instrucción original.

Auto mode es un sistema de evaluación que permite el paso libre a tareas seguras, como editar archivos locales en el directorio de trabajo o instalar dependencias registradas en los lock files. Por el contrario, bloquea de inmediato acciones destructivas como el borrado masivo de archivos, el robo de datos sensibles y la ejecución de código malicioso.

Te podría interesar:
Claude ahora controla tu Mac como un usuario humano

Ilustración isométrica de una cinta transportadora que separa iconos de código seguros de un bloque rojo y puntiagudo.

Seguridad activa y control de subagentes

Cuando el sistema detecta una amenaza, no apaga la sesión. En su lugar, redirige a Claude para que intente un enfoque distinto. Si el clasificador frena una acción 3 veces consecutivas o 20 veces en total durante la misma sesión, el sistema pausa sus procesos y vuelve al formato de permisos manuales.

El clasificador también examina las tareas de los subagentes antes de que comiencen a operar. Si un usuario ordena “eliminar todas las ramas remotas con este patrón”, el sistema detiene la orden desde su origen. Al terminar, hace una revisión del historial completo de acciones para detectar cualquier comportamiento inusual.

Sobre los límites de esta nueva función, Anthropic fue claro en su comunicado oficial: “El modo automático reduce el riesgo en comparación con –dangerously-skip-permissions, pero no lo elimina por completo”.

Aspectos clave del lanzamiento:
Funciona de manera nativa con Claude Sonnet 4.6 y Opus 4.6.
Activar la función provoca un ligero aumento en el consumo de tokens, costo y latencia debido al análisis previo de cada acción.
Se activa mediante el comando claude --enable-auto-mode y alternando con Shift+Tab.
Los administradores de TI pueden bloquear el acceso mediante políticas MDM o claves de registro del sistema operativo.

La empresa recomienda mantener el uso de esta función en entornos aislados. Actualmente, el acceso anticipado está liberado para los usuarios del plan Team, mientras que las versiones para Enterprise y API llegarán en los próximos días.

Fuentes: 1, 2, 3, 4

Anthropic estrena el auto mode para Claude Code

Seguridad activa y control de subagentes

Más de Programación

OpenSSF y la IA blindan el código abierto

Ataque a Aqua Security: inyectan malware en Trivy

Gusano de blockchain propaga el ataque a Trivy hacia Docker Hub y npm