✨︎ Resumen (TL;DR):
- Claude escribe más del 80% del código que Anthropic integra a sus sistemas en mayo de 2026.
- Los ingenieros humanos ahora integran hasta 8 veces más código al día comparado con el año 2024.
- El avance plantea el dilema de la mejora recursiva automática, donde una IA diseña a sus propios sucesores.
Anthropic encendió las alarmas en el sector tecnológico al revelar que su modelo, Claude, escribe el 80% del código que la empresa integra a sus sistemas. Este avance acelera el desarrollo interno pero desata una discusión urgente sobre la mejora recursiva automática, el punto donde una inteligencia artificial diseña a sus propios sucesores.
El avance de la herramienta ha sido drástico. Antes de lanzar Claude Code en febrero de 2025, el volumen de código escrito por la IA en la firma era mínimo. Para mayo de 2026, la proporción superó la barrera del 80%. Esto transformó por completo el día a día de sus ingenieros de software.
Durante el segundo trimestre de 2026, un programador promedio de la compañía integró 8 veces más código diario que en 2024. Aunque los directivos de la firma admiten que un mayor volumen de líneas no se traduce directamente en calidad, el cambio operativo es evidente. Claude ya no solo sugiere fragmentos aislados, sino que opera como un agente capaz de editar archivos, ejecutar pruebas y delegar tareas a otros sistemas.

Métricas del avance autónomo
Los registros internos recopilados por el Anthropic Institute demuestran la velocidad de esta transición:
- En marzo de 2026, una encuesta interna realizada a 130 investigadores reportó una mejora de 4 veces en la productividad tras utilizar el modelo Mythos Preview.
- En abril de 2026, el sistema aplicó de forma autónoma más de 800 correcciones que redujeron un tipo específico de error en la API por un factor de 1,000.
- En mayo de 2026, la tasa de éxito de Claude para resolver tareas abiertas de programación alcanzó el 76%, un incremento de 50 puntos porcentuales en solo seis meses.
Esta aceleración alteró la cultura técnica de la compañía. “Empecé a apoyarme fuerte en ‘Claudificar’ hace como un año. Ha sido una aventura brutal y ya van unos cinco meses desde la última vez que escribí código yo mismo”, detalló un empleado de Anthropic en el reporte de la empresa.
El cuello de botella de la industria se desplaza de la escritura al criterio científico. En la optimización del código de entrenamiento, los modelos ganaron autonomía. Mientras en mayo de 2025 el rendimiento de Claude Opus 4 mejoró aproximadamente 3 veces con optimización automatizada, en abril de 2026, Claude Mythos Preview se aceleró casi 52 veces. Un investigador humano experimentado habría tardado entre 4 y 8 horas en lograr apenas un avance de 4 veces.
¿Quién controla a los sucesores?
La velocidad a la que se genera este código genera presión en los filtros de seguridad. Anthropic utiliza ahora un proceso de auditoría basado en el mismo Claude para detectar errores y vulnerabilidades antes de que los cambios se publiquen. Estiman que este filtro preventivo habría detectado un tercio de las fallas históricas reportadas en la plataforma claude.ai.
“La industria necesita herramientas para asegurar que la inteligencia artificial trabaje correctamente y de acuerdo con la voluntad humana”, señaló Jack Clark, cofundador de Anthropic, en declaraciones para Axios.
La tecnológica plantea tres escenarios posibles para el futuro:
- Estancamiento tecnológico: la IA se expande en el mercado pero no desarrolla el criterio científico para guiar investigaciones avanzadas por cuenta propia.
- Eficiencia asistida: las máquinas asumen el trabajo operativo pesado, pero los humanos retienen el control de las prioridades y la validación de resultados.
- Autonomía recursiva: los sistemas logran diseñar, probar y entrenar modelos sucesores mucho más potentes con mínima intervención humana.
La empresa considera que el segundo camino es el más probable a corto plazo. No obstante, advierten que una transición hacia la autonomía recursiva completa exigiría mecanismos de control sumamente estrictos, incluyendo la posibilidad de pausas coordinadas y verificables entre los principales laboratorios del sector para evitar riesgos imprevistos.
