Amazon apaga Kirorank: la falsa productividad de la IA

Amazon apaga Kirorank: la falsa productividad de la IA

Amazon retira su ranking Kirorank tras detectar que empleados simulaban usar IA para subir de posición.

Por Humberto Toledo el 28 mayo, 2026 a las 20:23 PDT

✨︎ Resumen (TL;DR):

  • Amazon eliminó Kirorank, un ranking interno de IA, tras descubrir que los desarrolladores realizaban tareas sin sentido para subir de puesto.
  • La simulación de tareas disparó el consumo inútil de tokens y elevó los costos informáticos de la empresa.
  • La compañía cambiará su métrica hacia despliegues estandarizados para medir código realmente útil.

Amazon eliminó de forma definitiva Kirorank, su ranking interno que medía el uso de la plataforma de desarrollo de inteligencia artificial Kiro. La decisión se tomó tras descubrir que varios empleados utilizaban agentes autónomos para completar tareas inútiles, inflando artificialmente su actividad y disparando los costos operativos de la empresa.

Kiro es una plataforma de desarrollo de IA que integra IDE, CLI e interfaz Web para brindar soporte a los programadores, ayudándoles desde el diseño de prototipos hasta la documentación y pruebas de código listo para producción. El problema no radicaba en la herramienta, sino en Kirorank, un tablero que clasificaba a los empleados según su volumen de interacción con la inteligencia artificial.

En un intento por destacar en las clasificaciones, algunos desarrolladores recurrieron a la “maximización de tokens”, delegando procesos absurdos y repetitivos a los agentes de IA. Esta simulación de productividad no solo distorsionó el propósito del sistema, sino que disparó el consumo de tokens (unidades de datos procesadas por los modelos de lenguaje) y elevó de manera innecesaria los costos de infraestructura computacional.

“Por favor, por amor de Dios, la IA no es solo para usar IA”, advirtió Dave Treadwell a su equipo ante esta práctica. Tras el incidente, Amazon aclaró que “el dashboard beta no es ni una herramienta oficial ni aprobado y ahora ha sido eliminado” de sus sistemas.

Anthropic lanza Opus 4.8: IA que prioriza la honestidad
Te podría interesar:
Anthropic lanza Opus 4.8: IA que prioriza la honestidad
Un estanque tranquilo rodeado de exuberante vegetación en Rheda-Wiedenbrück, que captura la esencia de la belleza de la naturaleza.
Foto: Farman Kareem / Pexels

El costo de medir la cantidad sobre la calidad

El caso de Kirorank ilustra un desafío crítico para las grandes corporaciones tecnológicas: evaluar el uso de la IA mediante métricas de volumen en lugar de resultados concretos de negocio. Aunque Amazon impulsó a más del 80% de sus programadores a utilizar herramientas de IA semanalmente para reducir errores y acelerar el desarrollo, la presión por destacar motivó un comportamiento contraproducente.

Para corregir el rumbo, la empresa ahora implementará métricas de despliegue estandarizado, diseñadas para evaluar la cantidad de código útil que realmente llega a producción, en lugar de contabilizar llamadas a modelos o tokens consumidos.

Este ajuste ocurre en un periodo de alta sensibilidad financiera para Amazon. La compañía proyecta invertir 200 mil millones de dólares en gastos de capital durante 2026 para fortalecer su infraestructura de nube e inteligencia artificial, un aumento notable frente a los 131 mil millones de dólares de 2025.

Al mismo tiempo, el gigante tecnológico confirmó el despido de 16,000 empleados en enero de 2026, completando un recorte de aproximadamente 30,000 puestos planeado desde finales de 2025.

Por su parte, proveedores clave como Anthropic también reestructuran sus costos. A partir del 15 de junio de 2026, las suscripciones a su Agent SDK y Claude-P consumirán un saldo mensual fijo, independientemente de la cantidad de interacciones. Esto obliga a las organizaciones a optimizar cada consulta para no desperdiciar recursos.

Para las empresas de tecnología en México y América Latina, la lección de Amazon es contundente: no basta con adoptar inteligencia artificial por decreto; la verdadera eficiencia se mide en el tiempo ahorrado y la calidad final del software, no en el tamaño de la factura de los servidores.

Fuentes: 1, 2, 3, 4, 5, 6, 7

Más de Big Tech

Feed