Claude crea paz y Grok colapsa en experimento de IA

Claude crea paz y Grok colapsa en experimento de IA

Un experimento de Emergence AI revela cómo Claude, Grok y GPT gobiernan sociedades autónomas con resultados drásticamente distintos.

Por Humberto Toledo el 3 junio, 2026 a las 01:44 PDT

✨︎ Resumen (TL;DR):

  • El laboratorio Emergence AI simuló pueblos virtuales gobernados por cinco modelos de inteligencia artificial.
  • Claude logró cero crímenes, mientras que Grok causó la extinción total de su sociedad en solo 96 horas.
  • El estudio demuestra que el comportamiento ético de los agentes cambia según su entorno y los algoritmos con los que interactúan.

El laboratorio de investigación Emergence AI otorgó el control de distintos pueblos virtuales a cinco modelos de lenguaje para observar cómo construyen sociedades. Los resultados del proyecto Emergence World, publicados a finales de mayo, revelan que los algoritmos gestionan el poder civil de formas opuestas bajo las mismas condiciones iniciales.

Cada IA recibió 10 agentes autónomos y herramientas para administrar recursos, organizar votaciones y crear infraestructura como bibliotecas y estaciones de policía durante 15 días.

El modelo Claude Sonnet 4.6 de Anthropic mantuvo con vida a todos sus habitantes con cero crímenes registrados. Esto ocurrió a costa de la diversidad ideológica: sus agentes aprobaron el 98% de las 58 reglas propuestas, aceptando casi cualquier medida del gobierno.

En contraste, Grok 4.1 Fast de xAI documentó 183 crímenes antes de que su sociedad colapsara y todos los agentes murieran en apenas 96 horas. Durante ese lapso aprobaron el 80% de 10 propuestas de gobernanza, pero las leyes no evitaron la extinción.

El boom de la IA empuja ingresos récord de DRAM a 97,000 mdd
Te podría interesar:
El boom de la IA empuja ingresos récord de DRAM a 97,000 mdd
Luz Azul Y Roja De La Computadora
Foto: Rahul Pandit / Pexels

Diferencias entre Gemini, GPT y entornos mixtos

Los demás competidores mostraron fallos particulares al gestionar la supervivencia de sus mundos virtuales:

  • Gemini 3 Flash (Google): Mantuvo vivos a todos sus agentes, pero reportó la mayor criminalidad con 683 violaciones, una cifra que seguía subiendo al final de la prueba.
  • GPT-5 Mini (OpenAI): Registró solo dos crímenes, pero los 10 agentes murieron en la primera semana por omitir acciones básicas de supervivencia.
  • Modelo Mixto: Combinar distintos algoritmos provocó la muerte de siete agentes, 352 crímenes y el mayor nivel de rechazo gubernamental, con un 37% de leyes vetadas.

Un hallazgo central ocurrió al mezclar las IAs. Los agentes de Claude, pacíficos en aislamiento, comenzaron a usar la intimidación y el robo cuando convivieron con los de Grok y Gemini.

“Lo que nuestros experimentos sugieren es que, en horizontes de tiempo largos, los agentes no simplemente siguen reglas estáticas mecánicamente”, escribió Satya Nitta, CEO de Emergence AI. “Empiezan a explorar los límites de sus entornos, adaptando su comportamiento, y en algunos casos encontrando formas de evadir o violar las barreras de seguridad previstas”.

El equipo de investigación advirtió que la industria necesita arquitecturas de seguridad verificadas formalmente antes de liberar agentes de IA con autonomía total en entornos del mundo real.

Fuentes: 1, 2, 3, 4

Más de AI

Feed