xAI alista el modelo Grok 5 para competir contra el nuevo GPT-5.5

xAI entra en la fase final de entrenamiento de Grok 5, su modelo de 6 billones de parámetros, para competir frente al nuevo GPT-5.5.

Por Humberto Toledo el 24 de abril del 2026 a las 3:32 pm PDT

Resume con:

Seguir en

✨︎ Resumen (TL;DR):

xAI terminará pronto el entrenamiento de Grok 5 en su superclúster Colossus 2.

El nuevo GPT-5.5 de OpenAI redujo sus alucinaciones en un 60% respecto a GPT-5.4.

La empresa de Elon Musk enfrenta simultáneamente una batalla legal contra una ley de IA en Colorado.

La compañía xAI entró en la recta final de entrenamiento de su modelo de lenguaje más ambicioso, para competir directamente contra OpenAI y Anthropic en tareas de razonamiento complejo. El movimiento ocurre bajo presión máxima, luego de que OpenAI lanzara oficialmente GPT-5.5 el pasado 23 de abril de 2026.

Grok 5 es un modelo de inteligencia artificial que emplea una arquitectura Mixture-of-Experts con aproximadamente 6 billones de parámetros. El entrenamiento se ejecuta actualmente en el superclúster Colossus 2.

La empresa proyecta actualizar esta infraestructura a 1.5 gigavatios y operarla con más de 550,000 GPUs Nvidia Blackwell para finales de abril de 2026. Ante el tamaño del proyecto, Elon Musk estimó públicamente una probabilidad del “10% y subiendo” de que Grok 5 alcance la inteligencia artificial general a nivel humano.

La beta pública de Grok 5 llegará durante el segundo trimestre de 2026, tras perder su ventana de lanzamiento original en el primer trimestre. Polymarket otorga cerca de un 33% de probabilidad de que el modelo esté disponible antes del 30 de junio de 2026.

Por el lado de la competencia, OpenAI liberó GPT-5.5 con un índice de inteligencia de 59 y un puntaje de 88.7% en SWE-bench Verified. El modelo registró un 60% menos de alucinaciones en comparación con su predecesor GPT-5.4.

Te podría interesar:
Apple amenazó con eliminar a Grok de la App Store

Fotos de stock gratuitas de agricultura, al aire libre, Alemania — Foto: Jos van Ouwerkerk / Pexels

Rendimiento en benchmarks y desafíos legales

Grok 4.20 logró 88.5% en GPQA Diamond y 30% en Humanity’s Last Exam.
En SWE-bench, Grok 4 alcanzó 75%, por delante del 74.9% de GPT-5.4 y el 74% de Claude Opus 4.6.
En pruebas STEM como AIME, Grok 4 superó a GPT-5.4 por un 15%.
Tanto o3 de OpenAI como Grok 4 marcan 96.9% en pruebas de comprensión de contexto largo.

El actual Grok 4.20 funciona con una arquitectura de cuatro agentes en paralelo y reporta una tasa de precisión sin alucinaciones del 83%. Grok 5 incorporará generación dinámica de agentes y memoria persistente.

En un frente paralelo, xAI inició el 9 de abril una batalla constitucional en una corte federal de Denver contra la ley SB24-205 de Colorado. La normativa, diseñada para evitar la discriminación algorítmica, entrará en vigor el 30 de junio.

El Departamento de Justicia intervino recientemente a favor de xAI. Argumentan que la ley exige a las empresas de software prevenir impactos dispares no intencionales, pero exime de estas reglas a los algoritmos diseñados específicamente para promover la diversidad.

A pesar de los avances técnicos presentados, los investigadores independientes mantienen la cautela. La industria tecnológica exige mayor transparencia, ya que las empresas suelen reportar sus propias cifras de rendimiento antes de que evaluadores externos logren replicar los resultados completos.

Fuentes: 1, 2, 3, 4