GLM-5.1: El modelo de Z.ai que supera a GPT en código

Z.ai presenta GLM-5.1, modelo open-source que supera a GPT-5.4 en código y opera de forma autónoma por 8 horas seguidas.

Por Humberto Toledo el 7 abril, 2026 a las 21:10 PDT

Seguir en

Resume con:

✨︎ Resumen (TL;DR):

Z.ai liberó GLM-5.1, un modelo open-source diseñado para ingeniería autónoma.

El sistema logró 58.4 puntos en SWE-Bench Pro, rebasando a GPT-5.4 y Claude Opus 4.6.

La tecnología fue entrenada exclusivamente con chips Huawei Ascend y opera sin supervisión humana por ocho horas.

El martes, la empresa Z.ai (anteriormente Zhipu AI) presentó GLM-5.1, su nuevo modelo de código abierto construido para la ingeniería basada en agentes. El sistema resuelve tareas complejas de programación de manera autónoma, abarcando la planificación, ejecución y optimización continua hasta por ocho horas.

GLM-5.1 es un modelo de lenguaje que ejecuta flujos de trabajo de programación sin requerir intervención humana directa. Durante las pruebas de rendimiento, la plataforma registró 58.4 puntos en la evaluación SWE-Bench Pro.

Este resultado le permitió superar a rivales cerrados de la industria, incluyendo GPT-5.4, Claude Opus 4.6 y Gemini 3.1 Pro, posicionándose en el primer lugar absoluto de dicha prueba.

El desarrollo representa un refinamiento post-entrenamiento de GLM-5, revelado en febrero. Conserva la arquitectura Mixture-of-Experts de 744 mil millones de parámetros, con cerca de 40 mil millones de parámetros activos por token. Z.ai entrenó la infraestructura utilizando únicamente procesadores Huawei Ascend, eliminando cualquier dependencia de hardware de Nvidia.

Te podría interesar:
Databricks ofrece acceso inmediato a GPT-5.4 de OpenAI

Ilustración editorial de estilo vectorizado que muestra varias manos robóticas colaborando para construir una estructura arquitectónica abstracta y compleja hecha de código y formas geométricas.

Autonomía extrema y métricas técnicas

La documentación oficial de la compañía señala que este es uno de los pocos sistemas capaces de mantener una ejecución autónoma durante ocho horas completas, cerrando un ciclo de “experimentar-analizar-optimizar”.

En demostraciones prácticas, la inteligencia artificial programó un sistema de escritorio Linux desde cero. Durante el proceso, completó 655 iteraciones por su cuenta y aumentó el rendimiento de consultas de una base de datos vectorial en 6.9 veces respecto a su versión inicial.

Capacidad de tokens: Ofrece una ventana de contexto de 200,000 tokens de entrada y permite generar hasta 128,000 tokens de salida.
Compatibilidad: Funciona nativamente con herramientas del ecosistema como Claude Code y OpenClaw.
Aceleración: Alcanzó un incremento de velocidad de 3.6 veces en el benchmark KernelBench Level 3 frente a cargas de trabajo reales de machine learning.

Z.ai publicó los pesos de este software bajo una licencia MIT, habilitando el acceso inmediato para los suscriptores de su GLM Coding Plan. La empresa de tecnología, que debutó en la Bolsa de Valores de Hong Kong en enero con una valoración reportada de $31.3 mil millones de dólares, fijó el precio de su API en $1.00 dólar por millón de tokens de entrada y $3.20 dólares para los de salida.

Aunque el lanzamiento lidera las métricas de código abierto, la competencia técnica sigue ajustada. Z.ai reconoce en sus registros que la capacidad general del modelo está “alineada con Claude Opus 4.6”. Evaluaciones externas indican que logra el 94.6 por ciento del puntaje general de programación de Opus 4.6, mostrando áreas de oportunidad en tareas creativas y de razonamiento lógico.

Fuentes: 1, 2, 3, 4