La empresa china especializada en inteligencia artificial Z.ai, anteriormente conocida como Zhipu AI, ha presentado oficialmente GLM-5.2, un modelo de lenguaje de gran escala con 753.000 millones de parámetros y pesos abiertos, diseñado para dominar las tareas de programación autónoma que requieren de un procesamiento a largo plazo.
Este modelo ya está disponible en plataformas como Hugging Face, la API de Z.ai y más de veinte entornos de programación de terceros. Cuenta con una robusta ventana de contexto de un millón de tokens y ofrece planes empresariales desde tan solo 12,60 dólares mensuales.
Uno de los aspectos más destacados es que GLM-5.2 se distribuye bajo una licencia de código abierto MIT sin restricciones, lo que permite a las empresas descargarlo gratuitamente, personalizarlo y ejecutarlo localmente o en máquinas virtuales, pagando únicamente por el coste de la infraestructura y electricidad. Esta apertura cobra especial relevancia en un contexto global donde los modelos propietarios estadounidenses enfrentan restricciones regulatorias y bloqueos geográficos, como el reciente veto a extranjeros para usar el modelo Claude Fable 5 de Anthropic, que esta compañía retiró completamente de servicio para todos los usuarios.
Innovaciones técnicas para optimizar el cálculo
GLM-5.2 incorpora una novedad arquitectónica llamada «IndexShare» que reutiliza un mismo indexador para cuatro capas de atención dispersa, reduciendo enormemente la carga computacional de los modelos tradicionales cuando procesan documentos extensos. Gracias a esta mejora, el cálculo por token se reduce 2,9 veces en escenarios con la máxima ventana de contexto de un millón de tokens.
Asimismo, dispone de una capa avanzada de Predicción Multi-Token (MTP) que permite una decodificación especulativa, incrementando la longitud de tokens aceptados en un 20% durante la inferencia. Otra innovación es la inclusión de modos de razonamiento personalizables: el modo «Max» maximizando la precisión lógica, y el modo «High», que equilibra rendimiento y eficiencia para aplicaciones sensibles a la latencia.
Resultados sobresalientes en benchmarks de programación
En pruebas estandarizadas reconocidas en la industria, GLM-5.2 supera a la mayoría de modelos abiertos y compite o supera a líderes cerrados como el GPT-5.5 de OpenAI y Claude Opus 4.8 de Anthropic en varias áreas clave, especialmente en el uso de herramientas automáticas y proyectos de ingeniería de largo alcance:
- SWE-bench Pro: GLM-5.2 obtuvo 62,1 puntos, aventajando a GPT-5.5 (58,6) y a su predecesor GLM-5.1 (58,4).
- FrontierSWE (Dominance): Destinado a medir la finalización de tareas a largo plazo, logró un 74,4%, por encima del GPT-5.5 (72,6%) y muy cercano al Claude Opus 4.8 (75,1%).
- MCP-Atlas: Evaluación del uso de herramientas, con un resultado de 77,0, por delante de GPT-5.5 (75,3) y casi igual que Claude Opus 4.8 (77,8).
- Humanity’s Last Exam (con herramientas): Con apoyos externos, alcanzó 54,7 puntos, superando a GPT-5.5 (52,2) y cerca de Claude Opus 4.8 (57,9).
- PostTrainBench y SWE-Marathon: En tareas de ingeniería extensas y prolongadas, GLM-5.2 mantiene la delantera con un 34,3% frente al 25,0% de GPT-5.5 en PostTrainBench, y un 13,0% contra 12,0% en SWE-Marathon.
Si bien en la prueba Terminal-Bench 2.1 GLM-5.2 se queda ligeramente atrás frente a Claude Opus 4.8 (81,0 frente a 85,0) y GPT-5.5 (84,0), supera ampliamente al Gemini 3.1 Pro de Google (74,0). Además, ganó el reto de diseño crowdsourced Design Arena con una puntuación ELO de 1360, superando incluso al Claude Fable 5.
El impacto de los modos de procesamiento ajustables es notable: usando el modo «Max» a plena capacidad, el modelo alcanza su máximo rendimiento a costa de generar cerca de 85.000 tokens por tarea, mientras que el modo «High» mejora considerablemente la eficiencia reduciendo a la mitad la producción de tokens con una modesta pérdida de precisión.
Planes de suscripción y API competitivos
Z.ai ha lanzado el GLM Coding Plan, enfocado en flujos de trabajo para desarrolladores más allá de simples interfaces de chat. Este plan ya incluye soporte integrado para herramientas y agentes de programación globales como Claude Code, OpenClaw o Kilo Code.
Los niveles de suscripción, facturados anualmente, son:
- Lite: 12,60 dólares al mes, ideal para pequeñas iteraciones en repositorios reducidos.
- Pro: 50,40 dólares mensuales, dirigido a desarrollos diarios en proyectos medianos con 5 veces el uso del plan Lite.
- Max: 112,00 dólares al mes, para cargas intensas con 20 veces el uso de Lite y recursos dedicados en horas punta.
Para quienes integran el modelo en aplicaciones propias, la API de GLM-5.2 tiene tarifas de 1,40 dólares por millón de tokens de entrada y 4,40 dólares por millón de tokens de salida, posicionándose en un rango de precios medio y significativamente más económico que competidores líderes con modelos propietarios.
Licencia MIT y su valor para las empresas
El aspecto más disruptivo de GLM-5.2 es su distribución bajo licencia MIT, considerada una de las más permisivas del software libre. Esto elimina cualquier restricción regional o limitación de uso, permitiendo a las empresas modificar, comercializar y ejecutar el modelo sin pagar royalties ni someterse a condiciones restrictivas habituales en licencias duales y permitiendo autonomía total sin dependencia de proveedores.
Aceptación y entusiasmo en la comunidad de desarrolladores
La acogida por parte de desarrolladores y creadores de herramientas ha sido inmediata y muy positiva. Equipos como Kilo Code confirmaron su integración desde el primer día, destacando la ventana de contexto y el modo Max operativos. Entornos de código abierto como Cline IDE resaltaron la ventaja económica y el rendimiento superior del modelo, señalando que GLM-5.2 ha elevado el estándar en modelos abiertos alcanzando o superando a otros punteros y a Gemini de Google.
Asimismo, Eigent AI probó el modelo en tareas complejas de largo alcance, logrando organizar y analizar información de múltiples empresas en el sector de IA, destacando especialmente en planificación y estructuración avanzada.
En conjunto, GLM-5.2 representa un avance notable en modelos abiertos para programación autónoma, que combina potencia, flexibilidad y costos accesibles, ofreciendo una alternativa sólida frente a los modelos propietarios más caros y restrictivos del mercado global.