Z.ai, anteriormente conhecido como Zhipu AI, lançou o modelo GLM-5.1 na terça-feira. Este modelo principal de código aberto foi projetado para engenharia de agentes e pode lidar de forma autônoma com uma única tarefa de codificação por até oito horas, realizando planejamento, execução, testes e otimização em um loop contínuo.
O modelo GLM-5.1 obteve pontuação de 58,4 no benchmark SWE-Bench Pro, superando GPT-5.4, Claude Opus 4.6 e Gemini 3.1 Pro. Esta versão segue um refinamento pós-treinamento do GLM-5, que foi introduzido em fevereiro como um modelo de mistura de especialistas de 744 bilhões de parâmetros, utilizando aproximadamente 40 bilhões de parâmetros ativos por token e treinado inteiramente em chips Huawei Ascend sem hardware Nvidia.
De acordo com a documentação de Z.ai, o GLM-5.1 aprimora a codificação e as capacidades de agente por meio de técnicas como ajuste fino supervisionado multitarefa e estágios de aprendizado por reforço. O modelo é capaz de sustentar uma execução autônoma de oito horas, completando um ciclo completo de “experimentar-analisar-otimizar”. Em demonstrações, ele construiu com sucesso um sistema desktop Linux completo do zero em oito horas, executando 655 iterações e aumentando o rendimento de consultas de banco de dados vetoriais em 6,9 vezes.
GLM-5.1 apresenta uma janela de contexto de 200.000 tokens e suporta até 128.000 tokens de saída. Ele foi otimizado para fluxos de trabalho de codificação de agentes e é compatível com ferramentas como Claude Code e OpenClaw. O modelo alcançou uma aceleração média geométrica de 3,6x em cargas de trabalho reais de aprendizado de máquina no benchmark de otimização KernelBench Nível 3.
O GLM-5.1 está disponível para todos os assinantes do Plano de Codificação GLM, com seus pesos publicados sob uma licença do MIT. Z.ai, que abriu o capital na Bolsa de Valores de Hong Kong em janeiro com uma avaliação de US$ 31,3 bilhões, oferece acesso API para GLM-5.1 a um custo de US$ 1,00 por milhão de tokens de entrada e US$ 3,20 por milhão de tokens de saída.
O lançamento aumenta a concorrência no espaço de modelos de codificação de código aberto, posicionando o GLM-5.1 na vanguarda do SWE-Bench Pro, à frente de seus equivalentes de código fechado. Embora Z.ai afirme que as capacidades do modelo estão alinhadas com Claude Opus 4.6, avaliações independentes mostram que ele atinge aproximadamente 94,6% da pontuação de codificação mais ampla do Opus 4.6, indicando algumas lacunas no raciocínio e nas tarefas criativas.








