Z.ai lança modelo GLM-5.1, superando concorrentes em benchmarks

Z.ai, anteriormente conhecido como Zhipu AI, lançou o modelo GLM-5.1 na terça-feira. Este modelo principal de código aberto foi projetado para engenharia de agentes e pode lidar de forma autônoma com uma única tarefa de codificação por até oito horas, realizando planejamento, execução, testes e otimização em um loop contínuo.

O modelo GLM-5.1 obteve pontuação de 58,4 no benchmark SWE-Bench Pro, superando GPT-5.4, Claude Opus 4.6 e Gemini 3.1 Pro. Esta versão segue um refinamento pós-treinamento do GLM-5, que foi introduzido em fevereiro como um modelo de mistura de especialistas de 744 bilhões de parâmetros, utilizando aproximadamente 40 bilhões de parâmetros ativos por token e treinado inteiramente em chips Huawei Ascend sem hardware Nvidia.

De acordo com a documentação de Z.ai, o GLM-5.1 aprimora a codificação e as capacidades de agente por meio de técnicas como ajuste fino supervisionado multitarefa e estágios de aprendizado por reforço. O modelo é capaz de sustentar uma execução autônoma de oito horas, completando um ciclo completo de “experimentar-analisar-otimizar”. Em demonstrações, ele construiu com sucesso um sistema desktop Linux completo do zero em oito horas, executando 655 iterações e aumentando o rendimento de consultas de banco de dados vetoriais em 6,9 vezes.

GLM-5.1 apresenta uma janela de contexto de 200.000 tokens e suporta até 128.000 tokens de saída. Ele foi otimizado para fluxos de trabalho de codificação de agentes e é compatível com ferramentas como Claude Code e OpenClaw. O modelo alcançou uma aceleração média geométrica de 3,6x em cargas de trabalho reais de aprendizado de máquina no benchmark de otimização KernelBench Nível 3.

O GLM-5.1 está disponível para todos os assinantes do Plano de Codificação GLM, com seus pesos publicados sob uma licença do MIT. Z.ai, que abriu o capital na Bolsa de Valores de Hong Kong em janeiro com uma avaliação de US$ 31,3 bilhões, oferece acesso API para GLM-5.1 a um custo de US$ 1,00 por milhão de tokens de entrada e US$ 3,20 por milhão de tokens de saída.

O lançamento aumenta a concorrência no espaço de modelos de codificação de código aberto, posicionando o GLM-5.1 na vanguarda do SWE-Bench Pro, à frente de seus equivalentes de código fechado. Embora Z.ai afirme que as capacidades do modelo estão alinhadas com Claude Opus 4.6, avaliações independentes mostram que ele atinge aproximadamente 94,6% da pontuação de codificação mais ampla do Opus 4.6, indicando algumas lacunas no raciocínio e nas tarefas criativas.

Crédito da imagem em destaque

Z.ai lança modelo GLM-5.1, superando concorrentes em benchmarks

Related Stories

OpenAI aprovada para lançar modelos GPT-5.6 ao público em 9 de julho

Meta lança ferramenta para detectar imagens geradas por IA com marca d’água invisível

Claude Cowork agora pode executar tarefas do seu telefone

Apple traz controles de fala Siri mais pessoais para beta 3