A MiniMax lançou os pesos de seu modelo MiniMax M2.7 em 12 de abril de 2023, em meio a uma onda de lançamentos de peso aberto de laboratórios chineses, impactando significativamente o cenário competitivo de IA.

Este lançamento alinha-se com uma tendência mais ampla na China, à medida que várias empresas correm para revelar os seus avanços. O MiniMax M2.7 foi anunciado pela primeira vez em março e obteve 56,22% no benchmark SWE-Pro, igualando os resultados do GPT-5.3-Codex. Além disso, alcançou 55,6% no benchmark VIBE-Pro, que está quase no mesmo nível do Opus 4.6 para entrega de projetos em tarefas web, móveis e de simulação. O modelo também obteve a classificação ELO mais alta de 1.495 na avaliação GDPval-AA entre os modelos de código aberto.

Os pesos do MiniMax M2.7 agora estão disponíveis no Hugging Face e são suportados nas plataformas NVIDIA. No entanto, o lançamento enfrentou críticas devido a restrições de licenciamento que proíbem o uso comercial sem permissão prévia por escrito, o que alguns membros da comunidade argumentam que prejudica a sua classificação de código aberto. MiniMax caracterizou o M2.7 como o primeiro modelo a participar de seu próprio ciclo de desenvolvimento por meio de um processo que eles chamam de “autoevolução”.

O lançamento do MiniMax segue o código aberto da Zhipu AI de seu modelo GLM-5.1 em 7 de abril, que opera sob a licença do MIT. Este modelo, contendo 754 bilhões de parâmetros, pode executar tarefas de engenharia de forma autônoma por até oito horas. Por outro lado, a Alibaba lançou o seu modelo de API proprietário, Qwen 3.6 Plus, em 2 de abril, provocando especulações sobre o seu compromisso com práticas de código aberto. O Qwen 3.6 Plus ainda era gratuito no OpenRouter em 11 de abril, mas sua disponibilidade a longo prazo permanece incerta.

A expectativa está aumentando para o modelo V4 do DeepSeek, com lançamento previsto para o final de abril. O fundador da DeepSeek, Liang Wenfeng, indicou que o modelo funcionará com chips Ascend da Huawei, ressaltando os esforços de autossuficiência de semicondutores da China. Espera-se que apresente cerca de um trilhão de parâmetros e utilize a arquitetura Mixture-of-Experts com uma janela de contexto de um milhão de tokens. O V4 também deverá incluir múltiplas variantes, como um modo Vision para suporte multimodal. Apesar de sofrer dois atrasos, os primeiros testes de resistência sugerem que um lançamento público pode ser iminente.


Crédito da imagem em destaque