A equipe de Qwen anunciou o lançamento de QWEN3-CODER-480B e QWEN3-CODER-35B Instructmarcando um avanço significativo em modelos de código de órgãos abertos. Esses novos modelos foram projetados para aprimorar substancialmente os recursos de codificação, oferecendo design arquitetônico robusto e utilidade prática para tarefas de desenvolvimento de software.
QWEN3-CODER-480B é o maior modelo de código aberto até o momento, demonstrando desempenho de ponta (SOTA) em vários benchmarks de código. Seus recursos abrangem a conclusão, edição e geração do código. Uma conquista notável para o QWEN3-CODER-480B é seu desempenho excepcional na conclusão do código, particularmente na tarefa de preenchimento (FIM), onde alcançou uma pontuação@1 de 42,0%. O extenso regime de treinamento do modelo envolveu mais de 3 trilhões de tokens provenientes de diversos conjuntos de dados, o que contribui para sua capacidade aprimorada de compreender e gerar código de maneira eficaz. Esses vastos dados de treinamento e o tamanho do modelo o posicionam como uma ferramenta altamente versátil para desenvolvedores, capaz de lidar com um amplo espectro de tarefas, desde a conclusão fundamental do código até a complexa geração de código.
Complementando o modelo 480B, o QWEN3-CODER-35B Instruct é otimizado especificamente para funcionar como um agente de codificação, fornecendo assistência aos desenvolvedores com requisitos complexos de codificação. Este modelo incorpora recursos avançados, incluindo uma janela de contexto de 32k token. Foi treinado com técnicas especializadas que facilitam o uso contínuo de ferramentas externas e chamadas de funções. Essa funcionalidade permite que os desenvolvedores invocem APIs externas diretamente em seu ambiente de codificação, melhorando assim a produtividade e otimizando os fluxos de trabalho de desenvolvimento. O modelo de instrução QWEN3-CODER-35B é projetado para robustez e eficiência, tornando-o altamente adequado para aplicações de agentes que envolvem interações complexas.
Agora, o QWEN3-Coder-480B e o QWEN3-CODER-35B Instruct estão acessíveis ao público em plataformas líderes, como abraçar o rosto e o modelscope. Em uma mudança para promover a inovação e a colaboração na comunidade de desenvolvimento de software orientada pela IA, a equipe QWEN de código aberto todos os códigos associados, pesos do modelo e documentação abrangente. Essa abordagem de código aberto visa capacitar pesquisadores e desenvolvedores a utilizar esses modelos, contribuindo para sua melhoria adicional e adoção mais ampla.
Source: Novo modelo 480B QWEN quebra registros de código aberto








