A startup de IA chinesa Deepseek lançou a v3.1, uma atualização de seu modelo V3, posicionado como rival do GPT-5 do OpenAI. O novo modelo é otimizado para chips fabricados em chinês e com preços prejudicados para o Openai, marcando um desenvolvimento significativo na paisagem global da IA.

O V3.1 da Deepseek foi lançado silenciosamente através de uma mensagem no WeChat e na plataforma de rosto de abraço. Este lançamento ressalta a ambição da China de desenvolver e controlar sistemas avançados de IA independentemente da tecnologia estrangeira.

Os modelos da Deepseek viram adoção generalizada na China e crescendo interesse globalmente, mesmo entre algumas empresas americanas utilizando o modelo de raciocínio R1. No entanto, foram levantadas preocupações com relação aos resultados dos modelos que se alinham às narrativas do Partido Comunista Chinês, afetando potencialmente sua neutralidade.

O setor de IA da China também inclui modelos de empresas como Alibaba, Moonshot AI e Baidu. O lançamento da V3.1 da Deepseek, após o GPT-5 do OpenAI, destaca a determinação da China em competir com os principais laboratórios americanos.

O CEO da Openai, Sam Altman, reconheceu que a concorrência de modelos de código aberto chinês, incluindo Deepseek, influenciou a decisão da OpenAI de liberar seus próprios modelos de peso aberto. Altman afirmou: “Ficou claro que, se não o fizéssemos, o mundo seria construído principalmente sobre os modelos chineses de código aberto. Isso foi um fator em nossa decisão, com certeza. Não era o único, mas isso apareceu grande”.

O governo dos EUA concedeu licenças à NVIDIA e à AMD para exportar chips de IA específicos da China, incluindo o H20 da NVIDIA, sob a condição de que 15% da receita dessas vendas seja para Washington. Em resposta, Pequim se moveu para restringir as compras de chips da NVIDIA seguindo as declarações do secretário de Comércio Howard Lutnick, indicando restrições às vendas de chips de primeira linha para a China. Lutnick afirmou em 15 de julho: “Não vendemos nossas melhores coisas, nem as nossas segundas melhores coisas, nem mesmo a terceira melhor”.

A otimização da Deepseek para chips fabricados chineses sinaliza uma estratégia para mitigar o impacto dos controles de exportação dos EUA. A empresa mencionou em seu WeChat Post que o novo formato de modelo foi projetado para “chips domésticos de próxima geração em breve lançados”.

Altman expressou preocupações sobre a subestimação do progresso da China na IA e sugeriu que os controles de exportação podem não ser uma solução suficiente. Ele comentou: “Estou preocupado com a China”.

O modelo v3.1 é notável por suas especificações técnicas, incluindo 685 bilhões de parâmetros. Seu design de “mistura de especialistas” visa reduzir os custos de computação para os desenvolvedores, ativando apenas uma fração do modelo para cada consulta. Ao contrário dos modelos anteriores do Deepseek que separavam tarefas com base nos requisitos de pré -treinamento e raciocínio, a v3.1 combina respostas rápidas e raciocínio em um sistema.

Essa arquitetura híbrida é um avanço significativo, conforme observado pelo analista de tecnologia Ben Dickson, fundador do Blog do TechTalks. Ele afirmou que a arquitetura híbrida da V3.1 é “o maior recurso de longe”.

Source: Deepseek v3.1 da China, diminui o Openai com preços mais baratos