DeepSeek lançou seu novo modelo de IA, DeepSeek V4, alegando desempenho aprimorado e otimizado para chips produzidos internamente na China. O modelo apresenta um contexto ultralongo de um milhão de palavras, aprimorando as capacidades do agente, o conhecimento do mundo e o desempenho do raciocínio.

DeepSeek V4 está disponível em duas versões: DeepSeek V4-Pro e DeepSeek V4-Flash. A empresa descreve esta última como uma opção mais eficiente e econômica. De acordo com DeepSeek, o V4-Pro supera significativamente outros modelos de código aberto em benchmarks de conhecimento mundial e é apenas ligeiramente superado pelo modelo de código fechado do Google, Gemini-Pro-3.1.

A variante V4-Pro inclui um “modo de esforço máximo de raciocínio” projetado para aprimorar as capacidades de conhecimento dos modelos de código aberto, estabelecendo-o como um dos principais concorrentes nesse espaço. DeepSeek já causou uma liquidação de trilhões de dólares no mercado de ações com seu modelo anterior, R1, que desafiou sistemas de IA como o ChatGPT da OpenAI a um custo de desenvolvimento mais baixo.

O lançamento do R1 no ano passado levou a perdas significativas para grandes empresas de tecnologia, com a Nvidia sofrendo mais de US$ 500 bilhões em um único dia. O lançamento também marcou a primeira grande competição de uma empresa chinesa de IA contra gigantes da tecnologia estabelecidos nos EUA. O lançamento do DeepSeek ocorre em meio a restrições à exportação de semicondutores dos EUA para a China, afetando particularmente GPUs de última geração, essenciais para o desenvolvimento de IA.

O sistema de chip usado para treinar o DeepSeek V4 não foi divulgado, mas a empresa afirmou que suporta chips Nvidia e Huawei. DeepSeek V4 pode processar até 384.000 tokens, uma unidade fundamental de dados para modelos de IA. Isto marca uma melhoria significativa em relação ao seu antecessor, V3, que gerenciou apenas 128.000 tokens.

A atualização permite o raciocínio de vários documentos, permitindo que a IA compreenda livros inteiros e bancos de dados de código completos. A empresa afirma que esta capacidade representa um “salto dramático na eficiência computacional” e inicia uma nova era para grandes modelos de linguagem com contextos de um milhão de comprimentos.

DeepSeek V4-Pro supera o Gemini-3.1-Pro do Google, mas ainda fica atrás do modelo Claude Opus 4.6 da Anthropic. DeepSeek visa aprimorar ainda mais a inteligência, robustez e usabilidade do modelo em várias tarefas e cenários.


Crédito da imagem em destaque