DeepSeek anunciou reduções significativas de preços para seu serviço API no sábado, logo após o lançamento de seu modelo de linguagem grande V4 em 24 de abril de 2023. Os cortes de preço reduzem as taxas de cache de entrada para um décimo de suas taxas anteriores e oferecem um desconto de 75% no modelo V4-Pro até 5 de maio de 2023.

O preço de acerto do cache de entrada do V4-Pro caiu para 0,025 yuans (aproximadamente US$ 0,0036) por milhão de tokens. Os preços padrão durante o período promocional são fixados em 3 yuans para entrada e 6 yuans para produção por milhão de tokens. Essa estratégia de preços supera fortemente os concorrentes, com modelos da Anthropic, OpenAI e Google com preços entre US$ 12 e US$ 25 por milhão de tokens, de acordo com dados do OpenRouter.

DeepSeek lançou V4-Pro e V4-Flash em capacidade de visualização, marcando o primeiro lançamento de modelo significativo da empresa desde sua versão V3.2 em dezembro de 2022. V4-Pro tem 1,6 trilhão de parâmetros e 49 bilhões de parâmetros ativos por passagem de inferência, tornando-o o maior modelo de peso aberto atualmente disponível. O V4-Flash apresenta uma configuração menor com 284 bilhões de parâmetros.

Mesmo antes dos cortes recentes, os preços padrão do V4-Pro eram de US$ 1,74 para entrada e US$ 3,48 para produção por milhão de tokens, o que era cerca de 98% inferior ao preço do GPT-5.5 Pro da OpenAI. Os descontos mais recentes ampliam ainda mais essa vantagem competitiva.

Em meio ao aumento dos custos de energia computacional no setor de IA, a estratégia da DeepSeek se alinha com uma tendência mais ampla de reduções de preços na indústria. De acordo com um relatório de Gelonghui, a empresa abraçou totalmente o conceito de “redução de preços de IA”.

Notavelmente, o V4 opera em hardware Huawei Ascend em vez de chips Nvidia, o que os observadores sugerem que pode melhorar a adoção doméstica de sistemas de IA. Wei Sun, principal analista de IA da Counterpoint Research, indicou que este desenvolvimento permite a implantação de sistemas de IA sem depender apenas da Nvidia, acelerando potencialmente os avanços de IA nacionais e globais.

O V4-Pro demonstra eficiência significativa, exigindo apenas 27% do poder computacional de seu antecessor, V3.2, para uma janela de contexto de um milhão de tokens. Apesar de seus avanços, a DeepSeek reconhece que o V4 permanece atrás de modelos líderes como GPT-5.4 e Gemini 3.1 Pro por cerca de três a seis meses em desempenho, conforme declarado no documento técnico da empresa.


Crédito da imagem em destaque