A gigante da IA chinesa Deepseek encontrou atrasos significativos no lançamento de seu mais recente modelo, R2, principalmente devido a dificuldades técnicas persistentes com os chips ascend da Huawei. A empresa, enfrentando incentivo das autoridades chinesas a adotar processadores domésticos sobre os sistemas H20 da NVIDIA, lutou para obter uma execução de treinamento bem -sucedida usando o hardware da Huawei.

Apesar da assistência no local dos engenheiros da Huawei, a Deepseek foi obrigada a confiar no hardware da NVIDIA para o treinamento principal de seus modelos, reservando chips de ascend principalmente para tarefas de inferência. Essa dependência destaca uma lacuna notável na estabilidade, conectividade entre chips e maturidade do software entre as ofertas da Huawei e os produtos mais estabelecidos da Nvidia.

O lançamento do R2, inicialmente previsto para maio de 2025, foi consequentemente adiado. Os atrasos são atribuídos não apenas aos desafios de hardware, mas também à rotulagem de dados mais do que o esperado para o conjunto de dados de treinamento atualizado. O fundador da Deepseek, Liang Wenfeng, expressou insatisfação com o progresso do modelo, enfatizando a necessidade de desenvolvimento adicional para garantir que o R2 possa manter a vantagem competitiva da empresa no cenário de IA em rápida evolução.

Esse revés permitiu que os concorrentes, como o QWEN3 da Alibaba, obtenham uma vantagem. A QWEN3 incorporou os principais algoritmos de treinamento da Deepseek enquanto, simultaneamente, melhora a eficiência e a flexibilidade, demonstrando a rápida evolução nos ecossistemas de IA, mesmo quando uma startup líder enfrenta lutas internas.

A situação na Deepseek ressalta o impulso mais amplo de Pequim pela auto-suficiência de IA, que pressiona considerável as empresas domésticas a adotar o hardware local. No entanto, a implementação prática dessa estratégia revelou obstáculos técnicos significativos. A NVIDIA, um participante importante no mercado global de hardware de IA, enfatizou consistentemente a importância estratégica de manter o acesso aos desenvolvedores chineses, alertando que as restrições à adoção da tecnologia podem afetar negativamente os interesses de segurança econômica e nacional.

As empresas de IA chinesas estão navegando em um ambiente complexo, equilibrando as diretrizes governamentais para usar o hardware doméstico com as realidades práticas de desenvolver e implantar modelos avançados de grandes idiomas. Os desafios técnicos enfrentados pela Deepseek ilustram a tensão entre ambições políticas e recursos de implantação da IA do mundo real.

Apesar desses contratempos consideráveis, existe a possibilidade de que o modelo R2 da Deepseek ainda possa ser lançado nas próximas semanas. No entanto, seu desempenho provavelmente enfrentará um escrutínio intenso, principalmente quando comparado aos modelos rivais treinados em hardware mais maduro e confiável. Essa saga em andamento serve como um exemplo claro dos desafios inerentes à obtenção de auto-suficiência de IA, mantendo uma vantagem tecnológica competitiva.

Source: Modelo Deepseek R2 Lançamento adiado após falhas de chip ascend