Nvidia anuncia Rubin CPX GPU para um contexto longo ai

A NVIDIA anunciou a GPU “Rubin CPX” no AI Infra Summit, um acelerador especializado da próxima família “Rubin” projetada para modelos de IA de concurso maciço. Esperado até o final de 2026, o chip fornece 30 petaflops de computação NVFP4 em uma matriz monolítica com 128 GB de memória GDDR7. Essa configuração monolítica é um afastamento dos pacotes de dupla GPU dos atuais arquiteturas Blackwell e Blackwell Ultra da NVIDIA e o que o resto da família Rubin seguirá. O Rubin CPX aborda gargalos computacionais em cenários de contexto estendido, processando milhões de tokens simultaneamente para aplicações como análise abrangente da base de código de software e processamento de vídeo de uma hora, o que pode exigir até um milhão de tokens. O processador integra quatro codificadores de vídeo NVENC e quatro NVDEC no chip, permitindo fluxos de trabalho multimídia simplificados. A NVIDIA afirma que o Rubin CPX oferece três vezes a velocidade de processamento de atenção de seus atuais sistemas Ultra Aceleator GB300 Blackwell. A arquitetura usa uma abordagem de moradia única otimizada para reduzir a complexidade da fabricação, mantendo a densidade computacional. Embora as especificações da largura de banda de memória não sejam reveladas, uma interface de 512 bits pode produzir cerca de 1,8 TB/s de taxa de transferência com chips de memória GDDR7 de 30 Gbps. A NVIDIA planeja integrar os processadores Rubin CPX na plataforma Vera Rubin NVL144 CPX, combinando GPUs tradicionais de Rubin com as variantes CPX especializadas. Essa configuração híbrida visa 8 exaflops de computação agregada e 1,7 Pb/s de largura de banda de memória em uma implantação completa do rack. O rack “Kyber” incluirá adaptadores de rede Connectx-9 com rede de 1600g, espectro6 com comutação 102.4T e óptica co-embalada. A NVIDIA está comercializando o Rubin CPX como único na família Rubin para lidar com a complexidade dos sistemas de IA de escala no tempo de teste. À medida que os modelos evoluem para agentes sofisticados de raciocínio, as divisões de inferência entre o processamento de contexto intensivo computacionalmente e a geração de token dependente da largura de memória. O design do CPX é otimizado para esses requisitos duplos, lidando com operações de pré -preenchimento de contexto para chatbots corporativos com 256.000 tokens ou análise de código superior a 100.000 linhas. Essa especialização é fundamental para os sistemas de IA que precisam de memória persistente em interações ampliadas, que a NVIDIA pretende habilitar perfeitamente com esse hardware. O ciclo rápido de desenvolvimento da NVIDIA aumentou seu desempenho financeiro, com a empresa relatando US $ 41,1 bilhões em vendas de data centers em seu trimestre mais recente.

Source: Nvidia anuncia Rubin CPX GPU para um contexto longo ai

Nvidia anuncia Rubin CPX GPU para um contexto longo ai

Related Stories

Apple ativa Siri AI no Apple Watch no watchOS 27 beta 3

Há rumores de que a Apple lançará o iPhone Ultra dobrável em 2026

Google altera regras de armazenamento para backups de celulares Android

Samsung agenda quarto One UI 9 beta para Galaxy S26