A NVIDIA anunciou a GPU “Rubin CPX” no AI Infra Summit, um acelerador especializado da próxima família “Rubin” projetada para modelos de IA de concurso maciço. Esperado até o final de 2026, o chip fornece 30 petaflops de computação NVFP4 em uma matriz monolítica com 128 GB de memória GDDR7. Essa configuração monolítica é um afastamento dos pacotes de dupla GPU dos atuais arquiteturas Blackwell e Blackwell Ultra da NVIDIA e o que o resto da família Rubin seguirá. O Rubin CPX aborda gargalos computacionais em cenários de contexto estendido, processando milhões de tokens simultaneamente para aplicações como análise abrangente da base de código de software e processamento de vídeo de uma hora, o que pode exigir até um milhão de tokens. O processador integra quatro codificadores de vídeo NVENC e quatro NVDEC no chip, permitindo fluxos de trabalho multimídia simplificados. A NVIDIA afirma que o Rubin CPX oferece três vezes a velocidade de processamento de atenção de seus atuais sistemas Ultra Aceleator GB300 Blackwell. A arquitetura usa uma abordagem de moradia única otimizada para reduzir a complexidade da fabricação, mantendo a densidade computacional. Embora as especificações da largura de banda de memória não sejam reveladas, uma interface de 512 bits pode produzir cerca de 1,8 TB/s de taxa de transferência com chips de memória GDDR7 de 30 Gbps. A NVIDIA planeja integrar os processadores Rubin CPX na plataforma Vera Rubin NVL144 CPX, combinando GPUs tradicionais de Rubin com as variantes CPX especializadas. Essa configuração híbrida visa 8 exaflops de computação agregada e 1,7 Pb/s de largura de banda de memória em uma implantação completa do rack. O rack “Kyber” incluirá adaptadores de rede Connectx-9 com rede de 1600g, espectro6 com comutação 102.4T e óptica co-embalada. A NVIDIA está comercializando o Rubin CPX como único na família Rubin para lidar com a complexidade dos sistemas de IA de escala no tempo de teste. À medida que os modelos evoluem para agentes sofisticados de raciocínio, as divisões de inferência entre o processamento de contexto intensivo computacionalmente e a geração de token dependente da largura de memória. O design do CPX é otimizado para esses requisitos duplos, lidando com operações de pré -preenchimento de contexto para chatbots corporativos com 256.000 tokens ou análise de código superior a 100.000 linhas. Essa especialização é fundamental para os sistemas de IA que precisam de memória persistente em interações ampliadas, que a NVIDIA pretende habilitar perfeitamente com esse hardware. O ciclo rápido de desenvolvimento da NVIDIA aumentou seu desempenho financeiro, com a empresa relatando US $ 41,1 bilhões em vendas de data centers em seu trimestre mais recente.
Source: Nvidia anuncia Rubin CPX GPU para um contexto longo ai




