O GTC 2024 começou com força e a NVIDIA revelou sua próxima geração de aceleradores de IA, o B200 e GB200 GPUs, construídas com base na arquitetura inovadora da Blackwell.

Esses processadores representam um grande passo na computação de IA, projetados para lidar com a complexidade cada vez maior das cargas de trabalho modernas.

O B200 possui um design monolítico com uma contagem recorde de transistores, enquanto o GB200 adota uma abordagem multi-chip, combinando a potência de vários B200s com uma CPU Grace para um desempenho incomparável.

Juntas, essas GPUs oferecem um aumento dramático no poder de processamento e na capacidade de memória, abrindo caminho para avanços em vários campos que dependem fortemente da inteligência artificial.

NVIDIA B200GB200
O B200 é um chip gigante, possibilitado por 208 bilhões de transistores que parecem malucos (Crédito da imagem)

A maravilha monolítica NVIDIA B200

O NVIDIA B200 é uma obra-prima da engenharia, ostentando impressionantes 208 bilhões de transistores. Este feito notável é possível graças ao seu design de chiplet, onde duas matrizes enormes são perfeitamente integradas.

O B200 é uma potência computacional, oferecendo um aumento de três vezes no desempenho computacional de alta precisão FP64 em comparação com seu antecessor baseado em Hopper.

Talvez o mais impressionante seja a capacidade do B200 para tarefas de inferência de IA.

Reivindicações da NVIDIA esta GPU oferece uma melhoria impressionante de cinco vezes em relação ao H200. Este salto no desempenho é significativo para a implantação de grandes modelos de linguagem (LLMs) e outras aplicações de IA que dependem fortemente de inferência.

Para os magnatas da tecnologia, aqui estão todos os detalhes técnicos da Nvidia B200:

EspecificaçãoDetalhes
ArquiteturaBlackwell
Processo de fabricaçãoTSMC N4P (classe 4 nm personalizada)
Contagem de transistores208 bilhões (em dois chips)
Tipo de memóriaHBM3E
Capacidade de memória192 GB (pilhas de 8 x 24 GB)
Largura de banda de memória8 TB/s
Interface NVLink1,8 TB/s
Desempenho de computação FP64Melhoria de 3x em relação ao H100
Desempenho de inferência de IAMelhoria de 5x em relação ao H100

GB200 combina arquiteturas Grace e Blackwell

O GB200 leva o conceito de ‘superchip’ ainda mais ao unir o poder de duas GPUs B200 com uma CPU Grace por meio de uma interconexão chip a chip NVLink de consumo ultrabaixo.

Essa configuração oferece desempenho ainda mais impressionante e capacidade de memória personalizada para as cargas de trabalho de IA mais exigentes.

Os recursos do GB200 incluem:

  • Imensa capacidade de memória: Projetado para lidar com as demandas de memória de um modelo de IA de trilhões de parâmetros
  • Rede de alta velocidade: Suporte para plataformas Ethernet NVIDIA Quantum-X800 InfiniBand e Spectrum-X800 com velocidades ultrarrápidas de 800 Gb/s
  • Escalabilidade de vários nós: O GB200 forma a base do NVIDIA GB200 NVL72, um sistema em escala de rack com refrigeração líquida para os mais altos níveis de intensidade computacional

Aqui está um rápido resumo das especificações do GB200:

EspecificaçãoDetalhes
ArquiteturaBlackwell
Componentes2 GPUs B200 + CPU NVIDIA Grace
InterconectarNVLink de consumo ultrabaixo de 900 GB/s (chip-to-chip)
Capacidade de memória384GB HBM3E
Largura de banda total da memória16 TB/s
Suporte de redeNVIDIA Quantum-X800 InfiniBand (800 Gb/s), Ethernet Spectrum-X800 (800 Gb/s)
Configuração do sistemaGB200 NVL72 (resfriado a líquido, escala de rack)

O impacto potencial do B200 e do GB200 se estende a vários setores e aplicações.

Sua poderosa aceleração é ideal para treinar e implantar modelos massivos de IA generativos que mudam a forma como criamos arte, texto, código e muito mais.

O B200/GB200 potencializa serviços aprimorados em áreas como processamento de linguagem natural e sistemas de recomendação. Os pesquisadores também obterão precisão e velocidade em áreas como descoberta de medicamentos, modelagem climática e ciência de materiais.

NVIDIA B200GB200
O B200 e o GB200 estão sobrecarregados para construir a próxima geração de chatbots e IAs de escrita de código (Crédito da imagem)

Blackwell em escala

A NVIDIA anunciou simultaneamente o DGX SuperPOD, desenvolvido especificamente para aproveitar o poder dos Superchips GB200 Grace Blackwell. Esta solução pronta para uso oferece uma plataforma otimizada para dimensionar cargas de trabalho generativas de IA com confiabilidade líder do setor.

O futuro da aceleração de IA

O NVIDIA B200 e o GB200 representam um grande avanço na computação de IA e marcam um novo ponto alto em soluções de aceleração poderosas.

Essas GPUs de referência, com suas vantagens de desempenho e memória, estão preparadas para impulsionar a inovação e expandir as fronteiras do que é possível em vários setores.


Crédito da imagem em destaque: pvproduções/Freepik.

Source: NVIDIA acaba de lançar seus chips AI B200 e GB200 de próxima geração