Nvidia Grace CPU e Nvidia H100 foram revelados na Nvidia GTC 2022. A Nvidia anunciou hoje sua arquitetura Hopper GPU e GPU Hopper H100 de próxima geração, bem como um novo chip de data center que combina a GPU com uma CPU de alto desempenho, apelidado de “ Grace CPU Superchip” (não confundir com outros Superchip de graça).
CPU Nvidia Grace: especificações, preço e data de lançamento
O Nvidia GPU Superchip é a primeira tentativa da empresa em uma CPU de data center especializada. O chip baseado em Arm contará com impressionantes 144 núcleos e 1 terabyte por segundo de largura de banda de memória, de acordo com informações vazadas pela Intel. Na verdade, ele combina duas CPUs Grace conectadas pela interconexão NVLink da Nvidia – que é comparável à arquitetura M1 Ultra da Apple.
A nova CPU, que será alimentada por memória LPDDR5X rápida, deverá ser entregue no primeiro semestre de 2023 e oferecerá 2x o desempenho dos servidores convencionais. A Nvidia prevê que o chip alcançará 740 pontos no benchmark SPECrate®2017_int_base, colocando-o frente a frente com processadores de data center AMD e Intel de ponta (embora alguns deles tenham pontuação mais alta, mas ao custo de menor desempenho por watt ).
“Um novo tipo de data center surgiu – fábricas de IA que processam e refinam montanhas de dados para produzir inteligência. O Grace CPU Superchip oferece o mais alto desempenho, largura de banda de memória e plataformas de software NVIDIA em um chip e brilhará como a CPU da infraestrutura de IA do mundo.”
-Jensen Huang, fundador e CEO da Nvidia
Este novo chip, em muitos aspectos, é a progressão natural do Grace Hopper Superchip e CPU anunciados no ano passado. O Superchip Grace Hopper combina uma CPU e GPU em um único design de sistema em um chip. Este sistema, que também será lançado no primeiro semestre de 2023, incluirá uma GPU de memória de 600 GB para modelos grandes e a Nvidia afirma que a largura de banda da memória será 30 vezes maior que a GPU de um servidor básico. Esses processadores, de acordo com a Nvidia, são destinados a IA de “escala gigantesca” e aplicativos de computação de alto desempenho.
O Grace CPU Superchip é um SoC baseado em Arm v9 que pode ser usado para criar CPUs ou servidores autônomos com até oito GPUs baseadas em Hopper.
A empresa indica que está trabalhando com “clientes líderes de HPC, supercomputação, hiperescala e nuvem”, o que implica que esses sistemas eventualmente estarão disponíveis em um provedor de nuvem perto de você.
Nenhuma informação sobre o preço foi compartilhada ainda.
GPU Nvidia H100: especificações, preço e data de lançamento
A Nvidia está lançando várias tecnologias novas e aprimoradas com o Hopper, mas a ênfase da arquitetura em modelos de transformadores, que se tornaram a técnica de aprendizado de máquina preferida para muitas aplicações e quais modelos de energia como GPT-3 e asBERT, podem ser a mais essencial. .
O novo Transformer Engine do chip H100 promete acelerar o treinamento do modelo em até seis vezes e, como essa nova arquitetura também inclui o novo sistema NVLink Switch da Nvidia para vincular vários nós, clusters de servidores maciços alimentados por esses chips poderão ser dimensionados para suportar grandes redes com menos sobrecarga.
“Os maiores modelos de IA podem levar meses para serem treinados nas plataformas de computação atuais. Isso é muito lento para as empresas. AI, computação de alto desempenho e análise de dados estão crescendo em complexidade com alguns modelos, como os de linguagem grande, atingindo trilhões de parâmetros. A arquitetura NVIDIA Hopper foi construída desde o início para acelerar essas cargas de trabalho de IA de última geração com enorme poder de computação e memória rápida para lidar com redes e conjuntos de dados em crescimento.”
-Dave Salvator
Os Tensor Cores dos clientes, que podem combinar precisão de 8 bits e meia precisão de 16 bits conforme necessário, mantendo a precisão, são usados no novo Motor Transformador.
Nenhuma informação sobre o preço foi compartilhada ainda.