Nvidia anuncia Rubin GPUs em 2026, Rubin Ultra em 2027, Feynam também adicionou ao roteiro

A Nvidia anunciou atualizações em seu roteiro de data center para 2026 e 2027, mostrando as configurações planejadas para o próximo Rubin (em homenagem a astrônomo Vera Rubin) e Rubin Ultra. Embora tenha terminado de trazer o Blackwell B200 para a produção completa e tenha o Blackwell B300 previsto para o segundo semestre de 2025, ele já está ansioso pelos próximos dois anos e ajudando seus parceiros a planejar as próximas transposições.

Um dos pontos interessantes destacados é que “Blackwell foi nomeado errado”. Em suma, o Blackwell B200 realmente tem duas matrizes por GPU, que Jensen diz que altera a topologia do NVLink. Portanto, apesar de chamar a solução atual Blackwell B200 NVL72, ele diz que seria mais apropriado chamá -lo de NV144L. É o que a NVIDIA fará com as próximas soluções Rubin.

Acima, temos o rack Rubin NVL144 que será compatível com a infraestrutura Blackwell NVL72 existente. Temos os mesmos dados de configuração para o Blackwell Ultra B300 NVL72 no segundo slide para comparação. Onde o B300 NVL72 oferece 1,1 pflops de computação densa FP4, Rubin NVL144 – com os mesmos 144 matrizes totais de GPU – oferecerão 3,6 pflops de FP4 densos. Rubin também terá 1,2 exaflops de treinamento FP8, em comparação com apenas 0,36 Exaflops para B300. No geral, é uma melhoria de 3,3x no desempenho da computação.

Rubin também marcará a mudança de HBM3/HBM3E para HBM4, com o HBM4E usado para Rubin Ultra. A capacidade de memória permanecerá em 288 GB por GPU, a mesma que no B300, mas a largura de banda melhorará de 8 TB/s para 13 TB/s. Também haverá um NVLink mais rápido que dobrará a taxa de transferência para 260 TB/s total e um novo link CX9 entre os racks, com 28,8 TB/s (o dobro da largura de banda de B300 e CX8).

A outra metade da família Rubin será a CPU de Vera, substituindo as CPUs atuais de Grace. Vera será uma CPU relativamente pequena e compacta, com 88 núcleos de braço personalizados e 176 threads. Ele também terá uma interface núcleo a núcleo de 1,8 TB/S.

Rubin Ultra pousará na segunda metade de 2027 e, embora a CPU de Vera permaneça, o lado da GPU das coisas receberá outro impulso maciço. O rack completo será substituído por um novo layout, NVL576. Sim, isso é até 576 GPUs em um rack, cada um com um consumo de energia não especificado.

A computação de inferência com FP4 dispara até 15 exaflops, com 5 exaflops de computação de treinamento FP8. É cerca de 4x a computação do Rubin NVL144, o que faz sentido, considerando que também é quatro vezes mais GPUs. As GPUs apresentarão quatro mortidas de GPU por pacote desta vez, a fim de aumentar a densidade de computação.

Onde a solução NVL144 Rubin possui 75 TB de “memória rápida” (para CPUs e GPUs) por rack, o Rubin Ultra NVL576 oferecerá 365tb de memória. As GPUs receberão HBM4E, mas aqui as coisas estão um pouco curiosas. A NVIDIA lista 4.6 Pb/S da largura de banda HBM4E, mas com 576 GPUs que funcionam para 8 TB/s por GPU. Essa é aparentemente menos largura de banda por GPU do que antes, mas talvez seja um fator de como as quatro matrizes de GPU estão ligadas. Também haverá 1 TB de HBM4E por quatro GPUs do tamanho do retículo, com 100 petaflops de computação FP4.

A interface NVLink7 será 6x mais rápida que o Rubin, com 1,5 PB/S da taxa de transferência. Os interlinks do CX9 também terão uma melhoria 4x para 115,2 TB/s entre os racks – possivelmente quadruplicando o número de links.

Obviamente, há muito que ainda não conhecemos completamente sobre Rubin e Rubin Ultra, mas esses detalhes serão desenvolvidos no futuro. Os data centers precisam de muito mais planejamento do que as GPUs do consumidor, então a NVIDIA compartilhou detalhes completos antes dos produtos prontos para serem enviados. E não está pronto …

(Crédito da imagem: Nvidia)

Após Rubin, a próxima arquitetura do Data Center da NVIDIA receberá o nome do físico teórico Richard Feynman. Presumivelmente, isso significa que conseguiremos Richard CPUs com o Feynman GPUs, se a Nvidia mantiver o padrão atual.

Source link

Artigos Relacionados

Botão Voltar ao Topo