NVIDIA RTX PRO 6000 PARTIR PARA APENAS: BLACKWELL RTX WORKSTATION, MAX-Q WORKSTATION e Variantes de servidores mostradas

A GPU NVIDIA Blackwell RTX Pro 6000 foi anunciada durante a palestra GTX 2025. Isso usará a mesma matriz GB202 que entra na placa gráfica RTX 5090 da NVIDIA, mas com algumas mudanças significativas em alguns dos outros aspectos. Haverá três variantes do RTX Pro 6000: The Blackwell Workstation Edition, Max-Q Workstation Edition e Blackwell Server Edition.
As especificações principais para o RTX Pro 6000 são as mesmas nos três modelos. Você recebe 188 SMS ativado, de um potencial máximo de 192 do GB202. Isso é 10,6% mais SMS, núcleos de shader, núcleos tensores, núcleos de RT etc., em relação ao RTX 5090. As velocidades do relógio não foram fornecidas, mas a NVIDIA liste até 125 tflops de computação FP32 através dos shaders e 4000 tops a partir dos núcleos de tração. Isso resulta em um relógio de impulso de cerca de 2,6 GHz, mas isso não será o mesmo para as três variantes.
O RTX Pro 6000 apresenta o cache L2 de 128 MB de 128 MB do GB202, juntamente com quatro blocos de vídeo NVENC e quatro NVDEC. O RTX 5090 possui apenas 96 MB de cache L2 e três para NVENC/NVDEC. Está muito próximo de um chip totalmente ativado, com apenas 2% do SMS desativado.
A configuração da memória é a mesma para as três variantes. Conforme discutido no anúncio inicial do RTX Pro 6000, a NVIDIA usa chips GDDR7 de 24 GB (3 GB), em vez dos chips de 2 GB usados nos cartões de 50-Série do Consumer GeForce RTX. Isso aumenta a capacidade de memória para 48 GB por lado do PCB e, com chips em ambos os lados do PCB no modo ‘Clamshell’, há 96 GB de total. A memória possui os mesmos relógios de 28 Gbps que a maioria das peças da série 50, com 1792 GB/s de largura de banda total.
Placa gráfica | RTX Pro 6000 | RTX Pro 5000 | RTX PRO 4500 | RTX PRO 4000 |
---|---|---|---|---|
Arquitetura | GB | GB | GB2203 | GB2203 |
Tecnologia de processo | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N |
Transistores (bilhões) | 92.2 | 92.2 | 45.6 | 45.6 |
Tamanho da matriz (mm^2) | 750 | 750 | 378 | 378 |
SMS | 188 | 110 | 82 | 70 |
Shaders da GPU (ALUS) | 24064 | 14080 | 10496 | 8960 |
Núcleos tensores | 752 | 440 | 328 | 280 |
Núcleos de rastreamento de raios | 188 | 110 | 82 | 70 |
Relógio de Boost (MHz) | 2600 | 2500? | 2500? | 2500? |
Velocidade VRAM (GBPS) | 28 | 28 | 28 | 28? |
VRAM (GB) | 96 | 48 | 32 | 24 |
VRAM Largura do barramento | 512 | 384 | 256 | 192 |
L2 Cache | 128 | 96? | 64? | 48? |
Renderizar unidades de saída | 192 | 144? | 96? | 80? |
Unidades de mapeamento de textura | 752 | 440 | 328 | 280 |
Tflops fp32 (impulso) | 125.1 | 70.4? | 52.5? | 44.8? |
Tflops fp16 (fp4/fp8 tflops) | 1001 (4004) | 563 (2253)? | 420 (1679)? | 358 (1434)? |
Largura de banda (GB/s) | 1792 | 1344 | 896 | 672? |
TBP (Watts) | 600 | 300 | 200 | 140 |
A edição da Blackwell Workstation parece basicamente a mesma do RTX 5090, exceto com um acabamento preto brilhante em alguns lugares, em vez de um preto fosco. O TDP (TGP) para o cartão é 600W, 25W superior ao 5090, mas, caso contrário, os dois cartões parecem os mesmos. Você também obtém quatro saídas do DisplayPort 2.1B, enquanto o 5090 normalmente oferece pelo menos uma saída HDMI 2.1B.
Para a edição Max-Q Workstation, o TGP é limitado a 300W. Metade da energia significa naturalmente relógios de impulso típico mais baixo para muitas cargas de trabalho, embora, sem dúvida, haja casos em que ele ainda será executado quase tão rápido quanto o cartão de 600W. Ele também possui um fator de forma de slot duplo com altura total (altura total) com fãs de câmbio duplo com ventiladores de dupla no fundo do cartão. Ele também possui quatro saídas DP2.1b.
Por fim, a edição do Blackwell Server tem um fator de forma semelhante ao cartão Max-Q, mas abandona os ventiladores, confiando nos fãs do servidor para fornecer fluxo de ar e refrigeração. Isso geralmente está em amplo suprimento para servidores, e os níveis de ruído geralmente são menos preocupantes – você obtém altos ventiladores de RPM movendo muito ar em um ambiente regulamentado para fazer com que tudo corra o suficiente. A energia na edição do servidor é configurável até 600W, para que algumas instalações possam optar por uma potência mais baixa para otimizar a eficiência se forem com potência limitada.
Todos os três modelos usam o mesmo conector de 16 pinos encontrado nos cartões RTX da área de trabalho. Servidores e estações de trabalho tendem a ser criados com especificações muito mais rígidas e, até agora, não houve relatórios generalizados de servidores ou estações de trabalho com conectores de fusão. Isso sugere talvez que os maiores problemas com os conectores de 16 pinos sejam a qualidade dos componentes e a instalação adequada-as empresas têm menos probabilidade de barato nos cabos em um servidor ou estação de trabalho, portanto, não há impurezas causando pontos quentes e derretimento.
Os preços não foram discutidos, mas normalmente vemos soluções profissionais e servidores, como o RTX Pro 6000, vendendo por 4x ~ 5x a mais que as GPUs de consumo equivalentes. Não seria surpreendente se os vários cartões RTX Pro 6000 custassem US $ 10.000 ou mais. Vamos descobrir exatamente onde eles caem nos próximos dias.