O NVIDIA RTX 5090 supostamente lida com a descompressão DirectStorage GPU melhor que o RTX 4090

Sabe -se que a API do DirectStorage da Microsoft tem peculiaridades de desempenho estranhas com descompressão da GPU. No entanto, Youtuber Compusemble Alega que a mais recente GPU GeForce RTX 5090 da NVIDIA lida com a descompressão da GPU melhor do que a geração anterior RTX 4090, mostrando menos uma lacuna de desempenho ao usar a descompressão da GPU versus a descompressão da CPU.
O YouTuber comparou dois jogos com suporte DirectStorage (DS), Ratchet e Clank: Rift separados e Homem-Aranha 2. Os jogos foram testados Com a descompressão da GPU do DirectStorage e a descompressão da CPU, em um RTX 5090 às resoluções 4K, 1440p e 1080p. Observe que nenhum teste RTX 4090 foi mostrado para comparação, que possui um a priori Suposição de DS causa uma perda de desempenho.
Em Ratchet e Clank: Rift separadosO RTX 5090 produziu taxas de quadros médias quase idênticas com descompressão da GPU em comparação com a descompressão da CPU em 4K nativo. As taxas médias de quadros foram apenas 0,96% mais rápidas com descompressão da CPU, enquanto 1% baixos foram quase 10% mais altos a favor da descompressão da CPU. Isso sugere que, mais uma vez, uma carga de GPU mais alta (por exemplo, em 4K) fará com que o DS em execução na GPU reduza potencialmente o desempenho.
1440p vira a história e, embora mostrasse margens mais finas, desta vez o desempenho geral (especificamente os mínimos de 1%) favoreceu a descompressão da GPU. A descompressão da GPU do DirectStorage no RTX 5090 forneceu taxas de quadros 1,19% mais altas em média e 5,26% melhores baixos a 1% do que a descompressão da CPU. O 1080p viu a descompressão da GPU vencendo novamente, com taxas de quadros 0,48% mais altas em média e 11,11% melhores 1% baixos.
Jogo | FPS médio | 1% de baixo FPS |
---|---|---|
Catraca e clank: 4k | -0,95% | -8,48% |
Ratchet e Clank: 1440p | +1,19% | +5,26% |
Ratchet e Clank: 1080p | +0,48% | +11,11% |
Homem-Aranha 2: 4K | -7,58% | -9,53% |
Homem-Aranha 2: 1440p | -3,41% | -12,50% |
Spider-Man 2: 1080p | -3,19% | -8,45% |
Por outro lado, o Spider-Man 2 demonstrou um viés de desempenho contra a descompressão da GPU nas três resoluções. Em 4K, o RTX 5090 teve um desempenho 8,2% melhor na FPS média e 10,53% melhor nos mínimos de 1% com a descompressão da CPU. Em 1440p, a descompressão da CPU teve um desempenho 3,53% melhor na FPS média e 14,29% melhor em 1% baixos. Finalmente, a 1080p, a descompressão da CPU produziu 3,3% mais alta de FPS e 9,23% mais baixos 1% em comparação com a descompressão da GPU.
Consumable claims the RTX 5090’s performance is more consistent with GPU and CPU decompression compared to the older RTX 4090. An older video he recorded backs up his statement, showing the RTX 4090 with a greater performance drop-off when toggling between CPU and GPU decompression, specifically in Spider-Man 2. With the RTX 4090 at 4k in Spider-Man 2, average frame rates were 10.34% higher e 1% baixos 17,95% mais altos com a descompressão da CPU. Em 1440p, a taxa média de quadros foi 6,25% maior e 1% diminui 18,87% maior com a descompressão da CPU. Em 1080p, a taxa média de quadros foi 3,25% maior e 1% baixos 25,86% mais altos com a descompressão da CPU.
Considerando o RTX 5090 possui mais computação bruta (105 Tflops Fp32 vs 83 Tflops), bem como uma largura de banda de memória (1,8 TB/s vs 1,0 Tb/s), bem como 33% mais VRAM, todos podem contribuir para reduzir o impacto da descompressão GPU. O RTX 5090 possui uma interface de memória larga de 512 bits e módulos de memória GDDR7 de 28 Gbps, proporcionando 78% mais largura de banda de memória que o RTX 4090. A descompressão da GPU é muito pesada no sistema de memória, pois os ativos precisam ser transmitidos para a memória da GPU para o processo de descompressão para funcionar.
Obviamente, os cálculos de shader ainda entram em jogo e, portanto, faz sentido que, em resoluções mais baixas em que o 5090 tenha mais probabilidade de ser completamente limitado da CPU, também teria os ciclos de reposição para lidar com a descompressão. Mas qualquer que seja a causa (a arquitetura também pode desempenhar um papel), o 5090 não parece se importar com a descompressão da GPU tanto quanto o 4090. Ainda assim, o que queremos ver é mais jogos usando o DirectSorage para melhorar os tempos de carregamento e o desempenho geral – os tempos de carga um pouco mais longos seriam preferíveis a quadros inconsistentes.