Os discos rígidos continuarão sendo a solução de armazenamento mais econômica para data centers nos próximos anos, mas para torná-los mais adequados para data centers de IA, a Seagate está desenvolvendo HDDs que usam uma interface PCIE comum e o protocolo NVME 2.0. Na GTC, a Seagate demonstrou um sistema de prova de conceito que executa o NVME HDDS, NVME SSDs, o Bluefield 3 DPU da NVIDIA e o software Aistore para mostrar como o NVME transforma discos rígidos para cargas de trabalho de IA. A Seagate está à frente de seus rivais, que também estão trabalhando no NVME HDDS.
Novo protocolo, novo desempenho
As unidades de disco rígido tradicionalmente usam interfaces especializadas, como SCSI, ATA paralelo, ATA serial (SATA) e SATA, que são finos, mas estão atingindo seus limites para ambientes modernos de dados de alto desempenho, especificamente em dados de dados de IA e em larga escala. Tanto o SATA quanto o SAS dependem de protocolos serializados desenvolvidos na década de 1980 que carregam camadas de protocolo herdado não adequadas para o processamento moderno de dados de alta velocidade. Além disso, as configurações de SAS e SATA requerem adaptadores de barramento de host e camadas adicionais de controlador, adicionando complexidade, pontos potenciais de falha e latência. Como resultado, essas arquiteturas não são adequadas para cargas de trabalho de IA, que requerem acesso de alto rendimento e baixa latência a conjuntos de dados maciços.
Comparado ao SAS/SATA, o NVME emparelhado com PCIE oferece largura de banda significativamente mais alta, menor latência e melhor escalabilidade. Unlike SAS/SATA, which are limited to 6-12 Gbps speeds and rely on complex layers like HBAs and expanders, NVMe operates over an industry-standard PCIe interface, supporting speeds up to 128 GB/s (one HDD is not going to need more than 1 TB/s for quite a while, but on a system level, the more bandwidth, the merrier), and greatly reducing system complexity as well as simplificando escalabilidade. O NVME também permite o acesso direto à GPU para armazenamento (GPudirect) através de DPUs ignorando as CPUs (reduzindo assim os gargalos da CPU) e suporta 64 mil filas com comandos de 64 mil por fila, melhorando bastante o processamento paralelo, o que é importante para sistemas de IA.
Sistema de prova de conceito
Para validar essa arquitetura, a Seagate construiu um sistema de prova de conceito integrando oito HDDs NVME, quatro SSDs NVME para cache, um NVIDIA Bluefield 3 DPU e software Aistore, todos em execução em um recinto de matriz de híbridos da Seagate NVME.
A máquina de teste demonstrou que o acesso direto à GPU para armazenamento minimiza a latência nos fluxos de trabalho da IA. Além disso, removendo a infraestrutura SAS/SATA Legacy simplificou a arquitetura do sistema e o aumento da eficiência de armazenamento. O software Aistore otimiza dinamicamente o cache de dados e a camada, o que aprimora muito o desempenho do treinamento do modelo de IA.
Além disso, a Seagate diz que o sistema pode escalar para os níveis de exabytes ao usar o NVME-Over-Fabric (NVME-of). Especificamente, a integração NVME-of permite a expansão perfeita de clusters de armazenamento de IA multi-rack, que são cruciais para escalar com eficiência (talvez mais importante, sem problemas) entre grandes centers.
O julgamento confirmou que os HDDs do NVME poderiam suportar ambientes de IA de alto desempenho sem exigir soluções de armazenamento totalmente baseadas em flash, reduzindo os custos e mantendo o desempenho.
Os sistemas de IA estão impulsionando o crescimento exponencial nas necessidades de armazenamento de dados, com arquiteturas existentes enfrentando restrições significativas. Os SSDs oferecem desempenho de alta velocidade, mas são financeiramente insustentáveis para o armazenamento a longo prazo nessa escala. O SAS e o SATA HDDs oferecem acessibilidade, mas introduzem complexidade e latência devido à confiança nos adaptadores de barramento host (HBAs), sistemas proprietários de silício e controlador não otimizados para os requisitos de alta renda e de baixa latência da IA. As opções de armazenamento em nuvem complicam ainda mais a infraestrutura com altos custos de transferência de dados WAN, tempos de recuperação imprevisíveis e picos de latência, que dificultam a eficiência do processamento da IA. Essas limitações resultam em arquiteturas complexas, caras e ineficientes, diminuindo a adoção e o desempenho da IA.
Necessidades futuras de armazenamento de IA
Atualmente, as empresas gerenciam os conjuntos de dados em escala de exabytes para treinamento e inferência de modelo de IA. No futuro, suas necessidades aumentarão, e é aí que a solução da Seagate para trazer a conectividade NVME aos HDDs e criar uma plataforma de armazenamento de data center unificada e eficiente brilhará.
Do ponto de vista da complexidade do HDD, adicionar o NVME aos discos rígidos não é tão caro, pois os HDDs retêm os conectores físicos SAS/SATA e seu tradicional fator de forma de 3,5 polegadas. As únicas coisas que mudam são a adição do suporte do protocolo NVME e uma interface PCIE ao controlador (que provavelmente custa centavos), bem como o desenvolvimento de firmware que suporta recursos e recursos da NVME como o GPUDIRECT. Lembre -se de que a transição para a conectividade NVME/PCIE elimina os HBAs e a complexidade, pequenos aumentos de preços de custo de HDD dificilmente serão notados pelo setor.
No entanto, à medida que os HDDs ganham capacidade, o desempenho do IOPS por TB cai, e isso pode afetar o desempenho ao trabalhar em clusters de IA daqui para frente (ou exigirá mais flash para mitigar). Para esse fim, é possível que, no futuro, HDDs de ação dupla, como o Mach.2 da Seagate, sejam preferíveis a aglomerados de IA. Essas unidades são, obviamente, mais caras que os HDDs regulares de ação única, mas cada uma dessas unidades ainda custa menos de dois HDDs de ação única, portanto, isso não criará interrupções significativas.
Quando?
Uma das coisas que um leitor ávido pediria depois de aprender os benefícios do NVME para o HDDS é quando esses discos rígidos devem chegar ao mercado. Infelizmente, é difícil dizer. As grandes empresas preferem ter suprimento de fonte dupla para produtos como HDDs, e é por isso que os discos rígidos da NVME foram desenvolvidos como parte do projeto OCP. No entanto, enquanto a Seagate já tem discos rígidos da NVME, seus rivais ainda precisam apresentar seus dispositivos. Quando isso acontece, e todos os fabricantes de discos rígidos podem produzir esses produtos em volume, provedores de serviços em nuvem que abordam empresas e cargas de trabalho de IA começarão a adotar esses produtos.