Ontem, o CEO da Nvidia, Jensen Huang, se dirigiu à multidão na Conferência Global de Inteligência Artificial da Companhia. Naturalmente, a palestra teve um forte foco no futuro da NVIDIA nas tecnologias de IA, incluindo a atual arquitetura de processamento de Blackwell e além. Huang até abordou coisas como o uso da IA na robótica, mas com os preços das ações da NVIDIA continuando a cair, o mercado não parece muito impressionado.
Para a primeira parte da apresentação, o RTX Blackwell estava quente nos lábios do CEO. Acabamos de ver o lançamento dos novos cartões da NVIDIA RTX 50-Series, executando a nova tecnologia e o DLSS 4 foi um dos poucos destaques. Entre isso e o FSR 4 da AMD, o uso de escala de IA para ajudar a melhorar os jogos será fundamental nas próximas gerações. Huang fez questão de observar a versão do lado do servidor do aumento de 40x de Blackwell no desempenho da ‘fábrica’ da IA sobre a própria tremonha da NVIDIA.
Então, embora a empresa não tenha anunciado nenhum PCS para jogos, vimos dois novos desktops da NVIDIA exibidos. O DGX Spark (anteriormente dígitos) e a estação DGX são computadores de mesa projetados especificamente para executar a IA. Eles podem ser usados para executar modelos grandes em hardware projetado com precisão para o trabalho. Eles provavelmente não serão uma escolha de escolha para sua próxima plata RTX Blackwell Pros que foram anunciadosMas você pode Registre juros para o Golden AI Bois.
Huang também abordou o novo roteiro da Nvidia detalhando o trabalho futuro próximo sobre a IA. Como esta é uma conferência de desenvolvedor, isso se trata mais de ajudar as equipes a planejar quando trabalham em coordenação com a NVIDIA ou estarem prontas para usar as tecnologias da empresa. Dito isto, a NVIDIA está divulgando o próximo grande salto com recursos extremos de expansão com Rubin e Rubin Ultra.
Rubin é a próxima arquitetura pronta para a IA da Nvidia, e não é uma ortografia bastardizada do sanduíche. Em vez disso, a arquitetura recebeu o nome de Vera Rubin, o astrônomo que descobriu a matéria escura. Está destinado a introduzir novos designs para CPUs e GPUs, bem como sistemas de memória.
“Rubin é 900x o desempenho da tremonha nos fracassos, preparando o cenário para a próxima era da IA”. diz Huang, a uma multidão que esperançosamente entendeu isso.
Ele também vem com uma versão Turbo Boosted, Rubin Ultra. Isso é para grandes projetos e poderá configurar racks de até 600 quilowatts com mais de 2,5 milhões de componentes individuais por rack.
Com os dois no mercado, a Nvidia espera estar pronta para enfrentar as maiores demandas que a IA colocará em fábricas e processamento, enquanto ainda é escalável e com eficiência energética. De acordo com o roteiro, deveríamos ver Rubin em jogo pela Nvidia em 2026 e, depois disso, teremos a arquitetura Feynman, em homenagem ao físico Richard Feynman, em 2027-28
Provavelmente funcionará em conjunto com DínamoOutra capacitação da NVIDIA AI anunciada durante a palestra. Dynamo, será o sucessor do Triton Inference Server da NVIDIA e é criticamente de código aberto e está disponível para todos. O software de servir de inferência de IA ajudará os modelos de idiomas a interface entre as GPUs, separando as tarefas de processamento e raciocínio. Já dobrou o desempenho sobre a Hopper, mas leva a uma maneira mais interessante de lidar com essas tarefas.
O Dynamo armazena o que foi feito e começará a alocar tarefas para as GPUs que já possuem informações que podem ajudar. Essas GPUs se tornarão mais eficientes nessas tarefas graças a isso. Honestamente, isso parece muito como um cérebro real funciona. Quanto mais você pensa e associa tópicos, mais fortes esses links serão e melhor poderá processar idéias. Mas não se limita apenas às GPUs e CPUs, também mudará drasticamente o armazenamento.
“Em vez de um sistema de armazenamento baseado em recuperação, o sistema de armazenamento do futuro será um sistema de recuperação baseado em semântica. Um sistema de armazenamento que incorpora continuamente dados brutos ao conhecimento em segundo plano e, mais tarde, quando você o acessar, não o recuperará-você apenas falará com isso. Você fará perguntas e dará problemas”. Ele explica.
Se você ainda não está cambaleando, prepare -se para a Nvidia’s incrivelmente nomeada Isaac Gr00T N1. Apresentado para ser o primeiro modelo de fundação aberto e personalizável para o raciocínio e as habilidades humanóides generalizadas, isso ensinará seu robô exatamente o que fazer quando uma maçã cair na cabeça deles. Inventar gravidade.
“Com a NVIDIA ISAAC GR00T N1 e as novas estruturas de geração de dados e aprendizado de robôs, os desenvolvedores de robótica em todos os lugares abrirão a próxima fronteira na era da IA”. diz Huang.
Ele funciona dividindo tarefas em duas categorias diferentes, uma para reações imediatas e rápidas e outras para um raciocínio mais atencioso. Eles podem ser combinados para fazer coisas como olhar em volta de uma sala e analisá -la imediatamente e, em seguida, executar ações específicas capazes do robô específico. Estes são apenas os primeiros de uma série de módulos que a NVIDIA planeja pré -extrair e lançar download.
Essas palestras são sempre direcionadas diretamente a desenvolvedores e usuários corporativos, em vez dos jogadores comuns, mas também apontam para futuras tecnologias que podem acabar em qualquer lugar, incluindo jogos. Para a NVIDIA, parece que podemos esperar que a empresa faça um desenvolvimento de IA adicional, e a maioria parece que está sendo usada. Menos IA para fins de arte, mais para melhorar os gráficos, armazenamento eficiente, programação complexa e, é claro, ensinando robôs como pegar coisas.