Os custos da IA caem 280 vezes, mas os incidentes prejudiciais aumentam 56% no ano passado-o relatório da IA de Stanford 2025 destaca a competição China-EUA

O custo para solicitar a AI LLMS de ponta caiu de US $ 20 por milhão de tokens para US $ 0,07 por milhão em apenas 18 meses, de acordo com Stanford’s 2025 Relatório de índice de IA. Uma visão panorâmica da paisagem mundial de IA, o relatório anual de Stanford também relata uma séria necessidade de mais corrigas de IA responsáveis e uma corrida mais apertada entre os emergentes Tech da AI emergente dos EUA e da China.
O Instituto de IA da IA (HAI) da Universidade de Stanford (HAI) publica seu relatório anual de índice de IA desde 2017, com seus relatórios recentes citados regularmente pelos governos mundiais. A HAI coletou e coletou dados nas inúmeras facetas da IA, estudando investimentos no mercado, onde e como a tecnologia é mais usada e onde está mais falta. O relatório deste ano oferece sérias idéias sobre o crescimento da IA em 2024 e prevê onde provavelmente será a seguir.
Os custos de IA são mais baixos … e mais altos
Os modelos de inteligência artificial tornaram -se significativamente mais baratos para usar apenas no ano passado – mas ao mesmo tempo eles se tornaram mais caros para treinar. Essa aparente contradição é ilustrada nos gráficos úteis de Hai que acompanham o estudo: como as principais empresas aumentaram seus investimentos em seus modelos de carro -chefe, o custo para operar e consultar os mesmos modelos caiu significativamente.
O custo para consultar uma IA está inativo, no entanto, principalmente por causa de um hardware, desempenho e eficiência energética melhor. (4/13) pic.twitter.com/7xxj680leg8 de abril de 2025
Openai, Meta e Google aumentaram mensurável os custos investidos em seus principais modelos de idiomas. Em média, cada empresa gastou 28 vezes mais dinheiro treinando seu modelo de IA mais recente do que treinava o antecessor (o salto de US $ 3 milhões a US $ 170 milhões da Meta foi o maior). Outros recém-chegados relativos, como Mistral e Xai, também entraram no jogo gasto alto-Grok-2 custou cerca de US $ 107 milhões para treinar.
O custo para treinar esses LLMs também não parece estar caindo tão cedo. A GROK-3 de Xai, lançada ao público em fevereiro, afirma ter usado 10 vezes as GPUs do treinamento da GROK-2. A GROK-3 não tinha preço oficial, mas poderia ter custado US $ 1 bilhão ou mais para concluir.
Se esses números para treinar um programa de computador parecem astronômicos, é porque são. Embora essas empresas de trilhões de dólares investem centenas de bilhões na próxima geração de IA, o preço para alcançar o desempenho do GPT-3.5 encolheu. O custo para inferência Um modelo no desempenho do nível GPT-3.5-definido pelo HAI como 64,8% de precisão-caiu 280 vezes de novembro de 2022 a outubro de 2024.
Os custos de hardware e operação em queda de modelos menores de IA contribuíram fortemente para essa queda de preço. Os custos de hardware da AI corporativa caíram 30% no ano passado, com o novo hardware também sendo 40% mais eficiente em termos de energia. É provável que as empresas continuem gastando cada vez mais dinheiro no treinamento de modelos de carro-chefe todos os anos, mas os usuários típicos conteúdo com o desempenho do GPT-3.5 acharão seus custos cada vez mais baixos.
A China está alcançando o domínio dos EUA
Os Estados Unidos têm sido o maior gastador e o melhor desempenho em inteligência artificial desde o avanço da tecnologia no mainstream. No entanto, a China está logo atrás na corrida de IA. Os LLMs de melhor desempenho nos EUA e na China estão se aproximando cada vez mais de desempenho quando testados em benchmarks do setor.
Anteriormente, os EUA tinham não apenas a maioria dos modelos, mas também o melhor desempenho. Este ano, #China reduziu essa lacuna. Em janeiro de 2024, o principal modelo dos EUA superou o melhor modelo chinês em 9,26 %; Em fevereiro de 2025, era de 1,70 %. (6/13) pic.twitter.com/by4agebnrt8 de abril de 2025
Como o gráfico acima é exibido, o melhor modelo dos EUA venceu apenas 1,70%, como votado por ensaios cegos na LMSYS Chatbot Arena. Os resultados dos principais benchmarks MMLU e Humaneval também começaram a abordar os resultados uniformes, com os EUA ainda conseguindo ficar à frente.
Os Estados Unidos ainda venceram com facilidade a China, se não a qualidade. Em uma coleção HAI de modelos de IA altamente notavelmente, os Estados Unidos assumiram uma vantagem fácil, com 40 dos LLMs mais notáveis de 2024. A China ficou distante com 15, e toda a Europa contribuiu apenas com 3 modelos para a corrida.
Incidentes de IA prejudiciais
O capítulo de Hai sobre a IA responsável pinta uma imagem mais forte sobre a realidade do uso da IA, que carrega um nível de risco diferente de zero. O banco de dados de incidentes de IA (AIID), uma organização de pesquisa sem fins lucrativos dedicada a coletar informações sobre incidentes nocivos de IA, teria viu um aumento perturbador nos incidentes prejudiciais de IA em 2024. 233 incidentes prejudiciais ou perigosos foram relatados à IAID em 2024, superando os relatórios ~ 150 em 2023 e ~ 100 em 2022.
Alguns dos incidentes mais graves em 2024 foram listados no capítulo 3 completo de Hai. Esses incidentes incluíram um falso ID de um comprador que se considera um ladrão de lojas com IA anti-roubo, pornografia Deepfake e instâncias de chatbots que incentivam o comportamento prejudicial, incluindo a auto-mutilação. Notavelmente, poucas empresas de IA aceitam a responsabilidade pelos incidentes de IA quando ocorrem, com vários dos incidentes acima levando a recusas em emitir um pedido de desculpas ou reparação das empresas envolvidas.
Outras idéias
O índice de IA de 2025 de 2025 de Hai pode ser encontrado no Site de Stanford Hai. O estudo de 8 capítulos cobre uma faixa muito mais ampla do que poderia ser coberta aqui, representando muitas horas de leitura. O cenário da IA é mais amplo e mais investido do que nunca, fazendo tarifas recentes que ameaçam abalar o status quo assustador para a indústria ainda porca. O futuro da tecnologia ainda é desconhecido, embora esperançosamente a segurança e a responsabilidade em treinamento e aplicação, assumam uma parcela mais dominante de atenção nos próximos anos.