Os avanços da AI de Deepseek significam que os controles técnicos dos EUA falharam?

Os Estados Unidos trabalharam constantemente nos últimos três anos para limitar o acesso da China aos chips de computador de ponta que alimentam sistemas de inteligência artificial avançados. Seu objetivo foi retardar o progresso da China no desenvolvimento de modelos sofisticados de IA.
Agora, uma empresa chinesa, Deepseek, criou essa mesma tecnologia. Nas últimas semanas, a Deepseek lançou vários modelos de IA e um chatbot cujo desempenho rivaliza com o dos melhores produtos fabricados pelas empresas americanas, enquanto usava muito menos dos chips de AI de alto custo que as empresas normalmente precisam. No fim de semana, o chatbot de Deepseek disparou no topo das paradas da App Store da Apple, enquanto as pessoas o baixavam em todo o mundo.
O desenvolvimento levantou grandes questões sobre os controles de exportação construídos pelos Estados Unidos nos últimos anos. O governo Biden criou um sistema de regras globais e as expandiu constantemente para tentar manter a tecnologia avançada de IA – principalmente os chips feitos pela Nvidia – fora das mãos chinesas. Eles estavam preocupados com o fato de a tecnologia dar à China uma vantagem não apenas economicamente, mas também militarmente.
O desenvolvimento da Deepseek provocou um feroz debate sobre se os controles de tecnologia dos EUA falharam. Aqui está o que saber.
As inovações da Deepseek sugerem que o governo Biden pode ter agido muito lentamente para acompanhar as empresas privadas evitando seus controles.
Deepseek disse que seu modelo mais recente foi treinado em NVIDIA H800S. Este é um chip de IA que a Nvidia desenvolveu especificamente para o mercado chinês depois que os controles de exportação foram impostos pela primeira vez, e isso causou uma quantidade razoável de drama em Washington.
Quando os Estados Unidos colocam restrições aos chips mais avançados da NVIDIA em 2022, a Nvidia rapidamente se adaptou ao criar chips ligeiramente rebaixados que caíram logo abaixo do limiar que o governo havia estabelecido. Esses chips eram tecnicamente legais para as empresas chinesas usarem, mas lhes permitiam alcançar praticamente os mesmos resultados.
Isso irritou os funcionários de Biden e eles se mudaram para restringir os novos chips também. Mas o governo se moveu lentamente, e eles levaram cerca de um ano para proibir o H800 e outros chips rebaixados. Enquanto isso, as empresas chinesas armazenaram muitas delas.
Não está claro o quão Deepseek obteve seu NVIDIA H800S, mas teria sido legal para a empresa comprá -los no final de 2022 ou 2023. Agora, no entanto, essas compras não seriam.
“Você não pode controlar o que já está lá”, disse Jimmy Goodrich, consultor sênior de análise de tecnologia da Rand Corporation. “Se o governo Biden respondesse mais rapidamente e limitado o H800 à China, não há dúvida de que Deepseek teria sido mais desafiado em divulgar esse modelo”.
A Deepseek também passou anos construindo seu suprimento de chips antes que os controles de Washington entrarem em vigor. Em 2021, a Deepseek era uma das poucas empresas chinesas que adquiriram pelo menos 10.000 NVIDIA A100, o avançado Chip Nvidia lançado em 2020, de acordo com uma entrevista Com Liang Wenfeng, o fundador da Deepseek, no meio de mídia chinês 36kr.
Os EUA também lutaram para eliminar o contrabando de chips.
Não há evidências de que a Deepseek tenha usado fichas contrabandeadas. Mas muitas empresas de IA chinesas têm. Alexandr Wang, o diretor executivo da IA da gigante de treinamento da IA, disse ao The New York Times que as empresas chinesas tinham muito mais chips de ponta do que as restrições dos EUA permitiam, e que o DeepSeek provavelmente tinha cerca de 50.000 processadores H100 avançados da NVIDIA, “que obviamente eles obviamente Não posso falar sobre. ”
Tanto a Nvidia quanto o governo dos EUA argumentaram que a escala de contrabando era limitada. Mas o Times no ano passado relatou um comércio ativo na China em tecnologia restrita de IA. Em um mercado movimentado em Shenzhen, no sul da China, os fornecedores de chip relataram se envolver em vendas envolvendo centenas ou milhares de chips restritos.
Representantes de 11 empresas disseram que venderam ou transportaram chips Nvidia proibidos – incluindo A100 e H100, o mais avançado da empresa na época – e o Times encontrou dezenas de mais negócios que os oferecem on -line. Um fornecedor em Shenzhen mostrou mensagens de repórter organizando entregas de servidores contendo mais de 2.000 dos chips mais avançados da NVIDIA, uma transação totalizando US $ 103 milhões.
Desde então, Mais relatórios Surgiram documentar o contrabando de larga escala, principalmente através de outros países da Ásia.
O governo Biden divulgou um regulamento abrangente este mês que visa lidar com a questão do contrabando, definindo limites no número de chips que a Nvidia pode vender para todos os países em todo o mundo.
Resta ver o que o governo Trump fará sobre isso. Em uma ordem executiva comercial, o presidente Trump assinou em seu primeiro dia no cargo, no entanto, ele ordenou que seus funcionários revisassem o sistema de controle de exportação dos EUA, incluindo “como identificar e eliminar brechas nos controles de exportação existentes”.
Os controles dos EUA parecem ter incentivado a ingenuidade chinesa – mas eles também impediram claramente o desenvolvimento da IA da China.
As restrições tecnológicas americanas parecem ter acelerado os esforços dos pesquisadores chineses para tentar fazer mais com menos.
A coisa mais notável sobre o modelo de Deepseek é que, de acordo com a empresa, foi desenvolvido com apenas uma fração dos chips de alto preço que as empresas ocidentais usaram para fabricar tecnologia semelhante. Os engenheiros da Deepseek disseram que usaram apenas cerca de 2.000 chips da NVIDIA, enquanto a maioria das principais empresas treinou chatbots usando 16.000 chips ou mais. As ações da NVIDIA caíram acentuadamente na segunda-feira por medo de que as empresas de tecnologia possam fazer IA de ponta no futuro, enquanto pagava a Nvidia muito menos.
Jeffrey Ding, professor da Universidade George Washington que estuda tecnologias emergentes, disse que a maioria das empresas globais tem usado quantidades cada vez maiores de poder de computação e dados para melhorar o desempenho da IA. Mas a Deepseek e outras empresas chinesas foram “forçadas a seguir esse outro caminho para descobrir se podemos obter um desempenho suficientemente bom com custos de treinamento mais baixos e menos computação”, disse ele.
As implicações de modelos mais baratos como o Deepseek podem ser profundos. Com a Deepseek compartilhando abertamente detalhes sobre como ele construiu seu modelo, as empresas na China e em todo o mundo poderão replicar sua abordagem de baixo custo.
Isso significa “será muito mais barato e pode ser muito menos intensivo em energia para alguém construir e administrar a IA, de hiperscalers dos EUA a pequenas empresas do Centro -Oeste, hackers norte -coreanos e militares da Rússia”, disse Martin Chorzempa, membro sênior do Instituto Peterson para economia internacional.
Ainda assim, a China provavelmente estaria muito à frente na IA sem os controles de exportação. Nas entrevistas, o fundador da Deepseek reconheceu que a falta de acesso ao poder de computação era uma limitação para a empresa.
Ao contrário das empresas americanas de IA, a DeepSeek não poderá comprar legalmente a mais nova geração de chips de IA que a NVIDIA está sendo lançada no momento, o que multiplica a velocidade e o desempenho dos chips anteriores.
“Qualquer pessoa preocupada com o que a Deepseek pode fazer hoje ficaria mais preocupada se tivessem feito isso com acesso aos recursos de computação muito superiores que seus concorrentes dos EUA têm”, disse Chorzempa.
O sucesso de Deepseek sugere que a liderança do Vale do Silício na IA diminuiu, apesar dos esforços de Washington para limitar o acesso chinês às fichas avançadas. Mas é notável que a Deepseek ainda esteja construindo seus modelos nos chips da NVIDIA – não nos chips da AI rival que a empresa de tecnologia chinesa Huawei está tentando desenvolver.
Alguns engenheiros de computadores chineses sugeriram que seria possível executar o mais recente modelo Deepseek em um número maior de chips menos avançados, incluindo os feitos pela Huawei, mesmo que os chips de AI da Huawei sejam de desempenho muito mais baixo.
Mas nenhuma empresa chinesa ainda é capaz de fazer chips de IA avançados que rivalizam com a Nvidia ou o tipo de máquina complexa necessária para fazer esses chips. “A única vantagem que os Estados Unidos ainda têm sobre a China neste momento é em hardware”, disse Goodrich.