A China está se concentrando em grandes modelos de linguagem (LLMs) no espaço da inteligência artificial.
Blackdovfx | Istock | Imagens Getty
As tentativas da China de dominar o mundo da inteligência artificial podem estar a dar frutos, com especialistas da indústria e analistas de tecnologia a dizerem à CNBC que os modelos chineses de IA já são extremamente populares e estão a acompanhar – e até a superar – os dos EUA em termos de desempenho.
A IA tornou-se o mais recente campo de batalha entre os EUA e a China, sendo que ambos os lados a consideram uma tecnologia estratégica. Washington continua a restringir o acesso da China a chips de ponta concebidos para ajudar a alimentar a inteligência artificial, em meio a receios de que a tecnologia possa ameaçar a segurança nacional dos EUA.
Isso levou a China a seguir a sua própria abordagem para aumentar o apelo e o desempenho dos seus modelos de IA, incluindo confiar na tecnologia de código aberto e desenvolver o seu próprio software e chips super-rápidos.
A China está criando LLMs populares
Tal como algumas das principais empresas norte-americanas no setor, as empresas chinesas de IA estão a desenvolver os chamados grandes modelos de linguagem, ou LLMs, que são treinados em enormes quantidades de dados e sustentam aplicações como chatbots.
Ao contrário dos modelos da OpenAI que alimentam o imensamente popular ChatGPT, no entanto, muitas destas empresas chinesas estão desenvolver LLMs de código aberto ou de peso aberto, que os desenvolvedores podem baixar e construir gratuitamente e sem requisitos rigorosos de licenciamento do inventor.
No Hugging Face, um repositório de LLMs, os LLMs chineses são os mais baixados, segundo Tiezhen Wang, engenheiro de aprendizado de máquina da empresa. Qwen, uma família de modelos de IA criada pela gigante chinesa do comércio eletrônico Alibabaé o mais popular no Hugging Face, disse ele.
“Qwen está ganhando popularidade rapidamente devido ao seu excelente desempenho em benchmarks competitivos”, disse Wang à CNBC por e-mail.
Ele acrescentou que Qwen tem um “modelo de licenciamento altamente favorável”, o que significa que pode ser usado por empresas sem a necessidade de “extensas revisões jurídicas”.
Qwen vem em vários tamanhos, ou parâmetros, como são conhecidos no mundo dos LLMs. Modelos de parâmetros grandes são mais poderosos, mas têm custos computacionais mais elevados, enquanto modelos menores são mais baratos de executar.
“Independentemente do tamanho que você escolher, o Qwen provavelmente será um dos modelos de melhor desempenho disponíveis no momento”, acrescentou Wang.
DeepSeek, uma start-up, também fez sucesso recentemente com um modelo chamado DeepSeek-R1. DeepSeek disse no mês passado que seu modelo R1 compete com o o1 da OpenAI – um modelo projetado para raciocinar ou resolver tarefas mais complexas.
Essas empresas afirmam que seus modelos podem competir com outras ofertas de código aberto, como meta‘s Llama, bem como LLMs fechados como os da OpenAI, em diversas funções.
“No ano passado, vimos o aumento das contribuições chinesas de código aberto para IA com desempenho realmente forte, baixo custo de serviço e alto rendimento”, disse Grace Isford, sócia da Lux Capital, à CNBC por e-mail.
China incentiva o código aberto a se tornar global
O código aberto de uma tecnologia serve uma série de propósitos, incluindo impulsionar a inovação à medida que mais desenvolvedores têm acesso a ela, bem como construir uma comunidade em torno de um produto.
Não foram apenas as empresas chinesas que lançaram LLMs de código aberto. A Meta, controladora do Facebook, assim como a start-up europeia Mistral, também possuem versões de código aberto de modelos de IA.
Mas com a indústria tecnológica apanhada na mira da batalha geopolítica entre Washington e Pequim, os LLMs de código aberto dão às empresas chinesas outra vantagem: permitir que os seus modelos sejam utilizados globalmente.
“As empresas chinesas gostariam de ver os seus modelos utilizados fora da China, por isso esta é definitivamente uma forma de as empresas se tornarem intervenientes globais no espaço da IA”, disse Paul Triolo, sócio da empresa de consultoria global DGA Group, à CNBC por e-mail.
Embora o foco esteja nos modelos de IA neste momento, também há debate sobre quais aplicações serão construídas sobre eles – e quem dominará este cenário global da Internet daqui para frente.
“Se você assumir que esses modelos de IA de base de fronteira são apostas, trata-se da finalidade para a qual esses modelos são usados, como acelerar a ciência de fronteira e a tecnologia de engenharia”, disse Isford, da Lux Capital.
Os modelos de IA atuais foram comparados a sistemas operacionais, como da Microsoft Windows, GoogleAndroid e Maçãdo iOS, com potencial para dominar um mercado, como essas empresas fazem em celulares e PCs.
Se for verdade, isso aumenta os riscos para a construção de um LLM dominante.
“Elas (empresas chinesas) percebem os LLMs como o centro dos futuros ecossistemas tecnológicos”, disse Xin Sun, professor sênior de negócios chineses e do Leste Asiático no King’s College London, à CNBC por e-mail.
“Seus futuros modelos de negócios dependerão da adesão de desenvolvedores aos seus ecossistemas, desenvolvendo novos aplicativos baseados nos LLMs e atraindo usuários e dados a partir dos quais os lucros podem ser gerados posteriormente por vários meios, incluindo, mas muito além, direcionar os usuários para usarem seus serviços em nuvem”, Sol acrescentou.
Restrições de chips lançam dúvidas sobre o futuro da IA da China
Os modelos de IA são treinados em grandes quantidades de dados, exigindo enormes quantidades de poder computacional. Atualmente, Nvidia é o principal designer dos chips necessários para isso, conhecidos como unidades de processamento gráfico (GPUs).
A maioria das principais empresas de IA está treinando seus sistemas nos chips de maior desempenho da Nvidia – mas não na China.
Ao longo do último ano, os EUA aumentaram as restrições à exportação de semicondutores avançados e equipamentos de fabricação de chips para a China. Isso significa NvidiaOs chips de ponta da empresa não podem ser exportados para o país e a empresa teve que criar semicondutores compatíveis com sanções para exportar.
Apesar destas restrições, no entanto, as empresas chinesas ainda conseguiram lançar modelos avançados de IA.
“As principais plataformas tecnológicas chinesas têm atualmente acesso suficiente ao poder computacional para continuar a melhorar os modelos. Isto ocorre porque elas armazenaram um grande número de GPUs Nvidia e também estão aproveitando GPUs domésticas da Huawei e de outras empresas”, disse Triolo, do Grupo DGA.
Na verdade, as empresas chinesas têm intensificado os esforços para criar alternativas viáveis à Nvidia. A Huawei tem sido um dos principais intervenientes na prossecução deste objetivo na China, enquanto empresas como Baidu e o Alibaba também têm investido no design de semicondutores.
“No entanto, a lacuna em termos de computação de hardware avançado aumentará com o tempo, especialmente no próximo ano, à medida que a Nvidia lançar seus sistemas baseados em Blackwell, cuja exportação é restrita à China”, disse Triolo.
Isford, da Lux Capital, sinalizou que a China tem “investido e aumentado sistematicamente toda a sua pilha de infraestrutura doméstica de IA fora da Nvidia com chips de IA de alto desempenho de empresas como a Baidu”.
“A proibição ou não dos chips Nvidia na China não impedirá a China de investir e construir sua própria infraestrutura para construir e treinar modelos de IA”, acrescentou ela.