Como o Deepseek passou do Trader para Ai Star

Há dois anos, quando grandes empresas de tecnologia chinesa como Baidu e Alibaba estavam perseguindo os avanços do Vale do Silício na inteligência artificial com anúncios e novos chatbots, Deepseek adotou uma abordagem diferente. Ele se concentrou na pesquisa.
A estratégia valeu a pena.
A start-up chinesa sacou o mundo da tecnologia com a alegação de que criou um poderoso modelo de IA que era significativamente mais barato de construir do que as ofertas de seus rivais americanos mais bem financiados.
Na rivalidade entre a China e os Estados Unidos sobre o domínio da inteligência artificial, Deepseek parecia sair do nada. De fato, disparou pelo mundo da tecnologia da China nos últimos anos com um caminho que era tudo menos convencional.
Sua missão de buscar pesquisas reflete a de empresas como o Openai, a empresa do Vale do Silício que marcou uma assinatura americana sobre a IA no outono de 2022. Mas as semelhanças acabam principalmente por aí.
As origens da Deepseek estão em finanças, não na tecnologia por uma questão de tecnologia. Sua empresa controladora, um fundo de hedge chinês chamado High-Flyer, começou não como um laboratório dedicado a proteger a humanidade da IA como a IA aberta, mas como uma empresa usando a IA para fazer apostas no mercado de ações chinês.
O High-Flyer prosperou capitalizando um mercado dominado pelos investidores de varejo da China, conhecidos por entrar e sair de ações impulsivamente. Em 2021, o High-Flyer se viu pressionado por repressão regulatória na China em negociações especulativas, que as autoridades de Pequim sentiram estar em desacordo com suas tentativas de manter os mercados calmos.
Tão high-flyer perseguiu uma nova oportunidade que dizia que se alinhou melhor com as prioridades do governo chinês: AI avançada
“Queremos fazer coisas com maior valor e coisas que vão além da indústria de investimentos, mas foi mal interpretada como especulação de ações da IA”, disse Lu Zhengzhe, executivo-chefe da High-Flyer, Lu Zhengzhe. Uma nova equipe independente do investimento, que é equivalente a uma segunda start-up. ”
Deepseek nasceu. Como em muitas outras startups chinesas, a Deepseek chegou em um mercado estabelecido com uma abordagem comercial diferente.
Acredita -se que o mais recente modelo de inteligência artificial de Deepseek seja quase tão poderoso quanto os rivais americanos, mas muito mais eficiente. Seu sucesso sugere que a liderança da IA do Vale do Silício encolheu. O avanço de Deepseek, apesar dos esforços de Washington para limitar o acesso chinês aos chips avançados necessários para a IA, levanta questões sobre a eficácia desses controles pode ser a longo prazo – embora o fundador da Deepseek tenha reconhecido que as restrições de chip são uma limitação.
A Deepseek não confiou em fabricar os produtos de IA voltados para o consumidor para receita e apenas este mês lançou seu primeiro chatbot, o que permite que qualquer pessoa gere texto e fotos com comandos simples. Em vez disso, a empresa usou o dinheiro que o High-Flyer fez da negociação de ações a pesquisas ambiciosas de banca. A abordagem o diferencia dos rivais dos EUA, todos com empresas de tecnologia de consumo.
Essa abordagem não convencional também permitiu que a Deepseek evite regulamentos rigorosos que o governo chinês colocou no uso da IA pelo público. Porque seu foco foi pesquisar e vender para empresas que usam seu modelo – e, até o lançamento de seu chatbot este mês, não os aplicativos de consumidores – seu trabalho inicial não desencadeou as mesmas restrições do governo.
A Deepseek é administrada por seu executivo -chefe, Liang Wenfeng, um engenheiro magro e de óculos que estudou na Universidade de Zhejiang, na cidade de Hangzhou, no leste de Hangzhou. Ele disse repetidamente nas poucas entrevistas que deu à mídia chinesa que, para alcançar a inovação americana, as empresas chinesas devem colocar pesquisas antes dos lucros. Deepseek e High-Flyer não responderam aos pedidos de comentários.
O que as empresas de tecnologia chinesa “carecem de inovação certamente não são capital, mas falta de confiança e conhecimento sobre como organizar uma alta densidade de talento para obter inovação eficaz”, disse ele em um entrevista amplamente divulgada Com o ponto de tecnologia chinês 36kr.
Aqueles que trabalharam com o Sr. Liang o descrevem como um gerente capaz com um fundo técnico profundo, de acordo com entrevistas e relatos públicos.
“Ele é definitivamente um INTP”, disse Zihan Wang, um engenheiro de computação que trabalhou em um modelo anterior do Deepseek, referindo-se a um tipo de personalidade introspectiva do teste de Myers-Briggs, um teste de personalidade popular entre os jovens da China. “Os INTPs são realmente bons pesquisadores e têm vontade de explorar”, disse Wang. “Ele não é uma daquelas pessoas que quer controlar tudo.”
Liang não estava muito preocupado com detalhes como o Projeto Timelines e, ocasionalmente, enviou perguntas de pesquisa instigantes a toda a equipe de pesquisadores, disse Wang. Mas, principalmente, Liang parecia levar a avançar na tecnologia e não estava focado nos lucros.
Ao contrário de muitas empresas chinesas, que tendem a se concentrar em contratar programadores, o Sr. Liang ganhou uma reputação de empregar pessoas de fora da computação. Poetas e humanidades Majors das principais universidades da China na equipe de Deepseek treinam o modelo para escrever a poesia chinesa clássica e as perguntas do ACE retiradas do difícil exame de admissão da faculdade do país.
“A maior parte da equipe se formou nas principais universidades da China”, disse Yineng Zhang, engenheiro de software líder da Baseten em São Francisco, que trabalha no SGLANG, um projeto que não faz parte da Deepseek que ajuda as pessoas a se desenvolver no topo do sistema da Deepseek. “Eles são muito inteligentes e muito jovens.”
Durante anos, as empresas de tecnologia chinesas foram pioneiras em aplicações de inteligência artificial usadas na visão computacional, como o reconhecimento facial. Mas o lançamento do ChatGPT pela Openai levou a um acerto de contas. Quando nenhuma empresa chinesa imediatamente divulgou nada comparável, muitos concluíram que as empresas americanas tinham uma vantagem na IA avançada
Na China, os cientistas da computação estavam determinados a provar que poderiam competir. Em 2023, muitas empresas da China lançaram seus próprios modelos de idiomas, a tecnologia que sustenta os chatbots como o ChatGPT.
Mas a fabricação de modelos avançados exigiria o uso de um grande número de chips que custariam centenas de milhões de dólares.
High-Flyer também estava gastando. Até 2021, era uma das poucas empresas chinesas que conseguiram armazenar mais de 10.000 chips avançados da NVIDIA A100.
No entanto, a pesquisa de Deepseek deu uma vantagem surpreendente. No ano passado, reduziu drasticamente os preços que cobrava desenvolvedores que criam aplicativos usando seu modelo, provocando uma guerra de preços com rivais maiores.
Wang, o engenheiro que trabalhou anteriormente na Deepseek, disse que houve pouca discussão sobre aplicações comerciais para a tecnologia que estavam construindo. Em vez disso, ele disse, a empresa estava focada em criar um sistema de IA que poderia ser usado por uma variedade de pessoas para muitos propósitos.
“Durante meu tempo lá, não conversamos muito sobre como ganhamos dinheiro”, disse Wang. “Eles apenas se concentraram em criar um ótimo modelo de fundação”.
Uma parte crucial da popularidade da Deepseek é que ele tornou o trabalho de seus desenvolvedores público. Esse tipo de compartilhamento de informações, chamado de código aberto, tem sido uma pedra angular do desenvolvimento de software de computador, da Internet e agora inteligência artificial.
Nos Estados Unidos, pesquisadores e empreendedores de IA acompanham há muito tempo o progresso da tecnologia da Deepseek. No ano passado, a empresa virou a cabeça quando lançou sistemas projetados para gerar seus próprios programas de computador.
Um novo desafio para a empresa pode vir com seu novo alto perfil. No mesmo dia em que lançou R1, o modelo por trás de seu novo chatbot, na semana passada, Liang apareceu em uma discussão na mesa redonda com Li Qiang, a principal do China.
A repentina popularidade de Deepseek o levou ao centro dos esforços do Partido Comunista Chinês para estimular a inovação, e isso pode ser difícil de gerenciar, disse Jimmy Goodrich, consultor sênior de análise de tecnologia da Rand Corporation, um think tank financiado pelo governo federal. “É uma grande situação para o Deepseek. Tenho certeza de que eles não estavam no plano de cinco anos do governo ”, disse ele.
“Eles podem manter essa visão caótica despreocupada quando a festa e o mundo estão assistindo?”
Zixu Wang Contribuiu com pesquisas de Hong Kong.