DeepSeek: por que a nova IA chinesa abalou o Vale do Silício
Ler resumo da notícia
DeepSeek é o modelo chinês de IA que virou um dos aplicativos mais baixados nos Estados Unidos. Também está derrubando ações de big techs e vem mostrando para o Vale do Silício que a briga pela dominância da IA pode ter entrado em outro paradigma de desenvolvimento.
A China tem pesquisas sólidas na área de IA há muitos anos, mas ainda faltava algum produto que pudesse competir de igual para igual com os chatbots mais avançados, como o ChatGPT, Google Gemini ou a IA da Meta.
Ao longo de 2024, diversas empresas e startups chinesas apresentaram modelos que chamaram atenção por conta de seu bom desempenho. Um exemplo é o Qwen, desenvolvido pela Alibaba Cloud. Por ser um modelo de código-aberto, rapidamente caiu no gosto da comunidade técnica como uma alternativa mais eficiente ao modelo Llama da Meta.
Porém, foi no fim do ano passado que surgiu o modelo que hoje chacoalha todo o mercado de IA. A DeepSeek é uma startup chinesa que desenvolveu um modelo de código-aberto com desempenho similar ao ChatGPT, mas com o diferencial de ser mais otimizado e barato.
O que chama atenção nesse processo é que os chineses conseguiram driblar as sanções americanas que os impediam de ter acesso aos chips mais avançados para conseguir esse resultado, conforme comentamos no podcast "Deu Tilt" do UOL.
As GPUs H100 e H200 da Nvidia estão entre as mais poderosas, mas também estão na lista daquelas que não podem ser comercializadas com a China. Sem acesso ao que tem de mais avançado em chips, os chineses tiveram que pensar em estratégias para criar um modelo mais otimizado e eficiente. E foi isso que aconteceu.
De acordo com o Relatório Técnico da DeepSeek, eles precisaram de apenas 2,78 milhões de horas de uso de GPUs H800 —um chip com capacidade inferior customizado para a China. Para termos um grau de comparação, a Meta precisou de 30 milhões de horas de uso de GPU H100 para treinar o Llama 3.1, modelo por trás da IA da Meta.
Podemos também fazer uma comparação financeira. Estima-se que o custo para treinar o DeepSeek tenha sido de menos de US$ 6 milhões, enquanto o Google investiu mais de US$ 170 milhões para treinar o Gemini.
Esse processo de otimização no treinamento acaba refletido no custo de uso para seus clientes. Enquanto o preço da API do GPT-4o é de US$ 2,50 para cada 1 milhão de tokens de entrada, o DeepSeek custa apenas US$ 0,27 centavos. O mercado agora tem à sua disposição um modelo com desempenho parecido com o ChatGPT que custa praticamente um décimo do valor.
O que era impensável há alguns meses agora traz ainda mais questionamentos para um paradigma que já estava sendo questionado. As Big techs trabalham com a lei de escala, a perspectiva de que aumentando a capacidade computacional, a quantidade de dados e o tamanho do modelo, aumenta proporcionalmente o desempenho da IA. Apesar do custo ambiental, essa é a justificativa para os investimentos absurdos que estão acontecendo por lá, conforme comentei na minha última coluna.
Só que agora, a DeepSeek mostra que existem outras formas de treinamento mais otimizadas e eficientes, o que é uma espetada naquela perspectiva que guiava os loucos investimentos em infraestrutura. O resultado é um verdadeiro choque de realidade no Vale do Silício, pelo menos por enquanto.
Li no portal The Information que a Meta criou War Rooms com engenheiros para tentar desvendar como o DeepSeek funciona. E enquanto escrevo esta coluna, as ações da Nvidia despencam 15%.
Ainda é cedo para afirmar se esse efeito do DeepSeek no mercado é passageiro ou não. No entanto, fica a lição de que as crises geram oportunidades e que as sanções impostas à China levaram o país a colocar o desenvolvimento da IA em uma nova perspectiva.
DEU TILT
Toda semana, Diogo Cortiz e Helton Simões Gomes conversam sobre as tecnologias que movimentam os humanos por trás das máquinas. O programa é publicado às terças-feiras no YouTube do UOL e nas plataformas de áudio. Assista ao episódio da semana completo.
54 comentários
O autor da mensagem, e não o UOL, é o responsável pelo comentário. Leia as Regras de Uso do UOL.
Domingos Spinelli
Sua conclusão é perfeita. Esse papo de fechar tudo e não deixar que os concorrentes tenham acesso à tecnologia dá margem ao que foi feito. Os chineses já vêm demonstrando, há vários anos, que deixaram de ser um país especialista em fabricar "réplicas" e produtos de 2a categoria. Investem pesado em conhecimento e formação dos seus profissionais. Está aí o resultado.
Elaine Roatta Netto
Sigo torcendo pela China
Hélio Cazelli
Industria de Tecnologia Americana acaba de ser engolida pelos Chineses . Ações caindo....