Startup de IA Cohere prioriza modelos personalizados em vez de modelos maiores

Por Krystal Hu

5 Dez (Reuters) - - A startup canadense de inteligência artificial Cohere, avaliada em 5,5 bilhões de dólares, se concentrará na criação de modelos personalizados para usuários corporativos em vez de modelos de base maiores, disse a empresa à Reuters.

A evolução de sua estratégia, apresentada em uma carta da empresa aos investidores nesta quinta-feira, ocorre no momento em que muitas companhias ainda estão tentando descobrir como incorporar grandes modelos de linguagem em seu trabalho diário, dois anos após o surgimento do ChatGPT.

"O que estamos ouvindo dos clientes é que eles não precisam apenas de modelos maiores para serem bons em tudo. Eles precisam de modelos que sejam realmente criados para seus casos de uso específicos", disse Nick Frosst, cofundador da Cohere, à Reuters.

A Cohere, vista como concorrente dos laboratórios de IA, incluindo OpenAI e Anthropic, afirma que continuará a desenvolver modelos básicos, mas se concentrará em outras técnicas de treinamento para aprimorá-los, em vez de aumentar o tamanho deles. Embora a venda da Interface de Programação de Aplicativos (API) para seus modelos continue sendo uma pequena parte da oferta da Cohere, o foco está na implementação de modelos personalizados.

A corrida para criar modelos maiores e melhores alimentou um boom de investimentos, de startups a grandes empresas de tecnologia. OpenAI, Anthropic e xAI levantaram bilhões para financiar o desenvolvimento intensivo de modelos de IA de ponta.

Com sede em Toronto e San Francisco, a Cohere arrecadou mais de 900 milhões de dólares de investidores, incluindo Nvidia, Cisco e Innovia Capital.

A Cohere se apresenta como uma companhia de IA voltada para empresas e independente de provedores de serviços de computação em nuvem. A empresa tem trabalhado diretamente com clientes como Oracle e Fujisu para adaptar modelos a necessidades específicas.

O novo foco da Cohere também surge no momento em que o setor, que havia obtido avanços com o aumento da potência computacional e do tamanho do modelo, está vendo retornos cada vez menores com os grandes modelos de IA. Os laboratórios estão enfrentando atrasos no treinamento da nova geração de modelos de linguagem de grande porte. Ilya Sutskever, cofundador dos laboratórios de IA Safe Superintelligence (SSI) e OpenAI, disse recentemente à Reuters que os resultados do aumento do pré-treinamento atingiram um platô.

Continua após a publicidade

Frosst disse que o simples aumento do tamanho do modelo nem sempre produz melhores resultados. O foco na personalização poderia permitir que a Cohere seja mais eficiente em termos de capital, reduzindo a necessidade de poder computacional. A empresa não está buscando atingir uma inteligência artificial geral (AGI) como a OpenAI.

"Vamos trabalhar com empresa para descobrir como podemos tornar o modelo perfeito para seu caso de uso, adaptá-lo às suas necessidades específicas e chegar à produção, e não apostar no futuro da AGI que virá no próximo ano", disse Frosst.

Deixe seu comentário

O autor da mensagem, e não o UOL, é o responsável pelo comentário. Leia as Regras de Uso do UOL.