Por que nova IA 'raciocina', gabarita Fuvest, mas falha em problema social?

(Toda semana, Diogo Cortiz e Helton Simões Gomes conversam sobre tecnologia no podcast Deu Tilt. O programa vai ao ar às terças-feiras no YouTube do UOL, no Spotify, no Deezer e no Apple Podcasts. Nesta semana, o assunto é: Nova IA raciocina, mas não resolve; você precisa agora do iPhone 16?; a rede social só de bots)

Nem bem chegou ao mercado, e o o1, nova inteligência artificial da OpenAI , dona do ChatGPT, já foi submetido a desafios como o vestibular da Fuvest e o teste para entrar no ITA (Instituto Tecnológico de Aeronáutica). Gabaritou os dois, sobretudo a parte de matemática, ponto fraco de seus antecessores.

Todo mundo queria ver como a nova ferramenta se saía com seu novo alardeado poder: raciocinar. O novo episódio de Deu Tilt, podcast do UOL para os humanos por trás das máquinas, apresentado por Diogo Cortiz e Helton Simões Gomes, discute o que é esse "raciocínio" e em que medida ele se aproxima do pensamento humano.

Enquanto as outras versões tentavam responder o mais rápido possível, o o1 mostra uma mensagem de processamento assim que recebe uma tarefa para executar. É como se estivesse pensando. E a resposta, a depender da missão, é mesmo mais qualificada.

Mas isso chega a ser raciocínio?

É uma antropomorfização - que significa atribuir características humanas a coisas que não são humanas - muito grande
Diogo Cortiz

A resposta mais direta é: mais ou menos. Helton lembra que o cérebro humano realiza processos muito complexos e muito maiores do que os feitos por IA, tanto é que boa parte da comunidade de neurociência repudia algumas aproximações entre as funções cerebrais e a atuação das máquinas.

É quase como um descalabro falar que essa ferramenta - tão restrita, mas ainda tão impressionante - pode fazer coisas como redes neurais
Helton Simões Gomes

Diogo explica que o raciocínio descrito para essa ferramenta, na verdade, é uma aproximação do que é raciocinar. A plataforma aplica uma técnica chamada "Chain of Thoughts" (cadeia de pensamentos, em tradução livre), que consiste em quebrar estrategicamente uma questão em partes menores para lidar com elas até chegar a um resultado. Ou seja, é fazer a IA se debruçar em mais passos de um problema para dar uma resposta mais qualificada.

Continua após a publicidade

Em um vídeo divvulgado pela OpenAo, a geneticista Catherine Brownstein, do Hospital das Crianças de Boston, comprova a capacidade do o1 para detectar moléculas.

Bom de exatas, genérico em humanas

Além de gabaritar a prova de matemática do ITA, o novo modelo de linguagem da OpenAI acertou cerca de 80% da prova de residência em medicina da USP. Ainda que melhor que os antecessores em matemática e programação, o o1 ainda derrapa em problemas de outra natureza.

"Não dá para quebrar os outros problemas da vida em coisas menores e ir resolvendo?", pergunta Helton. Diogo explica que, quando as pessoas se referem a um raciocínio, ele deve ser entendido muito entre aspas. "O que essa IA faz é quebrar o problema, mas dentro de contextos muito específicos."

No caso de problemas mais complexos, como problemas sociais, por exemplo, exigem uma análise de vários fatores antes de uma resposta. Um resultado qualificado demanda um nível de complexidade tão grande que o programa não entrega nada além de algo genérico.

Aprendizado por reforço

Ainda assim, a nova IA apresenta melhor performance do que suas versões anteriores. Um dos trunfos do o1, conta Cortiz, é ter sido treinado com uma técnica chamada aprendizado por reforço, conceito importado da psicologia experimental para o mundo da tecnologia. Nele, a IA faz uma ação e recebe uma recompensa se a atitude estiver próxima do desejado pelo programador. Se o resultado não for o desejado, ela ganha uma punição.

Continua após a publicidade

Outra craque nessa atividade é o Google DeepMind. Recentemente, o braço de pesquisa em IA do Google criou um modelo de linguagem que pontuou o suficiente na Olimpíada Internacional de Matemática para obter uma medalha de prata.

Por enquanto, o OpenAI o1 só atua com texto e não consegue ler imagens ou ver vídeos. Além disso, ele tem uma limitação de uso e responde a aproximadamente de 30 a 50 mensagens por semana, devido ao custo elevado de processamento.

iPhone 16, Z Fold6: não é a hora de comprar novo smartphone top

Agora que o iPhone 16 começa a chegar ao Brasil, é hora de responder a pergunta: você precisa mesmo de um novo smartphone top de linha?

E olha que a oferta é grande. Não é só o celular da Apple que chegou às lojas. Nos últimos meses, foram lançados Galaxy Z Fold6 e Galaxy Z Flip6 (Samsung), Pixel 9 (Google), razr 40 (Motorola).

Continua após a publicidade

Humanos proibidos e latino prodígio: a rede social que só tem bots

Não é segredo para ninguém que muita rede social já é dominada por bots, aquelas contas automatizadas.

Mas você já viu uma rede em que é possível interagir apenas com robôs? Com humano nenhum à vista? Saiba que ela existe.

E, surpreendentemente, os bots da SocialAI podem ajudar as pessoas de carne e osso a lidar de forma mais humana.

DEU TILT

Toda semana, Diogo Cortiz e Helton Simões Gomes conversam sobre as tecnologias que movimentam os humanos por trás das máquinas. O programa é publicado às terças-feiras no YouTube do UOL e nas plataformas de áudio. Assista ao episódio da semana às 15h.

Continua após a publicidade

Deixe seu comentário

O autor da mensagem, e não o UOL, é o responsável pelo comentário. Leia as Regras de Uso do UOL.