Topo

Vai um refri? Como o Google está ensinando robôs assistentes a nos servirem

Pesquisador Fei Xia, do Google, aceita lata de refrigerante entregue por robô durante demonstração em cozinha da companhia na sede da empresa em Mountain View, na Califórnia (EUA) - Paresh Dave/Reuters
Pesquisador Fei Xia, do Google, aceita lata de refrigerante entregue por robô durante demonstração em cozinha da companhia na sede da empresa em Mountain View, na Califórnia (EUA) Imagem: Paresh Dave/Reuters

Barbara Mannara

Colaboração para Tilt*, do Rio de Janeiro

18/08/2022 12h19

"Quero um refrigerante!". Um pedido tão simples para nós, seres humanos, mas que uma inteligência artificial pode não compreender. Por isso, o Google está desenvolvendo robôs capazes de atender nossas demandas, através de um algoritmo para que ele entenda nossa linguagem natural e raciocine por conta própria.

A gigante das buscas está trabalhando com pesquisadores e engenheiros da Google Research e da Everyday Robots (outra empresa da Alphabet, o grupo-mãe do Google) para unir modelos avançados de aprendizado de máquina, com estruturas físicas de robôs auxiliares.

No caso do modesto pedido de um refrigerante, um robô precisa resolver várias questões antes de executar a tarefa, por exemplo: "onde ficam os refrigerantes?", "consigo abrir a geladeira?, "consigo alcançá-lo?". Como o novo algoritmo, a empresa está ensinando ele a entender melhor a linguagem humana e a aprender como realizar nossas tarefas cotidianas.

Veja o vídeo de apresentação do projeto, que mostra robôs de aspecto simpático sendo treinados — com erros e acertos, como uma criança crescendo — para tarefas como: encontrar um detergente, pegar uma banana, pegar toalhas de papel e trazer uma esponja.

Complexidade humana

Interações humanas são um tanto complexas. Levar essa troca natural de linguagem para uma máquina é o novo desafio do Google. O projeto quer ajudar as pessoas a se comunicarem melhor com robôs, seja por voz ou texto.

A proposta futura seria oferecer auxiliares robóticos úteis para o dia a dia das pessoas, que aprendam com o tempo, os ambientes e as experiências "vividas". Tudo isso turbinado por um sistema de inteligência artificial.

Além das tarefas simples, eles poderiam resolver problemas de matemática, responder perguntas em diferentes idiomas, explicar piadas, pegar uma lata de refrigerante, um pacote de salgadinho ou até ajudar na limpeza de uma bebida derramada no chão.

Lembra da Rosie, auxiliar doméstica dos Jetsons?

Robô do Google se move até o pesquisador Fei Xia para entregar um pacote de batata frita - Nathan Frandino/Reuters - Nathan Frandino/Reuters
Robô do Google se move até o pesquisador Fei Xia para entregar um pacote de batata frita
Imagem: Nathan Frandino/Reuters

O resultado poderia ser algo competitivo — e até mais avançado — que o robô inteligente de monitoramento doméstico, o Amazon Astro. O Google afirma que todo esse esforço é "a primeira implementação que usa um modelo de linguagem em larga escala para planejar um robô real".

Pensamento em cadeia

Para entender como esse sistema "pensa" e toma decisões por conta própria, vale conhecer o passo a passo do chamado "pensamento em cadeia". Trata-se de uma sequência de soluções executadas de forma personalizada. Primeiro, a pessoa encaminha uma tarefa para a máquina.

Em seguida, o algoritmo interpreta cada situação usando um raciocínio próprio. Por fim, o robô parte para a ação física, buscando as ferramentas necessárias para executar o pedido.

Em um exemplo rotineiro, se uma pessoa dá o comando: "Acabei de malhar. Você pode me trazer uma bebida e um lanche para me recuperar?", a inteligência artificial analisa a frase e entende o que ela quer (uma bebida e um lanche). E, na prática, a máquina leva uma garrafa de água e uma maçã.

Para tomar as decisões, o algoritmo PaLM-SayCan do robô é altamente interpretável. O sistema examina e aprende com os detalhes das ações que realiza. O modelo de linguagem pontua se cada etapa é útil para concluir a tarefa no local; essas pontuações são combinadas, sendo que a mais alta é escolhida no final das contas.

Ou seja, pegar uma maçã faz mais sentido para os padrões daquela pessoa e daquele ambiente do que encontrar uma barrinha de cereais, por exemplo.

Devemos nos preocupar?

Para quem está preocupado com a revolução das máquinas, o Google esclarece que existem várias camadas de segurança no robô auxiliar. Elas incluem análise de hardware (componentes físicos), além de parada de emergência e controles de movimentos que precisem de contato com demais objetos ou pessoas.

Segundo uma pesquisa do Google, foi observada uma melhoria de 14% em relação a outros modelos de robótica, na hora de planejar e abordar uma tarefa pelo novo sistema PaLM. Também é apontada uma melhoria de 13% na taxa de sucesso ao realizar tarefas.

O projeto ainda está sendo aprimorado pelos profissionais da empresa e ainda não há prazo de venda no mercado internacional.