Topo

Milagre? Como o Facebook usou a Bíblia para ensinar IA a falar 1000 línguas

Julia Moióli

Colaboração para Tilt, de São Paulo

25/05/2023 04h00

Além de ajudar no diagnóstico de doenças, combater fraudes, melhorar sistemas de segurança e bater papo como se fosse gente, a inteligência artificial agora é capaz de salvar idiomas que correm o risco de sumir do mapa.

É isso que faz o sistema de IA da Meta que transforma texto em fala e fala em texto. Como em um "milagre da multiplicação", a empresa dona do Facebook, WhatsApp e Instagram anunciou ainda que o número de línguas compreendidas por seu robô saltou de 100 para 1.100. Tudo graças a uma renomada "professora": a Bíblia.

A Big Tech usou os textos religiosos para treinar seus modelos de AI e torná-los mais inclusivos, além de abrir espaço para interação de mais pessoas no futuro.

Muitas das línguas do mundo correm o risco de desaparecer, e as limitações do reconhecimento de fala atual e da tecnologia generativa só vão acelerar essa tendência. Queremos tornar mais fácil para as pessoas acessar informações e usar dispositivos em seu idioma preferido, e hoje estamos anunciando uma série de modelos de inteligência artificial (IA) que podem ajudá-los a fazer exatamente isso Facebook

Por que a Bíblia foi escolhida

A estratégia de recorrer ao livro mais editado do mundo foi o jeito encontrado pela Meta para superar um grande problema: a falta de variedade linguística dos atuais bancos de dados de fala. Hoje, eles concentram apenas uma centena de idiomas (de um total de cerca de 7 mil existentes no mundo, de acordo com a Sociedade Linguística da América).

A grande vantagem da Bíblia é que ela já foi, ao menos em parte, publicada em mais de 3,5 mil idiomas, segundo a Wycliffe Global Alliance, um grupo de associações que busca levar o livro sagrado a todo mundo. Além disso, o livro pe traduzido para diversas línguas e seus textos são amplamente usados em pesquisas. Tudo isso faz com que os textos bíblicos sejam bastante registrados em áudio.

O resultado é ainda mais promissor: além de ampliar sua tecnologia "texto-fala" e "fala-texto" de aproximadamente 100 idiomas para mais de 1.100, a Meta aumentou a capacidade de sua IA a tal ponto que ela é capaz de identificar mais de 4 mil línguas.

Hoje, os modelos de linguagem mais utilizados coletam textos e os pareiam com suas traduções — para se ter uma ideia, nos melhores tradutores de inglês para alemão, há cerca de 500 milhões de pares. Ter como base a Bíblia, que é utilizada no mundo todo, dá a garantia de se saber exatamente o significado do texto Fabio Cozman, professor e diretor do centro de inteligência artificial da USP

IA católica e masculina?

O desenvolvimento de IAs já desperta críticas porque esses robôs reproduzem os preconceitos racial e de gênero de seus criadores. Após o anúncio da Meta, especialistas questionaram se a escolha de textos religiosos, com áudios majoritariamente gravados por vozes masculinas, poderia levar a mais vieses. Para os pesquisadores consultados por Tilt, isso não deve acontecer, porque:

  • A Bíblia não foi a única fonte utilizada, apesar de ser a principal. A Meta fala em "textos religiosos".
  • Embora o conteúdo tenha sido religioso, os áudios não influenciaram o modelo a adotar uma linguagem religiosa -- e funciona igualmente bem para vozes masculinas e femininas.

A IA da Meta foca principalmente em reconhecer o discurso, transcrever e gerar fala e, ao contrário do ChatGPT, não se baseia no entendimento da língua nem responde perguntas ou cria conteúdos. Portanto, é um modelo mais controlado, que não corre o risco de replicar uma única visão de mundo, comprometendo a pluralidade e a liberdade cultural e religiosa Diogo Cortiz, especialista em IA, professor da PUC-SP e pesquisador no NIC.br (Núcleo de Informação e Coordenação do Ponto BR)

"Talvez o sistema escolha palavras que tenham estilo bíblico, mas isso não significa que ele terá uma religião", completa Cozman.