Topo

Guarani e outras 23 línguas passam a fazer parte do Google Tradutor

Logotipo do Google na sede da empresa em Mountain View, na Califórnia (EUA) - Paraesh Dave/Reuters
Logotipo do Google na sede da empresa em Mountain View, na Califórnia (EUA) Imagem: Paraesh Dave/Reuters

Guilherme Tagiaroli

De Tilt, em São Paulo

11/05/2022 14h54Atualizada em 11/05/2022 15h42

O Google Tradutor começa a oferecer a partir desta quarta-feira (11) a possibilidade de tradução em mais 24 idiomas que, segundo a empresa, são pouco atendidos pela tecnologia. O destaque fica por conta do guarani, que é falado no Paraguai, além de populações indígenas no Brasil, Argentina e Chile.

Junto com o guarani, que é uma das línguas oficiais do Mercosul e falado por cerca de 7 milhões de pessoas no mundo, será adicionado ainda na plataforma de tradução quíchua e aimará, falados por povos nativos do Peru, Bolívia e Argentina. Estima-se 10 milhões e 2 milhões, respectivamente, falem esses dois idiomas.

Como a tecnologia aprendeu os idiomas

Segundo Isaac Caswell, engenheiro de software e pesquisador do Google, o diferencial na inclusão dessas línguas foi o uso de um modelo neural de inteligência artificial que aprendeu os idiomas "do zero".

Geralmente, para implementar uma nova língua, são necessários milhões de exemplos para um sistema "entender" e conseguir traduzi-la. Com o modelo neural, segundo Caswell, as línguas adicionadas foram treinadas dessa forma. A tecnologia passou a entender então como os idiomas funcionam.

A empresa diz ter consultado representantes de diversas comunidades antes de liberar os novos idiomas.

"Imagine que você é poliglota e que, baseado no seu entendimento de como as línguas são, consegue interpretar algo. É mais ou menos assim que opera nossa rede neural", explicou o pesquisador em conversa com jornalistas.

Planos futuros

Num primeiro momento, as 24 línguas só estarão disponíveis para tradução textual. O Google tem planos de adicionar com o tempo a parte de voz, permitindo a tradução de alguém falando ou mesmo para facilitar o entendimento de quem tem curiosidade sobre a sonoridade das palavras.

Ainda em conversa com jornalistas, Caswell disse que as línguas não estarão perfeitas logo de cara. "A qualidade é menor que o inglês e espanhol. Sabemos que haverá alguns erros, mas a ferramenta será útil", afirmou.

Fora da América Latina, o Google adicionou línguas como o krio, dialeto inglês de Serra Leoa, lingala (falado por 45 milhões de pessoas no centro da África, sobretudo na República do Congo) e mizo, falada por 800 mil pessoas no norte da Índia.

As novidades se somam aos mais de 100 idiomas que o Google Tradutor já oferece.

Abaixo, a lista completa de idiomas adicionados pelo Google Tradutor:

  • aimará - falado por quase 2 milhões de pessoas na Bolívia, Chile e Peru
  • assamês - falado por quase 25 milhões de pessoas no nordeste da Índia
  • axante - falada por cerca de 11 milhões de pessoas de Gana
  • bambara - falado por cerca de 14 milhões de pessoas de Mali
  • boiapuri - falado por cerca de 50 milhões de pessoas no norte da Índia, Nepal e Fiji
  • diveí - falado por cerca de 300 mil pessoas das Maldivas
  • dogri - falado por cerca de 3 milhões de pessoas do norte da Índia
  • jeje - falado por 7 milhões de pessoas de Gana e Togo
  • guarani - falado por 7 milhões de pessoas no Paraguai, Bolívia, Argentina e Brasil
  • ilocano - falado por cerca de 10 milhões de pessoas no norte das Filipinas
  • concani - falado por quase 2 milhões de pessoas do centro da Índia
  • krio - falada por quase 4 milhões de pessoas de Serra Leoa
  • curdo sorâni - falada por cerca de 8 milhões de pessoas (a maioria delas do Iraque)
  • língala - falada por quase 45 milhões de pessoas na República do Congo, Angola, República do Sudão do Sul e República Centro-Africana
  • luganda - falada por quase 20 milhões de pessoas em Uganda e Ruanda
  • maitili - falada por quase 34 milhões de pessoas no norte da Índia
  • manipuri - falada por 2 milhões de pessoas no nordeste da Índia
  • mizo - falada por cerca de 830 mil pessoas no nordeste da Índia
  • oromo - falada por 37 milhões de pessoas da Etiópia e do Quênia
  • quechuá - falada por 10 milhões de pessoas no Peru, Bolívia, Equador e regiões próximas aos países
  • sânscrito - falada por 20 mil pessoas na Índia
  • sepedi - falada por cerca de 14 milhões de pessoas na África do Sul
  • tigrínia - falada por quase 8 milhões de pessoas na Eritreia e na Etiópia
  • tsonga - falada por cerca de 7 milhões de pessoas em Essuatíni, Moçambique, África do Sul e Zimbábue