IA é como um gringo que fala bem português; vamos ter um modelo brasileiro?

Os modelos de IA atuais são treinados com dados majoritariamente em inglês Imagem: Tetra Images/Getty Images

Quem utiliza o ChatGPT pode estar satisfeito com as respostas, mesmo quando conversa com a máquina em português. Ela parece entender o que escrevemos e produz resultados plausíveis, especialmente quando a máquina não alucina.

Mas a IA é como um gringo que fala bem português. Apesar de conseguir se expressar no nosso idioma, acaba processando a partir de sua língua nativa, o inglês. E isso tem implicações que precisam ser debatidas a partir de perspectivas técnicas, sociais e políticas.

Os modelos de IA atuais são treinados com uma quantidade absurda de dados majoritariamente em inglês. O modelo da Meta, por exemplo, foi treinado com aproximadamente 95% dos dados na língua inglesa e somente 5% dos dados restantes em outros idiomas.

Sempre que um modelo não sabe uma resposta de bate e pronto no idioma solicitado, ele tem o recurso de traduzir o que seria a resposta em inglês. E assim, respostas e histórias podem ser construídas a partir de uma visão específica de mundo. É como se a IA inaugurasse uma nova forma de soft power ao padronizar estilos linguísticos e ao dar sentido às coisas.

Mas esse lance não é o único problema. Tem também o desafio de hard power e soberania. A Inteligência Artificial é uma tecnologia de propósito geral que habilita o desenvolvimento de novas inovações de diferentes naturezas. Muitas aplicações do presente e do futuro ficarão dependentes desses grandes modelos de IA, por isso precisamos encontrar alternativas locais para não ficar totalmente dependente das big techs.

Nesta semana, estou em Cabo Verde como membro da delegação brasileira no "Fórum Lusófono da Governança da Internet", um evento que reúne os países falantes da língua portuguesa para discutir temas relacionados a internet e novas tecnologias.

O fórum reservou um dia inteiro para debates sobre os caminhos de IA, e eu fui um dos painelistas que teve como objetivo responder o porquê e como poderíamos conseguir mais representatividade do português nos modelos de IA.

A conclusão que chegamos após um diagnóstico crítico e muito debate é que, embora os países lusófonos não vão conseguir competir de imediato com as big techs, precisamos encontrar caminhos para promover tanto a criação de conjuntos de dados em português quanto o desenvolvimento de modelos.

Língua é poder, e ninguém melhor do que nós para cuidar dela.

Continua após a publicidade

Singapura fez algo parecido. Eles desenvolveram uma família de IA (chamada SEA-LION) que foi especificamente pré-treinada e ajustada às línguas da região do Sudeste Asiático. Os modelos não são tão robustos em tamanho como o ChatGPT, mas têm a vantagem de ser especializados em línguas específicas. Outro diferencial é ser de código aberto, o que incentiva o ecossistema de inovação local.

Entre os países lusófonos, o Brasil é o que está mais adiantado. O Plano Brasileiro de IA (PBIA) prevê uma ação específica para o desenvolvimento de uma IA nacional. No "Deu Tilt", podcast do UOL de tecnologia e inovação, entrevistamos a Ministra de Ciência, Tecnologia e Inovação, responsável pelo documento, para entender melhor como funcionaria na prática a criação de uma IA brasileira.

Ela explicou que, apesar do montante de mais de 1 bilhão de reais reservado no plano, os detalhes seriam especificados por meio de um edital.

Sempre lembro que o diabo mora nos detalhes. E, nesse caso, mora mesmo.

Precisamos de muita atenção nos requisitos que serão escritos no edital porque o risco de jogar dinheiro pela janela não é pouco. São vários caminhos possíveis, como fomentar uma empresa "campeã nacional" que irá desenvolver um novo sistema de IA do zero ou diferentes organizações que poderão adaptar modelos de código aberto.

Continua após a publicidade

Possibilidades não faltam. Por isso, defendo que antes de definir esse edital, o governo reúna especialista para que possamos especificar bem o que queremos com a tal da IA brasileira.

Eu tenho uma opinião sobre isso que deixei claro na minha fala durante o fórum em Cabo Verde. Em vez de pensarmos a IA como um produto, precisamos pensá-la como um ecossistema. Quando falamos de uma IA brasileira, não podemos imaginá-la apenas como um chatbot que acessamos por meio de um site. É muito mais estratégico pensá-la como um ou mais modelos de código aberto que poderão promover um ambiente de inovação no Brasil e também nos demais países falantes da língua portuguesa.

Opinião

Texto em que o autor apresenta e defende suas ideias e opiniões, a partir da interpretação de fatos e dados.

** Este texto não reflete, necessariamente, a opinião do UOL.

Deixe seu comentário

O autor da mensagem, e não o UOL, é o responsável pelo comentário. Leia as Regras de Uso do UOL.

Diogo Cortiz

IA é como um gringo que fala bem português; vamos ter um modelo brasileiro?

Opinião

Deixe seu comentário

Diogo Cortiz

Diogo Cortiz

IA é como um gringo que fala bem português; vamos ter um modelo brasileiro?

Relacionadas

Opinião

Deixe seu comentário