Topo

'Só não vale se apaixonar': IA é capaz de provocar e até flertar com você

Joaquin Phoenix, em "Ela" (2013), vive amor com uma inteligência artificial - Divulgação
Joaquin Phoenix, em "Ela" (2013), vive amor com uma inteligência artificial Imagem: Divulgação

Barbara Mannara

Colaboração para Tilt, do Rio de Janeiro

27/02/2022 11h00

Já imaginou uma inteligência artificial sem aquela voz robótica do Google? A Sonantic, uma startup especializada em IA, desenvolveu uma voz sintética capaz de fazer provocações e até flertar. O diferencial está na capacidade de expressar emoções com maior realismo e aplicar sutilezas durante a fala, que deixam a comunicação mais "humana".

O tema geral escolhido para o treinamento da Inteligência Artificial é o "amor". Com isso, a mais nova atualização do software, divulgada pela Sonantic nesta semana, apresenta vozes com tons de paquera, timidez e provocação.

Vídeo mostra atualização realista de voz gerada por IA - Reprodução/Sonantic - Reprodução/Sonantic
Vídeo mostra atualização realista de voz gerada por IA
Imagem: Reprodução/Sonantic

IA quase humana

Para alcançar essa tonalidade mais leve, natural e sedutora, os modelos de AI são treinados para adicionar ao diálogo risadinhas e pequenas zombarias. E isso permite oferecer, segundo a empresa, uma narração mais autêntica.

"Nosso objetivo de pesquisa era ver se poderíamos modelar emoções sutis. Emoções maiores são um pouco mais fáceis de capturar", explica John Flynn, cofundador da Sonantic em entrevista ao site The Verge.

A Sonantic chegou a publicar um vídeo com a demonstração da sua voz sintética. O modelo de AI apresenta nuances de discurso mais suaves durante o diálogo. E o resultado é bem semelhante à tonalidade da voz humana.

Inspirado em HER

Quem já assistiu o filme "HER" ("Ela") de 2014, vai se lembrar claramente da voz feminina da inteligência artificial que interage com o personagem Theodore, interpretado por Joaquin Phoenix. O ator chamou atenção do público recentemente como protagonista em "Coringa" (2019), conquistando o Oscar de Melhor Ator em 2020.

Pois bem, saiba que a voz feminina apresentada pela Sonantic é inspirada na IA Samantha, do mesmo filme.

Quem assistiu o longa-metragem, sabe que o personagem de Joaquin se apaixona pela IA — e isso gera inúmeros problemas. Claro que se trata de ficção, mas é importante ressaltar que a empresa afirmou que está preocupada e ciente sobre as questões éticas relacionadas ao realismo do algoritmo.

Para isso, a Sonantic deixa claro que todas as demonstrações da empresa incluem uma divulgação afirmando que a voz é sintética. Apesar da empresa ser mais focada no mercado do entretenimento — como áudios para jogos, por exemplo —, não há uma norma interna que impede os clientes de usar a IA para fins enganosos, simulando uma voz humana real — um precedente bastante perigoso para os golpes virtuais.

Como funciona a tecnologia

O software criado pela Sonantic permite que o usuário adicione um texto digitado para transformar em leitura de voz sintética. Ainda é possível selecionar um elenco para a narração — baseado em atores humanos.

O cliente pode selecionar o tipo de humor com diferentes emoções disponíveis, como medo, felicidade, alegria, raiva e tristeza. Para deixar a leitura da IA ainda mais real, é possível ajustar a intensidade da voz, como por exemplo: tonalidade de "felicidade" em níveis baixos, médios ou altos.

Regulador da intensidade de voz AI da Sonantic - Reprodução/Sonantic - Reprodução/Sonantic
Regulador da intensidade de voz AI da Sonantic
Imagem: Reprodução/Sonantic

Para completar, é possível adicionar sons extras, como respirações e risadas, durante a narração.

O uso pode ser feito pelo aplicativo para desktop (computador) ou por meio da página com ferramentas mais avançadas de desenvolvedor. Ao final de toda a personalização, o áudio é exportado em alta qualidade em arquivo WAV.

Não tão perfeita assim

O uso para a IA no dia a dia é múltiplo. Segundo a empresa, a capacidade de entregar vozes mais expressivas e realistas podem ser utilizadas em jogos e até filmes. E, com isso, reduzir o tempo e custo de produção.

Segundo Flynn, o principal diferencial no software da empresa está na capacidade de controlar, editar e esculpir a performance da voz IA.

Para quem está curioso, no site da Sonantic é possível fazer um teste rápido e gratuito, utilizando um trecho de texto. A plataforma permite selecionar uma voz feminina (Taylor) ou masculina (Justin). Por fim, alterne entre os tipos de emoções: raiva, medo, felicidade, tristeza e expressivo.

Teste de voz IA da Sonantic - Reprodução/Sonantic - Reprodução/Sonantic
Teste de voz IA da Sonantic
Imagem: Reprodução/Sonantic

Além disso, o The Verge conseguiu exemplos da voz AI em diferentes emoções, já com a atualização mais realista. Em uma análise rápida, nota-se que os intervalos entre as palavras ainda não são tão realistas assim.

Durante a fala, a construção do texto deixa as sílabas próximas demais, com cadências (regularidade de movimentos do som) que soam "erradas". Isso acontece por ser aplicado o peso tônico da palavra na hora inapropriada, deixando a fala "não natural". Além disso, notam-se dobras de som - interferências na dicção do texto - que entregam ser a narração de um robô.

A apresentação por vídeo feita pela empresa parece mais realista do que ouvir apenas os arquivos de áudio. Isso se dá provavelmente por conta do suporte visual, onde é utilizado o vídeo de uma atriz humana olhando para a câmera, gerando maior proximidade e realismo.

Durante uma pesquisa no site, não foram encontrados os valores dos serviços da Sonantic. No entanto, é possível entrar em contato com a empresa utilizando um email corporativo para obter mais informações e solicitar um orçamento.