Topo

Por que está mais difícil diferenciar rosto humano de artificial em vídeos

Dados digital rosto de mulher - cottonbro/ Pexels
Dados digital rosto de mulher Imagem: cottonbro/ Pexels

Marcos Bonfim

Colaboração para Tilt, em São Paulo

03/10/2021 04h00

Hoje, quando você assiste a um filme ou série, consegue identificar qual personagem é representado por um ser humano e qual é por um recurso artificial, feito por uma computação gráfica? Se a resposta for não sei, essa dificuldade tem um motivo: a fronteira entre esses dois mundos está cada vez menor, o que acaba por dificultar a nossa capacidade humana de distinção.

Em caso recente e curioso, um ator de pele e osso, Brett Goldstein (Roy Kent), da série Ted Lasso, foi confundido com uma peça de computação gráfica, abrindo espaço para o lúdico mundo — às vezes, campo minado — de teorias do Twitter.

O avanço tecnológico associado ao talento dos artistas da área CGI (Computer-Generated Imagery, ou imagens geradas por computador, em tradução livre) e o nosso constante hábito de bancar os detetives tem criado um cenário que nos leva à confusão. Ficou confuso? Vamos explicar.

Brett Goldstein (Roy Kent) em 'Ted Lasso' - Divulgação/Apple TV+ - Divulgação/Apple TV+
Brett Goldstein (Roy Kent) em 'Ted Lasso'
Imagem: Divulgação/Apple TV+

Situações desse tipo já acontecem não apenas com personagens humanas, mas também em outras situações envolvendo produtos, por exemplo, como em campanhas de publicidade. É o que explica Cássio Braga, presidente-executivo e diretor da Miagui, estúdio de produção de conteúdo especializado em CGI e ilustração.

"Existe um fator psicológico nesta história toda que é o fato de que a gente está mais predisposto a questionar porque sabe que as coisas são mais possíveis. Antigamente, a gente acreditava em coisas que não eram tão realistas facilmente porque não estava preparado para chegar à conclusão de que eventualmente aquilo não era real", afirma.

No caso da série, ele considera que essa predisposição somada a características anatômicas do ator — como a perfeição da barba e mandíbula, que parece ter passado por harmonização facial —, e à fotografia mais artificial, podem ter gerado a desconfiança do público da série.

Avanços tecnológicos

Embora a computação gráfica seja uma realidade há décadas, como em "Star Wars", "Avatar" e "Blade Runner", profissionais entrevistados por Tilt dizem que os últimos cinco anos registraram um avanço muito grande tanto em termos de tecnologias quanto de acessibilidade. Evolução puxada em boa parte pelas indústrias de entretenimento e games.

Entre as inovações, estão tecnologias de ponta em:

  • renderização (processamento digital de imagens, fotos, áudios), que oferecem profundidades de luz e sombras para deixar cenas o mais próximo da realidade;
  • resolução de texturas;
  • subsurface scattering, técnica que simula a entrada de luz em superfícies translúcidas e, em casos de reprodução de pele e face humana, pode ser usada para mostrar veias;
  • game engines, softwares que funcionam como uma espécie de biblioteca e oferecem aos profissionais um conjunto de ferramentas para o desenvolvimento dos trabalhos;
  • placas de vídeo de alto desempenho, que fazem o processamento de tudo isso.

Luiz Evandro, diretor multimídia da produtora Vetor Zero e da VetorLab, braço de novas tecnologias da empresa, conta que, antes dessa evolução, os processos demoravam muito. Em alguns casos, para renderizar uma criação de um ou dois minutos, poderia levar cerca de uma semana.

"Nós começamos a ter coisas em tempo real com uma qualidade altíssima. Saímos do nível de apertar um botão, ir para casa, retornar e o sistema ainda estar rodando — e ainda ter que esperar mais uns dias — para um momento em que criamos e instantaneamente já visualizamos o resultado", compara.

Um outro elemento que tem feito a diferença é a captura dos movimentos dos atores, que confere mais facilidade e agilidade.

Dupla faz demonstração de motion capture -  mrkim/ Flickr -  mrkim/ Flickr
Dupla faz demonstração de motion capture
Imagem: mrkim/ Flickr

"Antigamente, você até poderia fazer [modelar no computador] um rosto bem feito, mas ainda ficava muito na mão do animador. Hoje você consegue fazer mockup [modelo em escala real de algo] pelo celular, se filmar mexendo e trocar a sua cabeça por uma virtual", explica Guilherme Duarte, sócio e diretor criativo da Imago Studio.

É verdade, porém, que alguns traços ainda precisam ser aprimorados no processo. Evandro considera que o mercado ainda precisa avançar na sincronização de movimentos labiais (conhecido como lip-sync).

Para Duarte, o olhar é algo que pega nos personagens, falta captar a "alma" deles. Essa dificuldade, segundo os especialistas, vem da complexidade do rosto humano. Um sorriso, por exemplo, movimenta diversos músculos. Levar isso com movimento para a tela é um desafio e tanto.

E onde fica o vale da estranheza?

Com todos esses avanços e distinção entre rostos humanos e artificiais diminuindo, os artistas de CGI estão sempre atentos a um termo que sempre foi a representação de um desafio: o uncanny valley. Ou seja, o Vale da Estranheza, definido lá em 1970 pelo professor japonês de robótica Masahiro Mori.

O conceito explica que uma personagem artificial gera empatia até um certo nível. Quando a reprodução gráfica artificial "está no vale", algo parecido com um ser humano e as pessoas percebem algum detalhe ou característica que está fora do que têm como real, surge um sentimento de repulsa.

Quando a passagem pelo vale é bem feita, a empatia retorna. Para Evandro, a computação gráfica está em um momento importante nesse quesito, embora acredite que à medida que a tecnologia avança também evolui a nossa compreensão.

Para exemplificar, um 3D do filme Parque dos Dinossauros é muito menos realista para nós hoje do que quando foi lançado.

Cena do filme "Jurassic Park: O Parque dos Dinossauros" (1993), de Steven Spielberg - Reprodução - Reprodução
Cena do filme "Jurassic Park: O Parque dos Dinossauros" (1993), de Steven Spielberg, inspirado no livro de Crichton
Imagem: Reprodução

"A gente acha que existe um ponto em que essas duas curvas se juntam e que efetivamente não haverá mais distinção. Estamos quase lá, estamos muito próximos", disse.

Braga, da Miagui, parte da mesma ideia de mudança de sensibilidade das pessoas, mas para defender uma outra compreensão. Para ele, não há um limite, uma linha traçada que será superada em algum momento, e sim soluções que ajudam a passar pelo "Vale da Estranheza".

"Quando você jogou Playstation 1 pela primeira vez, a percepção possivelmente era de que os jogadores estavam próximos da realidade. Se olhar hoje, será bem diferente. O ponto é que hoje existem soluções, tecnologias e, principalmente, a sensibilidade artística de pessoas muito competentes que sabem usar os recursos que têm para sobrepor a capacidade humana de perceber o uncanny valley", complementa.

Deepfakes x fake news

Um outro aspecto que está no horizonte dos especialistas em CGI é a relação da computação gráfica com as deepfakes, criadas a partir da inteligência artificial. Se por um lado há o receio que essa tecnologia acabe tomando o lugar de profissionais da área, por outro há a compreensão de que existe espaço para muitas trocas.

"Eu acho que nada substitui a cabeça humana, sabe? As deepfakes podem facilitar para nós pularmos um pouco a burocracia técnica e usarmos mais a criatividade para o trabalho em si", afirma Duarte.

Para Braga, a tendência é que o uso das tecnologias seja feito cada vez mais a partir das necessidades de cada história a ser contada e dos recursos disponíveis. "E o legal é que hoje em dia você tem deepfake, 3D, pós-produção sem 3D e uma infinidade de recursos", explica.

Montagem de deepfake - Arte/UOL - Arte/UOL
deepfake-jim-jack
Imagem: Arte/UOL

E, até pela polarização atual, há também questões que pesam à medida que as tecnologias convergem, como desvios por pessoas mal-intencionadas, que podem querer aproveitar do desenvolvimento tanto da computação gráfica quanto das deepfakes para utilização similar ao que vemos frequentemente nas fake news.

Para Eric Messa, coordenador no núcleo de mídia digital da Faap, uma preocupação atual é como o senso crítico e como o grau de maturidade da população vai reagir diante da velocidade com que a tecnologia evolui.

"Existe um certo risco de alcançarmos um momento em que sejamos incapazes, do ponto de vista da população em geral, de perceber a diferença entre o que é real ou não. Em particular, do que é algo falso e usado para manipulação", alerta Messa. Segundo ele, isso poderia ser "muito perigoso", principalmente para o ecossistema político.

Evandro já considera que as as questões morais vêm a reboque e acrescenta que é uma discussão que não tem nada a ver com tecnologia. Ela tem a ver muito mais com questão moral das pessoas.