IA descobre seu perfil político pela foto e a consequência é perturbadora
Isaac Newton (1643-1727) fez muito mais pela humanidade do que simplesmente revolucionar a física, a astronomia e a matemática, criando as bases para saltos tecnológicos incomensuráveis.
Newton abriu o portal para uma nova forma de pensar o mundo, muito mais rigorosa e científica, eternizada na imagem do universo como um imenso e complexo relógio, cuja precisão mecânica seria a própria expressão do divino, que nós mortais poderíamos inferir por meio da matemática e de suas aplicações.
Do outro lado deste portal aberto há 300 anos, fomos recebidos por um dos mais poderosos memes de todos os tempos: a ideia de que podemos fazer a engenharia reversa do real e chegar às regras que levam à sua manifestação, agora e sempre.
Porém, existem furos nessa ideia. As ressalvas foram se acumulando, se acumulando até darem origem àquilo que hoje chamamos de modernidade: uma trama de ideias e costumes originados no século XX, cujo ponto é comum é a oposição ao determinismo, físico, psicológico e social.
Determinismo preconceituoso como verdade científica
Uma das diversas linhas deterministas de pensamento que floresceu nas ciências humanas é a de que existe uma forte correlação entre os aspectos físicos do corpo e os aspectos mentais.
Há dois princípios por trás desta ideia. O primeiro é que a vida mental é propriedade de um sistema mecânico - eis a origem das neurociências como campo - que está integrado a todo o resto, tendo, portanto, grande correlação funcional. O segundo é político-ideológico: esta ideia cai como uma luva quando o objetivo é dizer que homens são de Marte, mulheres são de Vênus e, sobretudo, negros são assim, brancos assado.
A criminologia é uma das áreas mais fortemente influenciadas pela busca incansável das leis físicas do comportamento. Ali, ninguém foi mais célebre do que Cesare Lombroso (1835-1909), considerado pai da criminologia moderna - um sujeito celebrado pelo seu ativismo a favor da humanização presidiária e da ressocialização, como também reconhecido pelas teses inaceitáveis e preconceituosas sobre tipos humanos e suas inclinações criminosas naturais.
Uma das teses que Lombroso ajudou a popularizar é a de que homens de rosto largo têm maior inclinação à violência e à criminalidade, dado que tal é uma tendência primitiva, relacionada à incapacidade de viver sob as regras civilizatórias.
Não desqualifique a tese de forma precipitada. O buraco é mais em baixo. Hoje sabemos que uma das variáveis que influencia a relação entre os eixos do rosto é a quantidade de testosterona no útero e que a exposição hormonal do feto de fato pode influenciar a expressão de genes no cérebro.
Do mais, dezenas de estudos experimentais foram feitos para testar a relação entre formato do rosto e criminalidade; alguns concluíram que existe uma pequena correlação, outros que ela inexiste; há também os estudos inconclusivos e os que mostram que ela só vale em situações muito especiais.
Sempre é possível encontrar argumentos para seguir nesta linha de exploração, tal como faz Richard Wrangham, professor de Harvard, que diz que o ser humano se autodomesticou a partir do fim do paleolítico e que isso afinou o seu rosto, o que veio acompanhado de uma significativa redução na agressividade (tal como se deu na passagem de lobos para cachorros).
A tese vai na contramão das evidências arqueológicas e moleculares, que sugerem que os bandos paleolíticos não resolviam as questões do dia a dia na base da violência, nem tinham fortes hierarquias masculinas, típicas dos primatas mais violentos.
Para além desta discussão, um grande problema se coloca: as pessoas não reagem à realidades objetivas, mas a sentidos. Estes, nas relações interpessoais, tornam-se profecias autorrealizadoras.
Se coletivamente assumimos que homens de rosto largo (ou negros, pobres, quem for) têm mais chance de cometer crimes, passamos a tratá-los como potenciais criminosos, papel que então passa a lhes atrair como um imã. Isto não ocorre por alguma razão simbólica ou "mágica", mas se dá pela combinação de oportunidades piores com tratamentos menos empáticos. Aí reside o problema dos atuais algoritmos jurídicos, usados na dosimetria e progressão de sentença, como argumentei.
Foram necessários séculos de sofrimento até a consciência de que somos atraídos aos papéis que os outros assumem que ocupamos e a de que é particularmente cruel rodar esta manivela determinista em situações inescapáveis, como as que se apresentam em função da pele, gênero e outros determinantes físicos.
Hoje, por sorte, a ideia de que quando alguém surge com uma nova descoberta sobre diferenças comportamentais baseadas em sexo ou raça pode estar nos oferecendo mais do que dados deixou de ser novidade. A presença de um subtexto deletério atrelado a este tipo de coisa é comum e facilmente identificável. Só o ignora quem quer.
Uma porta se fecha, outras tantas se abrem
O aprendizado de máquina, versão mais prática e aplicável da inteligência artificial é o principal vetor de transformação tecnológica na atual revolução cognitiva.
Sua ação contra a realidade estabelecida nos dias de hoje parece a da água contra a parede porosa de uma barragem malcuidada: quando uma saída é fechada, outras são rapidamente abertas. Situação que deve durar até o momento em que a barragem estourar, isto é, a lógica dos algoritmos tornar-se ubíqua e passar a ser invadida pelas hordas bárbaras da próxima grande tendência analítica.
Razões para tanto já existem: o princípio fundamental do aprendizado de máquina é que o futuro reitera o passado. É esta propriedade que permite que dados (passado) sejam usados para treinar algoritmos, que serão usados para lidar com o presente e prever o futuro. Isso torna a técnica propensa a limitações e vieses comuns ao determinismo, conforme expliquei aqui.
Por outro lado, estes vieses convivem com acertos substanciais, derivados do fato de que aprendizado e reiteração são mesmo alguns dos principais leit motivs da ação humana e de muito mais. É a percepção de que o retorno esperado do seu uso é positivo que impulsiona a adoção massiva que estamos assistindo, a qual avança junto com a consciência sobre as zonas de exploração mais vantajosas e contraproducentes.
Uma das vias parcialmente interditadas é esta em que algoritmos tentam determinar a maneira como características físicas impactam competências que comumente geram hierarquias de valor social, como as morais e intelectuais. Não pega bem, dado a presença de estigma no subtexto.
Uma via alternativa, pela qual a água corre com cada vez mais força, é a dos algoritmos que combinam características físicas, emoções e posturas para determinar preferências - um termo difuso que nem sempre se aplica àquilo que as pessoas deliberadamente preferem. A diferença prática entre preferências e competências é simplesmente que aquelas não geram hierarquias sociais de maneira tão explícita e direta. É a inteligência artificial na zona cinzenta do comportamento.
Em 2018 Michal Kosinski e Yilun Wang (Stanford) publicaram um artigo descrevendo um algoritmo capaz de identificar preferências sexuais masculinas (hétero ou gay) com 81% de acurácia e femininas com 71%, a partir de uma única foto do rosto. De acordo com os autores, o algoritmo treinado tem desempenho bastante superior às pessoas, que na média acertam 61% das vezes para homens e 54% das vezes para mulheres.
No final daquele mesmo ano, o procedimento foi repetido com um segundo algoritmo, produzindo 68% e 77% de acurácia, respectivamente. Este segundo estudo foi feito por um aluno de mestrado, sem grande treinamento específico, nem relação com o grupo de Stanford. Em ambos os casos, fotos e preferências sexuais foram extraídas de sites de relacionamento e o treinamento envolveu dezenas de milhares de imagens. Quanto maior o treinamento, melhor - o que torna este um jogo econômico, em que as grandes empresas tendem a superar as universidades.
Fotos do rosto incluem mais do que a face; eles incluem os sentidos que a pessoa retratada deseja transmitir, através da pose (ou ausência dela) adotada na foto, além de adereços, como óculos de leitura, bem mais comuns em perfis de homens hétero do que gays.
Mesmo quando se resumem ao retrato desapaixonado de quem dorme, fotos do rosto abrem uma janela para as vivências de cada um: padrões alimentares, tensionais, exposição à violência, cuidados na infância, doenças, preocupações com a estética e muito mais entram nessa fórmula.
Estas considerações servem para que nos lembremos de que nada é mais distante da "natureza" do que um rosto. Feita esta ressalva, é de fato surpreendente que algoritmos bem treinados sejam tão melhores do que humanos neste jogo de adivinhação universalmente praticado.
A bola da vez nesta área é um novo algoritmo (Kosinski, 2021), treinado com cerca de um milhão de imagens, extraídas de sites de relacionamento e do Facebook, que é capaz de identificar a orientação político-ideológica primária das pessoas (liberais vs. conservadores), com 72% de sucesso, a partir de uma única foto. Tome como referência o fato de que Kosinski afirma que as pessoas acertam este dado cerca de 55% das vezes, um desempenho próximo do acaso.
Tal como o algoritmo de discriminação sexual (acho que não seria injusto chamá-lo assim), este se pauta por aspectos irredutíveis aos traços faciais para classificar os perfis, em consonância com o fato de que fatores grupais têm relevância aqui. Por exemplo, homens brancos mais velhos têm muito mais chance de serem conservadores do que mulheres negras mais novas.
Kosinski levou isso em consideração em uma segunda bateria de testes, que só usou pares de fotos, padronizadas por sexo, idade e raça. O desempenho caiu apenas 3.5%. A conclusão que segue é que o algoritmo de fato extrai parte importante das informações dos rostos, adereços e expressões.
Os dois fatores com maior poder preditivo são posição adotada na foto e emoções manifestas. Liberais tendem a posar mais de frente para a câmera e a manifestar mais surpresa; conservadores tendem a manifestar mais repugnância (desgosto/nojo).
Nossas inclinações político-ideológicas são intencionais?
Há duas linhas de raciocínio perturbadoras ligadas a este estudo. A primeira é a de que nossas escolhas político-ideológicas podem não ser tão intencionais assim. Esta seção é sobre ela.
De um lado, os processos que nos levam à exibir certos esquemas corporais com maior frequência, bem como aqueles que favorecem a manifestação pública de algumas emoções, podem reduzir a resistência para a aceitação de um ideário conservador ou liberal nos costumes. Do outro, as nossas escolhas político-ideológicas podem tornar certos esquemas corporais e emoções mais atraentes.
Esta última é facilmente explicável: conforme a pessoa adota um ideário, passa a sentir um incômodo em relação a tudo aquilo que sente ou expressa, que destoa do conjunto privilegiado por seus pares de credo. O mal-estar gerado conduz a uma remodelagem continuada de traços e comportamentos, a qual tende à "consonância" ou estereotipia.
Esta é a tese que costuma ser requisitada para explicar a formação das tribos contemporâneas. Funciona bem em aulas e entrevistas, mas possui duas fragilidades. A primeira é que não dá pistas da razão pela qual os pacotes estilísticos que seguem atrás das escolhas político-ideológicas são estes que estão aí e não outros quaisquer. Por exemplo, por que, afinal, homens que se assumem conservadores aposentam o All Star e desentocam a bota de montanhista? Por que manifestam mais desgosto nas fotos?
A linha de raciocínio é inequívoca: fulano é conservador, logo, prefere tudo mais careta. Mas, afinal, careta não é a definição daquilo que é preferido por quem é conservador? Como sair desta tautologia? A ausência de respostas simples, claras e diretas caracteriza a primeira fragilidade.
A segunda fragilidade é que este tipo de narrativa parte da premissa de que as pessoas têm consciência político-ideológica. Pense nisso e leia novamente a tese: "a pessoa adota um ideário, passa a sentir um incômodo em relação a tudo aquilo que sente ou expressa que destoa do conjunto privilegiado por seus pares de credo". Note como a mesma só funciona a partir da clareza sobre o ideário adotado e a identidade de seus pares de credo. A realidade nem sempre é essa.
Em geral, as preferências são meras inclinações difusas, irrefletidas e predominantemente latentes, as quais vão se manifestando de maneira mais clara conforme as pessoas vão sendo estimuladas a se posicionar. Por exemplo, o que você prefere: o insight na leitura de algo que lhe parece genial, ou o insight gerado a partir de um quadro engraçadíssimo, de um stand-up comedy? Percebe como a resposta não vem à mente de maneira tão imediata? Isso é reflexo do fato de que sua preferência não estava tão bem definida até este momento. Preferência deveria ser definida assim: a etapa final do processo de criação de gostos manifestos, que geralmente toma forma a partir do encontro de inclinações latentes com sugestões ambientais.
Na década de 1960, Philip Converse fez um barulho na ciência política americana e europeia com um estudo que mostrou que a grande maioria das pessoas não tem consciência político-ideológica. Pautas típicas da esquerda são comumente classificadas como de direita e vice e versa; noções e valores que os estudiosos assumem como partes de um todo coerente são impropriamente associados. A própria capacidade de descrever as preferências político-ideológicas é lábil.
Esta ideia se aplica aqui, na perspectiva de que as pessoas se reconhecem politicamente e, com base nisso, absorvem seletivamente aquilo que gera coesão identitária. Trata-se de uma realidade da elite intelectual, mas não do planeta como um todo.
A tese alternativa é a de que essas coisas todas surgem de um mesmo núcleo de inclinações latentes: inclinações político-ideológicas, posturais, emocionais e, em níveis bem genéricos, estilísticas. É uma tese bem menos interessante de se apresentar ou discutir, mas as evidências sugerem que seja bem mais válida.
Quando dizemos que alguém é liberal ou conservador estamos sobretudo falando da pauta de costumes, afinal, a oposição liberal vs. conservador, em termos econômicos, é menos explícita.
A pauta de costumes aponta para uma tendência muito mais ampla que é a normatividade de grupo. A dicotomia mais profunda é: você tem mais inclinação para tolerar a diferença e se regozijar com a mudança, ou para reafirmar princípios já testados e investir na coesão de grupo?
Como sempre, a grande maioria das pessoas não tem preferência clara. Porém isto não replica a situação anteriormente descrita, já que esta oposição faz sentido há vários milhares de anos.
Ao longo deste período, a atuação combinada da seleção natural e cultural levou-nos a manifestar inclinações tácitas. Tal como algumas pessoas são naturalmente mais introvertidas e outras mais extrovertidas, mas todas podem ter essa tendência modelada pelo aprendizado espontâneo ou pelo esforço, as pessoas têm facilitações para adotar pacotes de emoções, comportamentos e predileções político-ideológicas. Isto é provado por estudos de larga escala com gêmeos. Muitas vezes, estas facilitações são subvertidas pelo aprendizado, mas nem sempre.
Assim, por exemplo, a maior prevalência de expressões de repugnância entre conservadores está diretamente conectada ao fato de que esta é uma emoção que sinaliza o rechaço a algo externo e potencialmente tóxico, o que reforça a coesão de grupo. Nojo e desgosto compõem um par de emoções que servem para expulsar de dentro de si aquilo que é desagradável ou perigoso. Elas se ligam de maneira muito direta à imagem do outro como sujo ou inferior e, não por acaso, tiveram papel relevante na propaganda nazista - o que obviamente não autoriza ninguém a pintar suásticas imaginárias no peito de cada conservador que existe por aí.
A predileção dos liberais pelas fotos em que estão olhando para a câmera é uma expressão da maior abertura à experiência (em oposição a posturas mais fechadas ou oblíquas), um traço de personalidade correlacionado ao liberalismo de costumes. A lente da câmera é como um horizonte, em formato de olho, que o sujeito encara, como quem diz "quero desvendá-lo".
Até a oposição bota vs. All Star pode ser pensada desta mesma maneira: botas servem proteger os pés; são especialmente importantes quando o terreno é incerto, ameaçador. All Star é o contrário. Uniformes, idem: permitem a identificação imediata de quem é de dentro e quem é de fora. Logo, as pessoas mais sensíveis a esta dicotomia têm mais chance de gostar deles.
Passei a infância tentando entender como é que alguém um dia achou que os uniformes escolares poderiam fazer algum sentido. Hoje entendo: são pessoas que pensam de maneira diametralmente oposta a mim.
O fato das nossas predileções político-ideológicas serem influenciadas por combos de inclinações espontâneas é um forte motivo para desconfiarmos da ideia de que são a mais pura e profunda manifestação dos juízos que formamos a partir da realidade social "em si mesma" e, consequentemente, de que refletem as nossas intenções e nada mais. É perturbador, eu sei.
Inteligência artificial como usina de teses imbatíveis
Na seção anterior falei de duas consequências perturbadoras do algoritmo político de Kosinski. A primeira é que ele nos leva a encarar o fato de que aquilo que nos parece tão intencional e idiossincrático, na verdade, é bem menos do que parece.
A segunda é que, pela sistemática demonstração de sua superioridade preditiva, a inteligência artificial tende a assumir o papel de pivô na elucidação de nossos comportamentos sociais, em esferas que vão muito além da preferência.
Centenas de artigos, teses e livros foram escritos por gente genuinamente interessada em mapear a relação entre preferências políticas e os mais variados elementos, em fotos, filmes, músicas e livros. Uma das razões porque esta roda segue girando é o fato de que as combinações são extremamente complexas e envolvem o peso relativo que cada elemento possui no contexto em que surge. Algoritmos como os de Kosinski tendem a mudar o jogo, conforme expandem sua capacidade inigualável de reconhecimento de padrões presentes na ação humana, para outros domínios.
Até poucos anos atrás, divergências fatuais eram comuns. "Vasco da Gama chegou em Calecute, em 1498. Não, não foi Calecute, você está errada, foi?". Hoje este tipo de diversão praticamente desapareceu. Faz pouco sentido discutir o que é fatual, sabendo que a resposta está na ponta da língua da Siri. O paralelo entre os dois casos não poderia ser maior.
Interpretação de escritos em línguas extintas, identificação de conjuntos identitários, modelagem de rotas de comércio, decodificação de sistemas simbólicos complexos, definição do papel de terremotos, secas, chuvas ou eclipses na duração ou desfecho de guerras ou batalhas; tudo isso encontra-se no horizonte do procedimento adotado por Konsinski.
Assim chegamos à segunda conclusão, a qual me parece ainda mais perturbadora do que a primeira: é só uma questão de tempo para que o pensamento dominante se torne o de que não faz sentido tentar responder nada disso na cara e na coragem, já que sempre é possível usar um algoritmo bem treinado para ir além daquilo que conseguimos identificar, numa fração do tempo. A despeito das expressões de repugnância, algo me diz que isso vai mudar as ciências humanas para sempre.
ID: {{comments.info.id}}
URL: {{comments.info.url}}
Ocorreu um erro ao carregar os comentários.
Por favor, tente novamente mais tarde.
{{comments.total}} Comentário
{{comments.total}} Comentários
Seja o primeiro a comentar
Essa discussão está encerrada
Não é possivel enviar novos comentários.
Essa área é exclusiva para você, assinante, ler e comentar.
Só assinantes do UOL podem comentar
Ainda não é assinante? Assine já.
Se você já é assinante do UOL, faça seu login.
O autor da mensagem, e não o UOL, é o responsável pelo comentário. Reserve um tempo para ler as Regras de Uso para comentários.