Topo

Analistas usam "DNA" de fotos para avaliar denúncias sobre conteúdo digital

Carlos Oliveira

Do UOL, em São Paulo

14/01/2014 06h00

Os profissionais entrevistados pelo UOL Tecnologia relataram o uso de diversos programas para o trabalho de análise de conteúdo ofensivo. Os programas vão de simples complementos para navegadores a sistemas complexos que procuram pelo "DNA" das fotos. Muitas vezes os recursos são open source - de acesso livre.

Entre as ferramentas de fácil acesso, estão Geotool, Visualroute, Robtex e YouGetSignal para rastrear o conteúdo (identificar a localização física de onde foi publicado). Flagfox e World IP, complementos do navegador Firefox, também foram mencionados como bons recursos. Já o Request Tracker registra o acompanhamento das denúncias. Os outros programas são mais específicos.

DNA

Como filtrar um grande número de denúncias, deixando de lado aquelas repetidas e as já resolvidas, por exemplo? “Com certeza não se pode depender da memória dos analistas. É uma parte do processo, mas é preciso ter tecnologia”, diz John Shehan, diretor-executivo da organização norte-americana Ncmec (Centro para Crianças Desaparecidas e Abusadas dos Estados Unidos, na sigla em inglês).

No caso das fotos, a Ncmec usa o PhotoDNA, da Microsoft - a empresa afirma que doa o programa para provedoras de serviço online que queiram usá-lo para filtrar imagens de abuso infantil.

  • Divulgação/Microsoft

    O software PhotoDNA, da Microsoft, extrai o "DNA" de uma imagem (representado pelo quadrado à esquerda) e compara-o a outros para encontrar arquivos duplicados ou modificados

Essa tecnologia baseia-se no fato de cada imagem ter uma espécie de código DNA, uma sequência de caracteres chamada “hash”, o que permite sua identificação (o mesmo princípio é adotado em torrent, tecnologia que divide o arquivo em partes para fazer o compartilhamento via computadores diferentes).

O software consegue recuperar o hash mesmo quando a imagem sofre modificações, como um corte, uma rotação ou quando é compactada, diz John. “Temos uma sala de servidores dedicados ao software”, diz John. Segundo ele, a taxa de falsos positivos do programa é de um em 10 bilhões.

Thiago Tavares, diretor da brasileira Safernet, diz que os filtros que usa na organização também são eficientes: “Só precisamos acessar imagens que nunca foram avaliadas por nenhuma ferramenta [da Safernet] em sete anos”.

Habilidade

Shelley Allwang, supervisora do Programa de Identificação de Vítimas Infantis da Ncmec, diz que todos os analistas da entidade são capazes de fazer melhorias básicas nas imagens, usando softwares para deixá-las mais definidas e restaurar detalhes - a chamada depixelização (uma imagem “pixelada” é aquela com baixa definição).

“Cada programa tem suas funcionalidades próprias, o que torna interessante combinar diferentes ferramentas em vez de depender de só uma”, diz Nicolas D’Arcy, da organização francesa Point de Contact

Antivírus

Na hotline portuguesa FCCN (Fundação para a Computação Científica Nacional), todo o processo de análise é feito em uma máquina virtual, que simula um sistema operacional - algo como um Windows dentro de um Windows.

Gustavo Neves, consultor de segurança do órgão, explica que a estratégia protege as máquinas dos vírus: “Os acessos são tipicamente a sites de má reputação e com conteúdos privados. Convém estar em um espaço protegido”, diz. A máquina virtual é zerada todos os dias, “esquecendo” eventuais vírus que o computador tenha contraído.