Topo

Como um dos grandes mistérios da biologia foi solucionado com inteligência artificial

DeepMind foi capaz de prever a formação de estruturas de proteínas como essa em um nível sem precedentes - DeepMind/PA Wire
DeepMind foi capaz de prever a formação de estruturas de proteínas como essa em um nível sem precedentes Imagem: DeepMind/PA Wire

Hellen Brigs

Repórter de ciência da BBC

01/12/2020 12h22

Um dos maiores mistérios da biologia foi resolvido usando inteligência artificial, anunciaram especialistas.

Prever como uma proteína adquire uma forma tridimensional única intrigou os cientistas por meio século. Agora, o laboratório de inteligência artificial DeepMind, que pertence ao Google e tem sede em Londres, resolveu o problema, dizem os organizadores de um desafio científico.

Uma melhor compreensão das formas das proteínas pode desempenhar um papel fundamental no desenvolvimento de novos medicamentos para o tratamento de doenças.

Espera-se que esse avanço acelere pesquisas sobre uma série de doenças, incluindo a covid-19.

O programa determinou a forma das proteínas em um nível de precisão comparável a métodos de laboratório caros e demorados, segundo o anúncio.

Andriy Kryshtafovych, da Universidade da Califórnia em Davis, nos Estados Unidos, é um dos jurados científicos e descreveu o feito como "verdadeiramente notável".

"Ser capaz de investigar a forma das proteínas com rapidez e precisão tem o potencial de revolucionar as ciências da vida", disse ele.

O que são proteínas?

As proteínas estão presentes em todos os seres vivos, onde desempenham um papel central nos processos químicos essenciais para a vida.

Compostos por cadeias de aminoácidos, eles se dobram em um número infinito de maneiras em formas elaboradas que contêm a chave sobre como realizam suas funções vitais.

Muitas doenças estão ligadas ao papel das proteínas na catalisação de reações químicas (enzimas), no combate a doenças (anticorpos) ou na atuação como mensageiros químicos (hormônios como a insulina).

"Mesmo pequenos rearranjos dessas moléculas vitais podem ter efeitos catastróficos em nossa saúde, então uma das maneiras mais eficientes de entender a doença e encontrar novos tratamentos é estudar as proteínas envolvidas", disse John Moult, da Universidade de Maryland, EUA.

"Existem dezenas de milhares de proteínas humanas e muitos bilhões em outras espécies, incluindo bactérias e vírus, mas descobrir a forma de apenas uma requer equipamentos caros e pode levar anos".

Como foi o desafio científico?

Em 1972, Christian Anfinsen recebeu o Prêmio Nobel por seu trabalho mostrando que deveria ser possível determinar a forma das proteínas com base na sequência de seus blocos de aminoácidos.

A cada dois anos, dezenas de equipes de mais de 20 países tentam cegamente prever, usando computadores, a forma de um conjunto de cerca de 100 proteínas a partir de suas sequências de aminoácidos.

Ao mesmo tempo, as estruturas 3D são trabalhadas em laboratório por biólogos usando técnicas tradicionais como cristalografia de raios-X e espectroscopia por ressonância magnética nuclear (também chamada de espectroscopia por RMN), que determinam a localização de cada átomo em relação a outro na molécula de proteína.

Uma equipe de cientistas do Casp (experimento comunitário sobre a avaliação crítica de técnicas para predição de estrutura de proteínas) compara essas previsões com as estruturas 3D encontradas usando os métodos experimentais.

O Casp usa uma métrica conhecida como teste de distância global para avaliar a precisão, variando de 0 a 100. Uma pontuação de cerca de 90, que o programa AlphaFold da DeepMind alcançou, é considerada comparável às técnicas de laboratório.

O que aconteceu este ano?

Na última rodada do desafio Casp-14, o AlphaFold determinou a forma de cerca de dois terços das proteínas com precisão comparável a experimentos de laboratório.

Os avaliadores disseram que a precisão com a maioria das outras proteínas também era alta, embora não tenham chegado a esse nível.

AlphaFold é baseado em um conceito denominado aprendizado profundo. Nesse processo, a estrutura de uma proteína dobrada é representada como um gráfico espacial.

O programa então "aprende" usando informações sobre as formas 3D de proteínas conhecidas mantidas no Banco de Dados Público de Proteínas.

O programa de Inteligência Artificial foi capaz de fazer em questão de dias o que poderia levar anos em uma bancada de laboratório.

Como essa informação será usada?

Conhecer a estrutura 3D de uma proteína é importante na fabricação de medicamentos e na compreensão de doenças humanas, incluindo câncer, demência e doenças infecciosas.

cientistas-brasileiros-sequenciaram - CDC - CDC
O vírus que causa a covid-19 tem proteínas spike (ou 'de pico'), representadas em vermelho
Imagem: CDC

Um exemplo é a covid-19, em que os cientistas estudam como a proteína spike (ou "de pico") na superfície do vírus Sars-CoV-2 interage com os receptores nas células humanas.

O professor Andrew Martin, da University College London (UCL), ex-participante e assessor do Casp, disse à BBC News: "Entender como uma sequência de proteína se dobra em três dimensões é realmente uma das questões fundamentais da biologia. Toda a maneira como uma proteína funciona depende de sua estrutura tridimensional e a função da proteína é relevante para tudo na saúde e na doença".

"Conhecendo as estruturas tridimensionais das proteínas, podemos ajudar a projetar medicamentos e intervir em problemas de saúde, sejam infecções ou doenças hereditárias."

A professora Dame Janet Thornton, do Instituto Europeu de Bioinformática da EMBL no Reino Unido, disse que a forma como as proteínas se dobram para criar "estruturas tridimensionais extraordinariamente exclusivas" é um dos maiores mistérios da biologia.

"Uma melhor compreensão das estruturas das proteínas e a capacidade de prevê-las usando um computador significa uma melhor compreensão da vida, da evolução e, claro, da saúde e das doenças humanas", explicou ela.

O que acontece agora?

Outros cientistas vão querer olhar os dados para determinar o quão preciso é o método de Inteligência Artificial e quão bem ele funciona em um nível muito detalhado.

Ainda há uma lacuna de conhecimento, incluindo descobrir como várias proteínas se encaixam e como as proteínas interagem com outras moléculas, como DNA e RNA.

"Agora que o problema foi amplamente resolvido para proteínas individuais, o caminho está aberto para o desenvolvimento de novos métodos para determinar a forma de complexos de proteínas — coleções de proteínas que trabalham juntas para formar grande parte da maquinaria da vida e para outras aplicações", disse Kryshtafovych.