A Inteligência Artificial na resolução de um dos maiores mistérios da biologia: conheça o AlphaFold 2

Conheça o AlphaFold 2: a ferramenta de Inteligência Artificial do Google que solucionou um mistério da biologia de 5 décadas.

Devido às diversas funções que desempenham nos organismos vivos, as proteínas são, sem dúvidas, as moléculas mais importantes e versáteis da natureza. 

São as estruturas tridimensionais dessas proteínas, ou melhor, a forma como essas estruturas se enrolam ou enovelam que determinam quais funções específicas cada proteína irá desempenhar.

Como predizer, a partir de uma sequência de aminoácidos, a forma que uma proteína irá adotar, tornando-a capaz de ter papel fundamental em um processo vital para um ser vivo? 

Essa questão foi, durante 5 décadas, um dos maiores mistérios da biologia. E graças a uma ferramenta desenvolvida por meio de Inteligência Artificial (IA), chamada AlphaFold 2, esse mistério foi resolvido. E o melhor de tudo: disponível a apenas um “OK Google” de distância.

O incrível mundo das proteínas

Proteínas são macromoléculas orgânicas presentes em todos os seres vivos, compostas por longas cadeias de aminoácidos e capazes de adotar as mais diversas formas. 

O modo como essas proteínas se comportam na natureza é a chave para a resposta do porquê cada proteína adota formas específicas e, principalmente, explica a função associada a cada uma dessas formas.

Enovelamento de proteínas
Proteínas se enovelam a partir de sequências de aminoácidos e interagem entre si para desempenhar funções vitais nos seres vivos. Fonte: Adaptado de DeepMind (2020). #PraTodosVerem: Sequência de ilustrações mostrando as etapas do enovelamento de proteínas. Primeira ilustração: cadeia de aminoácidos representados em pequenos círculos unidos entre si, detalhes em lilás. Segunda ilustração: estrutura da alfa-hélice, semelhante a uma serpentina e estrutura da folha pregueada, semelhante a duas tiras de papel dobrado várias vezes, unidas entre si. Ambas estruturas em lilás. Terceira ilustração: alfa-hélice e folha pregueada se unindo para formar a estrutura tridimensional da proteína, ilustração semelhante a uma cobra na cor verde claro. Quarta e última ilustração: representação simples de uma proteína já enovelada, com uma estrutura em verde claro e outra em vermelho.

Proteínas, quando se enovelam da forma correta, são fundamentais em diferentes processos vitais, como a produção da insulina, o hormônio responsável por controlar os níveis de açúcar no sangue. Outros exemplos incluem o transporte de oxigênio ou até mesmo a sinalização de moléculas do nosso sistema imune.

No entanto, quando ocorre o mau enovelamento de proteínas, pode haver o surgimento de doenças, tais como, o mal de Parkinson ou o diabetes tipo II.

  O enovelamento das proteínas ocorre espontaneamente na natureza e em apenas algumas frações de segundos. Apesar de ser um processo tão rápido quanto um piscar de olhos, esse mecanismo foi um mistério que intrigou pesquisadores por cerca de 50 anos.

Um mistério de 50 anos

De acordo com o biólogo molecular Cyrus Levinthal, cujas notáveis contribuições incluem a elucidação da relação direta entre genes e sequências de aminoácidos codificadas por eles, levaríamos o equivalente à “idade do universo” para conseguirmos calcular todas as formas possíveis que as proteínas podem adotar.

Cyrus Levinthal
Cyrus Levinthal, na Universidade de Columbia, em 1980. Fonte: National Academy of Sciences, 2014.
#PraTodosVerem: fotografia em preto e branco do pesquisador Cyrus Levinthal, em que ele aparece sorrindo, próximo a uma lousa apontando com o giz para um esquema desenhado por ele.

No conhecido “Paradoxo de Levinthal”, que consiste em um experimento mental somado a equações matemáticas postuladas por esse biólogo molecular, as possíveis conformações adotadas pelas proteínas são tantas que resultam em um número astronômico de possibilidades.

É humanamente impossível lidarmos com números astronomicamente grandes. Dessa forma, só há uma maneira possível de lidar com algo que a nossa inteligência não pode alcançar: o uso de Inteligência Artificial.

A Inteligência Artificial a favor da Biologia: conheça o AlphaFold 2

Em 2018, o projeto AlphaFold 1, da empresa Google DeepMind, foi o grande vencedor da 13ª CASP (Avaliação Crítica de Técnicas para Predição de Estrutura de Proteínas). 

No entanto, após perceber que o AlphaFold 1 apresentava a tendência em preferir a modelagem de estruturas tridimensionais em que predominavam estruturas secundárias (alfa-hélices e folhas-beta), a equipe da DeepMind retornou ao desafio científico CASP, em 2020, com o projeto AlphaFold 2.

Mas afinal, como foi desenvolvido o AlphaFold 2? A resposta está nas chamadas Redes Neurais Artificiais.

As Redes Neurais Artificiais consistem em uma metodologia de Deep Learning, conhecidas pela elevada capacidade de aprendizado e reconhecimento de  padrões.

Os pesquisadores da DeepMind treinaram uma Rede Neural para reconhecer as propriedades de cada proteína, apenas através da leitura da sequência de aminoácidos.

Os métodos que até então eram utilizados para a modelagem da estrutura de proteínas são capazes apenas de prever se cada par de aminoácidos de uma proteína se encontram próximos um ao outro, ou não.

As Redes Neurais do AlphaFold 2 foram treinadas para conseguir estimar todas as distâncias e os ângulos possíveis entre cada par de aminoácidos, assim como todas as distâncias possíveis entre pares de resíduos de uma proteína.

Esquema representativo do funcionamento do AlphaFold 2
Esquema representativo do funcionamento do AlphaFold 2. Fonte: adaptado de DeepMind (2020). #PraTodosVerem: esquema em forma de fluxograma contendo as etapas que envolvem o funcionamento do AlphaFold 2: Ícone 1: barra em azul contendo uma sequência de proteínas; ícone 2: ícone redondo, em azul, com ilustração representando uma lista, com a escrita “Bancos de Dados” embaixo; ícone 3: ícone redondo, em azul, contendo ilustração em forma de rede e embaixo a escrita “Rede Neural”; ícones 4 e 5: o ícone 3 contém uma seta que aponta para os ícones 4 e 5: o ícone 4 apresenta um pequeno quadrado contendo um gráfico com detalhes em azul marinho e verde limão contendo embaixo a escrita “Predição de Distâncias”; o ícone 5 contém um pequeno quadrado contendo um gráfico em 3D, com fundo em cinza claro e os detalhes dos picos do gráfico em vermelho e a base em azul, contendo embaixo a escrita “Predição de ângulos”; ícone 6: os ícones 4 e 5 contêm uma seta que aponta para o ícone 6, que contém um círculo em azul, com a ilustração de um gráfico em curva, mostrando os eixos x e y, contendo embaixo a escrita “Pontuação”; ícone 7: a última etapa contém um ícone quadrado, com o fundo preto, mostrando a estrutura de uma proteína enovelada, sendo uma das cadeias em azul escuro e a outra em verde limão. Abaixo do ícone se encontra e escrita “Estrutura”.

O AlphaFold 2, com o material contido em bancos de dados, tais como o UniProt, e as propriedades medidas pela Rede Neural (as distâncias e ângulos entre pares de aminoácidos ou pares de resíduos), devolve ao usuário a pontuação (ou score) que vai dizer se o resultado foi preciso, ou seja, o quão boa foi a predição da estrutura proteica pela Rede Neural.

E, o mais importante, o AlphaFold 2 modela a estrutura tridimensional da proteína  de forma quase tão rápida e precisa quanto ocorre na natureza.

A ferramenta é gratuita, de fácil utilização e está disponível aos usuários no site oficial do AlphaFold 2.

Por que essa descoberta é tão importante? Quais serão os próximos passos?

O conhecimento da estrutura tridimensional de proteínas é imprescindível na compreensão sobre algumas  doenças e, consequentemente, na descoberta de medicamentos que possibilitem o tratamento dessas doenças.

O AlphaFold 2 atua como uma forma de rápida compreensão dessas estruturas que será, sem dúvidas, um grande aliado no estudo de proteínas como as do SARS-CoV-2.

Os próximos passos, segundo os pesquisadores da DeepMind, incluem o estudo da interação entre proteínas e outras moléculas fundamentais aos seres vivos, incluindo as moléculas de DNA e RNA.

Texto revisado por Darling Lourenço e Elaine Latocheski

Cite este artigo:
GODOY, B. R. B. A Inteligência Artificial na resolução de um dos maiores mistérios da biologia: conheça o AlphaFold 2. Revista Blog do Profissão Biotec. V. 10, 2023. Disponível em: <>. Acesso em: dd/mm/aaaa.

Referências

Cyrus Levinthal. National Academy of Sciences. Disponível em: http://www.nasonline.org/publications/biographical-memoirs/memoir-pdfs/levinthal-cyrus.pdf.  Acesso em: 19 de agosto de 2021.
GUIDOTTI, I. L. Estrutura de Proteínas e doenças causadas pelo seu mau enovelamento. Blog do Profissão Biotec, v.8, 2021. DIsponível em: < Estrutura de Proteínas e doenças causadas pelo seu mau enovelamento – Profissão Biotec> Acesso em: 28 de agosto de 2021
GODOI CONTESSOTO, Vinícius de et al. Introdução ao problema de enovelamento de proteínas: uma abordagem utilizando modelos computacionais simplificados. Revista Brasileira de Ensino de Física, v. 40, 2018.
IPEA. Inteligência Artificial e Redes Neurais.  Disponível em: https://www.ipea.gov.br/cts/pt/central-de-conteudo/artigos/artigos/106-inteligencia-artificial-e-redes-neurais. Acesso em: 30 de agosto de 2021.
JUMPER, John et al. Highly accurate protein structure prediction with AlphaFold. Nature, v. 596, n. 7873, p. 583-589, 2021.
NATURE. ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures.  Disponível em: https://www.nature.com/articles/d41586-020-03348-4. Acesso em: 28 de agosto de 2021.
SAS. Deep Learning. O que é e qual a sua importância?  Disponível em: https://www.sas.com/pt_br/insights/analytics/deep-learning.html. Acesso em: 30 de agosto de 2021.
SENIOR, Anderw et al. AlphaFold: Using AI for scientific discovery. [2018]. Disponível em: https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery. Acesso em: 20 de agosto de 2021.
TEAM, AlphaFold. AlphaFold: A Solution to a 50-year-old grand challenge in biology. DeepMind, November, v. 30, 2020.
Fonte da imagem destacada: Nature.

Sobre Nós

O Profissão Biotec é um coletivo de pessoas com um só propósito: apresentar o profissional de biotecnologia ao mundo. Somos formados por profissionais e estudantes voluntários atuantes nos diferentes ramos da biotecnologia em todos os cantos do Brasil e até mesmo espalhados pelo mundo.

Recentes

Assine nossa newsletter

Ao clicar no botão, você está aceitando receber nossas comunicações. 

X