Inteligência artificial de arte digital é usada para criar modelos de proteínas humanas

Inspirados por geradores de arte digital como o DALL-E, os biólogos estão construindo inteligências artificiais que podem combater o câncer, a gripe e a Covid

PUBLICIDADE

Por Cade Metz

THE NEW YORK TIMES - LIFE/STYLE - Na primavera (do hemisfério norte) passada, um laboratório de inteligência artificial chamado OpenAI revelou uma tecnologia que permite criar imagens digitais simplesmente descrevendo o que você deseja ver. Chamado DALL-E, ele gerou uma onda de ferramentas semelhantes com nomes como Midjourney e Stable Diffusion. Prometendo acelerar o trabalho dos artistas digitais, esta nova geração de IA capturou a imaginação do público e dos especialistas - e ameaçou gerar novos níveis de desinformação online.

As redes sociais agora estão repletas de coisas conceituais, nas quais imagens surpreendentemente detalhadas e muitas vezes fotorrealistas são geradas pelo DALL-E e outras ferramentas. “Foto de um ursinho de pelúcia andando de skate na Times Square.” “Um corgi fofo em uma casa feita de sushi.” “Jeflon Zuckergates.”

Um exemplo de um modelo de proteína gerada por IA. Foto: Ian C. Haydon/University of Washington Institute for Protein Design

PUBLICIDADE

Mas quando alguns cientistas consideram essa tecnologia, eles veem mais do que apenas uma maneira de criar fotos falsas. Eles veem um caminho para um novo tratamento contra o câncer ou uma nova vacina contra a gripe ou uma nova pílula que ajuda a digerir o glúten.

Usando muitas das mesmas técnicas que sustentam o DALL-E e outros geradores de arte, esses cientistas estão gerando modelos para novas proteínas - minúsculos mecanismos biológicos que podem mudar a maneira como nossos corpos se comportam.

Publicidade

Nossos corpos produzem naturalmente cerca de 20.000 proteínas, que lidam com tudo, desde a digestão de alimentos até a movimentação de oxigênio pela corrente sanguínea. Agora, os pesquisadores estão trabalhando para criar proteínas que não são encontradas na natureza, na esperança de melhorar nossa capacidade de combater doenças e fazer coisas que nosso corpo não consegue sozinho.

David Baker, diretor do Institute for Protein Design da Universidade de Washington, trabalha na construção de proteínas artesanais há mais de 30 anos. Em 2017, ele e sua equipe mostraram que isso era possível. Mas eles não previram como o surgimento de novas tecnologias de IA aceleraria repentinamente esse trabalho, diminuindo o tempo necessário para gerar novos modelos de anos para semanas.

“O que precisamos são novas proteínas que possam resolver problemas modernos, como câncer e pandemias virais”, disse Baker. “Mal podemos esperar por essa evolução.” Ele acrescentou: “Agora, podemos projetar essas proteínas muito mais rapidamente e com taxas de sucesso muito mais altas e criar moléculas muito mais sofisticadas que podem ajudar a resolver esses problemas”.

No ano passado, Baker e seus colegas pesquisadores publicaram dois artigos na revista Science descrevendo como várias técnicas de IA poderiam acelerar o design de proteínas. Mas esses artigos já foram ofuscados por um mais recente, que se baseia nas técnicas que impulsionam ferramentas como o DALL-E, mostrando como novas proteínas podem ser geradas do zero, como fotos digitais.

Publicidade

“Uma das coisas mais poderosas sobre essa tecnologia é que, como o DALL-E, ele faz o que você manda”, disse Nate Bennett, um dos pesquisadores que trabalha no laboratório da Universidade de Washington. “A partir de um único comando, ele pode gerar um número infinito de designs.”

Para gerar imagens, o DALL-E conta com o que os pesquisadores de IA chamam de rede neural, um sistema matemático vagamente modelado na rede de neurônios do cérebro. Essa é a mesma tecnologia que reconhece os comandos que você dá ao seu smartphone, permite que carros autônomos identifiquem (e evitem) pedestres e traduz idiomas em serviços como o Skype.

Uma rede neural aprende habilidades analisando grandes quantidades de dados digitais. Ao identificar padrões em milhares de fotos de corgi, por exemplo, ele pode aprender a reconhecer um corgi. Com o DALL-E, os pesquisadores construíram uma rede neural que procurava padrões enquanto analisava milhões de imagens digitais e as legendas de texto que descreviam o que cada uma dessas imagens representava. Dessa forma, ela aprendeu a reconhecer os vínculos entre as imagens e as palavras.

Namrata Anand, ex-pesquisador da Universidade de Stanford. Ela agora está construindo uma empresa em design de proteína gerada por AI. Foto: Herve Philippe/TerrificShot Photography

Quando você descreve uma imagem para o DALL-E, uma rede neural gera um conjunto de características principais que essa imagem pode incluir. Uma característica pode ser a curva da orelha de um ursinho de pelúcia. Outra pode ser a linha na borda de um skate. Em seguida, uma segunda rede neural - chamada de modelo de difusão - gera os pixels necessários para realizar essas características.

Publicidade

PUBLICIDADE

O modelo de difusão é treinado em uma série de imagens em que o ruído - imperfeição - é gradualmente adicionado a uma fotografia até que ela se torne um mar de pixels aleatórios. Ao analisar essas imagens, o modelo aprende a executar esse processo ao contrário. Quando você o alimenta com pixels aleatórios, ele remove o ruído, transformando esses pixels em uma imagem coerente.

Na Universidade de Washington, em outros laboratórios acadêmicos e em novas startups, os pesquisadores estão usando técnicas semelhantes em seus esforços para criar novas proteínas.

As proteínas começam como cadeias de compostos químicos, que então se torcem e se dobram em formas tridimensionais que definem como elas se comportam. Nos últimos anos, laboratórios de IA como o DeepMind, de propriedade da Alphabet, a mesma matriz do Google, mostraram que as redes neurais podem adivinhar com precisão a forma tridimensional de qualquer proteína no corpo com base apenas nos compostos menores que ela contém - um enorme avanço científico.

Agora, pesquisadores como Baker estão dando outro passo, usando esses sistemas para gerar modelos para proteínas inteiramente novas que não existem na natureza. O objetivo é criar proteínas que assumem formas muito específicas; uma forma específica pode servir a uma tarefa específica, como combater o vírus que causa a covid-19.

Publicidade

Em alta
Loading...Loading...
Loading...Loading...
Loading...Loading...

Assim como o DALL-E aproveita a relação entre legendas e fotografias, sistemas semelhantes podem aproveitar a relação entre uma descrição do que a proteína pode fazer e a forma que ela adota. Os pesquisadores podem fornecer um esboço aproximado da proteína que desejam e, em seguida, um modelo de difusão pode gerar sua forma tridimensional.

A diferença é que o olho humano pode julgar instantaneamente a fidelidade de uma imagem DALL-E. Não pode fazer o mesmo com uma estrutura de proteína. Depois que as tecnologias de IA produzem esses modelos de proteínas, os cientistas ainda devem levá-los a um laboratório experimental - onde experimentos podem ser feitos com compostos químicos reais - e garantir que eles façam o que devem fazer.

Por esta razão, alguns especialistas dizem que as mais recentes tecnologias de IA devem ser usadas com cautela. “Criar uma nova estrutura é apenas um jogo”, disse Frances Arnold, ganhadora do Prêmio Nobel e professora especializada em engenharia de proteínas no Instituto de Tecnologia da Califórnia. “O que realmente importa é: o que essa estrutura pode realmente fazer?”

Mas para muitos pesquisadores, essas novas técnicas não estão apenas acelerando a criação de novas proteínas candidatas ao laboratório experimental. Elas fornecem uma maneira de explorar novas inovações que os pesquisadores não poderiam investigar anteriormente por conta própria. /TRADUÇÃO LÍVIA BUELONI GONÇALVES

Publicidade

The New York Times Licensing Group - Todos os direitos reservados. É proibido todo tipo de reprodução sem autorização por escrito do The New York Times

Comentários

Os comentários são exclusivos para assinantes do Estadão.