NVIDIA e Evozyne criam modelo de IA generativa para proteínas

Listen to this article

Os cientistas usam o NVIDIA BioNeMo para grandes modelos de linguagem que geram proteínas de alta qualidade que podem acelerar o design de medicamentos e ajudar a criar um ambiente mais sustentável.

Usando um modelo de IA pré -treinado da NVIDIA, a startup Evozyne criou duas proteínas com potencial significativo em saúde e energia limpa.

Um documento conjunto divulgado hoje descreve o processo e os blocos de construção biológicos que ele produziu. Um visa curar uma doença congênita, outro é projetado para consumir dióxido de carbono para reduzir o aquecimento global.

Os resultados iniciais mostram uma nova maneira de acelerar a descoberta de medicamentos e muito mais.

“É realmente encorajador que, mesmo nesta primeira rodada, o modelo de IA tenha produzido proteínas sintéticas tão boas quanto as naturais”, disse Andrew Ferguson, cofundador da Evozyne e coautor do artigo. “Isso nos diz que aprendeu as regras de design da natureza corretamente.”

Um modelo de IA transformacional

Evozyne usou a implementação do ProtT5 da NVIDIA, um modelo de transformador que faz parte do NVIDIA BioNeMo , uma estrutura de software e serviço para criar modelos de IA para assistência médica.

“O BioNeMo realmente nos deu tudo o que precisávamos para dar suporte ao treinamento de modelos e, em seguida, executar trabalhos com o modelo de forma muito barata – poderíamos gerar milhões de sequências em apenas alguns segundos”, disse Ferguson, engenheiro molecular que trabalha na interseção de química e aprendizado de máquina. .

O modelo está no centro do processo de Evovyne chamado ProT-VAE. É um fluxo de trabalho que combina o BioNeMo com um autoencoder variacional que atua como um filtro.

“Usar modelos de linguagem grandes combinados com autoencoders variacionais para projetar proteínas não estava no radar de ninguém há alguns anos”, disse ele.

Modelo aprende os caminhos da natureza

Como um estudante lendo um livro, o modelo transformador da NVIDIA lê sequências de aminoácidos em milhões de proteínas. Usando as mesmas técnicas que as redes neurais empregam para entender o texto, ele aprendeu como a natureza monta esses poderosos blocos de construção da biologia.

O modelo então previu como montar novas proteínas adequadas para as funções que Evozyne deseja abordar.

“A tecnologia está nos permitindo fazer coisas que eram sonhos 10 anos atrás”, disse ele.

Um Mar de Possibilidades

O aprendizado de máquina ajuda a navegar pelo número astronômico de possíveis sequências de proteínas e identifica com eficiência as mais úteis.

O método tradicional de engenharia de proteínas, chamado de evolução dirigida, usa uma abordagem lenta de acertar ou errar. Normalmente, altera apenas alguns aminoácidos em sequência de cada vez.

Em contraste, a abordagem de Evozyne pode alterar metade ou mais dos aminoácidos em uma proteína em uma única rodada. Isso é o equivalente a fazer centenas de mutações.

“Estamos dando saltos enormes que nos permitem explorar proteínas nunca antes vistas e com funções novas e úteis”, disse.

Usando o novo processo, a Evozyne planeja construir uma gama de proteínas para combater doenças e mudanças climáticas.

Reduzindo o tempo de treinamento, dimensionando modelos

“A NVIDIA tem sido uma parceira incrível neste trabalho”, disse ele.

“Eles dimensionaram trabalhos para várias GPUs para acelerar o treinamento”, disse Joshua Moller, cientista de dados da Evozyne. “Estávamos analisando conjuntos de dados inteiros a cada minuto.”

Isso reduziu o tempo de treinamento de grandes modelos de IA de meses para uma semana. “Isso nos permitiu treinar modelos – alguns com bilhões de parâmetros treináveis ​​– que simplesmente não seriam possíveis de outra forma”, disse Ferguson.

Muito mais por vir

O horizonte para a engenharia de proteínas acelerada por IA é amplo.

“O campo está se movendo incrivelmente rápido e estou realmente animado para ver o que vem a seguir”, disse ele, observando o recente surgimento de modelos de difusão.

“Quem sabe onde estaremos daqui a cinco anos.”

origem: https://blogs.nvidia.com/blog/2023/01/12/generative-ai-proteins-evozyne/

Sirlei Madruga de Oliveira

Editora do Guia do CFTV

 sirlei@guiadocftv.com.br

Avalie esta notícia, mande seus comentários e sugestões. Encontrou alguma informação incorreta ou algum erro no texto?

Importante: ‘Todos os Conteúdos divulgados decorrem de informações provenientes das fontes aqui indicadas, jamais caberá ao Guia do CFTV qualquer responsabilidade pelo seu conteúdo, veracidade e exatidão. Tudo que é divulgado é de exclusiva responsabilidade do autor e ou fonte redatora.’

Quer enviar suas notícias? Envie um e-mail para noticias@guiadocftv.com.br

Sirlei Madruga

Sirlei Maria Guia do CFTV

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.