Ícone do site GuiadoCFTV

IA vai permitir editar imagens usando apenas a função “clique e arraste”

Listen to this article

Uma inteligência artificial em desenvolvimento vai permitir a manipulação de imagens apenas ao clicar e arrastar elementos. A ideia lançar usar uma tecnologia capaz de entender o que a pessoa deseja fazer para otimizar a edição.

O modelo é chamado Drag Your Gan, ou apenas DragGAN, e combina o melhor das IAs generativas de imagens com um sistema de arrastar e soltar. A interface até lembra os apps de edição tradicionais, mas o funcionamento é totalmente diferente.

Em vez de trabalhar um pixel individualmente como ocorre hoje, o modelo cria um conjunto com semelhanças entre si para apresentar o resultado. Isso significa que a tecnologia consegue identificar um sorriso e movimentar todos os pixels da boca ao mesmo tempo.

Como funciona o DragGAN?

A IA transforma imagens chapadas na tela em modelos 3D para modificar a foto em diferentes tamanhos, formatos e estilos. Em um dos vídeos, é possível notar um ajuste no reflexo de montanhas em um lago em poucos segundos, o que seria extremamente trabalhoso se feito na mão.

Há várias tecnologias capazes de gerar imagens realistas ou artes únicas, mas todas carecem de precisão. As Generative Adversarial Networks (GAN), classe de IA que trabalha com geração de conteúdo que pode enganar os humanos, são ótimas para criar algo do zero, mas pecam por nem sempre exibir o que você deseja.

No caso do DragGAN, é como se você conseguisse otimizar o processo para gerar uma imagem ideal. Além de descrever o que precisa, você pode editar tudo antes de concluir o trabalho.

Imagine que o DALL-E ou Midjourney criou a imagem de um cachorro shih-tzu preto com a cabeça para frente, mas você queria que estivesse de lado. A promessa do modelo é fazer esse giro de maneira rápida, gradual e realista.

O que pode ser feito com o DragGAN?

Os vídeos dão uma boa demonstração das possibilidades. É possível alterar o tamanho de um carro, mudar um sorriso para uma expressão fechada, virar a cabeça de um leão e muitas outras coisas. A interface ainda é meio assustadora e um tanto técnica, mas pode ser ajustada em uma versão final.

Claro que tudo ainda está em fase de demonstração, então ninguém ainda testou a tecnologia efetivamente. Mesmo assim, é interessante ver uma das incríveis possibilidades que as IAs generativas podem alcançar.

A IA está em desenvolvimento por pesquisadores do Max Planck Institute e Saarbrücken Research Center, ambos da Alemanha, e do Massachusetts Institute of Technology (MIT) e Universidade da Pensilvânia, dos Estados Unidos. O site oficial (mpi-inf.mpg.de) tem mais vídeos e ainda oferece o estudo completo com mais detalhes sobre o funcionamento.

O projeto ainda está na fase de estudos e não há previsão de quando a modelagem será lançada. Para o usuário, fica a expectativa de algo tão incrível quanto chegar ao mercado para democratizar a edição de imagens.

 

 

 

 

 

João Marcelo de Assis Peres

joao.marcelo@guiadocftv.com.br

GuiadoCFTV

Avalie esta notícia, mande seus comentários e sugestões. Encontrou alguma informação incorreta ou algum erro no texto?

Importante: ‘Todos os Conteúdos divulgados decorrem de informações provenientes das fontes aqui indicadas, jamais caberá ao Guia do CFTV qualquer responsabilidade pelo seu conteúdo, veracidade e exatidão. Tudo que é divulgado é de exclusiva responsabilidade do autor e ou fonte redatora.’

Quer enviar suas notícias? Envie um e-mail para noticias@guiadocftv.com.br

Sair da versão mobile