Nova IA do Google transforma textos e imagens em vídeos realistas
O Google descreve o Lumiere como um modelo de difusão de texto para vídeo projetado para sintetizar vídeos que retratam movimentos realistas, diversos e coerentes.
O Google anunciou na última semana sua nova ferramenta de inteligência artificial para geração de vídeos: o Lumiere. A ideia é que o Lumiere possa transformar qualquer texto ou imagem em vídeos elaborados e realistas, um grande desafio para a geração de vídeos por IA.
A ferramenta do Google, desenvolvida em parceria com o Instituto Weizmann, a Universidade de Tel-Aviv e o Instituto de Tecnologia de Israel Technion, usa um modelo de difusão no espaço-tempo conhecido como Space-Time U-Net, que gera todos os quadros da duração temporal do vídeo de uma só vez, diferente de outras ferramentas pré-existentes que geram quadros-chave distantes entre si que depois são conectados.
Esse modelo permite que os vídeos criados pelo Lumiere sejam mais realistas, com movimentos diversos e coerentes, mesmo que em baixa resolução.
Além da geração de vídeos com base em texto, a inteligência artificial do Google também permite que imagens se tornem vídeo, ou que seja possível copiar um estilo de desenho específico.
No artigo publicado junto ao lançamento do Lumiere, no entanto, o próprio Google reconhece que a ferramenta de geração de vídeos realistas pode ser utilizada de forma indevida, para criar conteúdo deliberadamente falso ou enganoso, ou prejudicial de alguma maneira.
Conforme as ferramentas de IA se aperfeiçoam, também se tornam mais desafiadores os problemas como os “deepfakes”, vídeos falsos porém extremamente realistas que podem ser usados para espalhar desinformação.
Todos estes desafios devem ser contemplados por qualquer empresa de tecnologia que passe a oferecer ferramentas de IA para gerar imagens.
Por enquanto, o Lumiere ainda não está disponível para o público geral.