Deepfake permite adicionar falas a pessoas em vídeos pela digitação

Em mais uma notícia que mostra o potencial assustador dos deepfakes, as ferramentas de inteligência artificial que criam composições artificiais que alteram vídeos em diversas formas, um novo modelo da tecnologia permite que você atribua afirmações a personagens de qualquer vídeo, nunca de fato feitas por eles, apenas por digitação simples.

Um grupo de cientistas da Universidade de Stanford conseguiu criar a tal ferramenta em parceria com o Adobe Research, nomeando-a Text-based Editing of Talking-head Video (“Edição baseada em texto para cabeça falante em vídeo”, na tradução livre). Segundo a descrição da pesquisa, a tecnologia permite “editar um vídeo com uma cabeça falante baseado na sua transcrição a fim de produzir um vídeo onde o diálogo da porta-voz foi modificado”.

Um vídeo demonstrativo do material foi publicado no YouTube, demonstrando o processo de criação que levou ao resultado final. Nele, várias pessoas reais foram filmadas falando diversas frases. Em seguida, uma parte das frases é alterada. Por exemplo, “Eu amo o cheiro de napalm pela manhã” (uma frase clássica do filme Apocalypse Now) virou “Eu amo o cheiro de torradas francesas pela manhã”.

O ponto-chave aqui é que a frase modificada aparece, no vídeo, sendo dita pela mesma pessoa, em um formato bem convincente. Veja você mesmo:

Segundo matéria sobre a tecnologia veiculada pelo Mashable, “fazer essa ferramenta funcionar desta forma tão simples requer técnicas que automaticamente denotem um vídeo com uma cabeça falante com ‘fonemas, visemas, posicionamento de rostos em 3D e geometria, reflexos, expressões faciais e iluminação de cenário quadro por quadro’”. Quando essa transcrição é alterada, o algoritmo criado pelos pesquisadores “costura” os elementos de volta, ao passo que a parte de baixo do rosto da pessoa no vídeo é renderizada para se adequar ao novo texto.

Claro, há limitações: a ferramenta, ao menos por enquanto, só funciona em vídeos com foco na cabeça de um personagem, em posicionamento frontal de câmera. Então não será hoje que aquele escândalo político será desmascarado como um deepfake. Ainda assim, dada a proeminência do tema (em especial, seu início na discussão mainstream), é sempre bom mantermos os olhos abertos para até onde algoritmos de inteligência artificial podem nos levar.

Fonte: Canal Tech

Compartilhe