Alibaba AI revelou uma tecnologia inovadora chamada EMO (abreviação de “Emote Portrait Alive”) que tem o poder de transformar retratos estáticos em vídeos animados realistas.

Prepare-se, porque a IA está mudando a forma como pensamos sobre o vídeo! Empresas como OpenAI e Alibaba estão nos surpreendendo com novas ferramentas. Lembra do Sora da OpenAI? Poderia criar personagens de vídeo de corpo inteiro apenas a partir de texto. Agora, o Alibaba tem algo chamado EMO (“Emote Portrait Alive”) que pode pegar qualquer retrato antigo e torná-lo vivo.

É um grande negócio, especialmente se você adora fazer vídeos ou é fascinado por IA. Vamos ver como o EMO funciona e que coisas malucas você pode fazer com ele.

Alibaba AI EMO Emote Retrato Vivo
Alibaba AI desenvolveu um sistema chamado EMO que transforma retratos estáticos em vídeos animados (Crédito da imagem)

O que é Alibaba AI EMO (Emote Portrait Alive)?

EMO é um sistema avançado de IA desenvolvido pela Alibaba que pode gerar vídeos realistas de fala e canto a partir de uma única imagem estática. Ele utiliza geração de vídeo falante acionada por áudio para criar animações incrivelmente realistas.

Vamos detalhar como funciona o EMO:

  • Entrada de imagem única: A magia do EMO começa com uma única foto de retrato. Pode ser uma figura histórica, um personagem fictício ou até mesmo uma foto sua
  • Entrada de áudio: Para animar o retrato, o EMO requer uma entrada de áudio, seja fala ou canto
  • Magia de IA: Os sofisticados algoritmos de IA do EMO analisam a imagem e o áudio, gerando expressões faciais, formatos de boca e movimentos de cabeça precisos que sincronizam perfeitamente com o áudio fornecido

Alibaba AI EMO se destaca por sua capacidade de produzir animações incrivelmente realistas. Os vídeos que ele gera muitas vezes são indistinguíveis das imagens reais, confundindo os limites entre o conteúdo alimentado por IA e a realidade. Este nível de realismo é um grande avanço na tecnologia de animação baseada em IA.

Além dos movimentos realistas, o EMO lida com áudio cantado e falado com facilidade. Quer você forneça uma gravação de fala ou uma música, o EMO animará o retrato com expressões apropriadas que correspondam ao áudio. Essa versatilidade o torna uma ferramenta poderosa para uma variedade de aplicações.

O EMO também oferece flexibilidade, permitindo que a duração do vídeo animado seja determinada pela duração da sua entrada de áudio. Isso significa que você pode criar clipes curtos ou animações mais longas e profundas, conforme necessário.

Espere, o Alibaba tem uma equipe de projeto de pesquisa de IA?

Alibaba tem um projeto significativo de pesquisa em IA em andamento.

Em 2017, eles estabeleceram o Academia DAMO (Discovery, Adventure, Momentum, Outlook), uma iniciativa de pesquisa global dedicada a explorar tecnologias de ponta como IA, aprendizado de máquina e inteligência de dados. A Alibaba aplica ativamente a IA em sua ampla plataforma de comércio eletrônico e em diversas outras áreas.

Por exemplo, a IA desempenha um papel na otimização das rotas de entrega e na gestão de armazéns nos seus sistemas de logística inteligentes. Ele também capacita chatbots e atendimento ao cliente por meio do processamento de linguagem natural e cria recomendações personalizadas de produtos para os clientes. A Alibaba demonstra o seu compromisso com a investigação em IA ao investir milhares de milhões de dólares nestes esforços.

A praga deepfake

O EMO do Alibaba AI representa um sério risco para o já preocupante mundo dos deepfakes. Tem o potencial de tornar a criação de conteúdo enganoso muito mais fácil. Com o EMO, alguém sem amplo conhecimento técnico poderia gerar vídeos realistas de pessoas dizendo coisas que nunca fizeram. A avançada tecnologia de animação do EMO ameaça tornar esses deepfakes ainda mais convincentes, confundindo a linha entre o que é real e o que é fabricado. Essa capacidade de manipular a imagem de uma pessoa apenas com entrada de áudio abre a porta para deturpações potencialmente devastadoras.

A EMO sublinha as capacidades alarmantes da manipulação alimentada pela IA. Este tipo de tecnologia pode ser perigosa nas mãos erradas e destaca a necessidade urgente de regulamentações e salvaguardas mais rigorosas. Os danos potenciais vão desde o simples assassinato de carácter até campanhas de desinformação em grande escala que podem desestabilizar totalmente a confiança nos meios de comunicação social. É crucial abordar a EMO e tecnologias semelhantes com extrema cautela para tentar prevenir estas consequências negativas.

Veja o artigo de pesquisa completo aqui.


Crédito da imagem em destaque: Mark Daynes/Remover respingo.

Source: Alibaba AI rivaliza com OpenAI Sora com EMO