Google anunciado a visualização privada de seu modelo de geração de vídeo, Veo, para clientes do Google Cloud que usam Vertex AI. O anúncio permite que empresas como Quora e Mondelez International aproveitem esta tecnologia de IA para fins criativos e de marketing.
O Veo, lançado em abril, pode gerar vídeos de alta definição, incluindo clipes de 1080p com até seis segundos de duração em várias taxas de quadros. Os usuários podem criar vídeos fornecendo imagens junto com instruções, permitindo ao modelo capturar diferentes estilos visuais e cinematográficos. Warren Barkley, diretor sênior de gerenciamento de produtos do Google Cloud, enfatizou que a longa espera pela API se deveu ao aprimoramento do modelo de prontidão empresarial.
O modelo se destaca na geração de efeitos específicos, como explosões, e compreende conceitos básicos de física. Ele também pode realizar edição mascarada, permitindo aos usuários modificar regiões específicas de um vídeo. Apesar de suas capacidades, o Veo apresenta inconsistências típicas da IA generativa atual, como desaparecimento de objetos e comportamento físico irrealista, levando a possíveis limitações em seu uso.
Veo e Imagen 3: O que eles oferecem
O Google introduziu o Veo junto com o Imagen 3, um modelo de imagem generativo projetado para produzir imagens da mais alta qualidade a partir de prompts de texto. Ambos os modelos estarão disponíveis para clientes Vertex AI, com o Imagen 3 definido para se tornar amplamente acessível na próxima semana. As empresas que começaram a utilizar essas ferramentas incluem Oreo e Cadbury, enfatizando suas aplicações comerciais.
Prompt do vídeo abaixo: Um vaqueiro solitário cavalga por uma planície aberta ao belo pôr do sol, luz suave e cores quentes.
(Vídeo: Google)
Prompt do vídeo abaixo: Uma foto aérea de um farol erguido em um penhasco rochoso, seu farol cortando o amanhecer, as ondas quebrando contra as rochas abaixo
(Vídeo: Google)
Barkley observou que a IA generativa está impulsionando a transformação dos negócios, com 86% das empresas relatando crescimento de receitas. Ele afirmou que o Google está comprometido com o avanço da tecnologia de IA generativa, evidente em suas ofertas mais recentes com Veo e Imagen 3.
Para resolver o potencial uso indevido, ambos os modelos incorporarão salvaguardas para evitar a geração de conteúdos nocivos. Além disso, todos os resultados apresentarão marcas d’água digitais, incluindo o SynthID do Google DeepMind, que incorpora marcadores invisíveis para combater a desinformação e atribuição incorreta. O Google afirma que não usa dados de clientes para treinar seus modelos, concentrando-se, em vez disso, em conjuntos de dados disponíveis publicamente.
Melhorar a funcionalidade empresarial tem sido uma prioridade desde o anúncio inicial da Veo. O modelo foi treinado usando uma vasta gama de amostras de vídeo de alta qualidade, embora detalhes sobre fontes de dados de treinamento específicas permaneçam não divulgados. Barkley reconheceu que embora alguns dados possam incluir conteúdo do YouTube, eles operam sob acordos do Google com criadores de conteúdo.
A abordagem proativa do Google também aborda os riscos de propriedade intelectual associados à IA generativa. A Veo está preparada para oferecer filtros de nível imediato para bloquear conteúdo violento e explícito, e Barkley indicou que os resultados da Veo virão com uma política de indenização para proteger os usuários contra reivindicações de violação de direitos autorais.
À medida que o Veo se integra gradualmente a mais produtos do Google, o modelo foi introduzido em testes por meio do Google Labs em maio e anunciado como parte do YouTube Shorts em setembro. No entanto, o Google enfrentou a concorrência no espaço de IA generativa de empresas como OpenAI e Adobe, que rapidamente garantiram parcerias com vários estúdios e agências criativas.
Crédito da imagem em destaque: Google DeepMind
O post As novas ferramentas de IA do Google estão mudando para sempre a criação de vídeos e imagens apareceu pela primeira vez em TechBriefly.
Source: As novas ferramentas de IA do Google estão mudando para sempre a criação de vídeos e imagens