DeepMind do Google tem anunciado Genie 2, um modelo inovador capaz de gerar mundos de jogos 3D jogáveis apenas a partir de instruções de texto. Esta tecnologia baseia-se na versão anterior, Genie 1, que criava ambientes 2D. Os avanços do Genie 2 o posicionam como uma ferramenta inovadora para criar experiências diversas e interativas em tempo real.
DeepMind do Google revela Genie 2 para mundos de jogos 3D
Genie 2 foi projetado para construir mundos virtuais imersivos simulando animações, física e interações. Utilizando imagens que podem ser geradas a partir de simples instruções de texto, o modelo permite flexibilidade criativa. Por exemplo, um usuário pode inserir uma solicitação de “um faroeste cyberpunk” e o Genie 2 produzirá um ambiente correspondente. Esta abordagem inovadora aproveita a IA generativa para ampliar os limites do que pode ser criado em espaços virtuais.
O modelo opera em um processo de duas etapas. Primeiro requer uma imagem de referência, que também pode ser gerada a partir de texto. Depois de receber informações visuais, o Genie 2 extrapola para construir um mundo interativo completo. As demonstrações revelaram interações perfeitas entre os jogadores usando controles tradicionais, como o layout WASD, garantindo assim uma navegação intuitiva.
Apesar desses avanços, o Genie 2 enfrenta desafios notáveis. Especificamente, a consistência do modelo diminui após aproximadamente 20 segundos, com as simulações mais longas durando até um minuto. Esta inconsistência pode resultar da sua capacidade de produzir “contrafactuais”, o que significa que a IA considera diferentes ações potenciais tomadas pelos jogadores, o que complica a manutenção de uma narrativa coerente.
Genie 2 brilha em sua capacidade de acomodar diversas perspectivas, como visualizações em primeira pessoa ou isométricas. Também incorpora elementos como efeitos realistas de água e interações ambientais, exemplificados por uma demonstração onde um personagem interage com um balão, mostrando física, gravidade e outras dinâmicas. No entanto, os detalhes sobre a resolução de renderização e a contagem de polígonos permanecem não divulgados pelo Google.
As capacidades do Genie 2 vão além do jogo controlado pelo usuário. O modelo também pode simular com eficácia personagens de IA que interagem nos ambientes gerados. O Google ilustrou isso mostrando a capacidade da IA de executar comandos com base em instruções de texto no mundo gerado. Esses recursos sugerem o potencial de NPCs controlados por IA que podem exibir um comportamento realista em futuras aplicações de jogos.
Considerações éticas e de segurança surgem em relação aos dados de treinamento do Genie 2. Foi sugerido que a estrutura de treinamento do modelo pode incluir vídeos de jogo provenientes de plataformas como o YouTube, levantando preocupações de propriedade intelectual sobre a semelhança com material protegido por direitos autorais. Essas questões podem levar a investigações sobre as implicações legais do uso de conteúdo existente pela IA generativa.
Embora as implementações atuais do Genie 2 possam não oferecer uma experiência de jogo totalmente coerente devido à sua temporalidade, a DeepMind vê o modelo como um recurso para pesquisa e desenvolvimento, em vez de produtos de jogos completos. O foco está na prototipagem de experiências interativas e na avaliação de agentes de IA em ambientes simulados.
As especificidades do lançamento público do Genie 2, as aplicações comerciais e os recursos tecnológicos necessários permanecem obscuros à medida que o Google navega lentamente nessas águas.
Créditos de imagem e vídeo em destaque: Google DeepMind
A postagem DeepMind do Google revela Genie 2 para mundos de jogos 3D apareceu pela primeira vez em TechBriefly.
Source: DeepMind do Google revela Genie 2 para mundos de jogos 3D