Genie 3: nova IA do Google cria mundos abertos e interativos em 3D

Tecnologia

O Google DeepMind anunciou o Genie 3, novo modelo de inteligência artificial capaz de criar mundos em 3D, desenvolvido especialmente para jogos. A ferramenta transforma imagens simples ou comandos de texto em um jogo interativo, mas ainda não está disponível ao público.

“O Genie 3 é o nosso primeiro modelo de mundo a permitir interação em tempo real, além de melhorar a consistência e o realismo em comparação com o Genie 2”, informou a empresa no comunicado.

O lançamento ocorre como uma prévia limitada para pesquisa, com acesso concedido apenas a um grupo de acadêmicos e criadores. O principal objetivo da ferramenta é projetar ambientes simulados com diferentes finalidades: educação, treinamento e, principalmente, entretenimento.


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

Entre as melhorias, a nova versão mantém os ambientes mais estáveis por até um minuto. Antes, os elementos fora da cena desapareciam após 10 ou 20 segundos. Para explorar os espaços criados, o usuário utiliza comandos de teclado semelhantes aos dos videogames.

A resolução também foi aprimorada: agora o modelo opera em 720p, com taxa de 24 quadros por segundo.

Desenvolvedores compartilharam suas experiências com a nova ferramenta na rede X.

Apesar dos avanços, o modelo ainda apresenta limitações. A estabilidade dos ambientes permanece um desafio. O próprio Google DeepMind reconhece que certos mundos exigiriam consistência por horas, e não apenas minutos.

Outro ponto crítico envolve possíveis alucinações e imprecisões visuais. O Genie 3 pode gerar movimentos incorretos dos personagens, que podem se deslocar em direções erradas ou de forma invertida.

Qual a diferença entre o Genie 3 e o Veo 3?

O Genie 3 é um “modelo de mundo” focado em criar ambientes interativos e jogáveis a partir de prompts de texto ou imagem. Ele permite gerar mini-jogos e simulações em tempo real.

Já o Veo 3 é um modelo de geração de vídeo voltado à criação de clipes cinematográficos de alta qualidade, também a partir de prompts de texto. A ferramenta atende à produção de vídeos realistas prontos para uso profissional.

As diferenças também aparecem na resolução e duração dos conteúdos. O Genie 3 opera em 720p, enquanto o Veo 3 alcança até 4K. O tempo de interação também varia: o Genie 3 sustenta minutos de navegação, enquanto o Veo 3 limita os vídeos a 8 segundos.

Leia mais:

VÍDEO: ChatGPT, Perplexity, Claude, Gemini: QUAL escolher?

Leia a matéria no Canaltech.