Nano Banana: Google turbina edição de imagens via IA do Gemini

Tecnologia
Resumo
  • Google integrou um novo modelo de IA ao Gemini que aprimora a consistência em edições de imagens.
  • Apelidado de Nano Banana, o recurso permite múltiplas etapas de edição e combinações de imagens.
  • Já disponível para todos os usuários do Gemini, as imagens editadas incluem marcas d’água visíveis e invisíveis.

O Google anunciou nessa terça-feira (26/08) uma atualização nas ferramentas de edição de imagem do Gemini. A novidade é a integração de um novo modelo de IA da DeepMind, chamado de Nano Banana, que garante muito mais consistência e fidelidade ao alterar fotos, mantendo as características originais das pessoas, animais e objetos mesmo após múltiplas edições.

A capacidade de edição de imagens não é totalmente nova para o ecossistema do Google. A empresa já vinha integrando essa funcionalidade desde maio. Ainda antes, embora de forma mais restrita, as edições pelo chatbot eram testadas através do AI Studio e da Vertex AI, suas plataformas voltadas para desenvolvedores.

Agora, a tecnologia chega de forma aprimorada e já é acessível a todos os usuários do aplicativo e site do Gemini.

Como funciona o Nano Banana?

A grande promessa do novo modelo é resolver um dos problemas mais comuns desde que os chatbots de IA passaram a aceitar imagens de entrada: a falta de consistência. Em versões anteriores, ao pedir para a IA alterar um detalhe em uma foto, era comum que todo o resto da imagem também mudasse de forma imprevisível.

Com o Nano Banana, a história parece ser diferente, já que o modelo consegue lembrar dos detalhes da imagem original, segundo o Google. Isso permite que o usuário realize edições em várias etapas, como trocar a roupa, depois mudar o cenário e, em seguida, adicionar um objeto — tudo isso pelo chat, sem precisar fazer seleções, como em apps de edição convencionais.

No Tecnoblog, testamos a funcionalidade e tivemos o resultado abaixo, sem grandes inconsistências entre a versão original e a editada. Os prompts utilizados foram: “Coloque essa pessoa sorrindo. Retire os itens que estão na bancada ao fundo. Troque a camisa interna por uma de cor vinho” e, em seguida, “agora coloque um cabelo louro no lugar. E a porta ao fundo deve ser laranja, inspirada no novo álbum da Taylor Swift”.

Segundo o Google, a atualização desbloqueia novos usos, como:

  • Mudar trajes e locais: é possível enviar uma foto sua e pedir para o Gemini reimaginar você em diversos cenários, mantendo sua aparência.
  • Misturar fotos: o usuário pode enviar duas ou mais imagens e pedir para a IA combiná-las em uma cena única.
  • Edição em várias etapas: funciona como o processo de criação iterativo dos textos. Agora é possível, por exemplo, adicionar móveis a um cômodo vazio, um item de cada vez, preservando o restante da imagem a cada passo.

Google testou modelo de forma anônima

O novo modelo, cujo nome técnico é Gemini 2.5 Flash Image, ganhou notoriedade na comunidade de IA antes mesmo do anúncio oficial. Com o codinome Nano Banana, ele surgiu anonimamente em plataformas de teste como a LMArena. As habilidades de edição do modelo impressionaram os especialistas e o levaram ao topo do ranking na plataforma.

Agora, o Google confirma que o Nano Banana é uma criação da DeepMind. A empresa destaca que, como em outras ferramentas de geração de imagem da casa, todas as fotos editadas no Gemini incluirão uma marca d’água visível, “AI”, e uma marca d’água digital invisível, chamada SynthID, para garantir a transparência.

Nano Banana: Google turbina edição de imagens via IA do Gemini