Além de editar fotos: 7 coisas que você pode fazer no Gemini

Tecnologia

O Gemini não se limita a editar fotos. A IA do Google traz recursos que vão desde a criação de vídeos curtos até o aprendizado guiado, passando por revisão de textos, transcrição de áudios e geração de códigos.

A seguir, tire suas dúvidas sobre:

  • 10 prompts para editar fotos no Gemini que você precisa conhecer
  • Como fazer a foto de Polaroid abraçando com IA pelo Gemini 

7 coisas que você pode fazer no Gemini

Veja 7 recursos do Gemini para além da geração e edição de imagens:


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

  1. Gerar vídeos
  2. Revisar textos
  3. Fazer buscas na web
  4. Transcrever áudios
  5. Gerar códigos
  6. Conversar por voz
  7. Estudar com Aprendizado Guiado

1. Gerar vídeos

Com o modelo Veo 3, o Gemini permite criar vídeos de oito segundos com áudio nativo usando descrições de texto. Também existe a opção “photo-to-video” (transformar uma foto em vídeo) para animar imagens com som ambiente ou efeitos.

2. Revisar textos

O Gemini consegue melhorar a escrita, revisar ortografia e gramática, além de sugerir ajustes de clareza e coesão. Ele também adapta o tom de acordo com a necessidade, seja em um e-mail profissional, seja em uma mensagem mais descontraída.

Nos aplicativos do Google Workspace, como Gmail e Documentos, essa capacidade já está integrada, o que permite melhorar o texto em tempo real sem depender de ferramentas externas.

3. Fazer buscas na web

O Deep Research no Gemini permite que o Gemini navegue por centenas de sites, filtre‐informações, reúna dados atualizados e apresente relatórios, inclusive com planos interativos e uploads de arquivos para guiar a pesquisa.

4. Transcrever áudios

O Gemini agora permite transcrever áudios, o que facilita registrar reuniões, aulas e outras gravações. A função está disponível na web e nos apps para Android e iOS.

No plano gratuito, é possível enviar arquivos de até 10 minutos e 100 MB, enquanto os planos pagos liberam áudios de até três horas. Também há suporte para vídeos, limitados a cinco minutos no plano grátis e até uma hora no pago.

Gemini no celular
O Gemini tem várias funcionalidades além da edição de imagens, como Aprendizado Guiado e geração de códigos. (Imagem: Viviane França/Canaltech)

5. Gerar códigos

O Gemini ajuda você a escrever, entender e corrigir códigos. Ele gera trechos a partir de descrições em linguagem natural, explica como um bloco funciona e sugere melhorias.

Também é possível enviar arquivos ou repositórios inteiros para que o modelo identifique erros e proponha soluções.

6. Conversar por voz

Com o Gemini Live, você consegue conversar “ao vivo” com o Gemini por voz, com opção de usar câmera ou tela, e as respostas são faladas.

Recentemente, o Google implementou melhorias na função para tornar a fala do Gemini mais natural, com ritmo, entonação e integração com apps do Google.

7. Estudar com Aprendizado Guiado

No Aprendizado Guiado, o Gemini se torna tutor que ajuda a aprofundar seu conhecimento sobre um tema.

Em vez de entregar respostas prontas, ele faz perguntas e oferece direcionamentos para que você descubra a solução sozinho. É bem semelhante ao modo socrático do ChatGPT.

Confira outros conteúdos do Canaltech:

VÍDEO: O Gemini é muito bom (e isso é um problema)

Leia a matéria no Canaltech.