Nova IA do Google navega pela web por você com o Gemini

Tecnologia

O Google anunciou um novo modelo do Gemini capaz de navegar pela web e executar ações de forma autônoma. A novidade recebe o nome de 2.5 Computer Use e permite atuar como um agente nos navegadores.

O novo modelo incorpora as habilidades de compreensão visual e raciocínio do Gemini 2.5 Pro enquanto consegue interagir com interfaces de usuário. Dessa forma, a IA vai entender as informações da página, localizar dados e atuar da mesma forma que uma pessoa faria.

De acordo com a Gigante de Mountain View, o objetivo é conseguir ir além do uso das APIs pelas inteligências artificiais — muitas tarefas podem exigir que a IA responda à interface do usuário, então é importante ter uma alternativa para isso. 


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

Dados revelados pela empresa indicam que o modelo pode atuar como um agente com baixa latência, ou seja, de forma mais rápida.

Novo modelo do Gemini consegue navegar pela web no seu lugar (Imagem: Divulgação/Google)

O que o modelo consegue fazer?

O Gemini 2.5 Computer Use é voltado para interagir com interfaces em páginas da web e executar diversas ações automaticamente. Alguns exemplos são:

  • Pesquisar e digitar páginas da web na busca;
  • Mover o cursor do mouse em diferentes seções do site;
  • Preencher formulários e fazer login;
  • Clicar e arrastar itens;
  • Copiar e selecionar textos.

O Google afirma que o LLM é otimizado para atuar em navegadores da web, mas mostra sinais positivos para controlar interfaces de dispositivos móveis. Por enquanto, ainda não foi otimizado para sistemas operacionais de computadores.

A novidade pode ser usada para melhorar o próprio Google Chrome, visto que a empresa já prometeu a chegada de agentes ao browser no futuro. Por enquanto, o modelo funciona apenas para demonstrações.

Leia também:

VÍDEO: IA em locadoras de carro: a inovação que pode virar um pesadelo?

Leia a matéria no Canaltech.