
Os agentes de inteligência artificial (IA) estão cada vez mais em evidência por terem a capacidade de executar tarefas de forma autônoma para os usuários. Mas uma executiva da Meta que utiliza esse recurso teve problemas com um assistente que alucinou e apagou todos os seus e-mails.
- Qual é a diferença entre IA generativa e agentes de IA?
- Adeus, protótipos: por que a IA em 2026 será a era dos ‘agentes de execução’
Em uma publicação feita no X (antigo Twitter), Summer Yue, diretora de segurança e alinhamento de superinteligência artificial da Meta, revelou que a falha aconteceu após ela instruir o agente de IA OpenClaw a verificar sua caixa de entrada e sugerir o que poderia ser excluído ou arquivado.
Acontece que a operação saiu de controle, com o assistente passando a excluir todas as mensagens trocadas antes do dia 15 de fevereiro. Yue, então, pediu diversas vezes para que o agente interrompesse o processo, com comandos como “OpenClaw, pare” e “Não faça isso” — que não foram atendidos.
–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–
A executiva afirmou que precisou parar de tentar interromper o fluxo de exclusões pelo celular e utilizar seu PC, dispositivo no qual o agente estava instalado, para “desarmar a bomba”.
Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb. pic.twitter.com/XAxyRwPJ5R
— Summer Yue (@summeryue0) February 23, 2026
Especialista assume “erro de principiante”
Um usuário com experiência em desenvolvimento de software chegou a questionar o fato de o problema ter acontecido justamente com uma especialista em segurança e alinhamento. Em resposta, Yue afirmou que se tratou de um “erro de principiante”.
“Acontece que os pesquisadores de alinhamento não são imunes a desalinhamentos. Fiquei confiante demais porque esse fluxo de trabalho estava funcionando na minha caixa de entrada de teste havia semanas. Caixas de entrada reais são diferentes”, explicou a executiva.
Rookie mistake tbh. Turns out alignment researchers aren’t immune to misalignment. Got overconfident because this workflow had been working on my toy inbox for weeks. Real inboxes hit different.
— Summer Yue (@summeryue0) February 23, 2026
Em resposta a outro comentário no post, ela acrescentou que sua caixa de entrada real era muito grande, o que acionou um processo de compactação do contexto. Durante esse procedimento, o agente perdeu a instrução original e passou a excluir os e-mails automaticamente.
Autonomia no uso do computador
O OpenClaw é um agente de IA de código aberto que promete maior autonomia no uso do computador. Antes chamado de Clowdbot e Moltbot, ele consegue realizar tarefas sem a necessidade de que o usuário forneça instruções detalhadas para cada etapa.
Algumas das atividades que o assistente pode realizar de forma autônoma são:
- Leitura e criação de arquivos;
- Automação de rotinas no computador;
- Navegação automática em sites e preenchimento de formulários no navegador;
- Organização de e-mails;
- Apoio a programadores ao executar testes, analisar erros e interagir com repositórios de código.
Apesar disso, a utilização de agentes de IA também envolve potenciais riscos, como falhas que podem expor dados sensíveis dos usuários. Outro problema é o envio de mensagens ou a exclusão de arquivos sem aviso prévio.
A injeção de prompt — que ocorre quando o assistente interpreta conteúdos externos (como textos de e-mails ou mensagens de WhatsApp) como comandos legítimos, levando-o a agir de forma equivocada — é outro risco associado à integração desses programas aos computadores.
Leia também:
- 5 formas de se proteger de injeção de prompt em navegadores de IA
- Testamos o Cowork: o agente de IA do Claude promete, mas tem ressalvas
- O que é OpenAI Frontier? Conheça a nova plataforma de agentes de IA
Leia a matéria no Canaltech.

