‘Não faça isso’: IA alucina e apaga todos os e-mails de executiva da Meta

Os agentes de inteligência artificial (IA) estão cada vez mais em evidência por terem a capacidade de executar tarefas de forma autônoma para os usuários. Mas uma executiva da Meta que utiliza esse recurso teve problemas com um assistente que alucinou e apagou todos os seus e-mails.

Em uma publicação feita no X (antigo Twitter), Summer Yue, diretora de segurança e alinhamento de superinteligência artificial da Meta, revelou que a falha aconteceu após ela instruir o agente de IA OpenClaw a verificar sua caixa de entrada e sugerir o que poderia ser excluído ou arquivado.

Acontece que a operação saiu de controle, com o assistente passando a excluir todas as mensagens trocadas antes do dia 15 de fevereiro. Yue, então, pediu diversas vezes para que o agente interrompesse o processo, com comandos como “OpenClaw, pare” e “Não faça isso” — que não foram atendidos.

–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–

A executiva afirmou que precisou parar de tentar interromper o fluxo de exclusões pelo celular e utilizar seu PC, dispositivo no qual o agente estava instalado, para “desarmar a bomba”.

Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb. pic.twitter.com/XAxyRwPJ5R

— Summer Yue (@summeryue0) February 23, 2026

Especialista assume “erro de principiante”

Um usuário com experiência em desenvolvimento de software chegou a questionar o fato de o problema ter acontecido justamente com uma especialista em segurança e alinhamento. Em resposta, Yue afirmou que se tratou de um “erro de principiante”.

“Acontece que os pesquisadores de alinhamento não são imunes a desalinhamentos. Fiquei confiante demais porque esse fluxo de trabalho estava funcionando na minha caixa de entrada de teste havia semanas. Caixas de entrada reais são diferentes”, explicou a executiva.

Rookie mistake tbh. Turns out alignment researchers aren’t immune to misalignment. Got overconfident because this workflow had been working on my toy inbox for weeks. Real inboxes hit different.

— Summer Yue (@summeryue0) February 23, 2026

Em resposta a outro comentário no post, ela acrescentou que sua caixa de entrada real era muito grande, o que acionou um processo de compactação do contexto. Durante esse procedimento, o agente perdeu a instrução original e passou a excluir os e-mails automaticamente.

Autonomia no uso do computador

O OpenClaw é um agente de IA de código aberto que promete maior autonomia no uso do computador. Antes chamado de Clowdbot e Moltbot, ele consegue realizar tarefas sem a necessidade de que o usuário forneça instruções detalhadas para cada etapa.

Algumas das atividades que o assistente pode realizar de forma autônoma são:

Leitura e criação de arquivos;
Automação de rotinas no computador;
Navegação automática em sites e preenchimento de formulários no navegador;
Organização de e-mails;
Apoio a programadores ao executar testes, analisar erros e interagir com repositórios de código.

Apesar disso, a utilização de agentes de IA também envolve potenciais riscos, como falhas que podem expor dados sensíveis dos usuários. Outro problema é o envio de mensagens ou a exclusão de arquivos sem aviso prévio.

A injeção de prompt — que ocorre quando o assistente interpreta conteúdos externos (como textos de e-mails ou mensagens de WhatsApp) como comandos legítimos, levando-o a agir de forma equivocada — é outro risco associado à integração desses programas aos computadores.

Leia também:

Leia a matéria no Canaltech.

‘Não faça isso’: IA alucina e apaga todos os e-mails de executiva da Meta

Especialista assume “erro de principiante”

Autonomia no uso do computador

Categorias

Links Importantes

Recentes

Especialista assume “erro de principiante”

Autonomia no uso do computador

Veja mais:

Mais IA e outras novidades ao iPhone: o que esperar do iOS 27?

Perplexity ganha app nas TVs da Samsung para facilitar pesquisas

Sandman: conheça os imperfeitos e amáveis Perpétuos da 2ª temporada na Netflix