
Resumo
-
- Reddit bloqueia robôs do Internet Archive, acusando empresas de IA de usarem a Wayback Machine para coletar dados da plataforma.
-
- Restrição permite arquivar apenas a página inicial do site, sem acesso a posts, comentários ou perfis de usuários.
-
- Decisão acompanha medidas de outras plataformas, como Cloudflare e Wikipédia, contra a raspagem de conteúdo por robôs de IA.
O Reddit não vai mais permitir que robôs do Internet Archive acessem seus fóruns. A rede alega que empresas de inteligência artificial estão coletando dados da Wayback Machine, arquivo que disponibiliza cópias de páginas da web.
“O Internet Archive presta um serviço à web aberta, mas nós tomamos conhecimento de que, em alguns casos, empresas de IA violam as políticas de plataformas, incluindo a nossa, e raspam dados da Wayback Machine”, disse o Reddit ao Verge.
“Até que eles sejam capazes de defender o site e se adequar às políticas das plataformas (como respeitar a privacidade de usuários ou deletar conteúdos removidos), vamos limitar o acesso deles ao Reddit, como forma de proteger os redditors”, acrescentou um porta-voz da empresa.

Com os novos bloqueios, os robôs do Internet Archive poderão apenas armazenar cópias da página inicial do Reddit, sem ter acesso a posts, comentários ou perfis. Assim, na prática, só será possível consultar quais eram as publicações mais populares em determinada data, sem saber o conteúdo delas.
“Temos um relacionamento de longa data com o Reddit e continuaremos discutindo esse assunto”, declarou Mark Graham, diretor da Wayback Machine.
Reddit já fechou API e assinou acordos por causa de IA
Nos últimos anos, o Reddit virou assunto no noticiário por suas medidas em relação à IA. Em 2023, a empresa limitou o acesso a suas APIs, alegando que elas vinham sendo usadas para raspar o conteúdo da rede. A medida fez apps independentes pararem de funcionar, o que levou a protestos da comunidade.
Em relação a empresas, o Reddit fechou acordos de licenciamento com o Google e a OpenAI, que passaram a pagar para treinar seus modelos com o conteúdo da rede. Por outro lado, processou a Anthropic por coletar informações de seus fóruns sem autorização.
Lidar com a inteligência artificial se tornou uma das grandes questões da web. A Cloudflare, que fornece serviços de otimização para sites, decidiu bloquear por padrão os bots usados por empresas de IA para rastrear conteúdo. Além disso, ela processou a Perplexity, sob a alegação de desrespeitar o protocolo robots.txt.
Quem também pensa em tomar medidas contra esses robôs é a Wikipédia. A fundação responsável pela enciclopédia diz que a raspagem de seus conteúdos causa lentidão e aumenta os gastos com infraestrutura.
Com informações do Verge
Reddit decide bloquear robôs do Internet Archive para fugir de IA