Reddit decide bloquear robôs do Internet Archive para fugir de IA

Resumo

- Reddit bloqueia robôs do Internet Archive, acusando empresas de IA de usarem a Wayback Machine para coletar dados da plataforma.

- Restrição permite arquivar apenas a página inicial do site, sem acesso a posts, comentários ou perfis de usuários.

- Decisão acompanha medidas de outras plataformas, como Cloudflare e Wikipédia, contra a raspagem de conteúdo por robôs de IA.

O Reddit não vai mais permitir que robôs do Internet Archive acessem seus fóruns. A rede alega que empresas de inteligência artificial estão coletando dados da Wayback Machine, arquivo que disponibiliza cópias de páginas da web.

“O Internet Archive presta um serviço à web aberta, mas nós tomamos conhecimento de que, em alguns casos, empresas de IA violam as políticas de plataformas, incluindo a nossa, e raspam dados da Wayback Machine”, disse o Reddit ao Verge.

“Até que eles sejam capazes de defender o site e se adequar às políticas das plataformas (como respeitar a privacidade de usuários ou deletar conteúdos removidos), vamos limitar o acesso deles ao Reddit, como forma de proteger os redditors”, acrescentou um porta-voz da empresa.

Com os novos bloqueios, os robôs do Internet Archive poderão apenas armazenar cópias da página inicial do Reddit, sem ter acesso a posts, comentários ou perfis. Assim, na prática, só será possível consultar quais eram as publicações mais populares em determinada data, sem saber o conteúdo delas.

“Temos um relacionamento de longa data com o Reddit e continuaremos discutindo esse assunto”, declarou Mark Graham, diretor da Wayback Machine.

Reddit já fechou API e assinou acordos por causa de IA

Nos últimos anos, o Reddit virou assunto no noticiário por suas medidas em relação à IA. Em 2023, a empresa limitou o acesso a suas APIs, alegando que elas vinham sendo usadas para raspar o conteúdo da rede. A medida fez apps independentes pararem de funcionar, o que levou a protestos da comunidade.

Em relação a empresas, o Reddit fechou acordos de licenciamento com o Google e a OpenAI, que passaram a pagar para treinar seus modelos com o conteúdo da rede. Por outro lado, processou a Anthropic por coletar informações de seus fóruns sem autorização.

Lidar com a inteligência artificial se tornou uma das grandes questões da web. A Cloudflare, que fornece serviços de otimização para sites, decidiu bloquear por padrão os bots usados por empresas de IA para rastrear conteúdo. Além disso, ela processou a Perplexity, sob a alegação de desrespeitar o protocolo robots.txt.

Quem também pensa em tomar medidas contra esses robôs é a Wikipédia. A fundação responsável pela enciclopédia diz que a raspagem de seus conteúdos causa lentidão e aumenta os gastos com infraestrutura.

Com informações do Verge

Reddit decide bloquear robôs do Internet Archive para fugir de IA

Reddit decide bloquear robôs do Internet Archive para fugir de IA

Reddit já fechou API e assinou acordos por causa de IA

Categorias

Links Importantes

Recentes

Reddit já fechou API e assinou acordos por causa de IA

Veja mais:

Samsung faz queima de tablet; Tab S10 Lite bate menor preço já visto

Strava vai parar de funcionar em relógios antigos da Samsung

Amazon faz queima de tablet: Tab S10 FE da Samsung está com preço no chão