Reddit processa Perplexity por suposto roubo de dados é a mais recente disputa que coloca grandes plataformas de conteúdo frente a startups de inteligência artificial. A rede social acusa a Perplexity, além de SerpApi, Oxylabs e AWMProxy, de coletarem ilegalmente publicações do site para treinar modelos de IA.
De acordo com o processo, as empresas teriam burlado os termos de serviço ao raspar (data scraping) material indexado pelo Google e revendê-lo à Perplexity. A prática, sustenta o Reddit, infringe direitos autorais e viola acordos já firmados com a plataforma.
Reddit processa Perplexity por suposto roubo de dados
Para comprovar a infração, a equipe jurídica criou um “post fantasma”, visível apenas a robôs de busca. Horas depois, esse conteúdo apareceu nos resultados produzidos pela ferramenta da Perplexity, o que, segundo a petição, demonstra o uso do Google como atalho para acesso não autorizado.
O Reddit afirma que enviou notificação formal à startup exigindo o fim da coleta; contudo, citações a seus tópicos na IA teriam aumentado quarenta vezes desde então. Em nota à agência Bloomberg, o diretor jurídico Ben Lee classificou a disputa entre desenvolvedores de IA por “conteúdo humano de qualidade” como uma “corrida armamentista” que impulsiona a “lavagem de dados em escala industrial”.
A reclamação lembra outros atritos envolvendo a Perplexity: em agosto, a Cloudflare acusou a companhia de ignorar arquivos robots.txt; já em 2024, a Amazon interveio após suspeitas de uso indevido de seus servidores para reproduzir matérias de veículos como Wired e Forbes.
A ação, registrada na Califórnia, pede indenização financeira e uma ordem judicial que proíba permanentemente o uso de dados do Reddit. SerpApi e Oxylabs não comentaram; a russa AWMProxy não foi localizada. O Google, não citado no processo, disse ao The New York Times que respeita diretrizes de sites, mas reconhece a existência de “scrapers furtivos”.

Procurada, a Perplexity declarou que ainda não recebeu a intimação, mas promete “defender vigorosamente o direito dos usuários de acessar conhecimento público”. Em junho, o Reddit já havia acionado judicialmente a Anthropic por motivos semelhantes.
Para acompanhar os próximos capítulos desta disputa e outras novidades sobre IA, visite nossa editoria de Inteligência Artificial em Suafontediaria.com e mantenha-se informado.
(imagem: reprodução/Shutterstock)