Inteligência Artificial

Cloudflare acusa Perplexity de ignorar robots.txt e usar rastreadores ocultos

Nesta segunda-feira, 8 de abril, a Cloudflare tornou públicas novas evidências de que a startup de inteligência artificial Perplexity estaria recolhendo dados de websites com um método que dribla regras de exclusão de robôs estabelecidas há três décadas.

Investigação aponta uso de bot camuflado

Segundo a empresa de segurança de rede, clientes que bloquearam o acesso do rastreador oficial da Perplexity por meio do arquivo robots.txt e de firewalls continuavam a ver seu conteúdo ser visitado. Uma análise subsequente identificou um segundo bot, não declarado, que entrava em ação sempre que o primeiro era barrado. Esse agente alternava entre múltiplos endereços IP e mascarava cabeçalhos HTTP para dificultar a detecção.

Os pesquisadores relatam que o comportamento foi observado em dezenas de milhares de domínios, com milhões de requisições diárias. O padrão indicaria uma tentativa sistemática de coletar informações para alimentar o mecanismo de busca com IA da Perplexity, mesmo contra a vontade dos proprietários dos sites.

Cloudflare reage e amplia bloqueios

Após confirmar o esquema, a Cloudflare removeu a Perplexity da lista de bots verificados e aplicou novas regras de firewall destinadas a interceptar o tráfego do rastreador oculto. A companhia sustenta que a prática fere o Protocolo de Exclusão de Robôs, formalizado pela IETF em 2022, e tradicionalmente respeitado por buscadores.

Cloudflare acusa Perplexity de ignorar robots.txt e usar rastreadores ocultos - Imagem do artigo original

Não é a primeira contestação enfrentada pela Perplexity. Em 2023, a revista Forbes acusou o serviço de publicar texto quase idêntico a uma reportagem exclusiva. A Wired, por sua vez, identificou picos suspeitos de acesso originados de IPs possivelmente ligados à empresa. Líderes de plataformas como Reddit também já criticaram grandes modelos de IA por recolherem conteúdo sem autorização.

Até o momento, a Perplexity não comentou publicamente as novas alegações. A controvérsia reacende o debate sobre limites éticos e técnicos para a coleta de dados que alimenta ferramentas de inteligência artificial.

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo