Perplexity AI analizza contenuti non autorizzati: rischi e controversie nell’uso dell’intelligenza artificiale

Perplexity AI analizza contenuti non autorizzati: rischi e controversie nell’uso dell’intelligenza artificiale

5 Agosto 2025

Perplexity e le accuse di accesso non autorizzato ai siti web

Perplexity AI si trova nuovamente al centro di un acceso dibattito riguardante l’accesso non autorizzato a contenuti digitali. Nel 2024, diversi proprietari di siti web hanno denunciato che i loro contenuti venivano consultati nonostante le esplicite restrizioni imposte tramite file robots.txt, un’azione che dovrebbe impedire ai crawler non autorizzati di indicizzare tali pagine. Inizialmente, l’azienda aveva attribuito gli accessi ai crawler di terze parti impiegati per i propri servizi, ma questa spiegazione appare ora sempre meno credibile alla luce delle indagini successive. Queste accuse indicano che Perplexity avrebbe utilizzato sistemi avanzati per aggirare i normali meccanismi di blocco e acquisire informazioni senza rispettare le limitazioni stabilite dai proprietari dei siti. Tale condotta ha sollevato rilevanti questioni etiche e legali sull’uso dei dati raccolti e sulla trasparenza delle pratiche adottate dalla società nel rispetto delle normative digitali.

Tecniche di crawling invisibile e strategie di elusione

Le indagini condotte da Cloudflare hanno fatto emergere metodi sofisticati adottati da Perplexity AI per bypassare i meccanismi standard di protezione dei contenuti web. Quando i file robots.txt bloccano specificamente i bot ufficiali come “PerplexityBot” e “Perplexity-User”, l’azienda ricorre a un’articolata strategia che coinvolge l’uso di un browser simulato, mimando esattamente Google Chrome su macOS. In tal modo, i crawler si presentano ai server web come utenti umani reali, rendendo estremamente complessa la loro identificazione e filtraggio da parte delle difese digitali.

Questa sofisticazione si estende anche alla gestione degli indirizzi IP, con rotazioni dinamiche e frequenti cambi di fascia IP che non rientrano nel range ufficiale assegnato a Perplexity. Di conseguenza, i firewall configurati per bloccare traffico proveniente da indirizzi automatizzati risultano impotenti di fronte a questa tecnica, capace di travestire il traffico bot come traffico legittimo. La manipolazione viene praticata anche sul piano dei numeri di sistema autonomo (Autonomous System Number, ASN), con continui cambi tra ASN diversi per mascherare l’origine del traffico e aggirare le restrizioni implementate a livello di rete.

BOTTONE COMPRA BRANDED CONTENT SU ASSODIGITALE SMALL

Queste tecniche di crawling invisibile comportano una lesione grave ai principi fondamentali di rispetto delle regole digitali, rendendo difficoltosa la tutela dei contenuti originali online e ponendo questioni rilevanti sull’etica delle pratiche di raccolta dati nell’ambito dell’intelligenza artificiale.

Risposte di Cloudflare e sfide future per la sicurezza digitale

Cloudflare ha reagito con decisione alle evidenze emerse, intervenendo prontamente per proteggere le piattaforme e i contenuti digitali dei propri utenti. La società ha escluso i bot riconducibili a Perplexity AI dalla lista dei crawler verificati, segnalando apertamente la natura ingannevole delle loro attività di raccolta dati. Parallelamente, sono state implementate nuove tecnologie di filtraggio e sistemi di rilevamento avanzati mirati a identificare e bloccare forme di crawling invisibile, rafforzando così le barriere contro accessi non autorizzati mascherati da traffico umano autentico.

Le iniziative di Cloudflare evidenziano una sfida crescente per la sicurezza digitale, rilevando come l’evoluzione delle tecniche di elusione impone un costante aggiornamento degli strumenti di difesa. La situazione descrive un contesto in cui i fornitori di contenuti e i provider di sicurezza devono ingaggiare un confronto dinamico e continuo con le aziende AI, chiamate a bilanciare le esigenze di reperimento di informazioni aggiornate con il rispetto delle normative e delle politiche di accesso. Lo scenario attuale preannuncia un inevitabile incremento delle complessità tecniche e legali, richiedendo regolamentazioni più stringenti e una vigilanza attiva da parte degli operatori digitali per tutelare gli asset online e i diritti di proprietà intellettuale.

Redazione Assodigitale Avatar

Redazione Assodigitale

La Redazione di Assodigitale Phd, MBA, CPA

Il team editoriale di Assodigitale coordina la pubblicazione di notizie, analisi e approfondimenti quotidiani dal mondo dell'innovazione, della tecnologia e dei mercati digitali.

Questo account raccoglie i contributi storici della testata, i comunicati stampa certificati e le inchieste collettive curate dai nostri giornalisti e analisti.

Fondata per esplorare l'impatto della trasformazione digitale sulla società e sull'economia, la Redazione di Assodigitale si impegna a fornire un'informazione accurata, indipendente e verificata, seguendo rigorosi standard deontologici e di fact-checking per garantire ai lettori una visione chiara ed esperta del futuro tecnologico."

Per tutte le vostre esigenze editoriali e per proporci progetti speciali di Branded Content oppure per inviare alla redazione prodotti per recensioni e prove tecniche potete contattarci direttamente scrivendo alla redazione : CLICCA QUI

Areas of Expertise: Digital Marketing, SEO, Content Strategy, Crypto, Blockchain, Fintech, Finance, Web3, Metaverse, Digital Content, Journalism, Branded Content, Digital Transformation, AI Strategy, Digital Publishing, DeFi, Tokenomics, Growth Hacking, Online Reputation Management, Emerging Tech Trends, Business Development, Media Relations, Editorial Management.
Fact Checked & Editorial Guidelines

Our Fact Checking Process

We prioritize accuracy and integrity in our content. Here's how we maintain high standards:

  1. Expert Review: All articles are reviewed by subject matter experts.
  2. Source Validation: Information is backed by credible, up-to-date sources.
  3. Transparency: We clearly cite references and disclose potential conflicts.
Reviewed by: Subject Matter Experts

Our Review Board

Our content is carefully reviewed by experienced professionals to ensure accuracy and relevance.

  • Qualified Experts: Each article is assessed by specialists with field-specific knowledge.
  • Up-to-date Insights: We incorporate the latest research, trends, and standards.
  • Commitment to Quality: Reviewers ensure clarity, correctness, and completeness.

Look for the expert-reviewed label to read content you can trust.