Perplexity AI analizza contenuti non autorizzati: rischi e controversie nell’uso dell’intelligenza artificiale

5 Agosto 2025

Aggiungi Assodigitale alle tue fonti preferite su Google

Perplexity e le accuse di accesso non autorizzato ai siti web

Perplexity AI si trova nuovamente al centro di un acceso dibattito riguardante l’accesso non autorizzato a contenuti digitali. Nel 2024, diversi proprietari di siti web hanno denunciato che i loro contenuti venivano consultati nonostante le esplicite restrizioni imposte tramite file robots.txt, un’azione che dovrebbe impedire ai crawler non autorizzati di indicizzare tali pagine. Inizialmente, l’azienda aveva attribuito gli accessi ai crawler di terze parti impiegati per i propri servizi, ma questa spiegazione appare ora sempre meno credibile alla luce delle indagini successive. Queste accuse indicano che Perplexity avrebbe utilizzato sistemi avanzati per aggirare i normali meccanismi di blocco e acquisire informazioni senza rispettare le limitazioni stabilite dai proprietari dei siti. Tale condotta ha sollevato rilevanti questioni etiche e legali sull’uso dei dati raccolti e sulla trasparenza delle pratiche adottate dalla società nel rispetto delle normative digitali.

Tecniche di crawling invisibile e strategie di elusione

Le indagini condotte da Cloudflare hanno fatto emergere metodi sofisticati adottati da Perplexity AI per bypassare i meccanismi standard di protezione dei contenuti web. Quando i file robots.txt bloccano specificamente i bot ufficiali come “PerplexityBot” e “Perplexity-User”, l’azienda ricorre a un’articolata strategia che coinvolge l’uso di un browser simulato, mimando esattamente Google Chrome su macOS. In tal modo, i crawler si presentano ai server web come utenti umani reali, rendendo estremamente complessa la loro identificazione e filtraggio da parte delle difese digitali.

ERRORI DI PREZZO ASSURDI SU AMAZON > PRENDILI PRIMA CHE SPARISCANO!

🔥 DA NON PERDERE ▷ Adolescenti scelgono nudi generati con intelligenza artificiale: nuova allarmante deriva del sexting senza consenso

Questa sofisticazione si estende anche alla gestione degli indirizzi IP, con rotazioni dinamiche e frequenti cambi di fascia IP che non rientrano nel range ufficiale assegnato a Perplexity. Di conseguenza, i firewall configurati per bloccare traffico proveniente da indirizzi automatizzati risultano impotenti di fronte a questa tecnica, capace di travestire il traffico bot come traffico legittimo. La manipolazione viene praticata anche sul piano dei numeri di sistema autonomo (Autonomous System Number, ASN), con continui cambi tra ASN diversi per mascherare l’origine del traffico e aggirare le restrizioni implementate a livello di rete.

Queste tecniche di crawling invisibile comportano una lesione grave ai principi fondamentali di rispetto delle regole digitali, rendendo difficoltosa la tutela dei contenuti originali online e ponendo questioni rilevanti sull’etica delle pratiche di raccolta dati nell’ambito dell’intelligenza artificiale.

🔥 DA NON PERDERE ▷ Commercio globale accelera con l’intelligenza artificiale ma pesa il nodo Taiwan

Risposte di Cloudflare e sfide future per la sicurezza digitale

Cloudflare ha reagito con decisione alle evidenze emerse, intervenendo prontamente per proteggere le piattaforme e i contenuti digitali dei propri utenti. La società ha escluso i bot riconducibili a Perplexity AI dalla lista dei crawler verificati, segnalando apertamente la natura ingannevole delle loro attività di raccolta dati. Parallelamente, sono state implementate nuove tecnologie di filtraggio e sistemi di rilevamento avanzati mirati a identificare e bloccare forme di crawling invisibile, rafforzando così le barriere contro accessi non autorizzati mascherati da traffico umano autentico.

Le iniziative di Cloudflare evidenziano una sfida crescente per la sicurezza digitale, rilevando come l’evoluzione delle tecniche di elusione impone un costante aggiornamento degli strumenti di difesa. La situazione descrive un contesto in cui i fornitori di contenuti e i provider di sicurezza devono ingaggiare un confronto dinamico e continuo con le aziende AI, chiamate a bilanciare le esigenze di reperimento di informazioni aggiornate con il rispetto delle normative e delle politiche di accesso. Lo scenario attuale preannuncia un inevitabile incremento delle complessità tecniche e legali, richiedendo regolamentazioni più stringenti e una vigilanza attiva da parte degli operatori digitali per tutelare gli asset online e i diritti di proprietà intellettuale.

🔥 DA NON PERDERE ▷ La Commissione Ue crea un gruppo di esperti sull’impatto dell’Ia sul lavoro

Redazione Assodigitale

La Redazione di Assodigitale

Il team editoriale di Assodigitale coordina la pubblicazione di notizie, analisi e approfondimenti quotidiani dal mondo dell'innovazione, della tecnologia e dei mercati digitali.

Questo account raccoglie i contributi storici della testata, i comunicati stampa certificati e le inchieste collettive curate dai nostri giornalisti e analisti.

Fondata per esplorare l'impatto della trasformazione digitale sulla società e sull'economia, la Redazione di Assodigitale si impegna a fornire un'informazione accurata, indipendente e verificata, seguendo rigorosi standard deontologici e di fact-checking per garantire ai lettori una visione chiara ed esperta del futuro tecnologico."

Per tutte le vostre esigenze editoriali e per proporci progetti speciali di Branded Content oppure per inviare alla redazione prodotti per recensioni e prove tecniche potete contattarci direttamente scrivendo alla redazione : CLICCA QUI

Areas of Expertise: Journalism, Branded Content, Digital Transformation, AI Strategy, Digital Publishing

redazione@assodigitale.it

Controllo delle fonti e linee guida editoriali

Revisione editoriale a cura di Michele Ficara Manganelli