Case editrici citano in giudizio Meta per uso integrale dei libri nei sistemi di intelligenza artificiale
Indice dei Contenuti:
Le principali case editrici citano Meta per addestramento illecito di Llama
Le case editrici Macmillan, McGraw Hill, Elsevier, Hachette, Cengage e lo scrittore Scott Turow hanno avviato una class action federale negli Stati Uniti contro Meta. Contestano l’uso, ritenuto illecito, di libri e articoli protetti da copyright per addestrare il modello di intelligenza artificiale Llama. According to the lawsuit, Meta avrebbe scaricato opere da noti siti di pirateria e dal dataset Common Crawl, considerato saturo di copie non autorizzate. Il caso esplode oggi perché gli editori vedono nelle AI generative una minaccia sistemica ai propri cataloghi e ai ricavi futuri, e puntano a fissare un precedente legale sulla liceità dell’addestramento dei modelli con contenuti coperti da diritto d’autore.
In sintesi:
- Class action di grandi editori e Scott Turow contro Meta per addestramento di Llama.
- Accuse di utilizzo sistematico di libri piratati e dataset Common Crawl.
- Meta rivendica il fair use; editori chiedono danni e blocco delle attività illecite.
- La causa può fissare uno standard legale per l’intero settore dell’AI generativa.
Perché gli editori accusano Meta e cosa rischia il settore AI
Nel ricorso gli editori documentano che, fornendo a Llama le prime frasi del manuale bestseller “Calculus: Early Transcendentals” di James Stewart (Cengage), il modello prosegue riproducendo il testo quasi parola per parola. Questo comportamento viene indicato come prova che i pesi del modello incorporerebbero copie integrali di opere protette e non semplici “astrazioni statistiche”.
Secondo gli editori, Meta avrebbe deliberatamente scaricato file da archivi pirata come LibGen, Anna’s Archive, Sci‑Hub e Sci‑Mag, integrandoli nel proprio corpus di addestramento, insieme a Common Crawl. Il dataset è descritto in atti come “pieno di copie non autorizzate” di libri e articoli accademici. L’azione chiede non solo risarcimenti e lo stop alle condotte giudicate illecite, ma anche un ordine che obblighi Meta a rendere pubblico l’elenco completo delle opere usate per addestrare Llama.
Sul fronte difensivo, il portavoce Meta Dave Arnold cita precedenti in cui i tribunali hanno riconosciuto che l’addestramento dei modelli AI su materiali coperti da copyright può rientrare nel fair use, promettendo che l’azienda “combatterà in modo aggressivo” la causa.
I precedenti giudiziari e gli scenari futuri per copyright e intelligenza artificiale
Casi analoghi contro Meta e altre big tech hanno già costretto le aziende a spiegare pubblicamente le proprie pratiche sui dataset “misti”, che combinano contenuti leciti e opere piratate. Un giudice federale statunitense ha chiarito che le decisioni finora emesse non equivalgono a un lasciapassare generale: la legalità dell’uso di opere protette per addestrare modelli linguistici resta aperta e altamente contestata.
Anche Anthropic è stata trascinata in tribunale dagli autori. In quel procedimento il giudice ha riconosciuto come possibile fair use l’addestramento su libri regolarmente acquistati, ma ha autorizzato una class action per le opere che sarebbero state ottenute in modo illecito. Il contenzioso si è chiuso con un accordo da 1,5 miliardi di dollari a favore degli scrittori, creando un primo riferimento economico di scala industriale.
La nuova causa contro Meta, sostenuta da cinque tra le maggiori case editrici globali, punta a qualcosa di più: fissare un precedente giuridico chiaro applicabile a tutte le aziende che usano dati web su larga scala, da Common Crawl ai repositori di ricerca. Se il tribunale imponesse a Meta la disclosure completa delle opere sfruttate per l’addestramento, l’effetto domino potrebbe riguardare ogni grande modello linguistico in commercio, ridefinendo costi di licenza, accordi con editori e modalità stesse di sviluppo dell’AI generativa.
FAQ
Chi sono gli editori che hanno citato in giudizio Meta?
Sono coinvolti gli editori Macmillan, McGraw Hill, Elsevier, Hachette, Cengage e lo scrittore Scott Turow, tutti parte della class action.
Cosa viene contestato a Llama nel dettaglio?
Viene contestato che Llama riproduca passaggi integrali di libri, come il manuale di James Stewart, dimostrando un addestramento su copie pirata.
Perché Common Crawl è al centro della controversia?
Perché Common Crawl contiene enormi porzioni del web, comprese copie non autorizzate di libri e articoli, e viene usato da molti sviluppatori AI.
Che impatto può avere il precedente Anthropic sul caso Meta?
L’accordo da 1,5 miliardi di dollari con gli scrittori offre un parametro economico significativo, aumentando pressione negoziale e aspettative di risarcimento verso Meta.
Quali sono le fonti di questo articolo sulla causa contro Meta?
L’analisi deriva da un’elaborazione congiunta delle informazioni diffuse da Ansa.it, Adnkronos.it, Asca.it e Agi.it, rielaborate dalla nostra Redazione.



