Vai al contenuto

Editori contro Google per il copyright sull’IA

Giovedì, Hachette Book Group e Cengage Group hanno presentato una mozione a un tribunale federale della California per intervenire in un’azione legale collettiva contro Google. L’azione legale accusa Google di violazione del copyright nell’addestramento dei suoi modelli di intelligenza artificiale, in particolare la piattaforma Gemini.

La denuncia sostiene che Google ha orchestrato una “storica violazione del copyright” scaricando libri da siti pirata e copiandoli ripetutamente durante l’addestramento dei modelli di intelligenza artificiale.

Secondo gli editori, Google ha scaricato libri da siti web pirata come Z-Library e OceanofPDF. Sostengono che queste copie sono state effettuate ripetutamente: prima nella memoria del computer, poi in un formato leggibile dal sistema AI e di nuovo nel set di addestramento per ogni nuova versione del modello.

La causa consolidata era stata originariamente intentata nel 2023 da singoli autori come proposta di azione legale collettiva sul copyright, accusando Google di copiare i loro libri per addestrare modelli di intelligenza artificiale generativa.

Il set di dati di formazione C4 di Google, secondo la denuncia, include opere protette da copyright raccolte da Z-Library, una raccolta pirata da cui le autorità hanno sequestrato più di 350 siti e domini web.

Gli editori hanno evidenziato come i libri siano stati copiati da b-ok.org, il dominio di Z-Library che attualmente mostra gli avvisi di sequestro federale, così come da OceanofPDF e WeLib, “un altro sito prolifico con accesso a un tesoro di contenuti protetti da copyright non autorizzati”.

La denuncia afferma che il set di dati C4 include opere provenienti da almeno 28 siti che il governo degli Stati Uniti ha identificato come mercati per la violazione del copyright e merci contraffatte.

“Il simbolo del copyright (©) appare più di 200 milioni di volte nel set di dati C4”, afferma la denuncia, sottolineando che mentre Google escludeva “avvisi sulla politica” e “termini di servizio”, includeva “vaste categorie di opere protette da copyright, opere piratate e opere ottenute dietro pagamenti a pagamento”.

Gli editori sostengono che Google copia opere da librerie basate su abbonamento come Scribd.com, eludendo gli accordi formali di licenza.

La causa sostiene che Gemini produce output che sono un “sostituto delle opere protette da copyright”, incluse riproduzioni letterali, riassunti dettagliati e “imitazioni che copiano gli elementi creativi dell’opera originale”.

L’editore chiede danni legali, un’ingiunzione per prevenire ulteriori violazioni e un ordine che imponga a Google di distruggere tutte le copie non autorizzate del materiale protetto da copyright e di rivelare quali libri sono stati utilizzati per addestrare Gemini.

Google si sta anche difendendo dalle accuse antitrust di Penske Media Corporation sulla sua funzionalità di riepilogo dell’intelligenza artificiale, sostenendo che la visualizzazione di riepiloghi generati dall’intelligenza artificiale costituisce “un miglioramento legittimo del prodotto, non un atto anticoncorrenziale”.

La mozione di intervento fa seguito a una serie di cause legali sul copyright che gli autori hanno intentato contro le società di intelligenza artificiale nel 2023, in cui un giudice federale ha ottenuto una vittoria parziale per Meta e Anthropic, stabilendo che l’uso di libri protetti da copyright per addestrare modelli costituisce un uso corretto ai sensi della legge sul copyright, ma ha criticato le società per il mantenimento di biblioteche permanenti di libri piratati.

Gli editori di libri cercano di unirsi alla battaglia sul copyright dell’intelligenza artificiale di Google


Leggi l’articolo completo

Entra nella community su Telegram

Vai al gruppo
Google News Ricevi le nostre ultime notizie da Google News clicca su SEGUICI, poi nella nuova schermata clicca sul pulsante con la stella.
SEGUICI

Articoli correlati

Autore

0 0 voti
Valutazione dell'articolo
Iscriviti
Notifica di
guest
0 Commenti
Il più vecchio
Più recente Più votato
Feedback in linea
Visualizza tutti i commenti
0
Mi piacerebbe conoscere la tua opinione, per favore lascia un commento.x