La Wikimedia Foundation ha stretto nuove partnership con diverse società di intelligenza artificiale per consentire l’utilizzo dei contenuti di Wikipedia nell’addestramento dei loro modelli. L’annuncio è stato fatto dalla fondazione stessa, un’organizzazione no-profit, nel contesto del 25° anniversario di Wikipedia.
La Wikimedia Foundation, con l’obiettivo di rafforzare la sostenibilità a lungo termine di Wikipedia in un contesto di cambiamento del comportamento online, ha stretto accordi con società di intelligenza artificiale per l’addestramento e il potenziamento dei modelli di intelligenza artificiale.
L’accordo è stato formalizzato attraverso Wikimedia Enterprise, il prodotto commerciale della Fondazione destinato ai riutilizzatori e distributori su larga scala dei contenuti dei progetti Wikimedia. Tra le nuove adesioni figurano Ecosia, Microsoft, Mistral AI, Perplexity, Pleias e ProRata, che si uniscono a partner già esistenti come Amazon, Google e Meta.
“Nell’era dell’intelligenza artificiale, Wikipedia e la sua conoscenza creata e curata dall’uomo sono più preziose che mai”, ha dichiarato la fondazione in una nota. “Questa conoscenza alimenta chatbot generativi di intelligenza artificiale, motori di ricerca, assistenti vocali e altro ancora. Wikipedia è uno dei set di dati di altissima qualità utilizzato per addestrare modelli linguistici su larga scala.”
Wikipedia, tra i 10 siti web più visitati al mondo, si distingue come l’unico gestito da un’organizzazione senza scopo di lucro. La fondazione riporta che i suoi oltre 65 milioni di articoli pubblicati in più di 300 lingue diverse vengono visualizzati quasi 15 miliardi di volte ogni mese.
Tuttavia, la fondazione evidenzia un cambiamento nei modelli di traffico. Ad ottobre, è stata annunciata una diminuzione dell’8% su base annua delle visite umane a Wikipedia, attribuita al fatto che gli utenti si affidano sempre più ai riepiloghi generati dall’intelligenza artificiale anziché visitare direttamente il sito. Attualmente, quasi il 60% delle ricerche su Google termina senza un clic, con risposte spesso fornite dai contenuti di Wikipedia.
L’accordo si inserisce in un dibattito più ampio sull’acquisizione dei dati di formazione da parte delle aziende di intelligenza artificiale. I modelli linguistici su larga scala, addestrati utilizzando grandi quantità di materiale online, sono stati oggetto di critiche da parte di autori, editori e altri detentori di diritti che contestano l’uso non autorizzato di opere protette da copyright.
In questo contesto, Reddit ha avviato diverse azioni legali contro società di intelligenza artificiale per l’utilizzo dei suoi contenuti nell’addestramento dei modelli, pur mantenendo accordi di licenza con Google e altri.
Gli editori di libri Hachette Book Group e Cengage Group hanno presentato un reclamo per partecipare a un’azione legale collettiva esistente contro Google, accusando la società di “**violazione storica del copyright**” nella costruzione della sua piattaforma di intelligenza artificiale Gemini. La causa sostiene che Google ha copiato libri durante la sua formazione sull’intelligenza artificiale senza ottenere le necessarie licenze. L’azione legale era stata originariamente intentata nel 2023 dal gruppo di autori.
Anche OpenAI deve affrontare azioni legali simili da parte di querelanti, tra cui lo sceneggiatore di “Il Trono di Spade”, George R.R. Martin.
Anche le società di intrattenimento stanno affrontando questo problema. A metà dicembre, Disney ha inviato una lettera di cessazione e desistenza a Google accusandola di violazione del copyright, nonostante avesse un accordo di licenza separato con OpenAI che copriva centinaia di personaggi nei video generati dall’intelligenza artificiale. Disney ha emesso avvisi simili ad altre società di intelligenza artificiale ed è coinvolta in una causa contro la società di generazione di immagini Midjourney, insieme ai principali studi cinematografici.
Nello stesso mese, una coalizione di sceneggiatori, attori e ingegneri ha lanciato un nuovo gruppo industriale volto a promuovere standard giuridicamente applicabili che regolano il modo in cui l’intelligenza artificiale viene addestrata e utilizzata nel settore dell’intrattenimento. Più di 500 celebrità hanno aderito all’iniziativa, tra cui Natalie Portman, Cate Blanchett, Ben Affleck, Guillermo del Toro e Taika Waititi.
La Commissione Europea ha avviato un’indagine antitrust formale per verificare se Google abbia violato le regole di concorrenza dell’UE utilizzando contenuti degli editori e di YouTube per alimentare i suoi servizi di intelligenza artificiale senza un’equa remunerazione o consenso.
Resta incerto se i titolari dei diritti d’autore riusciranno a trovare un rimedio definitivo. Un giudice federale negli Stati Uniti ha recentemente stabilito che l’uso da parte di Meta e Anthropic di libri protetti da copyright per addestrare modelli di intelligenza artificiale costituisce un uso corretto, criticando le società per il mantenimento di biblioteche permanenti di opere piratate.
Wikimedia Foundation ha annunciato partnership con aziende AI.
Wikipedia rivela molteplici accordi con i giganti dell’intelligenza artificiale per utilizzare i suoi contenuti
Ricevi le nostre ultime notizie da Google News
clicca su SEGUICI, poi nella nuova schermata clicca sul pulsante con la stella.

