Il prezzo dell’addestramento
Dalla Rai a Mediaset, alcuni gruppi media vietano all'intelligenza artificiale di usare i propri contenuti, altri come NewsCorpo fanno accordi. Chi ha ragione?
Anche se può sembrare un aspetto secondario, affermare la possibilità o meno di utilizzare materiale protetto da copyright per l’addestramento rischia di cambiare le sorti dell’intelligenza artificiale
Laura Turini
Buongiorno a tutte e tutti,
prima di ogni altra cosa, un paio di informazioni di servizio: vi aspetto questa sera a Milano, alle 18, alla libreria Egea di viale Bligny per il nuovo appuntamento con i “dibattiti di geopolitica”, un ciclo di eventi organizzato dall’Institute for European Policymaking e dalla rivista Grand Continent per discutere le grandi questioni geopolitiche da una prospettiva europea.
Oggi si parla, ovviamente, di elezioni europee con Marco Bassini, esperto di diritto digitale, Mara Morini, studiosa di Russia che i lettori di Appunti ben conoscono, Maurizio Ferrera, politologo che ha scritto un importante paper per lo IEP sui destini dell’Europa, e poi Beda Romano del Sole 24 Ore, che per il Mulino ha raccontato in un bel saggio tra storia e reportage i paesi dell’Europa dell’Est.
Non poteva mancare poi Andrea Colli, storico dell’economia che da qualche anno ha introdotto la geopolitica nei corsi di economia della Bocconi. Io sarò il moderatore. Trovate tutte le info qui:
Seconda info di servizio: ieri in molti mi hanno segnalato la puntata di Globo, il podcast del Post di Eugenio Cau.
L’ospite del nuovo episodio è Mario Monti, che ha da poco pubblicato per Solferino il libro Demagonia - Dove porta la politica delle illusioni. Nella parte finale della puntata dedicata ai consigli di lettura o ascolto, Monti consiglia di leggere nientemeno che… Appunti! Anche grazie a questo generoso e inatteso supporto, ieri abbiamo registrato oltre 250 nuove iscrizioni, credo sia un record.
Trovate la puntata qui, e il libro sotto:
Oggi vi lascio con Laura Turini, che sta monitorando da vicino l’evoluzione dell’intelligenza artificiale e in particolare il cruciale impatto sulla proprietà intellettuale, tema al quale ha dedicato anche un libro
Ci vediamo stasera a Milano!
Stefano
Il prezzo dell’addestramento
di Laura Turini
La possibilità di utilizzare materiale protetto dal diritto d’autore per addestrare sistemi di intelligenza artificiale è molto controversa.
Negli Stati Uniti sono pendenti dodici cause che vertono su questo tema, contro OpenAI, Microsoft, Midjourney e altri.
Al momento nessuna è stata decisa. Anzi, di fronte alla richiesta di emettere un ordine provvisorio che proibisse fin da subito ai sistemi di intelligenza artificiale di utilizzare materiale protetto, in attesa della decisione definitiva, la Corte ha preferito non azzardare alcuna presa di posizione, vista la delicatezza della questione.
Anche se può sembrare un aspetto secondario, affermare la possibilità o meno di utilizzare materiale protetto da copyright per l’addestramento rischia di cambiare le sorti dell’intelligenza artificiale.
Se dovessero essere pagati i diritti, le imprese che operano in questo settore dovrebbero cambiare strategia e, come esse stesse sostengono, molte chiuderebbero per l’impossibilità di sostenere l’impatto economico.
I dati di cui necessitano sono talmente numerosi che anche corrispondere una piccolissima royalty sarebbe un peso insopportabile.
Dal punto di vista legale, negli Stati Uniti, tutto ruota intorno all’interpretazione della dottrina del fair use e alla sua applicabilità alla nuova fattispecie.
Questa dottrina muove dal presupposto che lo scopo principale del copyright è diffondere la conoscenza e che deve essere trovato un equilibrio tra il sacrosanto diritto degli autori di ottenere un compenso per lo sfruttamento delle loro opere e l’interesse della collettività a conoscere e a partecipare al progresso.
In base al fair use possano essere utilizzate opere protette da copyright senza chiedere il consenso agli autori, e senza pagare alcun compenso, principalmente quando l’uso che ne viene fatto è un “uso trasformativo”, ovvero quando un’opera viene utilizzata non con il fine di copiarla o di sostituirsi ad essa, ma con uno scopo del tutto diverso, come accade quando viene usato un testo a fini di critica, di commento o per fornire informazioni su di esso. Non è l’unico criterio utilizzato, ma è il più importante.
Si sostiene così, su basi piuttosto solide a mio avviso, che i sistemi di intelligenza artificiale usano le opere protette per fini trasformativi, in quanto apprendono ed estraggono da esse modelli matematici, informazioni, elementi che consentono loro di creare opere nuove.
All’opposto, altri sostengono che un tale uso sarebbe comunque una copia illegale ed è su questo nodo cruciale che stanno riflettendo le Corti statunitensi con un’approfondita indagine anche di natura tecnica, utile a tutti anche per comprendere meglio il funzionamento dei sistemi di AI, che sono nelle mani di grosse imprese private ma non del tutto conosciuti.
In Europa non esiste la dottrina del fair use, ma nella Direttiva (UE) 2019/790 è stata introdotta la cosiddetta eccezione di “text and data mining” (TDM) definito come “qualsiasi tecnica di analisi automatizzata volta ad analizzare testi e dati in formato digitale avente lo scopo di generare informazioni inclusi, a titolo non esaustivo, modelli, tendenze e correlazioni”.
In particolare l’art. 4 prevede che i titolari dei diritti d’autore possono opporsi al TDM, attraverso l’opt out, manifestando la loro volontà contraria in modo appropriato, eccezione introdotta anche nella Legge d’Autore italiana agli articoli 70-ter e 70-quater che il Disegno di Legge approvato dal Consiglio dei Ministri il 23 Aprile 2024 estende espressamente anche ai sistemi di intelligenza artificiale.
Salvo che non si tratti di un’estrazione per fini di ricerca scientifica, che è sempre consentita, l’art. 70-quater prevede che “l'estrazione di testo e di dati è consentita quando l'utilizzo delle opere e degli altri materiali non è stato espressamente riservato dai titolari del diritto d'autore e dei diritti connessi nonché dai titolari delle banche dati”.
Esprimere il dissenso
Si è discusso molto su come possa essere manifestato “espressamente” il dissenso e in questi giorni ne sono arrivati alcuni esempi concreti. Mediaset, già a gennaio di quest’anno, ha introdotto nei titoli di coda una dicitura in cui specifica che “È severamente vietato ogni utilizzo delle immagini trasmesse atto all’addestramento di sistemi di intelligenza artificiale generativa, così come l’utilizzo di mezzi automatizzati di ‘data scraping’”.
La Rai, dal canto suo, in una nota pubblicata recentemente sul proprio sito , ha reso noto di avere affrontato la questione e di avere deciso “che la Rai eserciterà la facoltà cosiddetta di opt out: proteggerà dunque i propri contenuti, da un lato attraverso l’utilizzo di tecnologie specifiche e dall’altro segnalando esplicitamente con un disclaimer la volontà di Rai - in quanto titolare dei contenuti - di vietarne la riproduzione o l’utilizzo alle Piattaforme di Intelligenza artificiale in linea con i principali servizi pubblici europei”.
Ad esse si è aggiunta la Sony che ha manifestato il suo dissenso in modo formalmente più preciso indicando pubblicamente le singole attività vietate e inserendo recapiti di contatto per chi volesse ricevere chiarimenti o ottenere il permesso all’utilizzo del suo catalogo musicale.
In questo contesto, è recente la notizia che un importante operatore dell’editoria come News Corp, a cui fanno capo, tra gli altri, il Wall Street Journal, il Times e il Sun e il New York Post, ha trovato un accordo con OpenAI, proprietario di ChatGPT e Dall-E, per l’utilizzo dei propri articoli.
Accordi analoghi erano stati raggiunti anche con altri gruppi editoriali, ma i contenuti precisi sono ovviamente segreti, per cui non è ben chiaro se sia stato concordato un compenso economico o qualche altra utilità e se gli articoli saranno utilizzati per l’addestramento del sistema, come è molto probabile, o come base di dati.
In attesa che negli Stati Uniti venga decisa una delle cause pendenti su questo tema, sembra che si stia cercando di trovare una soluzione commerciale per non ostacolare lo sviluppo dei sistemi di intelligenza artificiale o metterli a rischio.
Ciò nonostante non è ancora certo che questa sarà la scelta finale.
Le cose potrebbero cambiare se un Giudice affermasse la prevalenza del fair use, ovvero della possibilità di potere utilizzare materiale protetto da diritto d’autore per attività di studio o a fini trasformativi, e non si può dimenticare che anche in Europa c’è chi sostiene che il diritto di text e data mining, inteso, come diritto di vietare a terzi di apprendere nozioni dai dati, non esista e non possa pertanto essere vietato ad alcuno di farlo.
Questioni giuridiche di lana caprina che potrebbero cambiare le sorti dell’intelligenza artificiale o, quanto meno, dei modelli economici e finanziari per il suo sviluppo.
Appunti è possibile grazie al sostegno delle abbonate e degli abbonati. E’ con il loro contributo che Appunti può crescere e svilupparsi anche con progetti ambiziosi come La Confessione. Se pensi che quello che facciamo è importante, regala un abbonamento a qualcuno a cui tieni.
Appunti e Dieci Rivoluzioni: il libro e l’abbonamento omaggio
Visto che in questa fase non riesco a fare molta della tradizionale promozione del libro - tra festival, tv, radio ecc - per gli impegni di lavoro e familiari, vorrei tentare un esperimento, legato alla comunità di Appunti.
Se gli influencer si appellano alla loro comunità per vendere i loro libri, o altra oggettistica, non posso farlo anche io?
Ho pensato questa formula, che - come direbbero gli aridi economisti - allinea tutti i nostri incentivi:
Se comprate il mio libro Dieci rivoluzioni, poi fate(vi) una foto mentre lo leggete, mentre lo sfogliate, mentre lo regalate a qualcuno: me la mandate qua su Appunti o su Instagram e io attiverò un abbonamento omaggio ad Appunti di sei mesi all’indirizzo mail che mi indicherete. E poi condividerò le vostre foto qui e dai miei social.
Così anche chi ha già l’abbonamento può approfittarne e regalare un ingresso tra gli abbonati di Appunti a qualcuno a cui tiene.
Il Podcast: La Confessione
Ascolta La Confessione, il podcast di inchiesta che rivela per la prima volta da dentro come funziona il sistema di copertura e insabbiamento degli abusi sessuali nella Chiesa cattolica italiana.
Un podcast realizzato da Stefano Feltri, Giorgio Meletti e Federica Tourn, realizzato grazie al sostegno della comunità di Appunti. Con la collaborazione di Carmelo Rosa e la consulenza per musiche ed effetti di Stefano Tumiati.
E’ arrivato il momento di tagliare i tassi di interesse per le banche centrali? E di quanto? Ignazio Angeloni consiglia di muoversi con grande prudenza, soprattutto la Bce.
Il fatto che alcune aziende prendano accordi di utilizzo dei loro contenuti con OpenAI e' significativo perche' (come dice l'articolo) il focus e' sullo sfruttamento commerciale dei contenuti.
Ci sono due aspetti che voglio ricordare:
1) Se uso ChatGPT anziche' un normale motore di ricerca, non ho alcuna fonte da citare per del testo che viene generato. Perdo la credibilita', non so se quel testo e' stato creato mixando un paper scientifico o fantasie di un terrapiattista. Non so che fondamento legale abbia questo "opt-out" ma mi sa OpenAI & friends si fanno delle grasse risate.
2) Alcuni aziende come Reddit o Twitter (che campano grazie ai contenuti creati dagli utenti), adesso vendono in licenza anni e anni di contenuti senza chiedere il permesso a nessuno. E non solo. Chiudono l'accesso programmatico (le cosiddette API) con l'obiettivo di bloccare questo sgraffignare dalle AI ma con la conseguenza di strangolare l'ecosistema di App terze parti creati dagli utenti.