Recentemente, il New York Times ha messo in evidenza le sfide affrontate da OpenAI nel tentativo di raggiungere accordi con gli editori riguardo l’utilizzo dei loro contenuti per addestrare i suoi modelli di intelligenza artificiale generativa. Fonti vicine hanno rivelato che l’offerta finanziaria agli editori per l’utilizzo dei loro contenuti nei dataset di addestramento è stata sorprendentemente bassa, anche per gli standard degli editori di dimensioni minori.
OpenAI: il blocco del GPTBot
OpenAI si è trovata al centro di polemiche e denunce, tra cui una recente dal New York Times, per aver utilizzato libri, articoli e altri materiali protetti da diritti d’autore nell’addestramento dei suoi modelli di AI. La compagnia ha impiegato tecniche di scraping, ovvero la raccolta di dati tramite crawler simili a quelli utilizzati dai motori di ricerca per indicizzare pagine web. Il GPTBot di OpenAI è stato bloccato da numerosi editori, ma l’azienda continua a esplorare il web per raccogliere dati.
In risposta a queste controversie, OpenAI ha iniziato a negoziare accordi di licenza con diversi editori. Tuttavia, secondo le informazioni rilasciate, l’offerta proposta da OpenAI variava tra 1 e 5 milioni di dollari all’anno, una cifra ritenuta inadeguata dagli editori, anche quelli di dimensioni più ridotte. Questo potrebbe spiegare le difficoltà incontrate da OpenAI nel raggiungere accordi soddisfacenti.
Nonostante le critiche, OpenAI si è accordata con The Associated Press e Alex Springer. Apple, per esempio, avrebbe offerto 50 milioni di dollari per l’accesso agli articoli, che verranno utilizzati per addestrare il suo modello destinato ad essere integrato in iOS 18.
La posizione di OpenAI in questo contesto è delicata. Nonostante le sue significative entrate nel 2023, che hanno superato 1,6 miliardi di dollari, e una valutazione di mercato che potrebbe superare i 100 miliardi di dollari, l’azienda deve ancora trovare un equilibrio tra l’accesso ai dati necessari per i suoi modelli di AI e il rispetto dei diritti di proprietà intellettuale degli editori. La questione rimane aperta e al centro di un dibattito che riguarda non solo la tecnologia, ma anche le implicazioni etiche e legali dell’uso di contenuti protetti da diritti d’autore.