La rivista è entrata in possesso di documenti riservati del team di Runway, tra cui un foglio di calcolo con canali consigliati, parole chiave e hashtag. Questi documenti fanno riferimento esplicito a canali YouTube di famose aziende di intrattenimento, digital creator come MKBHD, Linus Tech Tips e Sam Kolder, agenzie di stampa come The Verge, The New Yorker, Reuters e Wired, e persino a siti pirata come KissCartoon. Tra le società di intrattenimento citate figurano giganti come Netflix, Disney, Nintendo e Rockstar Games.
Un ex dipendente di Runway ha rivelato a 404 Media che gli sviluppatori hanno compiuto enormi sforzi per trovare video di alta qualità per costruire il loro modello. I video venivano utilizzati come input per un web crawler che automaticamente scaricava i contenuti dai canali indicati, utilizzando server proxy per evitare blocchi da parte di Google.
Nonostante queste rivelazioni, Runway ha scelto di non rilasciare dichiarazioni ufficiali alla rivista. Attualmente non ci sono prove concrete che tutti i video elencati nel foglio di calcolo siano stati utilizzati per l’addestramento del modello Gen-3 Alpha. Tuttavia, il co-fondatore di Runway, Anastasis Germanidis, ha affermato in un’intervista a TechCrunch lo scorso giugno che l’azienda utilizza un insieme di dati curati e interni per i suoi modelli di AI.
Se confermato, questo comportamento costituirebbe una chiara violazione delle politiche di YouTube, che proibisce espressamente l’estrapolazione di dati, specialmente se protetti da diritti d’autore. Questo caso arriva poco dopo il blocco da parte di YouTube di sei siti che permettevano di scaricare video dalla piattaforma, evidenziando la necessità di regolamentare congiuntamente le politiche di addestramento dell’AI.
La controversia sottolinea l’urgenza di stabilire norme chiare per l’utilizzo dei dati online, in un settore in rapida espansione come quello dell’intelligenza artificiale. La protezione dei diritti d’autore e il rispetto delle policy delle piattaforme diventano sempre più cruciali per evitare abusi e garantire un uso etico e legale delle tecnologie emergenti.