Wikipedia è uno di quei posti online che diamo un po’ per scontato. È sempre lì, pronto a dirci chi era quel personaggio storico di cui ci siamo appena dimenticati, cosa vuol dire quel termine tecnico che ci ha confuso o, banalmente, a risolvere dibattiti notturni tra amici su chi abbia vinto cosa e quando. Eppure, proprio ora che ci serve più che mai, Wikipedia è sotto pressione. E la colpa, stavolta, non è dei soliti utenti curiosi.
Il traffico IA su Wikipedia cresce: chi paga il conto?
Negli ultimi tre mesi, il consumo di media su Wikipedia — immagini, video, file audio — è schizzato alle stelle, con un aumento di quasi il 50%. Ma non perché improvvisamente ci siamo tutti innamorati della conoscenza. A far salire i numeri sono stati i crawler delle aziende di intelligenza artificiale: quei bot instancabili che scandagliano il web in lungo e in largo per trovare contenuti da usare per addestrare i modelli di IA generativa. E sì, Wikipedia è un vero paradiso per loro, pieno di contenuti ben organizzati, gratuiti e ricchi di informazioni.
Il problema? Questi bot non hanno limiti. Scaricano tutto: non solo le pagine più cliccate, ma anche quelle super di nicchia, che normalmente dormono tranquille nei meandri dell’enciclopedia. E questo genera un traffico pesante, che mette a dura prova le infrastrutture di Wikimedia. Tanto che, in momenti di picco, come dopo la notizia della morte di personaggi famosi, gli utenti reali rischiano di trovare Wikipedia lenta o addirittura bloccata.
E come se non bastasse, il traffico dei bot costa di più. Perché molte delle pagine richieste dai crawler non sono già pronte in cache, e quindi vanno recuperate dai server centrali, consumando più risorse. Secondo la fondazione, il 65% del traffico più “pesante” arriva proprio da questi bot.
Insomma, mentre le aziende di IA si servono a volontà, Wikipedia paga il conto. E adesso la fondazione sta valutando di cambiare le regole: chi vuole usare i suoi contenuti per addestrare modelli di IA potrebbe dover contribuire in modo più concreto.