Nelle ultime giornate, diversi utenti hanno assistito all’apparizione improvvisa, e altrettanto veloce sparizione, di un nuovo modello di intelligenza artificiale, soprannominato “gpt2-chatbot“, sulla piattaforma LMSYS Chatbot Arena. Questo evento ha suscitato un’ondata di eccitazione tra gli utenti e gli esperti, molti dei quali lo hanno considerato superiore alle capacità di GPT-4 di OpenAI.
Ma dopo soli pochi giorni di intensi test, il modello è misteriosamente svanito, ritirato a causa di un “traffico inaspettatamente elevato“, come confermato da LMSYS sul social network X, precedentemente noto come Twitter. Questa scomparsa ha scatenato molte speculazioni e teorie: alcuni ipotizzano che possa trattarsi di un’anteprima segreta del prossimo grande lancio di una compagnia come OpenAI.
Queste congetture non sono certo state mitigate dopo che Sam Altman, CEO della startup supportata da Microsoft, ha lasciato scritto sul suo X: “Ho un debole per gpt2”. Cosa volesse davvero dire è un mistero, ma è importante ricordare che OpenAI aveva rilasciato un modello chiamato GPT-2 nel 2019, oggi considerato datato rispetto alle più recenti innovazioni.
Durante la breve finestra di disponibilità, coloro che hanno avuto modo di testare il modello hanno condiviso impressioni molto positive, suggerendo che le sue capacità potessero competere con quelle dei grandi nomi nel settore. Ethan Mollick dell’Università della Pennsylvania ha dichiarato che il modello sembrava essere all’altezza di GPT-4 e forse anche superiore, evidenziando in particolare la sua abilità nel risolvere complesse questioni matematiche che ancora mettono in difficoltà altri modelli avanzati.
Il dibattito è comunque ancora aperto. Ars Technica, dopo aver effettuato i propri test, ha concluso che “qualunque cosa sia, probabilmente non è GPT-5“.
Simon Willison, programmatore e ricercatore di intelligenza artificiale, ha suggerito che possa trattarsi di una mossa di marketing da parte di OpenAI, una strategia che contrasterebbe con l’etica “neutrale” di LMSYS, un’organizzazione che promuove lo sviluppo aperto di modelli di linguaggio su larga scala. La situazione ha generato critiche verso la ricerca di LLM, come evidenziato da Willison: un rilascio non annunciato e opaco, seguito da reazioni frenetiche online basate più su impressioni che su analisi scientifiche.