News

OpenAI CriticGPT: il nuovo strumento che controlla ChatGPT

Le intelligenze artificiali, come ChatGPT, sono tecnologie estremamente potenti ed innovativi, ma per quanto ci si lavori, non sono ancora immuni dagli errori. OpenAI ha però trovato una sorta di soluzione promettente per affrontare questo problema creando il sistema CriticGPT. Questo nuovo modello di intelligenza artificiale ed è basato su GPT-4. Esso è progettato per individuare inesattezze nelle risposte generate da ChatGPT per poterne poi migliorare la precisione e l’affidabilità.

CriticGPT è attualmente utilizzato solo internamente da OpenAI e il suo scopo principale è supportare il processo di addestramento dell’IA. Da un documento pubblicato da OpenAI, esso può essere impiegato per migliorare le risposte del modello GPT-4 tramite una tecnica chiamata Reinforcement Learning from Human Feedback (RLHF). Questa permetterebbe di affinare le prestazioni di ChatGTP attraverso il feedback dell’utenza, migliorando pian piano in modo progressivo la qualità delle risposte generate.

CriticGPT insieme ai feedback degli utenti contro le inesattezze di ChatGPT

CriticGPT si è dimostrato sin da subito molto efficace nel rilevare errori nelle risposte di ChatGPT ma ci sono comunque difficoltà. Con il miglioramento continuo

di ChatGPT, individuare gli effettivi errori è diventato sempre più complicato. Man mano che i modelli diventano più competenti, secondo OpenAI, può diventare più arduo allinearli correttamente utilizzando solo il feedback umano.

Anche con queste sfide, OpenAI ha tuttavia riportato risultati promettenti. Un secondo trainer casuale ha preferito le critiche generate dal team Human+CriticGPT rispetto a quelle di una persona non assistita in oltre il 60% dei casi. Ciò suggerisce che CriticGPT unito ai feedback umani può fornire critiche più accurate e utili. Il modello CriticGPT è stato addestrato utilizzando risposte brevi ed è attualmente in grado di individuare errori solo nelle risposte di ChatGPT. Questo focus specifico permette a CriticGPT di essere altamente specializzato nel suo compito, ma anche limitato nell’ambito delle sue applicazioni. Lo strumento è ancora in fase di utilizzo interno e di valutazione, ma le sue potenzialità già sono prevedibili. Continuando con gli sviluppi e i miglioramenti, CriticGPT potrebbe essere esteso anche ad altre aree differenti dalla correzione delle risposte di ChatGPT, così da migliorare complessivamente la qualità dell’IA.

Condividi
Pubblicato da
Rossella Vitale