OpenAI ha recentemente presentato CriticGPT, una nuova intelligenza artificiale progettata per individuare errori nelle righe di codice generate da ChatGPT, un modello basato su GPT-4. Questa iniziativa mira a migliorare la precisione e l’affidabilità delle risposte generate dalle IA, affrontando le problematiche di allucinazioni e errori che possono verificarsi in queste tecnologie avanzate.
Attualmente utilizzato internamente, CriticGPT rappresenta un passo avanti significativo nel campo dell’addestramento delle intelligenze artificiali. OpenAI ha reso disponibile un documento di ricerca che esplora i potenziali utilizzi di CriticGPT, enfatizzando il suo ruolo nel supportare gli sviluppatori nell’ottimizzazione del modello GPT-4. Questo avviene attraverso una tecnica nota come Reinforcement Learning from Human Feedback (RLHF), che permette a CriticGPT di apprendere dagli errori e migliorare continuamente le sue capacità.
L’efficacia di CriticGPT ha però mostrato un declino nel tempo, poiché ChatGPT ha incrementato la sua precisione, rendendo più difficili da individuare i suoi errori. OpenAI ha evidenziato che questa sfida rappresenta una limitazione fondamentale della tecnica RLHF, poiché i modelli diventano sempre più competenti rispetto alle persone che forniscono il feedback.
Secondo le analisi di OpenAI, i risultati mostrano che un secondo revisore casuale ha preferito le correzioni proposte dal team Human+CriticGPT rispetto a quelle fornite da una persona non assistita in oltre il 60% dei casi. Questo suggerisce che CriticGPT può giocare un ruolo cruciale nel migliorare la qualità delle risposte generate dalle IA, soprattutto nei contesti dove la precisione e l’affidabilità sono cruciali.
Al momento, CriticGPT è specializzato nell’individuare errori nelle risposte di ChatGPT, utilizzando principalmente risposte brevi. Ma il potenziale di espansione e di applicazione di questa tecnologia potrebbe avere implicazioni significative nell’evoluzione futura delle intelligenze artificiali, promuovendo un uso più sicuro e accurato di queste tecnologie avanzate e una innovativa collaborazione uomo-macchina per migliorarle.