Chiedere l'aiuto di un'esperto, quando non si riesce in qualcosa, è utile per gli umani ma anche per le IA, da qui lo sviluppo del Co-LLM.

Un team di ricercatori del Computer Science and Artificial Intelligence Laboratory (CSAIL) del MIT ha sviluppato un innovativo algoritmo chiamato “Co-LLM“, che promette di rivoluzionare la collaborazione tra i modelli linguistici di grandi dimensioni (LLM). Questa tecnologia avanzata potrebbe portare a soluzioni di intelligenza artificiale più efficienti e performanti in campi come la medicina e la matematica.

 

Una collaborazione essenziale nel Co-LLM

Il funzionamento di Co-LLM si basa su una collaborazione tra un modello linguistico generico e uno specializzato, che lavorano insieme per ottenere risultati migliori. Il concetto può essere paragonato al comportamento umano: quando una persona non conosce la risposta a una domanda complessa, può chiedere aiuto a un esperto. Shannon Shen, dottoranda al MIT e autrice principale dello studio, ha spiegato: “Con Co-LLM, addestriamo un LLM generico a ‘telefonare’ a un modello esperto quando è necessario”. Questo approccio riproduce il modo in cui gli esseri umani riconoscono quando devono rivolgersi a un esperto per colmare le proprie lacune.

Al centro di questa innovazione vi è una variabile di commutazione, che agisce come un “project manager” virtuale, decidendo quando il modello generico necessita del supporto del modello esperto. La variabile valuta la competenza delle parole generate dai due LLM e interviene quando è possibile migliorare la risposta grazie all’esperienza del modello specializzato.

I risultati ottenuti con Co-LLM sono molto promettenti. In un esperimento, il modello generico ha dato una risposta errata a un problema matematico, ma con l’aiuto di un modello esperto, la soluzione corretta è stata individuata. L’algoritmo ha dimostrato di superare le prestazioni sia dei modelli generici che di quelli specializzati utilizzati singolarmente.

Le applicazioni di Co-LLM potrebbero essere molto ampie. Nel campo medico, potrebbe fornire risposte più precise a quesiti complessi, mentre nel settore aziendale, potrebbe aggiornare documenti interni combinando dati recenti e capacità di ragionamento avanzate.

Secondo Colin Raffel, professore associato all’Università di Toronto, “Co-LLM rappresenta un passo importante verso lo sviluppo di ecosistemi di modelli specializzati, migliorando efficienza e prestazioni”.

Articolo precedenteWhatsApp introduce un nuovo pulsante per la condivisione degli Stati