Operator si basa su un modello avanzato chiamato Computer-Using Agent (CUA). Quest’ultimo combina le capacità visive di GPT-4o con un ragionamento sofisticato. Ciò gli permette di navigare e interagire con interfacce utente grafiche (GUI) proprio come farebbe un essere umano. Tale approccio rivoluzionario consente a Operator di comprendere e gestire pulsanti, menu, campi di testo e altre componenti grafiche. Ciò senza la necessità di API specifiche o configurazioni particolari del sistema operativo.
L’addestramento del modello CUA si basa su progressi nel ragionamento, nella multimodalità e nella sicurezza. Con l’obiettivo di garantire un’interazione digitale fluida e naturale. Grazie a tale tecnologia, Operator è in grado di eseguire operazioni complesse
. Come prenotare viaggi, acquistare biglietti per eventi e persino gestire attività amministrative. Per fare ciò l’agente AI interpreta le richieste degli utenti e agisce di conseguenza.Per garantire un’esperienza ottimale, OpenAI ha stretto partnership strategiche con aziende leader. Come Booking, Expedia, Uber e Stubhub. Ciò permette a Operator di affinare continuamente le proprie capacità e adattarsi a scenari d’uso specifici. L’utilizzo di Operator è pensato per essere semplice e intuitivo. Gli utenti devono solo descrivere il compito desiderato, e l’agente si occuperà del resto. Inoltre, è sempre possibile prendere il controllo manuale del browser remoto.
Attualmente, l’anteprima di Operator è disponibile per gli utenti Pro maggiorenni in Europa, Norvegia, Islanda, Liechtenstein e Svizzera. Attraverso il sito dedicato operator.chatgpt.com. L’introduzione di Operator potrebbe rappresentare un cambiamento importante nel modo in cui si interagisce con l’intelligenza artificiale.