OpenAI, la società dietro ChatGPT, ha appena annunciato Operator. Si tratta di un servizio di intelligenza artificiale generativa che agisce come una sorta di agente ed esegue attività per conto dell’utente. Tramite il suo browser, Operator è in grado di guardare una pagina web e interagire con essa digitando, cliccando e scorrendo da solo, senza che vi sia bisogno di alcun input.
Cosa può fare Operator di OpenAI
Operator potrà gestire, così, varie task ripetitive del browser: OpenAI afferma di poter compilare moduli, ordinare generi alimentari e persino creare meme. Sarà in grado di usare le stesse interfacce e gli stessi strumenti con cui interagiscono gli esseri umani, e questo aiuterebbe anche le aziende, aprendo loro nuove opportunità di coinvolgimento.
Operator è alimentato da un nuovo modello chiamato CUA – Computer-Using Agent. Combina le capacità di visualizzazione GPT-4o con il ragionamento avanzato tramite apprendimento rinforzato. CUA è addestrato a interagire con le GUI, ovvero le interfacce utente grafiche con pulsanti, menu e campi di testo che le persone vedono su uno schermo.
Quando il servizio è bloccato o ha bisogno di assistenza, restituisce semplicemente il controllo all’utente. Anche i dati sensibili, come password o altri moduli di verifica, andranno inseriti manualmente, senza quindi rischi per la privacy. Operator potrà inoltre collaborare con servizi quali Doordash, Etsy, Booking.com, Uber e Instacart e potrà effettuare ricerche tramite partner mediatici quali Associated Press e Reuters.
Il lancio sarà graduale e i primi a beneficiarne saranno gli abbonati a ChatGPT Pro negli Stati Uniti. Per un’eventuale distribuzione nel mondo, e in particolare in Europa, OpenAI non ha ancora rivelato ulteriori dettagli.