Immagina un mondo in cui agenti software computazionali simulano un comportamento umano credibile, un mondo in cui artisti IA dipingono e autori scrivono, in cui questi agenti IA si formano opinioni e avviano conversazioni e in cui i ricordi vengono sintetizzati in riflessioni di livello superiore per pianificare il comportamento. Questo è il mondo degli agenti generativi. In questo articolo esploreremo l’innovativo documento che introduce gli agenti generativi e le loro implicazioni sul futuro del gaming e altre applicazioni.
Panoramica del documento
Un nuovo affascinante documento di Stanford e Google intitolato “Generative Agents: Interactive Simulacra of Human Behavior” introduce gli agenti generativi, agenti software computazionali che simulano un comportamento umano credibile. I ricercatori hanno creato un mondo simulato in cui hanno inserito 25 agenti generativi, ognuno con la propria personalità.
Questi agenti si svegliano, preparano la colazione, vanno al lavoro e si formano opinioni proprio come gli umani. L’aspetto affascinante è che questi agenti ricordano e riflettono sui giorni passati mentre pianificano i giorni successivi, usando i ricordi delle interazioni che hanno avuto. Tutti questi agenti sono guidati da un modello linguistico di grandi dimensioni e l’architettura estende tale modello per archiviare record complessi delle esperienze degli agenti usando il linguaggio naturale.
Gli agenti producono comportamenti sociali individuali ed emergenti credibili, proprio come gli umani. Questo lavoro ha implicazioni significative per l’industria del gaming, in quanto consente ai personaggi non giocabili (NPC) nei videogiochi di avere il proprio carattere e personalità, interagendo con i giocatori in modo più naturale.
Ambiente di simulazione: Smartville
Gli autori hanno simulato un piccolo mondo sandbox chiamato Smartville, ispirato al popolare gioco “The Sims”. Smartville è composta da spazi di co-living, case, caffè, bar, negozi, parchi, college, negozi di alimentari e farmacie. L’idea era di esplorare come i comportamenti sociali potessero emergere tra gli agenti IA.
Tre componenti principali sono stati inclusi nell’architettura degli agenti:
- Flusso di memoria: registra le esperienze degli agenti.
- Riflessione: sintetizza i ricordi in inferenze di livello superiore.
- Pianificazione: traduce le conclusioni in piani d’azione.
Queste riflessioni e piani influenzano il comportamento futuro degli agenti, consentendo loro di intraprendere azioni in modo indipendente.
Creazione di eventi e interazioni in-game
Gli agenti generativi possono semplificare il processo di creazione di eventi e interazioni in-game. Ad esempio, invece di scriptare manualmente il comportamento di più personaggi per una festa di San Valentino, è sufficiente dire a un agente che vuole organizzare una festa. Questi agenti possono interagire in modo indipendente tra loro e l’ambiente è riuscito a spargere la voce sulla festa e a presentarsi. Un agente chiede persino a un altro agente di uscire a un appuntamento alla festa, il tutto da un singolo suggerimento iniziale generato dall’utente.
Personalità e interazioni degli agenti
Gli autori hanno creato una descrizione in linguaggio naturale di un paragrafo dell’identità di ciascun agente, inclusi la sua occupazione e la relazione con altri agenti. Queste descrizioni fungono da ricordi iniziali per l’agente. Ad esempio, John Lin è descritto come un farmacista con la seguente descrizione:
“John Lin è un farmacista presso The Vito Market and Pharmacy che ama aiutare le persone. È sempre alla ricerca di modi per rendere più facile per i suoi clienti l’ottenimento di farmaci.”
Tutte le interazioni di questi agenti con il loro mondo e tra loro avvengono attraverso il linguaggio naturale. A ogni timestamp, gli agenti emettono una dichiarazione in linguaggio naturale che descrive la loro azione corrente, che viene tradotta nei movimenti correnti e visualizzata sull’interfaccia sandbox come un insieme di emoji.
Controllo e manipolazione degli agenti
Sebbene questi agenti IA siano indipendenti e le loro interazioni avvengano in modo organico, gli utenti hanno anche un certo controllo. Ci sono due modi in cui gli utenti possono interagire con il gioco:
- Comunicare con l’agente attraverso la conversazione.
- Dare direttive all’agente sotto forma di una voce interiore, che controlla il comportamento dell’agente.
Ad esempio, quando un utente dice a John come sua voce interiore: “Ti candiderai contro Sam alle prossime elezioni”, John decide di candidarsi e condivide la sua candidatura con sua moglie e suo figlio. Questo dimostra come gli utenti possono controllare e manipolare l’ambiente e il comportamento di questi agenti.
Un giorno nella vita di un agente
La giornata di un agente inizia con una descrizione di un singolo paragrafo e il loro comportamento si evolve man mano che interagiscono tra loro e con il mondo. Ad esempio, Jonathan si sveglia intorno alle 7 del mattino, si lava i denti, fa una doccia, prepara e mangia la colazione e controlla le notizie al tavolo da pranzo. Suo figlio Eddie si sveglia e fanno una breve conversazione prima di iniziare la loro giornata.
Il comportamento degli agenti cambia in base alle loro interazioni con altri agenti. L’architettura degli agenti controlla il comportamento di ciascun agente, consentendo loro di percepire il loro ambiente e archiviare le percezioni nel flusso di memoria. Quando devono eseguire un’azione, recuperano le informazioni dal flusso di memoria e pianificano la loro prossima azione in base a tali informazioni. I ricordi archiviati vengono anche utilizzati per modificare il comportamento degli agenti, consentendo loro di riflettere sui ricordi passati e adattare le loro interazioni con l’ambiente e altri agenti.
Applicazioni nel mondo reale
Oltre ai giochi e agli NPC, gli agenti generativi hanno applicazioni nel mondo reale. Ad esempio, se ti stai preparando per un colloquio con una persona o una personalità difficile, puoi utilizzare agenti IA per simulare il loro comportamento e interagire con loro. Questo può aiutarti a prepararti per il colloquio o altre situazioni sociali.
Demo online
Sebbene la demo online non sia in tempo reale e presenti una riproduzione precalcolata di una simulazione avvenuta in precedenza, puoi vedere le interazioni e le diverse attività degli agenti. Puoi selezionare uno dei 25 diversi agenti e vedere cosa sta facendo l’agente in un dato momento. Questo affascinante lavoro ha il potenziale per cambiare l’industria del gaming e il modo in cui interagiamo con diversi agenti IA, aprendo un mondo di possibilità completamente nuovo.
https://reverie.herokuapp.com/arXiv_Demo/
In conclusione, gli agenti generativi rappresentano un significativo passo avanti nel mondo dell’IA, offrendo uno sguardo a un futuro in cui il comportamento umano credibile viene simulato e interattivo. Questa tecnologia promette di rivoluzionare il gaming e altre applicazioni, offrendo infinite opportunità per esperienze e interazioni guidate dall’IA.
Articolo di ricerca
https://arxiv.org/pdf/2304.03442.pdf