Stel je een wereld voor waarin computationele software-agenten geloofwaardig menselijk gedrag simuleren, een wereld waarin AI-kunstenaars schilderen en auteurs schrijven, waarin deze AI-agenten meningen vormen en gesprekken initiëren, en waarin herinneringen worden gesynthetiseerd tot reflecties op hoger niveau om gedrag te plannen. Dit is de wereld van generatieve agenten. In dit artikel zullen we de baanbrekende paper verkennen die generatieve agenten introduceert en hun implicaties op de toekomst van gaming en andere toepassingen.
Overzicht van de paper
Een fascinerende nieuwe paper van Stanford en Google, getiteld “Generative Agents: Interactive Simulacra of Human Behavior”, introduceert generatieve agenten, computationele software-agenten die geloofwaardig menselijk gedrag simuleren. De onderzoekers creëerden een gesimuleerde wereld waarin ze 25 generatieve agenten plaatsten, elk met een eigen persoonlijkheid.
Deze agenten worden wakker, maken een ontbijt klaar, gaan naar hun werk en vormen meningen, net als mensen. Het fascinerende is dat deze agenten zich voorbije dagen herinneren en daarop reflecteren terwijl ze hun volgende dagen plannen, gebruikmakend van herinneringen aan interacties die ze hebben gehad. Al deze agenten worden aangestuurd door een groot taalmodel, en de architectuur breidt dat grote taalmodel uit om complexe records van de ervaringen van agenten op te slaan in natuurlijke taal.
De agenten produceren geloofwaardig individueel en opkomend sociaal gedrag, net als mensen. Dit werk heeft aanzienlijke implicaties voor de gamingindustrie, omdat het ervoor zorgt dat non-playable characters (NPC’s) in videogames hun eigen karakter en persoonlijkheid hebben, waardoor ze natuurlijker met spelers kunnen interageren.
Simulatie-omgeving: Smartville
De auteurs simuleerden een kleine sandbox-wereld genaamd Smartville, geïnspireerd door de populaire game “The Sims”. Smartville bestaat uit gedeelde woonruimtes, huizen, cafés, bars, winkels, parken, hogescholen, supermarkten en apotheken. Het idee was om te onderzoeken hoe sociaal gedrag zou kunnen ontstaan tussen AI-agenten.
Drie hoofdcomponenten waren opgenomen in de architectuur van de agenten:
- Geheugenstroom: registreert de ervaringen van agenten.
- Reflectie: synthetiseert herinneringen tot inferenties op hoger niveau.
- Planning: vertaalt conclusies in actieplannen.
Deze reflecties en plannen beïnvloeden het toekomstige gedrag van agenten, waardoor ze onafhankelijk acties kunnen ondernemen.
In-game evenementen en interacties creëren
Generatieve agenten kunnen het proces van het creëren van in-game evenementen en interacties vereenvoudigen. In plaats van bijvoorbeeld handmatig het gedrag van meerdere personages te scripten voor een Valentijnsdagfeest, is het voldoende om één agent te vertellen dat ze een feest wil geven. Deze agenten kunnen onafhankelijk met elkaar interageren, en de omgeving slaagde erin het woord over het feest te verspreiden en op te dagen. Eén agent vraagt zelfs een andere agent mee op date naar het feest, allemaal vanuit één door de gebruiker gegenereerde zaadsuggestie.
Agentpersoonlijkheden en -interacties
De auteurs creëerden een beschrijving van de identiteit van elke agent in natuurlijke taal van één alinea, inclusief hun beroep en relatie met andere agenten. Deze beschrijvingen dienen als zaadherinneringen voor de agent. John Lin wordt bijvoorbeeld beschreven als een apotheker met de volgende beschrijving:
“John Lin is een apotheker bij The Vito Market and Pharmacy die mensen graag helpt. Hij is altijd op zoek naar manieren om het proces van het verkrijgen van medicatie voor zijn klanten te vereenvoudigen.”
Alle interacties van deze agenten met hun wereld en onderling verlopen via natuurlijke taal. Op elk tijdstip geven agenten een verklaring in natuurlijke taal die hun huidige actie beschrijft, die wordt vertaald in huidige bewegingen en wordt weergegeven op de sandbox-interface als een reeks emoji’s.
Agenten besturen en manipuleren
Hoewel deze AI-agenten onafhankelijk zijn en hun interacties organisch verlopen, hebben gebruikers ook enige controle. Er zijn twee manieren waarop gebruikers met de game kunnen interageren:
- Communiceren met de agent via een gesprek.
- Directieven geven aan de agent in de vorm van een innerlijke stem, die het gedrag van de agent controleert.
Toen John bijvoorbeeld door een gebruiker als zijn innerlijke stem werd verteld: “Je gaat het opnemen tegen Sam in de komende verkiezingen,” besluit John zich kandidaat te stellen en deelt hij zijn kandidatuur met zijn vrouw en zoon. Dit laat zien hoe gebruikers de omgeving en het gedrag van deze agenten kunnen controleren en manipuleren.
Een dag uit het leven van een agent
De dag van een agent begint met een beschrijving van één alinea, en hun gedrag evolueert naarmate ze met elkaar en de wereld interageren. Jonathan wordt bijvoorbeeld rond 7 uur ’s ochtends wakker, poetst zijn tanden, neemt een douche, bereidt en eet een ontbijt en bekijkt het nieuws aan de eettafel. Zijn zoon Eddie wordt wakker en ze hebben een kort gesprek voordat ze hun dag beginnen.
Het gedrag van agenten verandert op basis van hun interacties met andere agenten. De architectuur van de agenten controleert het gedrag van elke agent, waardoor ze hun omgeving kunnen waarnemen en waarnemingen in de geheugenstroom kunnen opslaan. Wanneer ze een actie moeten uitvoeren, halen ze informatie uit de geheugenstroom en plannen ze hun volgende actie op basis van die informatie. Opgeslagen herinneringen worden ook gebruikt om het gedrag van agenten te veranderen, waardoor ze kunnen reflecteren op herinneringen uit het verleden en hun interacties met de omgeving en andere agenten kunnen aanpassen.
Real-world toepassingen
Naast games en NPC’s hebben generatieve agenten real-world toepassingen. Als je je bijvoorbeeld voorbereidt op een interview met een moeilijk persoon of persoonlijkheid, kun je AI-agenten gebruiken om hun gedrag te simuleren en met hen te interageren. Dit kan je helpen je voor te bereiden op het interview of andere sociale situaties.
Online demo
Hoewel de online demo niet real-time is en een vooraf berekende replay presenteert van een simulatie die al eerder heeft plaatsgevonden, kun je de interacties en de activiteiten van verschillende agenten zien. Je kunt een van de 25 verschillende agenten selecteren en zien wat de agent op een bepaald moment aan het doen is. Dit fascinerende werk heeft het potentieel om de gamingindustrie en de manier waarop we met verschillende AI-agenten interageren te veranderen, waardoor een gloednieuwe wereld van mogelijkheden opengaat.
https://reverie.herokuapp.com/arXiv_Demo/
Kortom, generatieve agenten vertegenwoordigen een significante vooruitgang in de wereld van AI en bieden een glimp van een toekomst waarin geloofwaardig menselijk gedrag wordt gesimuleerd en interactief is. Deze technologie belooft een revolutie teweeg te brengen in gaming en andere toepassingen, waardoor eindeloze mogelijkheden ontstaan voor AI-gedreven ervaringen en interacties.
Research paper
https://arxiv.org/pdf/2304.03442.pdf