Föreställ dig en värld där datorprogramvaruagenter simulerar trovärdigt mänskligt beteende, en värld där AI-konstnärer målar och författare skriver, där dessa AI-agenter bildar sig åsikter och inleder konversationer, och där minnen syntetiseras till reflektioner på högre nivå för att planera beteende. Detta är de generativa agenternas värld. I denna artikel kommer vi att utforska den banbrytande rapport som introducerar generativa agenter och deras implikationer för framtiden inom spel och andra tillämpningar.
Översikt av rapporten
En fascinerande ny rapport från Stanford och Google med titeln ”Generative Agents: Interactive Simulacra of Human Behavior” introducerar generativa agenter, datorprogramvaruagenter som simulerar trovärdigt mänskligt beteende. Forskarna skapade en simulerad värld där de placerade 25 generativa agenter, var och en med sin egen personlighet.
Dessa agenter vaknar, lagar frukost, går till jobbet och bildar sig åsikter precis som människor. Det fascinerande är att dessa agenter minns och reflekterar över tidigare dagar när de planerar sina nästa dagar, med hjälp av minnen från interaktioner de har haft. Alla dessa agenter drivs av en stor språkmodell, och arkitekturen utvidgar den stora språkmodellen för att lagra komplexa register över agenternas upplevelser med hjälp av naturligt språk.
Agenterna producerar trovärdigt individuellt och emergent socialt beteende, precis som människor. Detta arbete har betydande implikationer för spelindustrin, eftersom det möjliggör för icke-spelbara karaktärer (NPC:er) i videospel att ha sin egen karaktär och personlighet och interagera med spelare mer naturligt.
Simuleringsmiljö: Smartville
Författarna simulerade en liten sandlådevärld som heter Smartville, inspirerad av det populära spelet ”The Sims”. Smartville består av kollektivboenden, hus, kaféer, barer, butiker, parker, högskolor, livsmedelsbutiker och apotek. Idén var att utforska hur socialt beteende kunde uppstå bland AI-agenter.
Tre huvudkomponenter inkluderades i agenternas arkitektur:
- Minnesström: Registrerar agenternas upplevelser.
- Reflektion: Syntetiserar minnen till inferenser på högre nivå.
- Planering: Översätter slutsatser till handlingsplaner.
Dessa reflektioner och planer påverkar agenternas framtida beteende, vilket gör att de kan agera självständigt.
Skapa händelser och interaktioner i spelet
Generativa agenter kan förenkla processen att skapa händelser och interaktioner i spelet. Istället för att till exempel manuellt skripta beteendet hos flera karaktärer för en Alla hjärtans dag-fest, räcker det med att berätta för en agent att hon vill ordna en fest. Dessa agenter kan interagera med varandra självständigt, och miljön lyckades sprida ryktet om festen och se till att folk dök upp. En agent frågar till och med en annan agent på dejt till festen, allt från ett enda användargenererat startförslag.
Agentpersonligheter och interaktioner
Författarna skapade en beskrivning på ett stycke i naturligt språk av varje agents identitet, inklusive deras yrke och relation till andra agenter. Dessa beskrivningar fungerar som startminnen för agenten. John Lin beskrivs till exempel som en apotekare med följande beskrivning:
”John Lin är apotekare på The Vito Market and Pharmacy som älskar att hjälpa människor. Han letar alltid efter sätt att göra processen att få medicin enklare för sina kunder.”
Alla interaktioner mellan dessa agenter och deras värld och sinsemellan sker genom naturligt språk. Vid varje tidsstämpel matar agenterna ut ett uttalande i naturligt språk som beskriver deras aktuella handling, vilket översätts till aktuella rörelser och visas på sandlådegränssnittet som en uppsättning emojis.
Kontrollera och manipulera agenter
Även om dessa AI-agenter är självständiga och deras interaktioner sker organiskt, har användarna också viss kontroll. Det finns två sätt användare kan interagera med spelet:
- Kommunicera med agenten genom konversation.
- Ge direktiv till agenten i form av en inre röst, som styr agentens beteende.
Till exempel, när en användare säger som Johns inre röst: ”Du ska ställa upp mot Sam i det kommande valet”, bestämmer sig John för att ställa upp och delar med sig av sin kandidatur till sin fru och son. Detta visar hur användare kan kontrollera och manipulera miljön och beteendet hos dessa agenter.
En dag i en agents liv
En agents dag börjar med en beskrivning på ett enda stycke, och deras beteende utvecklas när de interagerar med varandra och världen. Till exempel vaknar Jonathan runt 7 på morgonen, borstar tänderna, duschar, förbereder och äter frukost och kollar nyheterna vid matbordet. Hans son Eddie vaknar, och de har en kort konversation innan de går vidare med sin dag.
Agenternas beteende förändras baserat på deras interaktioner med andra agenter. Agenternas arkitektur styr varje agents beteende och gör att de kan uppfatta sin omgivning och lagra uppfattningar i minnesströmmen. När de behöver utföra en handling hämtar de information från minnesströmmen och planerar sin nästa handling baserat på den informationen. Lagrade minnen används också för att förändra agenternas beteende, vilket gör att de kan reflektera över tidigare minnen och anpassa sina interaktioner med omgivningen och andra agenter.
Verkliga tillämpningar
Förutom spel och NPC:er har generativa agenter tillämpningar i verkligheten. Om du till exempel förbereder dig för en intervju med en svår person eller personlighet kan du använda AI-agenter för att simulera deras beteende och interagera med dem. Detta kan hjälpa dig att förbereda dig för intervjun eller andra sociala situationer.
Online-demo
Även om online-demon inte är i realtid och presenterar en förberäknad repris av en simulering som har hänt tidigare, kan du se interaktionerna och de olika agenternas aktiviteter. Du kan välja en av de 25 olika agenterna och se vad agenten gör vid en given tidpunkt. Detta fascinerande arbete har potential att förändra spelindustrin och sättet vi interagerar med olika AI-agenter, vilket öppnar upp en helt ny värld av möjligheter.
https://reverie.herokuapp.com/arXiv_Demo/
Sammanfattningsvis representerar generativa agenter ett betydande framsteg inom AI-världen, som erbjuder en inblick i en framtid där trovärdigt mänskligt beteende simuleras och är interaktivt. Denna teknik lovar att revolutionera spel och andra tillämpningar och ger oändliga möjligheter till AI-drivna upplevelser och interaktioner.
Forskningsrapport
https://arxiv.org/pdf/2304.03442.pdf