Představte si svět, kde softwaroví agenti simulují uvěřitelné lidské chování, kde AI umělci malují a autoři píší, kde tito AI agenti tvoří názory a zahajují konverzace a kde jsou vzpomínky syntetizovány do reflexí vyšší úrovně, aby naplánovaly chování. To je svět generativních agentů. V tomto článku prozkoumáme průlomovou studii, která představuje generativní agenty a jejich dopad na budoucnost herního průmyslu a dalších aplikací.
Přehled studie
Fascinující nová studie ze Stanfordu a Googlu s názvem „Generative Agents: Interactive Simulacra of Human Behavior“ (Generativní agenti: Interaktivní simulakra lidského chování) představuje generativní agenty, softwarové agenty, kteří simulují uvěřitelné lidské chování. Vědci vytvořili simulovaný svět, do kterého umístili 25 generativních agentů, každý s vlastní osobností.
Tito agenti se probouzejí, vaří snídani, chodí do práce a tvoří si názory stejně jako lidé. Fascinující je, že si tito agenti pamatují minulé dny a uvažují o nich, když plánují ty následující, a používají vzpomínky na interakce, které zažili. Všichni tito agenti jsou poháněni velkým jazykovým modelem a architektura tento velký jazykový model rozšiřuje, aby uchovával komplexní záznamy o zkušenostech agentů pomocí přirozeného jazyka.
Agenti produkují uvěřitelné individuální a emergentní sociální chování, stejně jako lidé. Tato práce má významný dopad na herní průmysl, protože umožňuje, aby nehratelné postavy (NPC) ve videohrách měly svou vlastní postavu a osobnost a přirozeněji interagovaly s hráči.
Simulační prostředí: Smartville
Autoři simulovali malý sandboxový svět zvaný Smartville, inspirovaný populární hrou „The Sims“. Smartville se skládá ze společných obytných prostor, domů, kaváren, barů, obchodů, parků, vysokých škol, obchodů s potravinami a lékáren. Cílem bylo prozkoumat, jak se může mezi agenty umělé inteligence vyvinout sociální chování.
Do architektury agentů byly zahrnuty tři hlavní komponenty:
- Paměťový proud: Zaznamenává zkušenosti agentů.
- Reflexe: Syntetizuje vzpomínky do inferencí vyšší úrovně.
- Plánování: Převádí závěry do akčních plánů.
Tyto reflexe a plány ovlivňují budoucí chování agentů a umožňují jim jednat nezávisle.
Vytváření herních událostí a interakcí
Generativní agenti mohou zjednodušit proces vytváření herních událostí a interakcí. Například místo ručního skriptování chování několika postav pro valentýnskou párty stačí říct jednomu agentovi, že chce uspořádat párty. Tito agenti mohou nezávisle interagovat jeden s druhým a prostředí uspělo v šíření zprávy o párty a účasti na ní. Jeden agent dokonce pozve jiného agenta na rande na párty, vše z jediného uživatelsky generovaného počátečního návrhu.
Osobnosti agentů a interakce
Autoři vytvořili jedno-odstavcový popis identity každého agenta v přirozeném jazyce, včetně jejich povolání a vztahu s ostatními agenty. Tyto popisy slouží jako počáteční vzpomínky pro agenta. Například John Lin je popsán jako lékárník s následujícím popisem:
„John Lin je lékárník v The Vito Market and Pharmacy, který rád pomáhá lidem. Neustále hledá způsoby, jak svým zákazníkům usnadnit proces získávání léků.“
Veškeré interakce těchto agentů s jejich světem a mezi sebou probíhají prostřednictvím přirozeného jazyka. V každém časovém okamžiku agenti vypíší prohlášení v přirozeném jazyce popisující jejich aktuální akci, která je převedena do aktuálních pohybů a zobrazena v sandboxovém rozhraní jako sada emotikonů.
Ovládání a manipulace s agenty
Ačkoli jsou tito AI agenti nezávislí a jejich interakce probíhají organicky, uživatelé mají také určitou kontrolu. Existují dva způsoby, jak mohou uživatelé interagovat s hrou:
- Komunikovat s agentem prostřednictvím konverzace.
- Vydávat agentovi směrnice ve formě vnitřního hlasu, který řídí chování agenta.
Například, když uživatel Johnovi řekne jako jeho vnitřní hlas: „Budeš kandidovat proti Samovi v nadcházejících volbách,“ John se rozhodne kandidovat a sdílí svou kandidaturu se svou ženou a synem. To ukazuje, jak mohou uživatelé ovládat a manipulovat s prostředím a chováním těchto agentů.
Den ze života agenta
Den agenta začíná jedno-odstavcovým popisem a jejich chování se vyvíjí, jak interagují jeden s druhým a se světem. Například Jonathan se probouzí kolem 7:00, čistí si zuby, sprchuje se, připravuje a jí snídani a kontroluje zprávy u jídelního stolu. Jeho syn Eddie se probouzí a krátce si popovídají, než se vydají na svůj den.
Chování agentů se mění v závislosti na jejich interakcích s ostatními agenty. Architektura agentů řídí chování každého agenta a umožňuje jim vnímat své prostředí a ukládat vnímání do paměťového proudu. Když potřebují provést akci, načtou informace z paměťového proudu a naplánují svou další akci na základě těchto informací. Uložené vzpomínky se také používají ke změně chování agentů, což jim umožňuje uvažovat o minulých vzpomínkách a upravovat své interakce s prostředím a ostatními agenty.
Aplikace v reálném světě
Kromě her a NPC postav mají generativní agenti aplikace v reálném světě. Například, pokud se připravujete na pohovor s obtížnou osobou nebo osobností, můžete použít agenty umělé inteligence k simulaci jejich chování a interakci s nimi. To vám může pomoci připravit se na pohovor nebo jiné sociální situace.
Online demo
Ačkoli online demo není v reálném čase a prezentuje předem vypočítanou repliku simulace, která se již odehrála, můžete vidět interakce a aktivity různých agentů. Můžete si vybrat jednoho z 25 různých agentů a zjistit, co agent v daném okamžiku dělá. Tato fascinující práce má potenciál změnit herní průmysl a způsob, jakým interagujeme s různými agenty umělé inteligence, a otevírá zcela nový svět možností.
https://reverie.herokuapp.com/arXiv_Demo/
Závěrem lze říci, že generativní agenti představují významný pokrok ve světě umělé inteligence a nabízejí pohled do budoucnosti, kde je simulováno uvěřitelné lidské chování a interaktivita. Tato technologie slibuje revoluci v herním průmyslu a dalších aplikacích a poskytuje nekonečné příležitosti pro zážitky a interakce řízené umělou inteligencí.
Výzkumná studie
https://arxiv.org/pdf/2304.03442.pdf