Skutečná umělá inteligence pro NPC postavy: Generativní agenti jako budoucnost herního průmyslu a společností s umělou inteligencí, které se chovají jako lidé

V rubrikách AI/ML, Games Štítky , , ,
Save and Share:

Představte si svět, kde softwaroví agenti simulují uvěřitelné lidské chování, kde AI umělci malují a autoři píší, kde tito AI agenti tvoří názory a zahajují konverzace a kde jsou vzpomínky syntetizovány do reflexí vyšší úrovně, aby naplánovaly chování. To je svět generativních agentů. V tomto článku prozkoumáme průlomovou studii, která představuje generativní agenty a jejich dopad na budoucnost herního průmyslu a dalších aplikací.

Přehled studie

Fascinující nová studie ze Stanfordu a Googlu s názvem „Generative Agents: Interactive Simulacra of Human Behavior“ (Generativní agenti: Interaktivní simulakra lidského chování) představuje generativní agenty, softwarové agenty, kteří simulují uvěřitelné lidské chování. Vědci vytvořili simulovaný svět, do kterého umístili 25 generativních agentů, každý s vlastní osobností.

Tito agenti se probouzejí, vaří snídani, chodí do práce a tvoří si názory stejně jako lidé. Fascinující je, že si tito agenti pamatují minulé dny a uvažují o nich, když plánují ty následující, a používají vzpomínky na interakce, které zažili. Všichni tito agenti jsou poháněni velkým jazykovým modelem a architektura tento velký jazykový model rozšiřuje, aby uchovával komplexní záznamy o zkušenostech agentů pomocí přirozeného jazyka.

Agenti produkují uvěřitelné individuální a emergentní sociální chování, stejně jako lidé. Tato práce má významný dopad na herní průmysl, protože umožňuje, aby nehratelné postavy (NPC) ve videohrách měly svou vlastní postavu a osobnost a přirozeněji interagovaly s hráči.

Simulační prostředí: Smartville

Autoři simulovali malý sandboxový svět zvaný Smartville, inspirovaný populární hrou „The Sims“. Smartville se skládá ze společných obytných prostor, domů, kaváren, barů, obchodů, parků, vysokých škol, obchodů s potravinami a lékáren. Cílem bylo prozkoumat, jak se může mezi agenty umělé inteligence vyvinout sociální chování.

Do architektury agentů byly zahrnuty tři hlavní komponenty:

  1. Paměťový proud: Zaznamenává zkušenosti agentů.
  2. Reflexe: Syntetizuje vzpomínky do inferencí vyšší úrovně.
  3. Plánování: Převádí závěry do akčních plánů.

Tyto reflexe a plány ovlivňují budoucí chování agentů a umožňují jim jednat nezávisle.

Vytváření herních událostí a interakcí

Generativní agenti mohou zjednodušit proces vytváření herních událostí a interakcí. Například místo ručního skriptování chování několika postav pro valentýnskou párty stačí říct jednomu agentovi, že chce uspořádat párty. Tito agenti mohou nezávisle interagovat jeden s druhým a prostředí uspělo v šíření zprávy o párty a účasti na ní. Jeden agent dokonce pozve jiného agenta na rande na párty, vše z jediného uživatelsky generovaného počátečního návrhu.

Osobnosti agentů a interakce

Autoři vytvořili jedno-odstavcový popis identity každého agenta v přirozeném jazyce, včetně jejich povolání a vztahu s ostatními agenty. Tyto popisy slouží jako počáteční vzpomínky pro agenta. Například John Lin je popsán jako lékárník s následujícím popisem:

„John Lin je lékárník v The Vito Market and Pharmacy, který rád pomáhá lidem. Neustále hledá způsoby, jak svým zákazníkům usnadnit proces získávání léků.“

Veškeré interakce těchto agentů s jejich světem a mezi sebou probíhají prostřednictvím přirozeného jazyka. V každém časovém okamžiku agenti vypíší prohlášení v přirozeném jazyce popisující jejich aktuální akci, která je převedena do aktuálních pohybů a zobrazena v sandboxovém rozhraní jako sada emotikonů.

Ovládání a manipulace s agenty

Ačkoli jsou tito AI agenti nezávislí a jejich interakce probíhají organicky, uživatelé mají také určitou kontrolu. Existují dva způsoby, jak mohou uživatelé interagovat s hrou:

  1. Komunikovat s agentem prostřednictvím konverzace.
  2. Vydávat agentovi směrnice ve formě vnitřního hlasu, který řídí chování agenta.

Například, když uživatel Johnovi řekne jako jeho vnitřní hlas: „Budeš kandidovat proti Samovi v nadcházejících volbách,“ John se rozhodne kandidovat a sdílí svou kandidaturu se svou ženou a synem. To ukazuje, jak mohou uživatelé ovládat a manipulovat s prostředím a chováním těchto agentů.

Den ze života agenta

Den agenta začíná jedno-odstavcovým popisem a jejich chování se vyvíjí, jak interagují jeden s druhým a se světem. Například Jonathan se probouzí kolem 7:00, čistí si zuby, sprchuje se, připravuje a jí snídani a kontroluje zprávy u jídelního stolu. Jeho syn Eddie se probouzí a krátce si popovídají, než se vydají na svůj den.

Chování agentů se mění v závislosti na jejich interakcích s ostatními agenty. Architektura agentů řídí chování každého agenta a umožňuje jim vnímat své prostředí a ukládat vnímání do paměťového proudu. Když potřebují provést akci, načtou informace z paměťového proudu a naplánují svou další akci na základě těchto informací. Uložené vzpomínky se také používají ke změně chování agentů, což jim umožňuje uvažovat o minulých vzpomínkách a upravovat své interakce s prostředím a ostatními agenty.

Aplikace v reálném světě

Kromě her a NPC postav mají generativní agenti aplikace v reálném světě. Například, pokud se připravujete na pohovor s obtížnou osobou nebo osobností, můžete použít agenty umělé inteligence k simulaci jejich chování a interakci s nimi. To vám může pomoci připravit se na pohovor nebo jiné sociální situace.

Online demo

Ačkoli online demo není v reálném čase a prezentuje předem vypočítanou repliku simulace, která se již odehrála, můžete vidět interakce a aktivity různých agentů. Můžete si vybrat jednoho z 25 různých agentů a zjistit, co agent v daném okamžiku dělá. Tato fascinující práce má potenciál změnit herní průmysl a způsob, jakým interagujeme s různými agenty umělé inteligence, a otevírá zcela nový svět možností.

https://reverie.herokuapp.com/arXiv_Demo/

Závěrem lze říci, že generativní agenti představují významný pokrok ve světě umělé inteligence a nabízejí pohled do budoucnosti, kde je simulováno uvěřitelné lidské chování a interaktivita. Tato technologie slibuje revoluci v herním průmyslu a dalších aplikacích a poskytuje nekonečné příležitosti pro zážitky a interakce řízené umělou inteligencí.

Výzkumná studie

https://arxiv.org/pdf/2304.03442.pdf

Video od Prompt Engineering

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *