Képzelj el egy világot, ahol számítógépes szoftverügynökök hihető emberi viselkedést szimulálnak, egy világot, ahol MI művészek festenek és írók írnak, ahol ezek az MI ágensek véleményt formálnak és beszélgetéseket kezdeményeznek, és ahol az emlékek magasabb szintű reflexiókká szintetizálódnak a viselkedés megtervezéséhez. Ez a generatív ágensek világa. Ebben a cikkben megvizsgáljuk azt az úttörő tanulmányt, amely bemutatja a generatív ágenseket, és azok jövőbeli hatásait a játékiparra és más alkalmazásokra.
A tanulmány áttekintése
Egy lenyűgöző új tanulmány a Stanford és a Google kutatóitól, „Generatív ágensek: Az emberi viselkedés interaktív szimulákrumai” címmel, mutatja be a generatív ágenseket, olyan számítógépes szoftverügynököket, amelyek hihető emberi viselkedést szimulálnak. A kutatók létrehoztak egy szimulált világot, amelyben 25 generatív ágenst helyeztek el, mindegyiknek saját személyiségével.
Ezek az ágensek felkelnek, reggelit főznek, munkába indulnak, és véleményt formálnak, akárcsak az emberek. A lenyűgöző rész az, hogy ezek az ágensek emlékeznek a korábbi napokra, és reflektálnak rájuk, miközben tervezik a következő napjaikat, felhasználva az interakcióik emlékeit. Mindezeket az ágenseket egy nagyméretű nyelvi modell vezérli, és az architektúra kiterjeszti ezt a nagyméretű nyelvi modellt, hogy komplex feljegyzéseket tároljon az ágensek tapasztalatairól természetes nyelven.
Az ágensek hihető egyéni és feltörekvő szociális viselkedést produkálnak, pont mint az emberek. Ennek a munkának jelentős következményei vannak a játékiparra nézve, mivel lehetővé teszi, hogy a videójátékokban szereplő nem játékos karakterek (NPC-k) saját karakterrel és személyiséggel rendelkezzenek, és természetesebben lépjenek interakcióba a játékosokkal.
Szimulációs környezet: Smartville
A szerzők egy Smartville nevű kis homokozó világot szimuláltak, amelyet a népszerű „The Sims” játék ihletett. Smartville lakóterekből, házakból, kávézókból, bárokból, üzletekből, parkokból, főiskolákból, élelmiszerboltokból és gyógyszertárakból áll. Az ötlet az volt, hogy feltárják, hogyan alakulhat ki szociális viselkedés az MI ágensek között.
Három fő összetevő került beépítésre az ágensek architektúrájába:
- Memória Folyam: Rögzíti az ágensek tapasztalatait.
- Reflexió: Magasabb szintű következtetésekké szintetizálja az emlékeket.
- Tervezés: Cselekvési tervekké fordítja a következtetéseket.
Ezek a reflexiók és tervek befolyásolják az ágensek jövőbeli viselkedését, lehetővé téve számukra, hogy önállóan cselekedjenek.
Játékon belüli események és interakciók létrehozása
A generatív ágensek egyszerűsíthetik a játékon belüli események és interakciók létrehozásának folyamatát. Például ahelyett, hogy manuálisan szkriptelnénk több karakter viselkedését egy Valentin-napi bulihoz, elég csak megmondani egy ügynöknek, hogy bulit szeretne rendezni. Ezek az ágensek önállóan tudnak interakcióba lépni egymással, és a környezet sikeresen terjesztette a hírt a buliról, és meg is jelentek. Az egyik ügynök még randevúra is hívott egy másik ügynököt a buliba, mindezt egyetlen felhasználó által generált kiinduló javaslatból.
Ágensek személyisége és interakciói
A szerzők egy egy bekezdéses természetes nyelvi leírást készítettek minden egyes ügynök identitásáról, beleértve a foglalkozásukat és a más ágensekkel való kapcsolatukat. Ezek a leírások kiinduló emlékekként szolgálnak az ügynök számára. Például John Lint gyógyszertár tulajdonosként írják le a következő leírással:
„John Lin gyógyszertár tulajdonos a Vito Market és Gyógyszertárban, aki szeret segíteni az embereknek. Mindig azon van, hogy megkönnyítse a gyógyszerbeszerzés folyamatát vásárlói számára.”
Ezeknek az ágenseknek a világgal és egymással való összes interakciója természetes nyelven keresztül történik. Minden időbélyegzőnél az ágensek egy természetes nyelvi kijelentést adnak ki, amely leírja az aktuális cselekvésüket, amelyet aktuális mozgásokká fordítanak le, és emojiként jelenítenek meg a homokozó felületén.
Ágensek irányítása és manipulálása
Bár ezek az MI ágensek függetlenek, és az interakcióik organikus módon történnek, a felhasználóknak is van némi befolyásuk. Kétféleképpen léphetnek interakcióba a játékkal:
- Beszélgetés útján kommunikálhatnak az ágenssel.
- Utasításokat adhatnak ki az ágensnek egy belső hang formájában, amely irányítja az ágens viselkedését.
Például, amikor egy felhasználó azt mondja John belső hangjaként: „Indulni fogsz Sammel szemben a közelgő választásokon,” John úgy dönt, hogy indul, és megosztja jelöltségét feleségével és fiával. Ez bemutatja, hogyan irányíthatják és manipulálhatják a felhasználók az ágensek környezetét és viselkedését.
Egy nap egy ágens életében
Egy ágens napja egyetlen bekezdéses leírással kezdődik, és viselkedésük az egymással és a világgal való interakciójuk során fejlődik. Például Jonathan reggel 7 óra körül felébred, fogat mos, zuhanyozik, elkészíti és elfogyasztja a reggelit, és megnézi a híreket az étkezőasztalnál. Fia, Eddie felébred, és rövid beszélgetést folytatnak, mielőtt folytatnák a napjukat.
Az ágensek viselkedése megváltozik más ágensekkel való interakcióik alapján. Az ágensek architektúrája irányítja az egyes ágensek viselkedését, lehetővé téve számukra, hogy érzékeljék környezetüket, és tárolják az észleléseket a memória folyamában. Amikor cselekedniük kell, információt kérnek le a memória folyamából, és az információk alapján megtervezik a következő cselekedetüket. A tárolt emlékek az ágensek viselkedésének megváltoztatására is szolgálnak, lehetővé téve számukra, hogy reflektáljanak a múltbeli emlékekre, és módosítsák a környezetükkel és más ágensekkel való interakcióikat.
Valós alkalmazások
A játékokon és az NPC-ken kívül a generatív ágenseknek valós alkalmazásai is vannak. Például, ha egy nehéz emberrel vagy személyiséggel készülsz interjúra, használhatsz MI ágenseket viselkedésük szimulálására és az interakcióra velük. Ez segíthet felkészülni az interjúra vagy más társadalmi helyzetekre.
Online Demó
Bár az online demó nem valós idejű, és egy korábban történt szimuláció előre kiszámított lejátszását mutatja be, láthatod az interakciókat és a különböző ágensek tevékenységeit. Kiválaszthatod a 25 különböző ágens egyikét, és megnézheted, hogy az adott pillanatban mit csinál az ágens. Ez a lenyűgöző munka képes megváltoztatni a játékipart és azt, ahogyan a különböző MI ágensekkel interakcióba lépünk, egy teljesen új lehetőségekkel teli világot nyitva meg.
https://reverie.herokuapp.com/arXiv_Demo/
Összefoglalva, a generatív ágensek jelentős előrelépést jelentenek az MI világában, bepillantást engedve egy olyan jövőbe, ahol a hihető emberi viselkedést szimulálják és interaktívvá teszik. Ez a technológia ígéretesen forradalmasíthatja a játékipart és más alkalmazásokat, végtelen lehetőségeket biztosítva az MI-vezérelt élményekhez és interakciókhoz.
Kutatási tanulmány
https://arxiv.org/pdf/2304.03442.pdf