Stellen Sie sich eine Welt vor, in der computergestützte Software-Agenten glaubwürdiges menschliches Verhalten simulieren, eine Welt, in der KI-Künstler malen und Autoren schreiben, in der diese KI-Agenten Meinungen bilden und Gespräche initiieren und in der Erinnerungen zu übergeordneten Reflexionen synthetisiert werden, um Verhaltensweisen zu planen. Das ist die Welt der generativen Agenten. In diesem Artikel werden wir die bahnbrechende Arbeit vorstellen, die generative Agenten einführt, und ihre Auswirkungen auf die Zukunft des Gamings und andere Anwendungen untersuchen.
Überblick über das Paper
Ein faszinierendes neues Paper von Stanford und Google mit dem Titel „Generative Agents: Interactive Simulacra of Human Behavior“ stellt generative Agenten vor, computergestützte Software-Agenten, die glaubwürdiges menschliches Verhalten simulieren. Die Forscher erstellten eine simulierte Welt, in der sie 25 generative Agenten platzierten, jeder mit seiner eigenen Persönlichkeit.
Diese Agenten wachen auf, kochen Frühstück, gehen zur Arbeit und bilden Meinungen, genau wie Menschen. Das Faszinierende daran ist, dass sich diese Agenten an vergangene Tage erinnern und darüber nachdenken, während sie ihre nächsten Tage planen, wobei sie Erinnerungen an Interaktionen nutzen, die sie hatten. Alle diese Agenten werden von einem großen Sprachmodell angetrieben, und die Architektur erweitert dieses große Sprachmodell, um komplexe Aufzeichnungen über die Erfahrungen der Agenten in natürlicher Sprache zu speichern.
Die Agenten erzeugen glaubwürdiges individuelles und emergentes Sozialverhalten, genau wie Menschen. Diese Arbeit hat erhebliche Auswirkungen auf die Gaming-Industrie, da sie es Nicht-Spieler-Charakteren (NPCs) in Videospielen ermöglicht, ihren eigenen Charakter und ihre eigene Persönlichkeit zu haben und auf natürlichere Weise mit den Spielern zu interagieren.
Simulationsumgebung: Smartville
Die Autoren simulierten eine kleine Sandbox-Welt namens Smartville, die von dem beliebten Spiel „Die Sims“ inspiriert ist. Smartville besteht aus Wohngemeinschaften, Häusern, Cafés, Bars, Geschäften, Parks, Colleges, Lebensmittelgeschäften und Apotheken. Die Idee war, zu erforschen, wie soziales Verhalten unter KI-Agenten entstehen könnte.
Drei Hauptkomponenten waren in der Architektur der Agenten enthalten:
- Memory Stream: Zeichnet die Erfahrungen der Agenten auf.
- Reflexion: Synthetisiert Erinnerungen zu übergeordneten Schlussfolgerungen.
- Planung: Übersetzt Schlussfolgerungen in Aktionspläne.
Diese Reflexionen und Pläne beeinflussen das zukünftige Verhalten der Agenten und ermöglichen es ihnen, unabhängig voneinander Maßnahmen zu ergreifen.
Erstellen von In-Game-Events und Interaktionen
Generative Agenten können den Prozess der Erstellung von In-Game-Events und Interaktionen vereinfachen. Anstatt beispielsweise das Verhalten mehrerer Charaktere für eine Valentinstagsfeier manuell zu skripten, reicht es aus, einem Agenten mitzuteilen, dass er eine Party veranstalten möchte. Diese Agenten können unabhängig voneinander interagieren, und die Umgebung hat es geschafft, die Nachricht über die Party zu verbreiten und zu zeigen. Ein Agent fragt sogar einen anderen Agenten nach einem Date auf der Party, alles ausgehend von einem einzigen benutzergenerierten Vorschlag.
Agentenpersönlichkeiten und Interaktionen
Die Autoren erstellten eine ein-Absatz-Beschreibung in natürlicher Sprache für die Identität jedes Agenten, einschließlich ihres Berufs und ihrer Beziehung zu anderen Agenten. Diese Beschreibungen dienen als Start-Erinnerungen für den Agenten. John Lin wird beispielsweise als Apothekenverkäufer mit der folgenden Beschreibung beschrieben:
„John Lin ist ein Apothekenverkäufer im The Vito Market and Pharmacy, der es liebt, Menschen zu helfen. Er ist immer auf der Suche nach Möglichkeiten, den Prozess der Medikamentenbeschaffung für seine Kunden zu vereinfachen.“
Alle Interaktionen dieser Agenten mit ihrer Welt und untereinander erfolgen in natürlicher Sprache. Zu jedem Zeitpunkt geben die Agenten eine Aussage in natürlicher Sprache aus, die ihre aktuelle Aktion beschreibt, die in aktuelle Bewegungen übersetzt und auf der Sandbox-Oberfläche als eine Reihe von Emojis angezeigt wird.
Kontrolle und Manipulation von Agenten
Obwohl diese KI-Agenten unabhängig sind und ihre Interaktionen organisch ablaufen, haben Benutzer auch eine gewisse Kontrolle. Es gibt zwei Möglichkeiten, wie Benutzer mit dem Spiel interagieren können:
- Kommunizieren Sie mit dem Agenten durch Konversation.
- Erteilen Sie dem Agenten Anweisungen in Form einer inneren Stimme, die das Verhalten des Agenten steuert.
Als John beispielsweise von einem Benutzer als Johns innere Stimme gesagt wird: „Du wirst bei den kommenden Wahlen gegen Sam antreten“, beschließt John, zu kandidieren, und teilt seine Kandidatur seiner Frau und seinem Sohn mit. Dies zeigt, wie Benutzer die Umgebung und das Verhalten dieser Agenten steuern und manipulieren können.
Ein Tag im Leben eines Agenten
Der Tag eines Agenten beginnt mit einer einzigen Absatzbeschreibung, und sein Verhalten entwickelt sich im Laufe der Interaktion mit anderen und der Welt weiter. Jonathan wacht zum Beispiel gegen 7 Uhr morgens auf, putzt sich die Zähne, duscht, bereitet das Frühstück zu und isst es und liest die Nachrichten am Esstisch. Sein Sohn Eddie wacht auf und sie führen ein kurzes Gespräch, bevor sie ihren Tag beginnen.
Das Verhalten von Agenten ändert sich basierend auf ihren Interaktionen mit anderen Agenten. Die Architektur der Agenten steuert das Verhalten jedes Agenten und ermöglicht es ihnen, ihre Umgebung wahrzunehmen und Wahrnehmungen im Memory Stream zu speichern. Wenn sie eine Aktion ausführen müssen, rufen sie Informationen aus dem Memory Stream ab und planen ihre nächste Aktion basierend auf diesen Informationen. Gespeicherte Erinnerungen werden auch verwendet, um das Verhalten von Agenten zu ändern, sodass sie über vergangene Erinnerungen nachdenken und ihre Interaktionen mit der Umgebung und anderen Agenten anpassen können.
Anwendungen in der realen Welt
Abgesehen von Spielen und NPCs haben generative Agenten Anwendungen in der realen Welt. Wenn Sie sich beispielsweise auf ein Interview mit einer schwierigen Person oder Persönlichkeit vorbereiten, können Sie KI-Agenten verwenden, um deren Verhalten zu simulieren und mit ihnen zu interagieren. Dies kann Ihnen helfen, sich auf das Interview oder andere soziale Situationen vorzubereiten.
Online-Demo
Obwohl die Online-Demo nicht in Echtzeit erfolgt und eine vorgefertigte Wiedergabe einer Simulation präsentiert, die zuvor stattgefunden hat, können Sie die Interaktionen und Aktivitäten der verschiedenen Agenten sehen. Sie können einen der 25 verschiedenen Agenten auswählen und sehen, was der Agent zu einem bestimmten Zeitpunkt tut. Diese faszinierende Arbeit hat das Potenzial, die Gaming-Industrie und die Art und Weise, wie wir mit verschiedenen KI-Agenten interagieren, zu verändern und eine völlig neue Welt voller Möglichkeiten zu eröffnen.
https://reverie.herokuapp.com/arXiv_Demo/
Zusammenfassend lässt sich sagen, dass generative Agenten einen bedeutenden Fortschritt in der Welt der KI darstellen und einen Einblick in eine Zukunft bieten, in der glaubwürdiges menschliches Verhalten simuliert und interaktiv ist. Diese Technologie verspricht, das Gaming und andere Anwendungen zu revolutionieren und endlose Möglichkeiten für KI-gesteuerte Erfahrungen und Interaktionen zu bieten.
Forschungsarbeit
https://arxiv.org/pdf/2304.03442.pdf