想象一下这样一个世界:计算软件代理能够模拟出可信的人类行为,AI 艺术家挥毫泼墨,AI 作家妙笔生花,这些 AI 代理形成自己的观点,发起对话,记忆被合成为更高层次的思考,从而规划行为。这就是生成式代理的世界。在本文中,我们将探讨一篇开创性的论文,该论文介绍了生成式代理及其对游戏未来和其他应用的意义。
论文概述
斯坦福大学和谷歌联合发表了一篇引人入胜的新论文,题为“生成式代理:人类行为的交互式模拟”。该论文介绍了生成式代理,这是一种能够模拟可信的人类行为的计算软件代理。研究人员创建了一个模拟世界,并在其中放置了 25 个生成式代理,每个代理都有自己的个性。
这些代理就像人类一样,会起床、做早餐、上班,并形成自己的观点。最令人着迷的是,这些代理会记住并反思过去的经历,以便规划未来,他们会利用对过往互动的记忆。所有这些代理都由大型语言模型驱动,并且该架构扩展了大型语言模型,可以使用自然语言存储代理的复杂经验记录。
这些代理能够产生可信的个体行为和涌现的社会行为,就像人类一样。这项工作对游戏行业具有重大意义,因为它允许视频游戏中的非玩家角色 (NPC) 拥有自己的个性和角色,从而能够更自然地与玩家互动。
模拟环境:斯马特维尔
作者模拟了一个名为斯马特维尔的小型沙盒世界,其灵感来自热门游戏《模拟人生》。斯马特维尔由合住空间、房屋、咖啡馆、酒吧、商店、公园、学院、杂货店和药房组成。其目的是探索 AI 代理之间如何产生社会行为。
代理的架构中包含三个主要组成部分:
- 记忆流:记录代理的经验。
- 反思:将记忆合成为更高层次的推论。
- 规划:将结论转化为行动计划。
这些反思和计划会影响代理未来的行为,使其能够独立采取行动。
创建游戏内事件和互动
生成式代理可以简化创建游戏内事件和互动的过程。例如,无需手动编写多个角色在情人节派对上的行为脚本,只需告知一个代理她想举办派对即可。这些代理可以独立地相互互动,并且环境成功地传播了关于派对的消息并最终举办了派对。其中一个代理甚至邀请另一个代理约会参加派对,而这一切都源于用户生成的一个初始建议。
代理个性和互动
作者为每个代理的身份创建了一段自然语言描述,包括他们的职业以及与其他代理的关系。这些描述充当代理的种子记忆。例如,约翰·林被描述为一家药房的店主,其描述如下:
“约翰·林是维托市场和药房的药房店主,他热衷于帮助他人。他一直在寻找让顾客更容易获得药物的方法。”
这些代理与其世界以及彼此之间的所有互动都通过自然语言进行。在每个时间戳,代理都会输出一段自然语言陈述,描述他们当前的行动,该陈述会被转化为当前动作,并以一组表情符号的形式显示在沙盒界面上。
控制和操纵代理
虽然这些 AI 代理是独立的,并且它们的互动是有机发生的,但用户也可以进行一些控制。用户可以通过两种方式与游戏互动:
- 通过对话与代理交流。
- 以内心声音的形式向代理发布指令,从而控制代理的行为。
例如,当用户以约翰的内心声音告诉他“你将参加即将到来的选举,与山姆竞争”时,约翰决定参选,并与他的妻子和儿子分享了他的候选人资格。这表明用户如何控制和操纵这些代理的环境和行为。
代理的一天
代理的一天从一段简单的描述开始,并且他们的行为会随着他们彼此互动以及与世界互动而不断演变。例如,乔纳森在早上 7 点左右醒来,刷牙、洗澡、准备并吃早餐,并在餐桌上查看新闻。他的儿子埃迪醒来后,他们在开始一天的工作之前进行了短暂的交谈。
代理的行为会根据他们与其他代理的互动而发生变化。代理的架构控制着每个代理的行为,使其能够感知他们的环境并将感知存储在记忆流中。当他们需要执行某个操作时,他们会从记忆流中检索信息,并根据该信息计划他们的下一个操作。存储的记忆也可用于改变代理的行为,使其能够反思过去的记忆并调整他们与环境和其他代理的互动。
现实世界的应用
除了游戏和 NPC 之外,生成式代理还具有现实世界的应用。例如,如果您正在准备与一个难相处的人或性格进行面试,您可以使用 AI 代理来模拟他们的行为并与他们互动。这可以帮助您为面试或其他社交场合做好准备。
在线演示
虽然在线演示不是实时的,而是展示了之前发生的模拟的预先计算的回放,但您可以看到互动和不同代理的活动。您可以选择 25 个不同的代理之一,并查看该代理在任何给定时间正在做什么。这项引人入胜的工作有可能改变游戏行业以及我们与不同 AI 代理互动的方式,从而开启一个充满可能性的全新世界。
https://reverie.herokuapp.com/arXiv_Demo/
总而言之,生成式代理代表了 AI 世界的重大进步,它让我们得以一窥可信的人类行为被模拟和互动的未来。这项技术有望彻底改变游戏和其他应用,为 AI 驱动的体验和互动提供无限的机会。
研究论文
https://arxiv.org/pdf/2304.03442.pdf