Hãy tưởng tượng một thế giới nơi các tác nhân phần mềm máy tính mô phỏng hành vi con người một cách đáng tin cậy, một thế giới nơi các nghệ sĩ AI vẽ tranh và các tác giả viết sách, nơi các tác nhân AI này hình thành ý kiến và bắt đầu cuộc trò chuyện, và nơi ký ức được tổng hợp thành những suy tư cấp cao hơn để lên kế hoạch hành vi. Đây chính là thế giới của generative agents (tác nhân tạo sinh). Trong bài viết này, chúng ta sẽ khám phá bài báo đột phá giới thiệu về generative agents và những tác động của chúng đối với tương lai của ngành game và các ứng dụng khác.
Tổng quan về bài báo
Một bài báo mới thú vị từ Stanford và Google mang tên “Generative Agents: Interactive Simulacra of Human Behavior” (Tác nhân tạo sinh: Mô phỏng tương tác hành vi con người) giới thiệu về generative agents, các tác nhân phần mềm máy tính mô phỏng hành vi con người một cách đáng tin cậy. Các nhà nghiên cứu đã tạo ra một thế giới mô phỏng, nơi họ đặt 25 generative agents, mỗi tác nhân có một tính cách riêng.
Các tác nhân này thức dậy, nấu bữa sáng, đi làm và hình thành ý kiến giống như con người. Điều thú vị là các tác nhân này ghi nhớ và suy ngẫm về những ngày đã qua khi họ lên kế hoạch cho những ngày tiếp theo, sử dụng ký ức về các tương tác mà họ đã có. Tất cả các tác nhân này đều được điều khiển bởi một mô hình ngôn ngữ lớn và kiến trúc này mở rộng mô hình ngôn ngữ lớn đó để lưu trữ các bản ghi phức tạp về trải nghiệm của tác nhân bằng ngôn ngữ tự nhiên.
Các tác nhân tạo ra các hành vi xã hội cá nhân và nổi trội đáng tin cậy, giống như con người. Nghiên cứu này có ý nghĩa quan trọng đối với ngành công nghiệp game, vì nó cho phép các nhân vật không phải người chơi (NPC) trong trò chơi điện tử có tính cách và cá tính riêng, tương tác với người chơi một cách tự nhiên hơn.
Môi trường mô phỏng: Smartville
Các tác giả đã mô phỏng một thế giới sandbox nhỏ gọi là Smartville, lấy cảm hứng từ trò chơi nổi tiếng “The Sims”. Smartville bao gồm không gian sống chung, nhà ở, quán cà phê, quán bar, cửa hàng, công viên, trường cao đẳng, cửa hàng tạp hóa và hiệu thuốc. Ý tưởng là khám phá cách hành vi xã hội có thể nổi lên giữa các tác nhân AI.
Ba thành phần chính đã được đưa vào kiến trúc của tác nhân:
- Luồng ký ức: Ghi lại trải nghiệm của tác nhân.
- Suy ngẫm: Tổng hợp ký ức thành suy luận cấp cao hơn.
- Lập kế hoạch: Chuyển đổi kết luận thành kế hoạch hành động.
Những suy ngẫm và kế hoạch này ảnh hưởng đến hành vi tương lai của tác nhân, cho phép họ hành động một cách độc lập.
Tạo sự kiện và tương tác trong game
Generative agents có thể đơn giản hóa quá trình tạo sự kiện và tương tác trong game. Ví dụ: thay vì tự tay viết kịch bản hành vi của nhiều nhân vật cho một bữa tiệc Ngày lễ tình nhân, chỉ cần nói với một tác nhân rằng cô ấy muốn tổ chức một bữa tiệc. Các tác nhân này có thể tự tương tác với nhau và môi trường đã thành công trong việc lan truyền tin tức về bữa tiệc và xuất hiện. Một tác nhân thậm chí còn rủ một tác nhân khác đi hẹn hò đến bữa tiệc, tất cả chỉ từ một gợi ý ban đầu do người dùng tạo ra.
Tính cách và tương tác của tác nhân
Các tác giả đã tạo ra một đoạn văn mô tả bằng ngôn ngữ tự nhiên về danh tính của mỗi tác nhân, bao gồm nghề nghiệp và mối quan hệ của họ với các tác nhân khác. Những mô tả này đóng vai trò là ký ức gốc cho tác nhân. Ví dụ: John Lin được mô tả là một chủ cửa hàng thuốc tây với mô tả sau:
“John Lin là chủ cửa hàng thuốc tây tại Chợ và Nhà thuốc Vito, người thích giúp đỡ mọi người. Anh ấy luôn tìm cách làm cho quá trình lấy thuốc trở nên dễ dàng hơn cho khách hàng của mình.”
Tất cả các tương tác của các tác nhân này với thế giới của họ và giữa họ với nhau đều thông qua ngôn ngữ tự nhiên. Tại mỗi dấu thời gian, các tác nhân đưa ra một tuyên bố bằng ngôn ngữ tự nhiên mô tả hành động hiện tại của họ, được dịch thành các chuyển động hiện tại và hiển thị trên giao diện sandbox dưới dạng một tập hợp các biểu tượng cảm xúc.
Kiểm soát và điều khiển tác nhân
Mặc dù các tác nhân AI này độc lập và các tương tác của chúng diễn ra một cách tự nhiên, người dùng cũng có một số quyền kiểm soát. Có hai cách người dùng có thể tương tác với trò chơi:
- Giao tiếp với tác nhân thông qua trò chuyện.
- Đưa ra chỉ thị cho tác nhân dưới dạng tiếng nói nội tâm, điều khiển hành vi của tác nhân.
Ví dụ, khi được người dùng nói với tư cách là tiếng nói nội tâm của John, “Bạn sẽ tranh cử với Sam trong cuộc bầu cử sắp tới,” John quyết định tranh cử và chia sẻ việc ứng cử của mình với vợ và con trai. Điều này chứng minh cách người dùng có thể kiểm soát và điều khiển môi trường và hành vi của các tác nhân này.
Một ngày trong cuộc sống của một tác nhân
Một ngày của tác nhân bắt đầu bằng một đoạn mô tả duy nhất và hành vi của chúng phát triển khi chúng tương tác với nhau và thế giới. Ví dụ, Jonathan thức dậy vào khoảng 7 giờ sáng, đánh răng, tắm, chuẩn bị và ăn sáng, đồng thời xem tin tức tại bàn ăn. Con trai anh ấy, Eddie, thức dậy và họ có một cuộc trò chuyện ngắn trước khi bắt đầu một ngày mới.
Hành vi của tác nhân thay đổi dựa trên tương tác của chúng với các tác nhân khác. Kiến trúc của tác nhân kiểm soát hành vi của mỗi tác nhân, cho phép chúng nhận thức môi trường của mình và lưu trữ nhận thức trong luồng ký ức. Khi cần thực hiện một hành động, chúng truy xuất thông tin từ luồng ký ức và lên kế hoạch cho hành động tiếp theo dựa trên thông tin đó. Ký ức đã lưu trữ cũng được sử dụng để thay đổi hành vi của tác nhân, cho phép chúng suy ngẫm về những ký ức trong quá khứ và điều chỉnh tương tác của chúng với môi trường và các tác nhân khác.
Ứng dụng trong thế giới thực
Ngoài game và NPC, generative agents còn có các ứng dụng trong thế giới thực. Ví dụ: nếu bạn đang chuẩn bị cho một cuộc phỏng vấn với một người hoặc tính cách khó tính, bạn có thể sử dụng tác nhân AI để mô phỏng hành vi của họ và tương tác với họ. Điều này có thể giúp bạn chuẩn bị cho cuộc phỏng vấn hoặc các tình huống xã hội khác.
Bản demo trực tuyến
Mặc dù bản demo trực tuyến không phải là thời gian thực và trình bày bản phát lại được tính toán trước của một mô phỏng đã xảy ra trước đó, bạn có thể thấy các tương tác và hoạt động của các tác nhân khác nhau. Bạn có thể chọn một trong 25 tác nhân khác nhau và xem tác nhân đó đang làm gì vào bất kỳ thời điểm nào. Công trình thú vị này có tiềm năng thay đổi ngành công nghiệp game và cách chúng ta tương tác với các tác nhân AI khác nhau, mở ra một thế giới khả năng hoàn toàn mới.
https://reverie.herokuapp.com/arXiv_Demo/
Tóm lại, generative agents đại diện cho một tiến bộ đáng kể trong thế giới AI, mang đến một cái nhìn thoáng qua về tương lai nơi hành vi con người đáng tin cậy được mô phỏng và tương tác. Công nghệ này hứa hẹn sẽ cách mạng hóa ngành game và các ứng dụng khác, mang lại vô số cơ hội cho trải nghiệm và tương tác dựa trên AI.
Bài nghiên cứu
https://arxiv.org/pdf/2304.03442.pdf