Φανταστείτε έναν κόσμο όπου υπολογιστικοί πράκτορες λογισμικού προσομοιώνουν πιστευτή ανθρώπινη συμπεριφορά, έναν κόσμο όπου καλλιτέχνες AI ζωγραφίζουν και συγγραφείς γράφουν, όπου αυτοί οι πράκτορες AI διαμορφώνουν απόψεις και ξεκινούν συζητήσεις, και όπου οι αναμνήσεις συντίθενται σε αναστοχασμούς υψηλότερου επιπέδου για να σχεδιάσουν τη συμπεριφορά. Αυτός είναι ο κόσμος των παραγωγικών πρακτόρων. Σε αυτό το άρθρο, θα εξερευνήσουμε την πρωτοποριακή εργασία που εισάγει τους παραγωγικούς πράκτορες και τις επιπτώσεις τους στο μέλλον του gaming και σε άλλες εφαρμογές.
Επισκόπηση της Εργασίας
Μια συναρπαστική νέα εργασία από το Stanford και την Google με τίτλο “Generative Agents: Interactive Simulacra of Human Behavior” (Παραγωγικοί Πράκτορες: Διαδραστικά Ομοιώματα Ανθρώπινης Συμπεριφοράς) εισάγει τους παραγωγικούς πράκτορες, υπολογιστικούς πράκτορες λογισμικού που προσομοιώνουν πιστευτή ανθρώπινη συμπεριφορά. Οι ερευνητές δημιούργησαν έναν προσομοιωμένο κόσμο στον οποίο τοποθέτησαν 25 παραγωγικούς πράκτορες, ο καθένας με τη δική του προσωπικότητα.
Αυτοί οι πράκτορες ξυπνούν, μαγειρεύουν πρωινό, πηγαίνουν στη δουλειά και διαμορφώνουν απόψεις όπως οι άνθρωποι. Το συναρπαστικό είναι ότι αυτοί οι πράκτορες θυμούνται και αναλογίζονται τις περασμένες ημέρες καθώς σχεδιάζουν τις επόμενες, χρησιμοποιώντας αναμνήσεις αλληλεπιδράσεων που είχαν. Όλοι αυτοί οι πράκτορες καθοδηγούνται από ένα μεγάλο γλωσσικό μοντέλο και η αρχιτεκτονική επεκτείνει αυτό το μεγάλο γλωσσικό μοντέλο για να αποθηκεύει σύνθετες εγγραφές των εμπειριών των πρακτόρων χρησιμοποιώντας φυσική γλώσσα.
Οι πράκτορες παράγουν πιστευτές ατομικές και αναδυόμενες κοινωνικές συμπεριφορές, όπως ακριβώς οι άνθρωποι. Αυτή η εργασία έχει σημαντικές επιπτώσεις για τη βιομηχανία του gaming, καθώς επιτρέπει στους μη-παίξιμους χαρακτήρες (NPCs) στα βιντεοπαιχνίδια να έχουν τον δικό τους χαρακτήρα και προσωπικότητα, αλληλεπιδρώντας με τους παίκτες πιο φυσικά.
Περιβάλλον Προσομοίωσης: Smartville
Οι συγγραφείς προσομοίωσαν έναν μικρό sandbox κόσμο που ονομάζεται Smartville, εμπνευσμένο από το δημοφιλές παιχνίδι “The Sims”. Το Smartville αποτελείται από χώρους συγκατοίκησης, σπίτια, καφετέριες, μπαρ, καταστήματα, πάρκα, κολέγια, παντοπωλεία και φαρμακεία. Η ιδέα ήταν να διερευνηθεί πώς θα μπορούσαν να αναδυθούν κοινωνικές συμπεριφορές μεταξύ των πρακτόρων AI.
Τρία κύρια συστατικά συμπεριλήφθηκαν στην αρχιτεκτονική των πρακτόρων:
- Ροή Μνήμης: Καταγράφει τις εμπειρίες των πρακτόρων.
- Αναστοχασμός: Συνθέτει αναμνήσεις σε συμπεράσματα υψηλότερου επιπέδου.
- Σχεδιασμός: Μεταφράζει τα συμπεράσματα σε σχέδια δράσης.
Αυτοί οι αναστοχασμοί και τα σχέδια επηρεάζουν τη μελλοντική συμπεριφορά των πρακτόρων, επιτρέποντάς τους να αναλαμβάνουν δράσεις ανεξάρτητα.
Δημιουργία Ενδοπαιχνιδικών Γεγονότων και Αλληλεπιδράσεων
Οι παραγωγικοί πράκτορες μπορούν να απλοποιήσουν τη διαδικασία δημιουργίας ενδοπαιχνιδικών γεγονότων και αλληλεπιδράσεων. Για παράδειγμα, αντί να δημιουργούνται χειροκίνητα σενάρια για τη συμπεριφορά πολλών χαρακτήρων για ένα πάρτι του Αγίου Βαλεντίνου, αρκεί να πει κανείς σε έναν πράκτορα ότι θέλει να κάνει ένα πάρτι. Αυτοί οι πράκτορες μπορούν να αλληλεπιδράσουν ανεξάρτητα μεταξύ τους και το περιβάλλον κατάφερε να διαδώσει τη φήμη για το πάρτι και να εμφανιστεί. Ένας πράκτορας μάλιστα ζητάει από έναν άλλο πράκτορα να βγουν ραντεβού στο πάρτι, όλα από μια μεμονωμένη πρόταση που δημιουργήθηκε από τον χρήστη.
Προσωπικότητες και Αλληλεπιδράσεις Πρακτόρων
Οι συγγραφείς δημιούργησαν μια περιγραφή σε φυσική γλώσσα μιας παραγράφου για την ταυτότητα κάθε πράκτορα, συμπεριλαμβανομένου του επαγγέλματός του και της σχέσης του με άλλους πράκτορες. Αυτές οι περιγραφές χρησιμεύουν ως αρχικές αναμνήσεις για τον πράκτορα. Για παράδειγμα, ο John Lin περιγράφεται ως ιδιοκτήτης φαρμακείου με την ακόλουθη περιγραφή:
“Ο John Lin είναι ιδιοκτήτης φαρμακείου στο The Vito Market and Pharmacy που λατρεύει να βοηθάει τους ανθρώπους. Πάντα ψάχνει τρόπους να κάνει τη διαδικασία λήψης φαρμάκων ευκολότερη για τους πελάτες του.”
Όλες οι αλληλεπιδράσεις αυτών των πρακτόρων με τον κόσμο τους και μεταξύ τους γίνονται μέσω φυσικής γλώσσας. Σε κάθε χρονική σήμανση, οι πράκτορες εξάγουν μια δήλωση σε φυσική γλώσσα που περιγράφει την τρέχουσα δράση τους, η οποία μεταφράζεται σε τρέχουσες κινήσεις και εμφανίζεται στη διεπαφή sandbox ως ένα σύνολο emojis.
Έλεγχος και Χειραγώγηση Πρακτόρων
Αν και αυτοί οι πράκτορες AI είναι ανεξάρτητοι και οι αλληλεπιδράσεις τους συμβαίνουν οργανικά, οι χρήστες έχουν επίσης κάποιο έλεγχο. Υπάρχουν δύο τρόποι με τους οποίους οι χρήστες μπορούν να αλληλεπιδράσουν με το παιχνίδι:
- Επικοινωνήστε με τον πράκτορα μέσω συνομιλίας.
- Δώστε οδηγίες στον πράκτορα με τη μορφή μιας εσωτερικής φωνής, η οποία ελέγχει τη συμπεριφορά του πράκτορα.
Για παράδειγμα, όταν ένας χρήστης λέει ως εσωτερική φωνή του John, “Θα κατέβεις εναντίον του Sam στις επερχόμενες εκλογές”, ο John αποφασίζει να κατέβει και μοιράζεται την υποψηφιότητά του με τη γυναίκα και τον γιο του. Αυτό καταδεικνύει πώς οι χρήστες μπορούν να ελέγξουν και να χειραγωγήσουν το περιβάλλον και τη συμπεριφορά αυτών των πρακτόρων.
Μια Μέρα στη Ζωή ενός Πράκτορα
Η μέρα ενός πράκτορα ξεκινά με μια περιγραφή μιας παραγράφου και η συμπεριφορά τους εξελίσσεται καθώς αλληλεπιδρούν μεταξύ τους και με τον κόσμο. Για παράδειγμα, ο Jonathan ξυπνάει γύρω στις 7 π.μ., βουρτσίζει τα δόντια του, κάνει ένα ντους, ετοιμάζει και τρώει πρωινό και ελέγχει τις ειδήσεις στο τραπέζι της τραπεζαρίας. Ο γιος του, Eddie, ξυπνάει και έχουν μια σύντομη συζήτηση πριν συνεχίσουν τη μέρα τους.
Η συμπεριφορά των πρακτόρων αλλάζει με βάση τις αλληλεπιδράσεις τους με άλλους πράκτορες. Η αρχιτεκτονική των πρακτόρων ελέγχει τη συμπεριφορά κάθε πράκτορα, επιτρέποντάς τους να αντιλαμβάνονται το περιβάλλον τους και να αποθηκεύουν τις αντιλήψεις στη ροή μνήμης. Όταν πρέπει να εκτελέσουν μια ενέργεια, ανακτούν πληροφορίες από τη ροή μνήμης και σχεδιάζουν την επόμενη ενέργειά τους με βάση αυτές τις πληροφορίες. Οι αποθηκευμένες αναμνήσεις χρησιμοποιούνται επίσης για να αλλάξουν τη συμπεριφορά των πρακτόρων, επιτρέποντάς τους να αναλογιστούν τις παρελθοντικές αναμνήσεις και να προσαρμόσουν τις αλληλεπιδράσεις τους με το περιβάλλον και άλλους πράκτορες.
Εφαρμογές στον Πραγματικό Κόσμο
Εκτός από τα παιχνίδια και τους NPCs, οι παραγωγικοί πράκτορες έχουν εφαρμογές στον πραγματικό κόσμο. Για παράδειγμα, εάν προετοιμάζεστε για μια συνέντευξη με ένα δύσκολο άτομο ή προσωπικότητα, μπορείτε να χρησιμοποιήσετε πράκτορες AI για να προσομοιώσετε τη συμπεριφορά τους και να αλληλεπιδράσετε μαζί τους. Αυτό μπορεί να σας βοηθήσει να προετοιμαστείτε για τη συνέντευξη ή άλλες κοινωνικές καταστάσεις.
Διαδικτυακή Επίδειξη
Αν και η διαδικτυακή επίδειξη δεν είναι σε πραγματικό χρόνο και παρουσιάζει μια προ-υπολογισμένη αναπαραγωγή μιας προσομοίωσης που έχει συμβεί πριν, μπορείτε να δείτε τις αλληλεπιδράσεις και τις δραστηριότητες διαφορετικών πρακτόρων. Μπορείτε να επιλέξετε έναν από τους 25 διαφορετικούς πράκτορες και να δείτε τι κάνει ο πράκτορας σε οποιαδήποτε δεδομένη στιγμή. Αυτή η συναρπαστική εργασία έχει τη δυνατότητα να αλλάξει τη βιομηχανία του gaming και τον τρόπο με τον οποίο αλληλεπιδρούμε με διαφορετικούς πράκτορες AI, ανοίγοντας έναν ολοκαίνουργιο κόσμο δυνατοτήτων.
https://reverie.herokuapp.com/arXiv_Demo/
Συμπερασματικά, οι παραγωγικοί πράκτορες αντιπροσωπεύουν μια σημαντική πρόοδο στον κόσμο της Τεχνητής Νοημοσύνης, προσφέροντας μια ματιά σε ένα μέλλον όπου η πιστευτή ανθρώπινη συμπεριφορά προσομοιώνεται και είναι διαδραστική. Αυτή η τεχνολογία υπόσχεται να φέρει επανάσταση στο gaming και σε άλλες εφαρμογές, παρέχοντας ατελείωτες ευκαιρίες για εμπειρίες και αλληλεπιδράσεις που βασίζονται στην Τεχνητή Νοημοσύνη.
Ερευνητική εργασία
https://arxiv.org/pdf/2304.03442.pdf