কল্পনা করুন এমন একটা জগৎ, যেখানে কম্পিউটেশনাল সফটওয়্যার এজেন্টরা বিশ্বাসযোগ্য মানুষের আচরণ অনুকরণ করে, যেখানে এআই শিল্পীরা ছবি আঁকে এবং লেখকরা লেখে, যেখানে এই এআই এজেন্টরা মতামত তৈরি করে এবং কথোপকথন শুরু করে, এবং যেখানে স্মৃতিগুলোকে উচ্চ-স্তরের চিন্তাভাবনায় রূপান্তরিত করে আচরণের পরিকল্পনা করা হয়। এটাই হল জেনারেটিভ এজেন্টদের জগৎ। এই নিবন্ধে, আমরা জেনারেটিভ এজেন্টদের পরিচিতি এবং গেমিং ও অন্যান্য ক্ষেত্রে এর প্রভাব নিয়ে আলোচনা করা যুগান্তকারী গবেষণাপত্রটি দেখব।
গবেষণাপত্রের সংক্ষিপ্ত বিবরণ
স্ট্যানফোর্ড এবং গুগল থেকে প্রকাশিত “জেনারেটিভ এজেন্ট: ইন্টারেক্টিভ সিমুলাক্রা অফ হিউম্যান বিহেভিয়ার” নামক একটি আকর্ষণীয় গবেষণাপত্র জেনারেটিভ এজেন্টদের পরিচয় করিয়ে দেয়, যা কম্পিউটেশনাল সফটওয়্যার এজেন্ট এবং বিশ্বাসযোগ্য মানুষের আচরণকে অনুকরণ করে। গবেষকরা একটি সিমুলেটেড জগৎ তৈরি করেছেন, যেখানে তারা ২৫টি জেনারেটিভ এজেন্ট বসিয়েছেন, যাদের প্রত্যেকের নিজস্ব ব্যক্তিত্ব রয়েছে।
এই এজেন্টরা ঘুম থেকে ওঠে, সকালের নাস্তা তৈরি করে, কাজে যায় এবং মানুষের মতো মতামত তৈরি করে। মজার বিষয় হল, এই এজেন্টরা তাদের অতীতের দিনগুলো মনে রাখে এবং তাদের অভিজ্ঞতার স্মৃতি ব্যবহার করে ভবিষ্যতের দিনগুলোর পরিকল্পনা করে। এই এজেন্টগুলো একটি বৃহৎ ভাষা মডেল দ্বারা চালিত, এবং এই আর্কিটেকচারটি এজেন্টদের অভিজ্ঞতার জটিল রেকর্ডগুলো প্রাকৃতিক ভাষায় সংরক্ষণের জন্য সেই বৃহৎ ভাষা মডেলটিকে প্রসারিত করে।
এই এজেন্টরা মানুষের মতোই বিশ্বাসযোগ্য স্বতন্ত্র এবং সামাজিক আচরণ তৈরি করে। এই কাজটি গেমিং শিল্পের জন্য খুবই গুরুত্বপূর্ণ, কারণ এটি ভিডিও গেমের নন-প্লেয়েবল ক্যারেক্টারদের (NPC) নিজস্ব চরিত্র এবং ব্যক্তিত্ব তৈরি করতে সাহায্য করে, যা খেলোয়াড়দের সাথে আরও স্বাভাবিকভাবে যোগাযোগ করতে পারে।
সিমুলেশন এনভায়রনমেন্ট: স্মার্টভিল
লেখকরা স্মার্টভিল নামের একটি ছোট স্যান্ডবক্স জগৎ তৈরি করেছেন, যা জনপ্রিয় গেম “The Sims” থেকে অনুপ্রাণিত। স্মার্টভিলে বসবাসের স্থান, বাড়ি, ক্যাফে, বার, দোকান, পার্ক, কলেজ, মুদি দোকান এবং ওষুধের দোকান রয়েছে। ধারণাটি ছিল এআই এজেন্টদের মধ্যে সামাজিক আচরণগুলো কীভাবে তৈরি হতে পারে, তা খুঁজে বের করা।
এজেন্টদের আর্কিটেকচারে তিনটি প্রধান উপাদান অন্তর্ভুক্ত ছিল:
- মেমরি স্ট্রিম: এজেন্টদের অভিজ্ঞতা রেকর্ড করে।
- রিফ্লেকশন: স্মৃতিগুলোকে উচ্চ-স্তরের অনুমানে সংশ্লেষণ করে।
- প্ল্যানিং: সিদ্ধান্তগুলোকে কর্মপরিকল্পনায় অনুবাদ করে।
এই রিফ্লেকশন এবং পরিকল্পনাগুলো এজেন্টদের ভবিষ্যতের আচরণকে প্রভাবিত করে, যা তাদের স্বাধীনভাবে কাজ করতে সাহায্য করে।
ইন-গেম ইভেন্ট এবং ইন্টার্যাকশন তৈরি করা
জেনারেটিভ এজেন্টরা ইন-গেম ইভেন্ট এবং ইন্টার্যাকশন তৈরির প্রক্রিয়াকে সহজ করতে পারে। উদাহরণস্বরূপ, ভ্যালেন্টাইনস ডে পার্টির জন্য একাধিক চরিত্রের আচরণ হাতে-কলমে স্ক্রিপ্ট করার পরিবর্তে, একজন এজেন্টকে বলা যেতে পারে যে সে একটি পার্টি দিতে চায়। এই এজেন্টরা একে অপরের সাথে স্বাধীনভাবে যোগাযোগ করতে পারে এবং পার্টি সম্পর্কে খবর ছড়াতে এবং উপস্থিত হতে সক্ষম। এমনকি একজন এজেন্ট অন্য এজেন্টকে পার্টিতে ডেটে যাওয়ার প্রস্তাব দেয়, যা একজন ব্যবহারকারীর তৈরি করা সামান্য পরামর্শ থেকে শুরু হয়।
এজেন্টদের ব্যক্তিত্ব এবং ইন্টার্যাকশন
লেখকরা প্রতিটি এজেন্টের পরিচয়, তাদের পেশা এবং অন্যান্য এজেন্টদের সাথে তাদের সম্পর্ক সহ একটি অনুচ্ছেদে বর্ণনা করেছেন। এই বর্ণনাগুলো এজেন্টের জন্য প্রাথমিক স্মৃতিরূপে কাজ করে। উদাহরণস্বরূপ, জন লিনকে একজন ফার্মেসী দোকানদার হিসেবে বর্ণনা করা হয়েছে:
“জন লিন হলেন দ্য ভিটোর একটি ফার্মেসী দোকানদার, যিনি মানুষকে সাহায্য করতে ভালোবাসেন। তিনি সবসময় তার গ্রাহকদের জন্য ওষুধ পাওয়ার প্রক্রিয়াটিকে আরও সহজ করার উপায় খোঁজেন।”
এই এজেন্টদের তাদের জগৎ এবং নিজেদের মধ্যেকার সমস্ত ইন্টার্যাকশন প্রাকৃতিক ভাষার মাধ্যমে সম্পন্ন হয়। প্রতিটি টাইমস্ট্যাম্পে, এজেন্টরা তাদের বর্তমান কার্যকলাপের একটি প্রাকৃতিক ভাষার বিবৃতি আউটপুট করে, যা বর্তমান নড়াচড়ায় অনুবাদ করা হয় এবং স্যান্ডবক্স ইন্টারফেসে ইমোজি আকারে প্রদর্শিত হয়।
এজেন্টদের নিয়ন্ত্রণ এবং ম্যানিপুলেট করা
যদিও এই এআই এজেন্টরা স্বাধীন এবং তাদের ইন্টার্যাকশনগুলো স্বাভাবিকভাবে ঘটে, তবুও ব্যবহারকারীদের কিছু নিয়ন্ত্রণ থাকে। ব্যবহারকারীরা দুটি উপায়ে গেমের সাথে ইন্টার্যাক্ট করতে পারেন:
- কথোপকথনের মাধ্যমে এজেন্টের সাথে যোগাযোগ করুন।
- এজেন্টকে একটি অভ্যন্তরীণ কণ্ঠের মাধ্যমে নির্দেশনা দিন, যা এজেন্টের আচরণ নিয়ন্ত্রণ করে।
উদাহরণস্বরূপ, যখন জন-এর অভ্যন্তরীণ কণ্ঠ ব্যবহারকারী দ্বারা বলা হয়, “তুমি আসন্ন নির্বাচনে স্যামের বিরুদ্ধে প্রতিদ্বন্দ্বিতা করতে যাচ্ছ,” তখন জন প্রতিদ্বন্দ্বিতা করার সিদ্ধান্ত নেয় এবং তার স্ত্রী ও ছেলের সাথে তার প্রার্থীতার কথা জানায়। এটি দেখায় যে কীভাবে ব্যবহারকারীরা এই এজেন্টদের পরিবেশ এবং আচরণ নিয়ন্ত্রণ ও ম্যানিপুলেট করতে পারে।
এজেন্টের জীবনে একটি দিন
একজন এজেন্টের দিন শুরু হয় একটি অনুচ্ছেদ বর্ণনা দিয়ে, এবং তাদের আচরণ একে অপরের এবং জগতের সাথে ইন্টার্যাক্ট করার সাথে সাথে বিকশিত হয়। উদাহরণস্বরূপ, জোনাথন সকাল ৭টার দিকে ঘুম থেকে ওঠে, দাঁত ব্রাশ করে, গোসল করে, সকালের নাস্তা তৈরি করে ও খায় এবং ডাইনিং টেবিলে বসে খবর দেখে। তার ছেলে এডি জেগে ওঠে এবং তারা তাদের দিন শুরু করার আগে সংক্ষিপ্ত কথোপকথন করে।
এজেন্টদের আচরণ অন্যান্য এজেন্টদের সাথে তাদের ইন্টার্যাকশনের উপর ভিত্তি করে পরিবর্তিত হয়। এজেন্টদের আর্কিটেকচার প্রতিটি এজেন্টের আচরণ নিয়ন্ত্রণ করে, যা তাদের পরিবেশকে উপলব্ধি করতে এবং মেমরি স্ট্রিমে উপলব্ধিগুলো সংরক্ষণ করতে দেয়। যখন তাদের কোনও কাজ করার প্রয়োজন হয়, তখন তারা মেমরি স্ট্রিম থেকে তথ্য পুনরুদ্ধার করে এবং সেই তথ্যের ভিত্তিতে তাদের পরবর্তী পদক্ষেপের পরিকল্পনা করে। সঞ্চিত স্মৃতিগুলো এজেন্টদের আচরণ পরিবর্তন করতেও ব্যবহৃত হয়, যা তাদের অতীতের স্মৃতিগুলোর প্রতিফলন করতে এবং পরিবেশ ও অন্যান্য এজেন্টদের সাথে তাদের ইন্টার্যাকশন সামঞ্জস্য করতে সহায়তা করে।
বাস্তব বিশ্বের অ্যাপ্লিকেশন
গেম এবং NPC ছাড়াও, জেনারেটিভ এজেন্টদের বাস্তব-বিশ্বের অ্যাপ্লিকেশন রয়েছে। উদাহরণস্বরূপ, আপনি যদি কোনও কঠিন ব্যক্তি বা ব্যক্তিত্বের সাথে ইন্টারভিউয়ের জন্য প্রস্তুতি নিচ্ছেন, তবে আপনি তাদের আচরণ অনুকরণ করতে এবং তাদের সাথে ইন্টার্যাক্ট করতে এআই এজেন্ট ব্যবহার করতে পারেন। এটি আপনাকে ইন্টারভিউ বা অন্যান্য সামাজিক পরিস্থিতির জন্য প্রস্তুত হতে সাহায্য করতে পারে।
অনলাইন ডেমো
যদিও অনলাইন ডেমোটি রিয়েল-টাইম নয় এবং পূর্বে ঘটা একটি সিমুলেশনের একটি প্রাক-গণনাকৃত রিপ্লে উপস্থাপন করে, তবুও আপনি ইন্টার্যাকশন এবং বিভিন্ন এজেন্টের কার্যকলাপ দেখতে পারেন। আপনি ২৫টি ভিন্ন এজেন্টের মধ্যে একটি নির্বাচন করতে পারেন এবং দেখতে পারেন যে এজেন্টটি যে কোনও সময়ে কী করছে। এই আকর্ষণীয় কাজটি গেমিং শিল্প এবং বিভিন্ন এআই এজেন্টদের সাথে আমাদের ইন্টার্যাক্ট করার পদ্ধতি পরিবর্তন করার সম্ভাবনা রাখে, যা সম্ভাবনার একটি নতুন জগৎ উন্মোচন করে।
https://reverie.herokuapp.com/arXiv_Demo/
উপসংহারে, জেনারেটিভ এজেন্টরা এআই-এর জগতে একটি গুরুত্বপূর্ণ অগ্রগতি উপস্থাপন করে, যা এমন একটি ভবিষ্যতের আভাস দেয় যেখানে বিশ্বাসযোগ্য মানুষের আচরণ অনুকরণ করা হয় এবং ইন্টার্যাক্টিভ হয়। এই প্রযুক্তি গেমিং এবং অন্যান্য অ্যাপ্লিকেশনগুলোতে বিপ্লব ঘটাতে প্রতিশ্রুতিবদ্ধ, যা এআই-চালিত অভিজ্ঞতা এবং ইন্টার্যাকশনের জন্য অফুরন্ত সুযোগ প্রদান করে।
গবেষণা পত্র
https://arxiv.org/pdf/2304.03442.pdf