আজকে আমরা একটি যুগান্তকারী গবেষণাপত্র নিয়ে আলোচনা করব, যেখানে গবেষকরা দেখিয়েছেন কীভাবে স্টেবল ডিফিউশন (generative AI-এর একটি প্রকার) ব্যবহার করে মানুষের মস্তিষ্কের কার্যকলাপের উপর ভিত্তি করে ছবি পুনর্গঠন করা যায়। এই গবেষণাটি শুধুমাত্র নিউরোসায়েন্সের জন্য গুরুত্বপূর্ণ নয়, এটি স্বপ্ন পড়া থেকে শুরু করে প্রাণীদের অনুভূতি বোঝা পর্যন্ত বিভিন্ন ক্ষেত্রে নতুন দিগন্ত উন্মোচন করে।

স্টেবল ডিফিউশন এবং মস্তিষ্কের কার্যকলাপের ডিকোডিং
স্টেবল ডিফিউশন হলো একটি ওপেন-সোর্স জেনারেটিভ এআই, যা টেক্সট প্রম্পটের উপর ভিত্তি করে অত্যাশ্চর্য ছবি তৈরি করতে সক্ষম। গবেষণাপত্রে, গবেষকরা কয়েক হাজার ব্রেইন স্ক্যানের উপর স্টেবল ডিফিউশনকে প্রশিক্ষণ দিয়েছেন। যেখানে মানুষের অংশগ্রহণকারীদের বিভিন্ন ছবি দেখানোর সময় মেমোরাইজ ক্যাম নামক একটি ডিভাইস ব্যবহার করে তাদের মস্তিষ্কের কার্যকলাপ রেকর্ড করা হয়েছে। মস্তিষ্কের কার্যকলাপের ধরণ এবং সংশ্লিষ্ট ছবিগুলোর মধ্যে সম্পর্ক তৈরি করার মাধ্যমে, এআই অংশগ্রহণকারীদের মস্তিষ্কের কার্যকলাপের উপর ভিত্তি করে ছবি পুনর্গঠন করতে সক্ষম হয়েছিল।
সব সময় নিখুঁত না হলেও, অ্যালগরিদম প্রায়শই মূল ছবিগুলোর সঠিক পুনর্গঠন করতে পেরেছে। যেখানে ছবির অবস্থান এবং স্কেল প্রায়শই হুবহু মিলে যায়। সাধারণত শুধুমাত্র কিছু উপাদানের রঙের পার্থক্য দেখা যায়। এই পদ্ধতির সাফল্যের কারণ হলো নিউরোসায়েন্স এবং ল্যাটেন্ট ডিফিউশন মডেলের সাম্প্রতিক গবেষণার সংমিশ্রণ।
সম্ভাব্য প্রয়োগ এবং ভবিষ্যতের চ্যালেঞ্জ
এই প্রযুক্তির অসংখ্য সম্ভাব্য ব্যবহার রয়েছে, যার মধ্যে কয়েকটি হলো:
- স্বপ্ন, চিন্তা এবং স্মৃতি পড়া
- প্রাণীরা তাদের মস্তিষ্কের কার্যকলাপের মাধ্যমে কীভাবে বিশ্বকে উপলব্ধি করে, তা বোঝা
- কৃত্রিম সিস্টেম তৈরি করা, যা মানুষের মতো বিশ্বকে বুঝতে পারে
অ্যালগরিদমের নির্ভুলতা উন্নত করার জন্য প্রধান চ্যালেঞ্জগুলোর মধ্যে একটি হলো ব্রেইন স্ক্যানের একটি বৃহত্তর ডেটাসেটের উপর স্টেবল ডিফিউশনকে প্রশিক্ষণ দেওয়া। প্রযুক্তির অগ্রগতির সাথে সাথে, এটি সম্ভবত মানব-যন্ত্র ইন্টারফেসে একটি বড় বিপ্লব ঘটাবে।
ব্রেইন-কম্পিউটার ইন্টারফেস: পরবর্তী হার্ডওয়্যার ইন্টারফেস
বেশ কয়েকটি স্টার্টআপ ইতিমধ্যেই এমন ডিভাইস তৈরি করছে, যা চিন্তা পড়তে এবং সেগুলোকে টেক্সট মেসেজে অনুবাদ করতে পারে, এমনকি মনের শক্তি দিয়ে ভার্চুয়াল পরিবেশ নিয়ন্ত্রণ করতে পারে। নেক্সট মাইন্ড এবং মাইক্রোসফটের মতো কোম্পানিগুলো বর্তমানে নন-ইনভেসিভ ব্রেইন-কম্পিউটার ইন্টারফেস (BCI) নিয়ে কাজ করছে। তারা মনে করে যে, চিন্তা দিয়ে ডিভাইস নিয়ন্ত্রণ করাই হবে পরবর্তী প্রধান হার্ডওয়্যার ইন্টারফেস।
মানব-যন্ত্রের মিথস্ক্রিয়ায় এই পরিবর্তন আমাদের যোগাযোগ, কাজ এবং শিল্প তৈরি করার পদ্ধতিতে গুরুত্বপূর্ণ প্রভাব ফেলবে। নন-ইনভেসিভ বিসিআই, ইনভেসিভ বিসিআই-এর চেয়ে নিরাপদ এবং আরও ব্যবহারিক বিকল্প সরবরাহ করে। যেখানে মস্তিষ্কের গভীরে প্রবেশ করে চিন্তা পড়ার জন্য মাথার খুলিতে ছিদ্র করার প্রয়োজন হয়।
অ্যানাস্তাসি ইন টেক-এর ভিডিও
গবেষণাপত্র:
https://www.biorxiv.org/content/10.1101/2022.11.18.517004v3.full.pdf
উপসংহার
নিউরোসায়েন্স এবং এআই-এর উন্নতির সাথে সাথে, আমাদের মন পড়ার ক্ষমতা আর নাগালের বাইরে মনে হচ্ছে না। নন-ইনভেসিভ বিসিআই দিগন্তে থাকার কারণে, আমরা মানব-যন্ত্র ইন্টারফেসের একটি বিপ্লবের দ্বারপ্রান্তে রয়েছি। যা আমাদের ডিভাইস এবং আমাদের চারপাশের বিশ্বের সাথে যোগাযোগের পদ্ধতিকে পরিবর্তন করবে।