هوش مصنوعی می‌تواند ذهن شما را بخواند: استیبل دیفیوژن و آینده‌ی رابط‌های مغز-کامپیوتر

دسته‌بندی شده در AI/ML برچسب خورده با ،،،
Presented images (red box, top row) and images reconstructed from fMRI signals (gray box, bottom row) for one subject.
Save and Share:

امروز، قصد داریم در مورد یک مقاله‌ی پیشگامانه صحبت کنیم که بررسی می‌کند چگونه محققان از استیبل دیفیوژن (Stable Diffusion)، نوعی هوش مصنوعی مولد، برای بازسازی تصاویر بر اساس فعالیت مغز انسان استفاده کردند. این تحقیق نه‌تنها پیامدهای مهمی برای علوم اعصاب دارد، بلکه دری را به روی طیف گسترده‌ای از کاربردها، از خواندن رویاها گرفته تا درک نحوه‌ی ادراک حیوانات، باز می‌کند.

تصاویر ارائه شده (کادر قرمز، ردیف بالا) و تصاویر بازسازی شده از سیگنال‌های fMRI (کادر خاکستری، ردیف پایین) برای یک سوژه.
تصاویر ارائه شده (کادر قرمز، ردیف بالا) و تصاویر بازسازی شده از سیگنال‌های fMRI (کادر خاکستری، ردیف پایین) برای یک سوژه.

استیبل دیفیوژن و رمزگشایی فعالیت مغز

استیبل دیفیوژن یک هوش مصنوعی مولد متن‌باز است که قادر است تصاویر خیره‌کننده‌ای بر اساس دستورات متنی ایجاد کند. در این مقاله، محققان استیبل دیفیوژن را بر روی هزاران اسکن مغزی آموزش دادند؛ به این صورت که شرکت‌کنندگان انسانی را در معرض تصاویر مختلف قرار دادند و همزمان فعالیت مغز آنها را با استفاده از دستگاهی به نام Memorize Cam ثبت کردند. با آموزش مدل بر اساس رابطه‌ی بین الگوهای فعالیت مغز و تصاویر مربوطه، هوش مصنوعی توانست تصاویر را بر اساس فعالیت مغز شرکت‌کنندگان بازسازی کند.

اگرچه همیشه بی‌نقص نبود، اما الگوریتم اغلب بازسازی‌های دقیقی از تصاویر اصلی تولید می‌کرد و موقعیت و مقیاس اغلب به‌طور دقیق مطابقت داشتند. تنها تفاوت قابل توجه معمولاً رنگ عناصر خاص بود. موفقیت این روش به ترکیبی از تحقیقات اخیر در علوم اعصاب و مدل‌های انتشار نهفته نسبت داده می‌شود.

کاربردهای بالقوه و چالش‌های آینده

کاربردهای بالقوه‌ی متعددی برای این فناوری وجود دارد، از جمله:

  • خواندن رویاها، افکار و خاطرات
  • درک اینکه حیوانات چگونه جهان را بر اساس فعالیت مغز خود درک می‌کنند
  • ایجاد سیستم‌های مصنوعی که می‌توانند جهان را مانند انسان‌ها درک کنند

یکی از چالش‌های کلیدی برای بهبود دقت الگوریتم، آموزش استیبل دیفیوژن بر روی مجموعه‌ی داده‌ی بزرگتری از اسکن‌های مغزی است. با پیشرفت این فناوری، احتمالاً منجر به یک انقلاب بزرگ در رابط‌های انسان و ماشین خواهد شد.

رابط‌های مغز-کامپیوتر: رابط سخت‌افزاری بعدی

چندین استارتاپ در حال حاضر دستگاه‌هایی را توسعه می‌دهند که می‌توانند افکار را بخوانند و آنها را به پیام‌های متنی ترجمه کنند، یا حتی محیط‌های مجازی را با قدرت ذهن کنترل کنند. شرکت‌هایی مانند Next Mind و Microsoft به‌طور فعال روی رابط‌های مغز-کامپیوتر (BCI) غیرتهاجمی کار می‌کنند و معتقدند که کنترل دستگاه‌ها با افکار، رابط سخت‌افزاری اصلی بعدی خواهد بود.

این تغییر در تعامل انسان و ماشین پیامدهای مهمی برای نحوه‌ی ارتباط، کار و خلق هنر ما خواهد داشت. رابط‌های مغز-کامپیوتر غیرتهاجمی جایگزین ایمن‌تر و عملی‌تری برای رابط‌های مغز-کامپیوتر تهاجمی هستند که برای خواندن افکار با دقت بیشتر نیاز به سوراخ کردن جمجمه دارند.

ویدیو از Anastasi In Tech

مقاله تحقیقاتی:

https://www.biorxiv.org/content/10.1101/2022.11.18.517004v3.full.pdf

نتیجه‌گیری

با ادامه‌ی توسعه‌ی علوم اعصاب و هوش مصنوعی، توانایی خواندن ذهن ما دیگر دور از دسترس به نظر نمی‌رسد. با وجود رابط‌های مغز-کامپیوتر غیرتهاجمی در راه، ما در آستانه‌ی انقلابی در رابط‌های انسان و ماشین هستیم که نحوه‌ی تعامل ما با دستگاه‌هایمان و دنیای اطرافمان را متحول می‌کند.

دیدگاهی بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *