今天,我们将探讨一篇开创性的论文,该论文探讨了研究人员如何利用Stable Diffusion(一种生成式AI)根据人类大脑活动重建图像。这项研究不仅对神经科学具有重大意义,也为从读取梦境到理解动物感知等广泛应用打开了大门。

Stable Diffusion与解码大脑活动
Stable Diffusion是一种开源生成式AI,能够根据文本提示创建令人惊叹的图像。在这篇论文中,研究人员利用数千张脑部扫描图像训练Stable Diffusion,让参与者接触各种图像,同时使用一种名为Memorize Cam的设备记录他们的大脑活动。通过训练模型了解大脑活动模式和相应图像之间的关系,AI能够根据参与者的大脑活动重建图像。
虽然并非总是完美,但该算法经常能够准确地重建原始图像,位置和比例通常精确匹配。唯一明显的区别通常是某些元素的颜色。这种方法的成功归功于神经科学和潜在扩散模型领域的最新研究成果的结合。
潜在应用与未来挑战
这项技术有许多潜在的应用,包括:
- 读取梦境、想法和记忆
- 根据动物的大脑活动了解它们如何感知世界
- 创建能够像人类一样理解世界的人工系统
提高算法准确性的关键挑战之一是用更大的脑部扫描数据集来训练Stable Diffusion。随着技术的进步,它可能会导致人机界面的重大革命。
脑机接口:下一个硬件界面
一些初创公司已经在开发能够读取思想并将其转化为短信的设备,甚至可以用大脑的力量控制虚拟环境。Next Mind和微软等公司正在积极开发非侵入式脑机接口 (BCI),他们认为用思想控制设备将是下一个主要的硬件界面。
人机交互的这种转变将对我们如何沟通、工作和创作艺术产生重大影响。非侵入式BCI提供了一种更安全、更实用的替代方案,以取代侵入式BCI,后者需要在头骨上钻孔才能更精确地读取思想。
Anastasi In Tech的视频
研究论文:
https://www.biorxiv.org/content/10.1101/2022.11.18.517004v3.full.pdf
结论
随着神经科学和人工智能的不断发展,读取我们的思想不再遥不可及。随着非侵入式BCI即将到来,我们正处于人机界面革命的边缘,这将改变我们与设备和周围世界互动的方式。