今日は、研究者たちがStable Diffusion(生成AIの一種)を用いて、人間の脳活動に基づいて画像を再構築するという画期的な論文について議論します。この研究は神経科学に大きな影響を与えるだけでなく、夢の解読から動物の知覚の理解まで、幅広い応用への扉を開くものです。

Stable Diffusionと脳活動の解読
Stable Diffusionは、テキストプロンプトに基づいて驚くほど美しい画像を生成できるオープンソースの生成AIです。この論文では、研究者たちは何千もの脳スキャンデータを用いてStable Diffusionを訓練しました。その際、Memorize Camと呼ばれるデバイスを使用して、人間の被験者にさまざまな画像を見せながら脳活動を記録しました。脳活動パターンと対応する画像の関係をモデルに学習させることで、AIは被験者の脳活動に基づいて画像を再構築することができました。
必ずしも完璧ではありませんが、このアルゴリズムは元の画像を正確に再構築することが多く、位置やスケールは正確に一致していました。唯一顕著な違いは、特定の要素の色であることが一般的でした。この手法の成功は、神経科学と潜在拡散モデルにおける最近の研究の組み合わせによるものと考えられます。
潜在的な応用と今後の課題
この技術には、以下のような多くの潜在的な応用があります。
- 夢、思考、記憶の解読
- 動物の脳活動に基づいて、動物がどのように世界を知覚しているかの理解
- 人間のように世界を理解できる人工システムの構築
アルゴリズムの精度を向上させるための重要な課題の1つは、Stable Diffusionをより大規模な脳スキャンデータセットで訓練することです。技術が進歩するにつれて、ヒューマン・マシン・インターフェースに大きな革命をもたらす可能性があります。
脳波インターフェース:次世代のハードウェアインターフェース
すでにいくつかのスタートアップ企業が、思考を読み取り、それをテキストメッセージに変換したり、思考の力で仮想環境を制御したりできるデバイスを開発しています。Next MindやMicrosoftなどの企業は、思考によるデバイスの制御が次世代の主要なハードウェアインターフェースになると信じて、非侵襲的な脳波インターフェース(BCI)に積極的に取り組んでいます。
このヒューマン・マシン・インタラクションの変化は、私たちのコミュニケーション、仕事、芸術の創造方法に大きな影響を与えるでしょう。非侵襲的なBCIは、より高い精度で思考を読み取るために頭蓋骨に穴を開ける必要のある侵襲的なBCIよりも、安全で実用的な代替手段となります。
アナスタシ・イン・テックによるビデオ
研究論文:
https://www.biorxiv.org/content/10.1101/2022.11.18.517004v3.full.pdf
結論
神経科学とAIが発展し続けるにつれて、私たちの心を読み取る能力はもはや手の届かないものではないように思われます。非侵襲的なBCIが目前に迫り、私たちはヒューマン・マシン・インターフェースの革命の瀬戸際に立っており、デバイスや周囲の世界とのインタラクションの方法を変革しようとしています。