AI, 당신의 생각을 읽다: 스테이블 디퓨전과 뇌-컴퓨터 인터페이스의 미래

카테고리 AI/ML 태그 , , ,
Presented images (red box, top row) and images reconstructed from fMRI signals (gray box, bottom row) for one subject.
Save and Share:

오늘은 생성형 AI의 일종인 스테이블 디퓨전을 활용하여 인간의 뇌 활동을 기반으로 이미지를 재구성하는 연구 논문에 대해 이야기해 보겠습니다. 이 연구는 신경 과학에 중요한 의미를 가질 뿐만 아니라 꿈을 읽는 것부터 동물의 인식을 이해하는 것까지 광범위한 응용 분야의 문을 열어줍니다.

제시된 이미지 (빨간색 상자, 맨 위 행) 및 한 피험자에 대해 fMRI 신호로부터 재구성된 이미지 (회색 상자, 맨 아래 행).
제시된 이미지 (빨간색 상자, 맨 위 행) 및 한 피험자에 대해 fMRI 신호로부터 재구성된 이미지 (회색 상자, 맨 아래 행).

스테이블 디퓨전과 뇌 활동 해독

스테이블 디퓨전은 텍스트 프롬프트를 기반으로 놀라운 이미지를 생성할 수 있는 오픈 소스 생성형 AI입니다. 해당 논문에서 연구자들은 수천 건의 뇌 스캔을 통해 스테이블 디퓨전을 훈련했습니다. 뇌 활동을 기록하는 Memorize Cam이라는 장치를 사용하여 인간 참가자에게 다양한 이미지를 보여주었습니다. 뇌 활동 패턴과 해당 이미지 간의 관계에 대해 모델을 훈련함으로써 AI는 참가자의 뇌 활동을 기반으로 이미지를 재구성할 수 있었습니다.

항상 완벽하지는 않지만, 알고리즘은 종종 원래 이미지의 정확한 재구성을 생성했으며, 위치와 스케일이 정확하게 일치하는 경우가 많았습니다. 눈에 띄는 유일한 차이점은 일반적으로 특정 요소의 색상이었습니다. 이 방법의 성공은 신경 과학과 잠재적 확산 모델의 최근 연구의 조합 덕분입니다.

잠재적 응용 분야 및 향후 과제

이 기술에는 다음과 같은 수많은 잠재적 응용 분야가 있습니다.

  • 꿈, 생각, 기억 읽기
  • 동물이 뇌 활동을 기반으로 세상을 어떻게 인식하는지 이해
  • 인간처럼 세상을 이해할 수 있는 인공 시스템 만들기

알고리즘의 정확도를 개선하기 위한 주요 과제 중 하나는 더 큰 뇌 스캔 데이터 세트에 대해 스테이블 디퓨전을 훈련하는 것입니다. 기술이 발전함에 따라 인간-기계 인터페이스에 큰 혁명이 일어날 것입니다.

뇌-컴퓨터 인터페이스: 차세대 하드웨어 인터페이스

몇몇 스타트업은 이미 생각을 읽고 문자 메시지로 번역하거나, 심지어 정신력으로 가상 환경을 제어할 수 있는 장치를 개발하고 있습니다. Next Mind 및 Microsoft와 같은 회사는 생각을 통해 장치를 제어하는 것이 차세대 주요 하드웨어 인터페이스가 될 것이라고 믿고 비침습적 뇌-컴퓨터 인터페이스 (BCI) 개발에 적극적으로 참여하고 있습니다.

이러한 인간-기계 상호 작용의 변화는 우리가 소통하고, 일하고, 예술을 창조하는 방식에 큰 영향을 미칠 것입니다. 비침습적 BCI는 더 높은 정밀도로 생각을 읽기 위해 두개골에 구멍을 뚫어야 하는 침습적 BCI에 비해 더 안전하고 실용적인 대안을 제공합니다.

Anastasi In Tech의 비디오

연구 논문:

https://www.biorxiv.org/content/10.1101/2022.11.18.517004v3.full.pdf

결론

신경 과학과 AI가 계속 발전함에 따라 우리의 생각을 읽는 능력은 더 이상 실현 불가능해 보이지 않습니다. 비침습적 BCI가 현실화되면서 우리는 인간-기계 인터페이스의 혁신 직전에 있으며, 이는 우리가 장치 및 주변 세계와 상호 작용하는 방식을 변화시킬 것입니다.

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다