Сегодня мы поговорим о новаторской статье, в которой исследователи использовали Stable Diffusion, разновидность генеративного ИИ, для восстановления изображений на основе активности человеческого мозга. Это исследование имеет не только важное значение для нейронауки, но и открывает двери для широкого спектра применений: от чтения сновидений до понимания восприятия животных.

Stable Diffusion и расшифровка активности мозга
Stable Diffusion — это генеративный ИИ с открытым исходным кодом, способный создавать потрясающие изображения на основе текстовых запросов. В статье исследователи обучили Stable Diffusion на тысячах сканов мозга, подвергая участников эксперимента воздействию различных изображений и одновременно записывая их мозговую активность с помощью устройства под названием Memorize Cam. Обучив модель на взаимосвязи между паттернами мозговой активности и соответствующими изображениями, ИИ смог реконструировать изображения на основе мозговой активности участников.
Хотя алгоритм и не всегда выдавал идеальные результаты, он часто создавал точные реконструкции исходных изображений, при этом положение и масштаб часто совпадали с высокой точностью. Единственным заметным отличием обычно был цвет определенных элементов. Успех этого метода объясняется сочетанием последних исследований в области нейронауки и латентных диффузионных моделей.
Потенциальные применения и будущие задачи
У этой технологии есть множество потенциальных применений, в том числе:
- Чтение сновидений, мыслей и воспоминаний
- Понимание того, как животные воспринимают мир, на основе их мозговой активности
- Создание искусственных систем, способных понимать мир так же, как люди
Одной из ключевых задач для повышения точности алгоритма является обучение Stable Diffusion на большем наборе данных сканов мозга. По мере развития технологии это, вероятно, приведет к серьезной революции в интерфейсах «человек-машина».
Интерфейсы «мозг-компьютер»: следующий этап развития аппаратных интерфейсов
Несколько стартапов уже разрабатывают устройства, которые могут читать мысли и переводить их в текстовые сообщения или даже управлять виртуальными средами силой мысли. Такие компании, как Next Mind и Microsoft, активно работают над неинвазивными интерфейсами «мозг-компьютер» (BCI), полагая, что управление устройствами с помощью мыслей станет следующим важным этапом развития аппаратных интерфейсов.
Этот сдвиг в человеко-машинном взаимодействии окажет значительное влияние на то, как мы общаемся, работаем и создаем искусство. Неинвазивные BCI предлагают более безопасную и практичную альтернативу инвазивным BCI, которые требуют сверления отверстия в черепе для считывания мыслей с большей точностью.
Видео от Anastasi In Tech
Исследовательская работа:
https://www.biorxiv.org/content/10.1101/2022.11.18.517004v3.full.pdf
Заключение
По мере развития нейронауки и ИИ способность читать наши мысли уже не кажется чем-то недостижимым. С появлением неинвазивных BCI мы находимся на пороге революции в интерфейсах «человек-машина», которая изменит то, как мы взаимодействуем с нашими устройствами и окружающим миром.