Dneska se budeme bavit o průlomové studii, která popisuje, jak vědci použili Stable Diffusion, což je typ generativní AI, k rekonstrukci obrázků na základě aktivity lidského mozku. Tenhle výzkum má obrovský dopad nejen na neurovědu, ale taky otevírá dveře široké škále aplikací, od čtení snů po pochopení vnímání zvířat.

Stable Diffusion a dekódování aktivity mozku
Stable Diffusion je open-source generativní AI, která dokáže vytvářet úžasné obrázky na základě textových zadání. V téhle studii vědci trénovali Stable Diffusion na tisících snímků mozku. Účastníci výzkumu se dívali na různé obrázky a zároveň jim monitorovali aktivitu mozku pomocí zařízení zvaného Memorize Cam. Tím, že model trénovali na vztahu mezi vzorci aktivity mozku a odpovídajícími obrázky, AI dokázala rekonstruovat obrázky na základě aktivity mozku účastníků.
I když to nebylo vždycky perfektní, ten algoritmus často produkoval dost přesné rekonstrukce originálních obrázků, přičemž pozice a měřítko se často shodovaly naprosto přesně. Jediný výraznější rozdíl byla obvykle barva některých prvků. Úspěch téhle metody se připisuje kombinaci nejnovějších výzkumů v neurovědě a latentních difuzních modelů.
Potenciální aplikace a budoucí výzvy
Tato technologie má spoustu potenciálních využití, například:
- Čtení snů, myšlenek a vzpomínek
- Pochopení toho, jak zvířata vnímají svět na základě aktivity jejich mozku
- Vytváření umělých systémů, které dokážou chápat svět jako lidi
Jednou z hlavních výzev pro zlepšení přesnosti tohohle algoritmu je trénování Stable Diffusion na větším množství snímků mozku. S tím, jak se technologie bude vyvíjet, to pravděpodobně povede k velké revoluci v rozhraních člověk-stroj.
Rozhraní mozek-počítač: Další hardwarové rozhraní
Už teď existuje několik startupů, které vyvíjejí zařízení, která dokážou číst myšlenky a překládat je do textových zpráv, nebo dokonce ovládat virtuální prostředí silou myšlenek. Firmy jako Next Mind a Microsoft aktivně pracují na neinvazivních rozhraních mozek-počítač (BCI) a věří, že ovládání zařízení myšlenkami bude dalším velkým hardwarovým rozhraním.
Tenhle posun v interakci člověka se strojem bude mít velký dopad na to, jak komunikujeme, pracujeme a tvoříme umění. Neinvazivní BCI nabízejí bezpečnější a praktičtější alternativu k invazivním BCI, které vyžadují vyvrtání díry do lebky, aby bylo možné číst myšlenky s větší přesností.
Video od Anastasi In Tech
Studie:
https://www.biorxiv.org/content/10.1101/2022.11.18.517004v3.full.pdf
Závěr
S tím, jak se neurověda a AI dál vyvíjejí, schopnost číst myšlenky už nevypadá jako sci-fi. S neinvazivními BCI na obzoru jsme na prahu revoluce v rozhraních člověk-stroj, která změní to, jak interagujeme se zařízeními i s okolním světem.