AI umí číst myšlenky: Stable Diffusion a budoucnost rozhraní mozek-počítač

V rubrikách AI/ML Štítky , , ,
Presented images (red box, top row) and images reconstructed from fMRI signals (gray box, bottom row) for one subject.
Save and Share:

Dneska se budeme bavit o průlomové studii, která popisuje, jak vědci použili Stable Diffusion, což je typ generativní AI, k rekonstrukci obrázků na základě aktivity lidského mozku. Tenhle výzkum má obrovský dopad nejen na neurovědu, ale taky otevírá dveře široké škále aplikací, od čtení snů po pochopení vnímání zvířat.

Zobrazované obrázky (červený rámeček, horní řada) a obrázky rekonstruované z fMRI signálů (šedý rámeček, dolní řada) pro jednoho subjektu.
Zobrazované obrázky (červený rámeček, horní řada) a obrázky rekonstruované z fMRI signálů (šedý rámeček, dolní řada) pro jednoho subjektu.

Stable Diffusion a dekódování aktivity mozku

Stable Diffusion je open-source generativní AI, která dokáže vytvářet úžasné obrázky na základě textových zadání. V téhle studii vědci trénovali Stable Diffusion na tisících snímků mozku. Účastníci výzkumu se dívali na různé obrázky a zároveň jim monitorovali aktivitu mozku pomocí zařízení zvaného Memorize Cam. Tím, že model trénovali na vztahu mezi vzorci aktivity mozku a odpovídajícími obrázky, AI dokázala rekonstruovat obrázky na základě aktivity mozku účastníků.

I když to nebylo vždycky perfektní, ten algoritmus často produkoval dost přesné rekonstrukce originálních obrázků, přičemž pozice a měřítko se často shodovaly naprosto přesně. Jediný výraznější rozdíl byla obvykle barva některých prvků. Úspěch téhle metody se připisuje kombinaci nejnovějších výzkumů v neurovědě a latentních difuzních modelů.

Potenciální aplikace a budoucí výzvy

Tato technologie má spoustu potenciálních využití, například:

  • Čtení snů, myšlenek a vzpomínek
  • Pochopení toho, jak zvířata vnímají svět na základě aktivity jejich mozku
  • Vytváření umělých systémů, které dokážou chápat svět jako lidi

Jednou z hlavních výzev pro zlepšení přesnosti tohohle algoritmu je trénování Stable Diffusion na větším množství snímků mozku. S tím, jak se technologie bude vyvíjet, to pravděpodobně povede k velké revoluci v rozhraních člověk-stroj.

Rozhraní mozek-počítač: Další hardwarové rozhraní

Už teď existuje několik startupů, které vyvíjejí zařízení, která dokážou číst myšlenky a překládat je do textových zpráv, nebo dokonce ovládat virtuální prostředí silou myšlenek. Firmy jako Next Mind a Microsoft aktivně pracují na neinvazivních rozhraních mozek-počítač (BCI) a věří, že ovládání zařízení myšlenkami bude dalším velkým hardwarovým rozhraním.

Tenhle posun v interakci člověka se strojem bude mít velký dopad na to, jak komunikujeme, pracujeme a tvoříme umění. Neinvazivní BCI nabízejí bezpečnější a praktičtější alternativu k invazivním BCI, které vyžadují vyvrtání díry do lebky, aby bylo možné číst myšlenky s větší přesností.

Video od Anastasi In Tech

Studie:

https://www.biorxiv.org/content/10.1101/2022.11.18.517004v3.full.pdf

Závěr

S tím, jak se neurověda a AI dál vyvíjejí, schopnost číst myšlenky už nevypadá jako sci-fi. S neinvazivními BCI na obzoru jsme na prahu revoluce v rozhraních člověk-stroj, která změní to, jak interagujeme se zařízeními i s okolním světem.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *