Agy olvassuk az AI-jal: Stable Diffusion és az agy-számítógép interfészek jövője

AI/ML kategóriába sorolva Címkézve , , ,
Presented images (red box, top row) and images reconstructed from fMRI signals (gray box, bottom row) for one subject.
Save and Share:

Ma egy úttörő tanulmányról fogunk beszélgetni, amely azt vizsgálja, hogyan használták a kutatók a Stable Diffusiont, egy generatív AI típust, képek rekonstruálására az emberi agyi aktivitás alapján. Ez a kutatás nemcsak a neurológia számára bír jelentős következményekkel, hanem megnyitja az ajtót a legkülönfélébb alkalmazások előtt, az álmok olvasásától az állati érzékelés megértéséig.

A bemutatott képek (piros keret, felső sor) és az fMRI jelekből rekonstruált képek (szürke keret, alsó sor) egy alany esetében.
A bemutatott képek (piros keret, felső sor) és az fMRI jelekből rekonstruált képek (szürke keret, alsó sor) egy alany esetében.

Stable Diffusion és az agyi aktivitás dekódolása

A Stable Diffusion egy nyílt forráskódú generatív AI, amely képes lenyűgöző képeket létrehozni szöveges promptok alapján. A tanulmányban a kutatók a Stable Diffusiont több ezer agyi szkennelésen képezték, miközben emberi résztvevőket különböző képeknek tettek ki, agyi aktivitásukat pedig egy Memorize Cam nevű eszközzel rögzítették. Azzal, hogy a modellt az agyi aktivitásminták és a hozzájuk tartozó képek közötti kapcsolatra képezték, az AI képes volt rekonstruálni a képeket a résztvevők agyi aktivitása alapján.

Bár nem mindig tökéletes, az algoritmus gyakran pontos rekonstrukciókat produkált az eredeti képekről, a pozíció és a méret gyakran pontosan egyezett. Az egyetlen figyelemre méltó különbség általában bizonyos elemek színe volt. Ennek a módszernek a sikere a neurológia és a látens diffúziós modellek terén elért legújabb kutatások kombinációjának köszönhető.

Lehetséges alkalmazások és jövőbeli kihívások

Számos potenciális alkalmazása van ennek a technológiának, beleértve:

  • Álmok, gondolatok és emlékek olvasása
  • Annak megértése, hogy az állatok hogyan érzékelik a világot agyi aktivitásuk alapján
  • Olyan mesterséges rendszerek létrehozása, amelyek az emberekhez hasonlóan képesek felfogni a világot

Az algoritmus pontosságának javításának egyik legfontosabb kihívása a Stable Diffusion betanítása egy nagyobb adathalmazon, agyi szkennelésekkel. A technológia fejlődésével valószínűleg jelentős forradalomhoz fog vezetni az ember-gép interfészek terén.

Agy-számítógép interfészek: A következő hardver interfész

Számos startup már fejleszt olyan eszközöket, amelyek képesek olvasni a gondolatokat és szöveges üzenetekké fordítani azokat, vagy akár virtuális környezeteket irányítani az elme erejével. Az olyan cégek, mint a Next Mind és a Microsoft, aktívan dolgoznak nem invazív agy-számítógép interfészeken (BCI), abban a hitben, hogy az eszközök gondolatokkal történő vezérlése lesz a következő jelentős hardver interfész.

Ez az ember-gép interakcióban bekövetkező eltolódás jelentős hatással lesz arra, ahogyan kommunikálunk, dolgozunk és alkotunk művészetet. A nem invazív BCI-k biztonságosabb és praktikusabb alternatívát kínálnak az invazív BCI-kkel szemben, amelyekhez lyukat kell fúrni a koponyába, hogy nagyobb pontossággal lehessen olvasni a gondolatokat.

Videó: Anastasi In Tech

Tanulmány:

https://www.biorxiv.org/content/10.1101/2022.11.18.517004v3.full.pdf

Összegzés

Ahogy a neurológia és az AI tovább fejlődik, az a képesség, hogy olvassunk a gondolatainkban, már nem tűnik elérhetetlennek. A nem invazív BCI-kkel a láthatáron az ember-gép interfészek forradalmának küszöbén állunk, amely átalakítja, hogyan lépünk kapcsolatba eszközeinkkel és a minket körülvevő világgal.

Hozzászólás

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük