Idag ska vi diskutera en banbrytande artikel som utforskar hur forskare använde Stable Diffusion, en typ av generativ AI, för att rekonstruera bilder baserat på mänsklig hjärnaktivitet. Den här forskningen har inte bara betydande implikationer för neurovetenskapen, utan öppnar också dörren för en mängd olika tillämpningar, från att läsa drömmar till att förstå hur djur uppfattar.

Stable Diffusion och avkodning av hjärnaktivitet
Stable Diffusion är en öppen källkodsgenerativ AI som kan skapa fantastiska bilder baserat på textprompter. I artikeln tränade forskarna Stable Diffusion på tusentals hjärnskanningar genom att utsätta mänskliga deltagare för olika bilder medan de registrerade deras hjärnaktivitet med hjälp av en enhet som kallas Memorize Cam. Genom att träna modellen på förhållandet mellan hjärnaktivitetsmönster och motsvarande bilder kunde AI:n rekonstruera bilder baserat på deltagarnas hjärnaktivitet.
Även om algoritmen inte alltid var perfekt, producerade den ofta korrekta rekonstruktioner av originalbilderna, där position och skala ofta stämde exakt. Den enda anmärkningsvärda skillnaden var vanligtvis färgen på vissa element. Framgången med denna metod tillskrivs kombinationen av nyare forskning inom neurovetenskap och latenta diffusionsmodeller.
Potentiella tillämpningar och framtida utmaningar
Det finns många potentiella tillämpningar för denna teknik, inklusive:
- Att läsa drömmar, tankar och minnen
- Att förstå hur djur uppfattar världen baserat på deras hjärnaktivitet
- Att skapa artificiella system som kan förstå världen som människor
En av de viktigaste utmaningarna för att förbättra algoritmens noggrannhet är att träna Stable Diffusion på en större datamängd av hjärnskanningar. I takt med att tekniken utvecklas kommer den sannolikt att leda till en stor revolution inom gränssnitt mellan människa och maskin.
Gränssnitt mellan hjärna och dator: Nästa hårdvarugränssnitt
Flera startups utvecklar redan enheter som kan läsa tankar och översätta dem till textmeddelanden, eller till och med styra virtuella miljöer med tankens kraft. Företag som Next Mind och Microsoft arbetar aktivt med icke-invasiva gränssnitt mellan hjärna och dator (BCI) och tror att styrning av enheter med tankar kommer att vara nästa stora hårdvarugränssnitt.
Denna förändring i interaktionen mellan människa och maskin kommer att ha betydande implikationer för hur vi kommunicerar, arbetar och skapar konst. Icke-invasiva BCI erbjuder ett säkrare och mer praktiskt alternativ till invasiva BCI, som kräver att man borrar ett hål i skallen för att läsa tankar med större precision.
Video av Anastasi In Tech
Forskningsartikel:
https://www.biorxiv.org/content/10.1101/2022.11.18.517004v3.full.pdf
Slutsats
I takt med att neurovetenskapen och AI fortsätter att utvecklas verkar förmågan att läsa våra tankar inte längre vara utom räckhåll. Med icke-invasiva BCI i horisonten står vi på gränsen till en revolution inom gränssnitt mellan människa och maskin, vilket förändrar hur vi interagerar med våra enheter och världen omkring oss.