Mis on Mamba? Mamba on paljulubav LLM-arhitektuur, mis pakub alternatiivi Transformeri arhitektuurile. Selle peamised eelised on mälu tõhusus, skaleeritavus ja võime töödelda väga pikki järjestusi. Mamba põhineb olekuruumimudelitel (SSM) ja gated mitmekihilisel pertseptronil (MLP). Kuidas…
Silt: AI
Viimased edusammud tehisintellekti arhitektuurides: Transformerid, Mamba, I-JEPA
Tehisintellekti kiiresti arenevas maailmas on soov võimsamate ja mitmekülgsemate arhitektuuride järele olnud liikumapanevaks jõuks viimaste aastate kõige põnevamate läbimurrete taga. Alates murrangulistest Transformer mudelitest, mis on revolutsiooniliselt muutnud loomuliku keele töötlust, kuni uuenduslike ühis-embeddingsprognoosarhitektuurideni (JEPA),…
Stable Diffusion 3: Tehisintliku pildigeneratsiooni suur samm edasi
Stability AI on välja andnud oma uusima tekstist-pildiks tehisintellekti mudeli Stable Diffusion 3, mis tähistab märkimisväärset edasiminekut generatiivse tehisintellekti kiiresti arenevas valdkonnas. Uus mudel pakub muljetavaldavaid täiustusi pildikvaliteedis, teksti renderdamises ja keeruliste viipade mõistmises, olles…
3D-stseeni renderdamise evolutsioon: NeRF-ist, ADOP-ist ja Gaussian Splattingust TRIPS-ini
3D-graafika valdkonnas on toimunud märkimisväärne areng, eriti just keerukate stseenide renderdamise tehnikates. See artikkel süveneb kolme keskse tehnoloogia nüanssidesse, mis on seda maastikku kujundanud: NeRF (Neural Radiance Fields ehk närvivõrgupõhised kiirgusväljad), ADOP (Approximate Differentiable One-Pixel…
Safetensors, CKPT, ONNX, GGUF ja teised peamised tehisintellekti mudelite vormingud [2025]
Tehisintellekti ja masinõppe areng on tekitanud kriitilise vajaduse meetodite järele, mis võimaldaksid mudeleid tõhusalt, turvaliselt ja erinevate süsteemidega ühilduvalt talletada ning levitada. Kuna mudelid muutuvad keerukamaks ja neid kasutatakse üha mitmekesisemates oludes, on serialiseerimisvormingu valik…
Pildist tekstiks tehisintellekti mudelid: CLIP, BLIP, WD 1.4 (ehk WD14), SigLIP 2 ja ChatGPT Visioniga
Piltide automaatne märgendamine, sildistamine või kirjeldamine on paljudes rakendustes, eriti masinõppe andmekogumite ettevalmistamisel, ülioluline ülesanne. Siin tulevad appi pildist tekstiks mudelid. Peamiste pildist tekstiks mudelite hulka kuuluvad CLIP, BLIP, WD 1.4 (tuntud ka kui WD14…
Tehisintelligentsus suudab su mõtteid lugeda: Stable Diffusion ja aju-arvuti liideste tulevik
Täna räägime murrangulisest teadustööst, milles uurijad kasutasid generatiivse tehisintellekti tüüpi Stable Diffusion, et rekonstrueerida pilte, mis põhinevad inimese aju aktiivsusel. Sellel uurimusel on oluline mõju mitte ainult neuroteadusele, vaid see avab ka ukse paljudele rakendustele,…
Päris tehisintellekt NPC-dele: generatiivsed agendid kui mängutööstuse ja inimesesarnaste tehisintellektiühiskondade tulevik
Kujutage ette maailma, kus arvutitarkvara agendid simuleerivad usutavat inimkäitumist, kus tehisintellektist kunstnikud maalivad ja kirjanikud kirjutavad, kus need tehisintellektist agendid kujundavad arvamusi ja algatavad vestlusi ning kus mälestused sünteesitakse kõrgema taseme mõtisklusteks, et planeerida käitumist.…
GPT-4 mudelid, mis õpivad oma vigadest: läbimurre tehisintellekti arutlusvõimes
Tehisintellekti maailm areneb pidevalt ja hiljutine läbimurre tehisintellekti uuringutes on viinud asjad täiesti uuele tasemele. Uues teadusartiklis tutvustatakse “Refleksiooni” (Reflection), autonoomset agenti dünaamilise mälu ja eneserefleksiooni võimetega, mis võimaldab tehisintellekti mudelitel õppida oma vigadest ja…
Tehisintellekt suudab paroole murda: mida pead teadma
PassGAN suudab murda mis tahes 7-kohalise parooli vähem kui 6 minutiga, isegi kui see sisaldab sümboleid! Seepärast võimaldab ülitugev parooligeneraator luua väga pikki paroole, mis sisaldavad tähti ja sümboleid paljudest erinevatest tähestikest. Hämmastav? Või hirmutav?…