A Microsoft nemrégiben két úttörő jelentőségű bejelentést tett, amelyek mérföldkövet jelentenek a kvantum számítástechnika és a mesterséges intelligencia terén. Ezek a fejlesztések, melyeket külön-külön Nature publikációkban részleteztek, az iparágak átalakítását, a tudományos felfedezések felgyorsítását, valamint…
Kategória: AI/ML
Alphabet 2024. évi negyedik negyedéves eredménybeszámolója – összefoglaló és főbb pontok: A Google mesterséges intelligenciája (MI) erőteljes növekedést generál, a jövőbeli befektetések prioritást élveznek
Alphabet 2024. évi negyedik negyedéves eredménybeszámolója: A Google Gemini MI-je erőteljes növekedést generál, a jövőbeli befektetések prioritást élveznek Az Alphabet, a Google anyavállalata nemrég (2025. február 4-én) tette közzé a 2024-es negyedik negyedévre vonatkozó robusztus…
Mamba architektúra LLM/AI modellekhez
Mi az a Mamba? A Mamba egy ígéretes LLM architektúra, amely alternatívát kínál a Transformer architektúrával szemben. Erősségei a memóriahatékonyság, a skálázhatóság és a nagyon hosszú szekvenciák kezelésének képessége. A Mamba az állapottér-modelleken (SSM) és…
Legújabb fejlesztések a MI-architektúrák terén: Transformerek, Mamba, I-JEPA
A mesterséges intelligencia rohamosan fejlődő világában az egyre erőteljesebb és sokoldalúbb architektúrák iránti igény hajtotta a legizgalmasabb áttöréseket az elmúlt években. A forradalmi Transformer modellektől kezdve, amelyek átalakították a természetes nyelvfeldolgozást, az innovatív Joint-Embedding Predictive…
Stable Diffusion 3: Ugrás az AI képalkotásban
A Stability AI kiadta legújabb szövegből képet generáló AI modelljét, a Stable Diffusion 3-at, ami jelentős előrelépést jelent a generatív AI gyorsan fejlődő területén. Ez az új modell lenyűgöző fejlesztésekkel büszkélkedhet a képminőség, a szövegrenderelés…
A 3D szcéna renderelésének evolúciója: A NeRF-től, ADOP-on és Gaussian Splattingon át a TRIPS-ig
A 3D grafika világa figyelemre méltó fejlődésen ment keresztül, különösen a komplex jelenetek renderelésére használt technikák terén. Ez a cikk három kulcsfontosságú technológia rejtelmeibe mélyed el, amelyek formálták ezt a területet: a NeRF (Neural Radiance…
Mik azok a Safetensors fájlok, és miért jobbak, mint a .ckpt (pickletensor) fájlok?
A Safetensors egy figyelemre méltó modellformátum, amelyet a tenzorok biztonságos tárolására terveztek, és amely lenyűgöző sebességet és teljesítményt nyújt a területen található számos alternatívához képest. A Safetensors nemcsak hihetetlenül gyors, hanem egyszerűséggel és biztonsággal is…
Kép-szöveg AI modellek: CLIP, BLIP, WD 1.4 (azaz WD14), SigLIP 2 és a ChatGPT Visionnel
Az automatizált címkézés, feliratozás vagy képleírás kritikus feladat számos alkalmazásban, különösen a gépi tanuláshoz szükséges adathalmazok előkészítése során. Ebben nyújtanak segítséget a kép-szöveg modellek. A vezető kép-szöveg modellek közé tartozik a CLIP, a BLIP, a…
Agy olvassuk az AI-jal: Stable Diffusion és az agy-számítógép interfészek jövője
Ma egy úttörő tanulmányról fogunk beszélgetni, amely azt vizsgálja, hogyan használták a kutatók a Stable Diffusiont, egy generatív AI típust, képek rekonstruálására az emberi agyi aktivitás alapján. Ez a kutatás nemcsak a neurológia számára bír…
Valódi MI NPC-k számára: A generatív ágensek a játékok és az emberszerű MI társadalmak jövője
Képzelj el egy világot, ahol számítógépes szoftverügynökök hihető emberi viselkedést szimulálnak, egy világot, ahol MI művészek festenek és írók írnak, ahol ezek az MI ágensek véleményt formálnak és beszélgetéseket kezdeményeznek, és ahol az emlékek magasabb…