Что такое Mamba? Mamba — это многообещающая архитектура LLM, предлагающая альтернативу архитектуре Transformer. Её сильные стороны — эффективность памяти, масштабируемость и способность работать с очень длинными последовательностями. Mamba основана на моделях пространства состояний (State Space…
Метка: ML
Новейшие достижения в архитектурах ИИ: трансформеры, Mamba, I-JEPA
В стремительно развивающемся мире искусственного интеллекта стремление к созданию более мощных и универсальных архитектур является движущей силой самых значительных прорывов последних лет. От революционных моделей-трансформеров, преобразивших обработку естественного языка, до инновационных Joint-Embedding Predictive Architectures (JEPAs),…
Stable Diffusion 3: Прорыв в области создания изображений с помощью ИИ
Компания Stability AI выпустила свою новейшую модель искусственного интеллекта для преобразования текста в изображение – Stable Diffusion 3, что ознаменовало значительный прогресс в быстро развивающейся области генеративного ИИ. Новая модель может похвастаться впечатляющими улучшениями в…
Эволюция рендеринга 3D-сцен: от NeRF, ADOP и Gaussian Splatting до TRIPS
Область 3D-графики пережила значительную эволюцию, особенно в техниках, используемых для рендеринга сложных сцен. Эта статья углубляется в детали трех ключевых технологий, которые сформировали современный ландшафт: NeRF (нейронные поля излучения), ADOP (приблизительный дифференцируемый рендеринг однопиксельных точек),…
Лучшие инструменты ChatGPT для многократного повышения вашей продуктивности
Эти потрясающие инструменты ChatGPT увеличат вашу продуктивность во много раз! Исправитель грамматики в ChatGPT Исправитель грамматики работает очень просто: вы отправляете любой текст, и он возвращает вам тот же текст, но с исправленной грамматикой. Это…
Cerebras Systems заключила сделку на создание крупнейшего в мире суперкомпьютера для ИИ
Санта-Клара, Калифорния — 20 июля 2023 г. — Компания Cerebras Systems, ведущий поставщик решений для искусственного интеллекта (ИИ) на основе технологии производства чипов, занимающих всю кремниевую пластину, объявила о крупной сделке с G42, технологическим конгломератом…
Orca LLM: Новый король в океане LLM с открытым исходным кодом
Microsoft Research опубликовали очень многообещающую статью о своих усилиях и успехах в прогрессивном обучении на основе сложных объяснений, полученных от GPT-4. И самое интересное, что они собираются выпустить модель в скором времени и в настоящее…
Что такое Safetensors и почему они лучше, чем .ckpt (pickletensor)
Safetensors – это замечательный формат моделей, разработанный для безопасного хранения тензоров, отличающийся впечатляющей скоростью и производительностью по сравнению со многими альтернативами в этой области. Safetensors не только невероятно быстр, но и разработан с акцентом на…
Модели ИИ для преобразования изображений в текст: CLIP, BLIP, WD 1.4 (также известная как WD14), SigLIP 2 и ChatGPT с Vision
Автоматическая расстановка тегов, маркировка или описание изображений — важнейшая задача во многих приложениях, особенно при подготовке наборов данных для машинного обучения. Именно здесь на помощь приходят модели преобразования изображений в текст. Среди ведущих моделей в…
Увеличение изображений в Automatic1111: Tiled VAE и Multidiffusion Upscaler
Создание высококачественных изображений в Automatic1111 стало еще проще благодаря Tiled Variational Autoencoder (VAE) и Multidiffusion Upscaler. Эти мощные инструменты позволяют пользователям генерировать впечатляющие 4K+ изображения без видимых швов или сложных шагов. Обзор Tiled VAE Tiled…