Архитектура Mamba для LLM/ИИ моделей

Что такое Mamba? Mamba — это многообещающая архитектура LLM, предлагающая альтернативу архитектуре Transformer. Её сильные стороны — эффективность памяти, масштабируемость и способность работать с очень длинными последовательностями. Mamba основана на моделях пространства состояний (State Space…

Опубликовано
В рубрике AI/MLОтмечено ,

Новейшие достижения в архитектурах ИИ: трансформеры, Mamba, I-JEPA

В стремительно развивающемся мире искусственного интеллекта стремление к созданию более мощных и универсальных архитектур является движущей силой самых значительных прорывов последних лет. От революционных моделей-трансформеров, преобразивших обработку естественного языка, до инновационных Joint-Embedding Predictive Architectures (JEPAs),…

Опубликовано
В рубрике AI/MLОтмечено ,

Stable Diffusion 3: Прорыв в области создания изображений с помощью ИИ

Компания Stability AI выпустила свою новейшую модель искусственного интеллекта для преобразования текста в изображение – Stable Diffusion 3, что ознаменовало значительный прогресс в быстро развивающейся области генеративного ИИ. Новая модель может похвастаться впечатляющими улучшениями в…

Эволюция рендеринга 3D-сцен: от NeRF, ADOP и Gaussian Splatting до TRIPS

Область 3D-графики пережила значительную эволюцию, особенно в техниках, используемых для рендеринга сложных сцен. Эта статья углубляется в детали трех ключевых технологий, которые сформировали современный ландшафт: NeRF (нейронные поля излучения), ADOP (приблизительный дифференцируемый рендеринг однопиксельных точек),…

Лучшие инструменты ChatGPT для многократного повышения вашей продуктивности

Эти потрясающие инструменты ChatGPT увеличат вашу продуктивность во много раз! Исправитель грамматики в ChatGPT Исправитель грамматики работает очень просто: вы отправляете любой текст, и он возвращает вам тот же текст, но с исправленной грамматикой. Это…

Опубликовано
В рубрике AI/MLОтмечено , ,

Cerebras Systems заключила сделку на создание крупнейшего в мире суперкомпьютера для ИИ

Санта-Клара, Калифорния — 20 июля 2023 г. — Компания Cerebras Systems, ведущий поставщик решений для искусственного интеллекта (ИИ) на основе технологии производства чипов, занимающих всю кремниевую пластину, объявила о крупной сделке с G42, технологическим конгломератом…

Orca LLM: Новый король в океане LLM с открытым исходным кодом

Microsoft Research опубликовали очень многообещающую статью о своих усилиях и успехах в прогрессивном обучении на основе сложных объяснений, полученных от GPT-4. И самое интересное, что они собираются выпустить модель в скором времени и в настоящее…

Что такое Safetensors и почему они лучше, чем .ckpt (pickletensor)

Safetensors – это замечательный формат моделей, разработанный для безопасного хранения тензоров, отличающийся впечатляющей скоростью и производительностью по сравнению со многими альтернативами в этой области. Safetensors не только невероятно быстр, но и разработан с акцентом на…

Опубликовано
В рубрике AI/MLОтмечено ,

Модели ИИ для преобразования изображений в текст: CLIP, BLIP, WD 1.4 (также известная как WD14), SigLIP 2 и ChatGPT с Vision

Автоматическая расстановка тегов, маркировка или описание изображений — важнейшая задача во многих приложениях, особенно при подготовке наборов данных для машинного обучения. Именно здесь на помощь приходят модели преобразования изображений в текст. Среди ведущих моделей в…

Увеличение изображений в Automatic1111: Tiled VAE и Multidiffusion Upscaler

Создание высококачественных изображений в Automatic1111 стало еще проще благодаря Tiled Variational Autoencoder (VAE) и Multidiffusion Upscaler. Эти мощные инструменты позволяют пользователям генерировать впечатляющие 4K+ изображения без видимых швов или сложных шагов. Обзор Tiled VAE Tiled…