معماری مامبا برای مدل‌های LLM/AI

مامبا چیست؟ مامبا یک معماری LLM امیدوارکننده است که جایگزینی برای معماری ترنسفورمر ارائه می‌دهد. نقاط قوت آن در بهره‌وری حافظه، مقیاس‌پذیری و توانایی مدیریت توالی‌های بسیار طولانی نهفته است. مامبا بر اساس مدل‌های فضای…

منتشر شده در
دسته‌بندی شده در AI/MLبرچسب خورده با ،

آخرین پیشرفت‌ها در معماری‌های هوش مصنوعی: ترنسفورمرها، مامبا، I-JEPA

در دنیای به سرعت در حال تحول هوش مصنوعی، تلاش برای دستیابی به معماری‌های قدرتمندتر و همه‌کاره‌تر، نیروی محرکه‌ای بوده است در پشت برخی از هیجان‌انگیزترین پیشرفت‌ها در سال‌های اخیر. از مدل‌های ترنسفورمر پیشگامانه که…

منتشر شده در
دسته‌بندی شده در AI/MLبرچسب خورده با ،

استیبل دیفیوژن 3: جهشی بزرگ در تولید تصویر با هوش مصنوعی

استیبل اِی‌آی (Stability AI) جدیدترین مدل هوش مصنوعی خود را برای تولید تصویر از متن، با نام استیبل دیفیوژن 3، منتشر کرده است که نشان‌دهنده‌ی پیشرفتی چشمگیر در عرصه‌ی به سرعت در حال تکامل هوش…

تکامل رندرینگ صحنه‌های سه‌بعدی: از NeRF، ADOP و Gaussian Splatting تا TRIPS

دنیای گرافیک سه‌بعدی شاهد تحولی چشمگیر بوده است، به ویژه در تکنیک‌های مورد استفاده برای رندر کردن صحنه‌های پیچیده. این مقاله به بررسی جزئیات سه فناوری کلیدی می‌پردازد که این چشم‌انداز را شکل داده‌اند: NeRF…

مدل زبانی اورکا: پادشاه جدید اقیانوس مدل‌های زبانی متن‌باز

بخش تحقیقات مایکروسافت مقاله بسیار امیدوارکننده‌ای درباره تلاش‌ها و موفقیت‌هایشان در یادگیری تدریجی از ردپاهای توضیحی پیچیده GPT-4 منتشر کرده است. و هیجان‌انگیزترین بخش این است که به‌زودی آن را منتشر می‌کنند و در حال…

قالب‌های کلیدی مدل‌های هوش مصنوعی: Safetensors، CKPT، ONNX، GGUF و دیگران [۲۰۲۵]

رشد هوش مصنوعی و یادگیری ماشین، نیاز مبرمی به روش‌هایی برای ذخیره‌سازی و توزیع مدل‌ها ایجاد کرده است که کارآمد، امن و سازگار با سیستم‌های مختلف باشند. با پیچیده‌تر شدن مدل‌ها و استفاده از آن‌ها…

مدل‌های هوش مصنوعی تبدیل عکس به متن: CLIP، BLIP، WD 1.4 (معروف به WD14)، SigLIP 2 و ChatGPT با قابلیت بینایی

تگ‌گذاری، برچسب‌زنی یا توصیف خودکار تصاویر، وظیفه‌ای حیاتی در بسیاری از کاربردها، به‌ویژه در آماده‌سازی مجموعه‌داده‌ها برای یادگیری ماشین است. اینجاست که مدل‌های تبدیل عکس به متن به کمک می‌آیند. از جمله مدل‌های پیشرو در…

هوش مصنوعی می‌تواند ذهن شما را بخواند: استیبل دیفیوژن و آینده‌ی رابط‌های مغز-کامپیوتر

Presented images (red box, top row) and images reconstructed from fMRI signals (gray box, bottom row) for one subject.

امروز، قصد داریم در مورد یک مقاله‌ی پیشگامانه صحبت کنیم که بررسی می‌کند چگونه محققان از استیبل دیفیوژن (Stable Diffusion)، نوعی هوش مصنوعی مولد، برای بازسازی تصاویر بر اساس فعالیت مغز انسان استفاده کردند. این…

هوش مصنوعی واقعی برای NPCها: عامل‌های مولد به عنوان آینده‌ی بازی‌ها و جوامع هوش مصنوعی شبیه انسان

دنیایی را تصور کنید که در آن عامل‌های نرم‌افزاری محاسباتی، رفتار باورپذیر انسانی را شبیه‌سازی می‌کنند؛ دنیایی که در آن هنرمندان هوش مصنوعی نقاشی می‌کنند و نویسندگان می‌نویسند، جایی که این عامل‌های هوش مصنوعی عقیده…

مدل‌های GPT-4 که از اشتباهات خود درس می‌گیرند: پیشرفتی بزرگ در استدلال هوش مصنوعی

دنیای هوش مصنوعی به‌طور مداوم در حال تحول است و به‌تازگی، یک پیشرفت در تحقیقات هوش مصنوعی، سطح این فناوری را ارتقا داده است. در یک مقاله جدید، «بازتاب» معرفی شده است؛ یک عامل خودمختار…