معماری مامبا برای مدل‌های LLM/AI

مامبا چیست؟ مامبا یک معماری LLM امیدوارکننده است که جایگزینی برای معماری ترنسفورمر ارائه می‌دهد. نقاط قوت آن در بهره‌وری حافظه، مقیاس‌پذیری و توانایی مدیریت توالی‌های بسیار طولانی نهفته است. مامبا بر اساس مدل‌های فضای…

منتشر شده در
دسته‌بندی شده در AI/MLبرچسب خورده با ،

آخرین پیشرفت‌ها در معماری‌های هوش مصنوعی: ترنسفورمرها، مامبا، I-JEPA

در دنیای به سرعت در حال تحول هوش مصنوعی، تلاش برای دستیابی به معماری‌های قدرتمندتر و همه‌کاره‌تر، نیروی محرکه‌ای بوده است در پشت برخی از هیجان‌انگیزترین پیشرفت‌ها در سال‌های اخیر. از مدل‌های ترنسفورمر پیشگامانه که…

منتشر شده در
دسته‌بندی شده در AI/MLبرچسب خورده با ،

استیبل دیفیوژن 3: جهشی بزرگ در تولید تصویر با هوش مصنوعی

استیبل اِی‌آی (Stability AI) جدیدترین مدل هوش مصنوعی خود را برای تولید تصویر از متن، با نام استیبل دیفیوژن 3، منتشر کرده است که نشان‌دهنده‌ی پیشرفتی چشمگیر در عرصه‌ی به سرعت در حال تکامل هوش…

تکامل رندرینگ صحنه‌های سه‌بعدی: از NeRF، ADOP و Gaussian Splatting تا TRIPS

دنیای گرافیک سه‌بعدی شاهد تحولی چشمگیر بوده است، به ویژه در تکنیک‌های مورد استفاده برای رندر کردن صحنه‌های پیچیده. این مقاله به بررسی جزئیات سه فناوری کلیدی می‌پردازد که این چشم‌انداز را شکل داده‌اند: NeRF…

مدل زبانی اورکا: پادشاه جدید اقیانوس مدل‌های زبانی متن‌باز

بخش تحقیقات مایکروسافت مقاله بسیار امیدوارکننده‌ای درباره تلاش‌ها و موفقیت‌هایشان در یادگیری تدریجی از ردپاهای توضیحی پیچیده GPT-4 منتشر کرده است. و هیجان‌انگیزترین بخش این است که به‌زودی آن را منتشر می‌کنند و در حال…

Safetensors چیست و چرا از .ckpt (pickletensor) بهتر است؟

Safetensors یک فرمت مدل‌سازی فوق‌العاده است که برای ذخیره‌سازی امن تنسورها طراحی شده و در مقایسه با بسیاری از گزینه‌های موجود در این زمینه، از سرعت و عملکرد چشمگیری برخوردار است. Safetensors نه‌تنها فوق‌العاده سریع…

مدل‌های هوش مصنوعی تبدیل عکس به متن: CLIP، BLIP، WD 1.4 (معروف به WD14)، SigLIP 2 و ChatGPT با قابلیت بینایی

تگ‌گذاری، برچسب‌زنی یا توصیف خودکار تصاویر، وظیفه‌ای حیاتی در بسیاری از کاربردها، به‌ویژه در آماده‌سازی مجموعه‌داده‌ها برای یادگیری ماشین است. اینجاست که مدل‌های تبدیل عکس به متن به کمک می‌آیند. از جمله مدل‌های پیشرو در…

هوش مصنوعی می‌تواند ذهن شما را بخواند: استیبل دیفیوژن و آینده‌ی رابط‌های مغز-کامپیوتر

Presented images (red box, top row) and images reconstructed from fMRI signals (gray box, bottom row) for one subject.

امروز، قصد داریم در مورد یک مقاله‌ی پیشگامانه صحبت کنیم که بررسی می‌کند چگونه محققان از استیبل دیفیوژن (Stable Diffusion)، نوعی هوش مصنوعی مولد، برای بازسازی تصاویر بر اساس فعالیت مغز انسان استفاده کردند. این…

هوش مصنوعی واقعی برای NPCها: عامل‌های مولد به عنوان آینده‌ی بازی‌ها و جوامع هوش مصنوعی شبیه انسان

دنیایی را تصور کنید که در آن عامل‌های نرم‌افزاری محاسباتی، رفتار باورپذیر انسانی را شبیه‌سازی می‌کنند؛ دنیایی که در آن هنرمندان هوش مصنوعی نقاشی می‌کنند و نویسندگان می‌نویسند، جایی که این عامل‌های هوش مصنوعی عقیده…

مدل‌های GPT-4 که از اشتباهات خود درس می‌گیرند: پیشرفتی بزرگ در استدلال هوش مصنوعی

دنیای هوش مصنوعی به‌طور مداوم در حال تحول است و به‌تازگی، یک پیشرفت در تحقیقات هوش مصنوعی، سطح این فناوری را ارتقا داده است. در یک مقاله جدید، «بازتاب» معرفی شده است؛ یک عامل خودمختار…