مقایسه NVIDIA HGX B200 و HGX H200

دسته‌بندی شده در GPU،NVIDIA
Save and Share:

HGX B200 جدیدتر، در مقایسه با HGX H200، به‌ویژه در زمینه‌هایی مانند عملیات FP8، INT8، FP16/BF16 و TF32 Tensor Core، با بهبود ۱۲۵ درصدی، عملکرد بسیار بهتری را در حجم‌های کاری هوش مصنوعی ارائه می‌دهد.

با این حال، وقتی به FP32 و FP64 نگاه می‌کنیم، این جهش کوچک‌تر و در حدود ۱۸.۵٪ است.

نکته‌ی شگفت‌انگیز این است که عملکرد FP64 Tensor Core در واقع کاهش می‌یابد و حدود ۴۰٪ افت می‌کند.

B200 در بخش حافظه خوش می‌درخشد و ظرفیت حافظه‌ی کل بزرگ‌تری (۱.۵ ترابایت در مقابل ۱.۱ ترابایت) و دو برابر پهنای باند NVSwitch GPU-to-GPU را ارائه می‌دهد. این ارتباط سریع‌تر، یک مزیت بزرگ برای آموزش مدل‌های هوش مصنوعی در مقیاس بزرگ است.

با این حال، وقتی قیمت تخمینی را وارد معادله می‌کنید، اوضاع جالب می‌شود.

برچسب قیمت B200 حدود ۲۱.۵٪ بالاتر است، بنابراین در حالی که یک افزایش بزرگ در عملکرد هوش مصنوعی دریافت می‌کنید، بهبودِ محاسبه به ازای هر دلار کمتر چشمگیر است و حدود ۸۵٪ برای اکثر عملیات هوش مصنوعی است (که هنوز هم بسیار زیاد است).

برای حجم‌های کاری که به شدت به FP32 و FP64 متکی هستند، ممکن است حتی با B200 کمی کمتر از پول خود بهره ببرید.

ویژگیواحدHGX H200 (8x H200 SXM)HGX B200 (8x B200 SXM)تفاوت عملکردتفاوت محاسبه به ازای هر دلار
INT8 Tensor CorePOPS۳۲۷۲۱۲۵.۰۰%۸۵.۱۱%
FP4 Tensor CorePFLOPS۱۴۴
FP6 Tensor CorePFLOPS۷۲
FP8 Tensor CorePFLOPS۳۲۷۲۱۲۵.۰۰%۸۵.۱۱%
FP16/BF16 Tensor CorePFLOPS۱۶۳۶۱۲۵.۰۰%۸۵.۱۱%
TF32 Tensor CorePFLOPS۸۱۸۱۲۵.۰۰%۸۵.۱۱%
FP32TFLOPS۵۴۰۶۴۰۱۸.۵۲%-۲.۵۰%
FP64TFLOPS۲۷۰۳۲۰۱۸.۵۲%-۲.۵۰%
FP64 Tensor CoreTFLOPS۵۴۰۳۲۰-۴۰.۷۴%-۵۱.۲۵%
حافظهTB۱.۱۱.۵۳۶.۳۶%۱۲.۱۸%
پهنای باند NVSwitch GPU-to-GPUGB/s۹۰۰۱۸۰۰۱۰۰.۰۰%۶۴.۵۲%
پهنای باند تجمیعی کلTB/s۷.۲۱۴.۴۱۰۰.۰۰%۶۴.۵۲%
قیمت تخمینیUSD۲۹۰۰۰۰۳۵۲۵۰۰۲۱.۵۵%
جدول مقایسه‌ی دقیق HGX B200 در مقابل HGX H200
دسته‌بندی شده در GPU،NVIDIA

دیدگاهی بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *