NVIDIA HGX B200 срещу HGX H200

Categorized as GPU, NVIDIA
Save and Share:

Новият HGX B200 предлага огромен скок в производителността за AI задачи в сравнение с HGX H200, особено в области като FP8, INT8, FP16/BF16 и TF32 Tensor Core операции, където се наблюдава 125% подобрение.

Въпреки това, когато разглеждаме FP32 и FP64, скокът е по-малък, около 18.5%.

Изненадващо, производителността на FP64 Tensor Core всъщност отбелязва спад, намалявайки с около 40%.

B200 се отличава в отдела за памет, предлагайки по-голям общ капацитет на паметта (1.5 TB срещу 1.1 TB) и удвоена NVSwitch честотна лента GPU-към-GPU. Тази по-бърза комуникация променя играта за мащабно обучение на AI модели.

Въпреки това, когато включите очакваната цена в картината, нещата стават интересни.

Цената на B200 е с около 21.5% по-висока, така че въпреки че получавате голям тласък в AI производителността, подобрението на изчислителната мощност на долар е по-малко драматично, около 85% за повечето AI операции (все пак огромно).

За работни натоварвания, които разчитат в голяма степен на FP32 и FP64, може дори да получавате малко по-малко за парите си с B200.

FeatureUnitHGX H200 (8x H200 SXM)HGX B200 (8x B200 SXM)Performance DifferenceCompute per Dollar Difference
INT8 Tensor CorePOPS3272125.00%85.11%
FP4 Tensor CorePFLOPS144
FP6 Tensor CorePFLOPS72
FP8 Tensor CorePFLOPS3272125.00%85.11%
FP16/BF16 Tensor CorePFLOPS1636125.00%85.11%
TF32 Tensor CorePFLOPS818125.00%85.11%
FP32TFLOPS54064018.52%-2.50%
FP64TFLOPS27032018.52%-2.50%
FP64 Tensor CoreTFLOPS540320-40.74%-51.25%
MemoryTB1.11.536.36%12.18%
NVSwitch GPU-to-GPU BandwidthGB/s9001800100.00%64.52%
Total Aggregate BandwidthTB/s7.214.4100.00%64.52%
Estimated PriceUSD29000035250021.55%
HGX B200 срещу HGX H200 подробна сравнителна таблица

Leave a comment

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *