NVIDIA HGX B200 vs HGX H200

Kategoriseret som GPU, NVIDIA
Save and Share:

Den nye HGX B200 giver et markant løft i ydeevnen for AI-workloads sammenlignet med HGX H200, især inden for områder som FP8, INT8, FP16/BF16 og TF32 Tensor Core-operationer, hvor den kan prale af en forbedring på 125%.

Men når vi ser på FP32 og FP64, er springet mindre, omkring 18,5%.

Overraskende nok falder FP64 Tensor Core-ydeevnen faktisk, med et fald på ca. 40%.

B200’eren brillerer til gengæld på hukommelsesfronten med en større samlet hukommelseskapacitet (1,5 TB vs. 1,1 TB) og en fordoblet NVSwitch GPU-til-GPU-båndbredde. Denne hurtigere kommunikation er en gamechanger for træning af store AI-modeller.

Men når man tager den estimerede pris med i betragtningen, bliver det interessant.

B200’erens pris er ca. 21,5% højere, så selvom du får et stort løft i AI-ydeevne, er forbedringen i compute-per-dollar mindre dramatisk, på omkring 85% for de fleste AI-operationer (stadig enormt).

For workloads, der i høj grad er afhængige af FP32 og FP64, kan du endda få lidt mindre valuta for pengene med B200’eren.

FeatureUnitHGX H200 (8x H200 SXM)HGX B200 (8x B200 SXM)Performance DifferenceCompute per Dollar Difference
INT8 Tensor CorePOPS3272125.00%85.11%
FP4 Tensor CorePFLOPS144
FP6 Tensor CorePFLOPS72
FP8 Tensor CorePFLOPS3272125.00%85.11%
FP16/BF16 Tensor CorePFLOPS1636125.00%85.11%
TF32 Tensor CorePFLOPS818125.00%85.11%
FP32TFLOPS54064018.52%-2.50%
FP64TFLOPS27032018.52%-2.50%
FP64 Tensor CoreTFLOPS540320-40.74%-51.25%
MemoryTB1.11.536.36%12.18%
NVSwitch GPU-to-GPU BandwidthGB/s9001800100.00%64.52%
Total Aggregate BandwidthTB/s7.214.4100.00%64.52%
Estimated PriceUSD29000035250021.55%
HGX B200 vs HGX H200 detailed comparison table

Skriv kommentar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *