NVIDIA HGX B200 vs HGX H200

Categorizado como GPU, NVIDIA
Save and Share:

O novo HGX B200 oferece um aumento massivo no desempenho para cargas de trabalho de IA em comparação com o HGX H200, particularmente em áreas como operações de FP8, INT8, FP16/BF16 e TF32 Tensor Core, onde ostenta uma melhora de 125%.

No entanto, quando analisamos FP32 e FP64, o salto é menor, em torno de 18,5%.

Surpreendentemente, o desempenho do FP64 Tensor Core, na verdade, sofre uma queda, com um declínio de cerca de 40%.

O B200 realmente brilha no quesito memória, oferecendo uma capacidade total de memória maior (1,5 TB contra 1,1 TB) e uma largura de banda NVSwitch GPU para GPU dobrada. Essa comunicação mais rápida é um divisor de águas para o treinamento de modelos de IA em larga escala.

No entanto, quando colocamos o preço estimado na equação, as coisas ficam interessantes.

O preço do B200 é cerca de 21,5% maior, então, embora você obtenha um grande aumento no desempenho de IA, a melhoria de poder de computação por dólar é menos dramática, em torno de 85% para a maioria das operações de IA (ainda enorme).

Para cargas de trabalho que dependem fortemente de FP32 e FP64, você pode até estar obtendo um retorno ligeiramente menor do seu investimento com o B200.

FeatureUnitHGX H200 (8x H200 SXM)HGX B200 (8x B200 SXM)Performance DifferenceCompute per Dollar Difference
INT8 Tensor CorePOPS3272125.00%85.11%
FP4 Tensor CorePFLOPS144
FP6 Tensor CorePFLOPS72
FP8 Tensor CorePFLOPS3272125.00%85.11%
FP16/BF16 Tensor CorePFLOPS1636125.00%85.11%
TF32 Tensor CorePFLOPS818125.00%85.11%
FP32TFLOPS54064018.52%-2.50%
FP64TFLOPS27032018.52%-2.50%
FP64 Tensor CoreTFLOPS540320-40.74%-51.25%
MemoryTB1.11.536.36%12.18%
NVSwitch GPU-to-GPU BandwidthGB/s9001800100.00%64.52%
Total Aggregate BandwidthTB/s7.214.4100.00%64.52%
Estimated PriceUSD29000035250021.55%
HGX B200 vs HGX H200 detailed comparison table

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *