NVIDIA H100 PCIe 80 GB vs NVIDIA GeForce RTX 4090

VS

NVIDIA H100 PCIe 80 GB NVIDIA GeForce RTX 4090

AI GPU 私たちは向けの80GBのメモリを搭載した H100 PCIe 80 GB とデスクトッププラットフォーム向けの24GBのメモリを搭載した GeForce RTX 4090 を比較しました。両方のグラフィックスカードの主な仕様、ベンチマークテスト、消費電力などの情報を確認できます。

主要な違い

NVIDIA H100 PCIe 80 GB の利点

リリースが6ヶ月遅れました

より大きな VRAM (80GB vs 24GB)

より大きなメモリ帯域幅 (2039GB/s vs 1.01GB/s)

より低いTDP電力 (350W と 450W)

NVIDIA GeForce RTX 4090 の利点

最大ブーストクロックは 44% 向上しました (2520MHz と 1755MHz)

追加されたレンダリングコア数は 1792個です

スコア

ベンチマーク

FP32 (浮動小数点)

H100 PCIe 80 GB

51.22 TFLOPS

GeForce RTX 4090 +61%

82.58 TFLOPS

H100 PCIe 80 GB

VS

GeForce RTX 4090

グラフィックスカード

2023年3月

リリース日

2022年9月

Tesla Hopper

世代

GeForce 40

AI GPU

タイプ

デスクトップ

PCIe 5.0 x16

バスインターフェース

PCIe 4.0 x16

クロック速度

1095 MHz

ベースクロック

2235 MHz

1755 MHz

ブーストクロック

2520 MHz

1593 MHz

メモリクロック

1313 MHz

メモリ

80GB

メモリサイズ

24GB

HBM2e

メモリタイプ

GDDR6X

5120bit

メモリバス

384bit

2039GB/s

帯域幅

1.01TB/s

レンダリング設定

114

SM数

128

-

計算ユニット

-

14592

シェーディングユニット

16384

456

TMU

512

24

ROP

176

456

テンソルコア

512

-

RTコア

128

256 KB (per SM)

L1キャッシュ

128 KB (per SM)

50 MB

L2キャッシュ

72 MB

理論的な性能

42.12 GPixel/s

ピクセルレート

443.5 GPixel/s

800.3 GTexel/s

テクスチャレート

1290 GTexel/s

204.9 TFLOPS

FP16 (半精度)

82.58 TFLOPS

51.22 TFLOPS

FP32 (単精度)

82.58 TFLOPS

25.61 TFLOPS

FP64 (倍精度)

1290 GFLOPS

グラフィックスプロセッサ

GH100

GPU名

AD102

-

GPUバリアント

AD102-300-A1

Hopper

アーキテクチャ

Ada Lovelace

TSMC

ファウンドリ

TSMC

4 nm

プロセスサイズ

5 nm

800 億

トランジスタ

763 億

814 mm²

ダイサイズ

609 mm²

ボード設計

350W

TDP

450W

750 W

推奨PSU

850 W

No outputs

出力

1x HDMI 2.1 3x DisplayPort 1.4a

1x 16-pin

電源コネクタ

1x 16-pin

グラフィックス機能

N/A

DirectX

12 Ultimate (12_2)

N/A

OpenGL

4.6

3.0

OpenCL

3.0

N/A

Vulkan

1.3

9.0

CUDA

8.9

N/A

シェーダモデル

6.7

NVIDIA H100 PCIe 80 GB vs NVIDIA GeForce RTX 4090

主要な違い

スコア

ベンチマーク

グラフィックスカード

クロック速度

メモリ

レンダリング設定

理論的な性能

グラフィックスプロセッサ

ボード設計

グラフィックス機能

関連GPU比較