ホーム GPU比較 NVIDIA H100 PCIe 80 GB vs NVIDIA GeForce RTX 4090

NVIDIA H100 PCIe 80 GB vs NVIDIA GeForce RTX 4090

AI GPU 私たちは向けの80GBのメモリを搭載した H100 PCIe 80 GB と デスクトッププラットフォーム向けの24GBのメモリを搭載した GeForce RTX 4090 を比較しました。両方のグラフィックスカードの主な仕様、ベンチマークテスト、消費電力などの情報を確認できます。

主要な違い

NVIDIA H100 PCIe 80 GB の利点
リリースが6ヶ月遅れました
より大きな VRAM (80GB vs 24GB)
より大きなメモリ帯域幅 (2039GB/s vs 1.01GB/s)
より低いTDP電力 (350W と 450W)
NVIDIA GeForce RTX 4090 の利点
最大ブーストクロックは 44% 向上しました (2520MHz と 1755MHz)
追加されたレンダリングコア数は 1792個です

スコア

ベンチマーク

FP32 (浮動小数点)
H100 PCIe 80 GB
51.22 TFLOPS
GeForce RTX 4090 +61%
82.58 TFLOPS
VS

グラフィックスカード

2023年3月
リリース日
2022年9月
Tesla Hopper
世代
GeForce 40
AI GPU
タイプ
デスクトップ
PCIe 5.0 x16
バスインターフェース
PCIe 4.0 x16

クロック速度

1095 MHz
ベースクロック
2235 MHz
1755 MHz
ブーストクロック
2520 MHz
1593 MHz
メモリクロック
1313 MHz

メモリ

80GB
メモリサイズ
24GB
HBM2e
メモリタイプ
GDDR6X
5120bit
メモリバス
384bit
2039GB/s
帯域幅
1.01TB/s

レンダリング設定

114
SM数
128
-
計算ユニット
-
14592
シェーディングユニット
16384
456
TMU
512
24
ROP
176
456
テンソルコア
512
-
RTコア
128
256 KB (per SM)
L1キャッシュ
128 KB (per SM)
50 MB
L2キャッシュ
72 MB

理論的な性能

42.12 GPixel/s
ピクセルレート
443.5 GPixel/s
800.3 GTexel/s
テクスチャレート
1290 GTexel/s
204.9 TFLOPS
FP16 (半精度)
82.58 TFLOPS
51.22 TFLOPS
FP32 (単精度)
82.58 TFLOPS
25.61 TFLOPS
FP64 (倍精度)
1290 GFLOPS

グラフィックスプロセッサ

GH100
GPU名
AD102
-
GPUバリアント
AD102-300-A1
Hopper
アーキテクチャ
Ada Lovelace
TSMC
ファウンドリ
TSMC
4 nm
プロセスサイズ
5 nm
800 億
トランジスタ
763 億
814 mm²
ダイサイズ
609 mm²

ボード設計

350W
TDP
450W
750 W
推奨PSU
850 W
No outputs
出力
1x HDMI 2.1 3x DisplayPort 1.4a
1x 16-pin
電源コネクタ
1x 16-pin

グラフィックス機能

N/A
DirectX
12 Ultimate (12_2)
N/A
OpenGL
4.6
3.0
OpenCL
3.0
N/A
Vulkan
1.3
9.0
CUDA
8.9
N/A
シェーダモデル
6.7

関連GPU比較

© 2024 - TopCPU.net   お問い合わせ プライバシーポリシー