ホーム GPU比較 NVIDIA H100 PCIe 96 GB vs NVIDIA GeForce RTX 4090

NVIDIA H100 PCIe 96 GB vs NVIDIA GeForce RTX 4090

AI GPU 私たちは向けの96GBのメモリを搭載した H100 PCIe 96 GB と デスクトッププラットフォーム向けの24GBのメモリを搭載した GeForce RTX 4090 を比較しました。両方のグラフィックスカードの主な仕様、ベンチマークテスト、消費電力などの情報を確認できます。

主要な違い

NVIDIA H100 PCIe 96 GB の利点
リリースが6ヶ月遅れました
より大きな VRAM (96GB vs 24GB)
より大きなメモリ帯域幅 (1681GB/s vs 1008GB/s)
追加されたレンダリングコア数は 512個です
NVIDIA GeForce RTX 4090 の利点
最大ブーストクロックは 37% 向上しました (2520MHz と 1837MHz)
より低いTDP電力 (450W と 700W)

スコア

ベンチマーク

FP32 (浮動小数点)
H100 PCIe 96 GB
62.08 TFLOPS
GeForce RTX 4090 +33%
82.58 TFLOPS
VS

グラフィックスカード

2023年3月
リリース日
2022年9月
Tesla Hopper
世代
GeForce 40
AI GPU
タイプ
デスクトップ
PCIe 5.0 x16
バスインターフェース
PCIe 4.0 x16

クロック速度

1665 MHz
ベースクロック
2235 MHz
1837 MHz
ブーストクロック
2520 MHz
1313 MHz
メモリクロック
1313 MHz

メモリ

96GB
メモリサイズ
24GB
HBM3
メモリタイプ
GDDR6X
5120bit
メモリバス
384bit
1681GB/s
帯域幅
1008GB/s

レンダリング設定

132
SM数
128
-
計算ユニット
-
16896
シェーディングユニット
16384
528
TMU
512
24
ROP
176
528
テンソルコア
512
-
RTコア
128
256 KB (per SM)
L1キャッシュ
128 KB (per SM)
50 MB
L2キャッシュ
72 MB

理論的な性能

44.09 GPixel/s
ピクセルレート
443.5 GPixel/s
969.9 GTexel/s
テクスチャレート
1290 GTexel/s
248.3 TFLOPS
FP16 (半精度)
82.58 TFLOPS
62.08 TFLOPS
FP32 (単精度)
82.58 TFLOPS
31.04 TFLOPS
FP64 (倍精度)
1290 GFLOPS

グラフィックスプロセッサ

GH100
GPU名
AD102
-
GPUバリアント
AD102-300-A1
Hopper
アーキテクチャ
Ada Lovelace
TSMC
ファウンドリ
TSMC
4 nm
プロセスサイズ
5 nm
800 億
トランジスタ
763 億
814 mm²
ダイサイズ
609 mm²

ボード設計

700W
TDP
450W
1100 W
推奨PSU
850 W
No outputs
出力
1x HDMI 2.1 3x DisplayPort 1.4a
8-pin EPS
電源コネクタ
1x 16-pin

グラフィックス機能

N/A
DirectX
12 Ultimate (12_2)
N/A
OpenGL
4.6
3.0
OpenCL
3.0
N/A
Vulkan
1.3
9.0
CUDA
8.9
N/A
シェーダモデル
6.7

関連GPU比較

© 2024 - TopCPU.net   お問い合わせ プライバシーポリシー