ホーム GPU比較 NVIDIA GeForce RTX 4090 vs NVIDIA Tesla P100 SXM2

NVIDIA GeForce RTX 4090 vs NVIDIA Tesla P100 SXM2

私たちはデスクトッププラットフォーム向けの24GBのメモリを搭載した GeForce RTX 4090 と プロフェッショナル市場向けの16GBのメモリを搭載した Tesla P100 SXM2 を比較しました。両方のグラフィックスカードの主な仕様、ベンチマークテスト、消費電力などの情報を確認できます。

主要な違い

NVIDIA GeForce RTX 4090 の利点
リリースが6年 と 5 ヶ月 遅れました
最大ブーストクロックは 70% 向上しました (2520MHz と 1480MHz)
より大きな VRAM (24GB vs 16GB)
より大きなメモリ帯域幅 (1008GB/s vs 732.2GB/s)
追加されたレンダリングコア数は 12800個です
NVIDIA Tesla P100 SXM2 の利点
より低いTDP電力 (300W と 450W)

スコア

ベンチマーク

FP32 (浮動小数点)
GeForce RTX 4090 +678%
82.58 TFLOPS
Tesla P100 SXM2
10.61 TFLOPS
VS

グラフィックスカード

2022年9月
リリース日
2016年4月
GeForce 40
世代
Tesla
デスクトップ
タイプ
プロフェッショナル
PCIe 4.0 x16
バスインターフェース
PCIe 3.0 x16

クロック速度

2235 MHz
ベースクロック
1328 MHz
2520 MHz
ブーストクロック
1480 MHz
1313 MHz
メモリクロック
715 MHz

メモリ

24GB
メモリサイズ
16GB
GDDR6X
メモリタイプ
HBM2
384bit
メモリバス
4096bit
1008GB/s
帯域幅
732.2GB/s

レンダリング設定

128
SM数
56
-
計算ユニット
-
16384
シェーディングユニット
3584
512
TMU
224
176
ROP
96
512
テンソルコア
-
128
RTコア
-
128 KB (per SM)
L1キャッシュ
24 KB (per SM)
72 MB
L2キャッシュ
4 MB

理論的な性能

443.5 GPixel/s
ピクセルレート
142.1 GPixel/s
1290 GTexel/s
テクスチャレート
331.5 GTexel/s
82.58 TFLOPS
FP16 (半精度)
21.22 TFLOPS
82.58 TFLOPS
FP32 (単精度)
10.61 TFLOPS
1290 GFLOPS
FP64 (倍精度)
5.304 TFLOPS

グラフィックスプロセッサ

AD102
GPU名
GP100
AD102-300-A1
GPUバリアント
GP100-890-A1
Ada Lovelace
アーキテクチャ
Pascal
TSMC
ファウンドリ
TSMC
5 nm
プロセスサイズ
16 nm
763 億
トランジスタ
153 億
609 mm²
ダイサイズ
610 mm²

ボード設計

450W
TDP
300W
850 W
推奨PSU
700 W
1x HDMI 2.1 3x DisplayPort 1.4a
出力
No outputs
1x 16-pin
電源コネクタ
None

グラフィックス機能

12 Ultimate (12_2)
DirectX
12 (12_1)
4.6
OpenGL
4.6
3.0
OpenCL
3.0
1.3
Vulkan
1.3
8.9
CUDA
6.0
6.7
シェーダモデル
6.4

関連GPU比較

© 2024 - TopCPU.net   お問い合わせ プライバシーポリシー