ホーム GPU比較 NVIDIA A100 PCIe vs NVIDIA A40 PCIe

NVIDIA A100 PCIe vs NVIDIA A40 PCIe

AI GPU 私たちは向けの40GBのメモリを搭載した A100 PCIe と デスクトッププラットフォーム向けの48GBのメモリを搭載した A40 PCIe を比較しました。両方のグラフィックスカードの主な仕様、ベンチマークテスト、消費電力などの情報を確認できます。

主要な違い

NVIDIA A100 PCIe の利点
より大きなメモリ帯域幅 (1555GB/s vs 695.8GB/s)
より低いTDP電力 (250W と 300W)
NVIDIA A40 PCIe の利点
最大ブーストクロックは 23% 向上しました (1740MHz と 1410MHz)
より大きな VRAM (48GB vs 40GB)
追加されたレンダリングコア数は 3840個です

スコア

ベンチマーク

FP32 (浮動小数点)
A100 PCIe
19.49 TFLOPS
A40 PCIe +91%
37.42 TFLOPS
VS

グラフィックスカード

2020年6月
リリース日
2020年10月
Tesla
世代
Tesla
AI GPU
タイプ
デスクトップ
PCIe 4.0 x16
バスインターフェース
PCIe 4.0 x16

クロック速度

765 MHz
ベースクロック
1305 MHz
1410 MHz
ブーストクロック
1740 MHz
1215 MHz
メモリクロック
1812 MHz

メモリ

40GB
メモリサイズ
48GB
HBM2e
メモリタイプ
GDDR6
5120bit
メモリバス
384bit
1555GB/s
帯域幅
695.8GB/s

レンダリング設定

108
SM数
84
-
計算ユニット
-
6912
シェーディングユニット
10752
432
TMU
336
160
ROP
112
432
テンソルコア
336
-
RTコア
84
192 KB (per SM)
L1キャッシュ
128 KB (per SM)
40 MB
L2キャッシュ
6 MB

理論的な性能

225.6 GPixel/s
ピクセルレート
194.9 GPixel/s
609.1 GTexel/s
テクスチャレート
584.6 GTexel/s
77.97 TFLOPS
FP16 (半精度)
37.42 TFLOPS
19.49 TFLOPS
FP32 (単精度)
37.42 TFLOPS
9.746 TFLOPS
FP64 (倍精度)
584.6 GFLOPS

グラフィックスプロセッサ

GA100
GPU名
GA102
-
GPUバリアント
-
Ampere
アーキテクチャ
Ampere
TSMC
ファウンドリ
Samsung
7 nm
プロセスサイズ
8 nm
542 億
トランジスタ
283 億
826 mm²
ダイサイズ
628 mm²

ボード設計

250W
TDP
300W
600 W
推奨PSU
700 W
No outputs
出力
3x DisplayPort 1.4a
8-pin EPS
電源コネクタ
8-pin EPS

グラフィックス機能

N/A
DirectX
12 Ultimate (12_2)
N/A
OpenGL
4.6
3.0
OpenCL
3.0
N/A
Vulkan
1.3
8.0
CUDA
8.6
N/A
シェーダモデル
6.6

関連GPU比較

© 2024 - TopCPU.net   お問い合わせ プライバシーポリシー