NVIDIA A100 PCIe vs NVIDIA A40 PCIe

VS

NVIDIA A100 PCIe NVIDIA A40 PCIe

AI GPU 私たちは向けの40GBのメモリを搭載した A100 PCIe とデスクトッププラットフォーム向けの48GBのメモリを搭載した A40 PCIe を比較しました。両方のグラフィックスカードの主な仕様、ベンチマークテスト、消費電力などの情報を確認できます。

主要な違い

NVIDIA A100 PCIe の利点

より大きなメモリ帯域幅 (1555GB/s vs 695.8GB/s)

より低いTDP電力 (250W と 300W)

NVIDIA A40 PCIe の利点

最大ブーストクロックは 23% 向上しました (1740MHz と 1410MHz)

より大きな VRAM (48GB vs 40GB)

追加されたレンダリングコア数は 3840個です

スコア

ベンチマーク

FP32 (浮動小数点)

A100 PCIe

19.49 TFLOPS

A40 PCIe +91%

37.42 TFLOPS

A100 PCIe

VS

A40 PCIe

グラフィックスカード

2020年6月

リリース日

2020年10月

Tesla

世代

Tesla

AI GPU

タイプ

デスクトップ

PCIe 4.0 x16

バスインターフェース

PCIe 4.0 x16

クロック速度

765 MHz

ベースクロック

1305 MHz

1410 MHz

ブーストクロック

1740 MHz

1215 MHz

メモリクロック

1812 MHz

メモリ

40GB

メモリサイズ

48GB

HBM2e

メモリタイプ

GDDR6

5120bit

メモリバス

384bit

1555GB/s

帯域幅

695.8GB/s

レンダリング設定

108

SM数

84

-

計算ユニット

-

6912

シェーディングユニット

10752

432

TMU

336

160

ROP

112

432

テンソルコア

336

-

RTコア

84

192 KB (per SM)

L1キャッシュ

128 KB (per SM)

40 MB

L2キャッシュ

6 MB

理論的な性能

225.6 GPixel/s

ピクセルレート

194.9 GPixel/s

609.1 GTexel/s

テクスチャレート

584.6 GTexel/s

77.97 TFLOPS

FP16 (半精度)

37.42 TFLOPS

19.49 TFLOPS

FP32 (単精度)

37.42 TFLOPS

9.746 TFLOPS

FP64 (倍精度)

584.6 GFLOPS

グラフィックスプロセッサ

GA100

GPU名

GA102

-

GPUバリアント

-

Ampere

アーキテクチャ

Ampere

TSMC

ファウンドリ

Samsung

7 nm

プロセスサイズ

8 nm

542 億

トランジスタ

283 億

826 mm²

ダイサイズ

628 mm²

ボード設計

250W

TDP

300W

600 W

推奨PSU

700 W

No outputs

出力

3x DisplayPort 1.4a

8-pin EPS

電源コネクタ

8-pin EPS

グラフィックス機能

N/A

DirectX

12 Ultimate (12_2)

N/A

OpenGL

4.6

3.0

OpenCL

3.0

N/A

Vulkan

1.3

8.0

CUDA

8.6

N/A

シェーダモデル

6.6

NVIDIA A100 PCIe vs NVIDIA A40 PCIe

主要な違い

スコア

ベンチマーク

グラフィックスカード

クロック速度

メモリ

レンダリング設定

理論的な性能

グラフィックスプロセッサ

ボード設計

グラフィックス機能

関連GPU比較