NVIDIA A100 PCIe vs NVIDIA GeForce RTX 3070 Ti 16 GB

VS

NVIDIA A100 PCIe NVIDIA GeForce RTX 3070 Ti 16 GB

AI GPU 주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 GPU와 데스크톱 플랫폼 GPU를 비교했습니다. 40GB VRAM A100 PCIe과 16GB VRAM GeForce RTX 3070 Ti 16 GB 중 어떤 GPU가 성능이 더 우수한지 알아보았습니다.

주요 차이점

NVIDIA A100 PCIe 의 장점

더 많은 VRAM (40GB 대 16GB)

더 큰 VRAM 대역폭 (1555GB/s 대 608.3GB/s)

768 개의 추가 렌더링 코어

낮은 TDP (250W 대 290W)

NVIDIA GeForce RTX 3070 Ti 16 GB 의 장점

부스트 클럭 의 성능이 26% 증가했습니다. (1770MHz 대 1410MHz)

점수

벤치마크

FP32 (float)

A100 PCIe

19.49 TFLOPS

GeForce RTX 3070 Ti 16 GB +11%

21.75 TFLOPS

A100 PCIe

VS

GeForce RTX 3070 Ti 16 GB

그래픽 카드

2020년6월

출시일

알 수 없음

Tesla

세대

GeForce 30

AI GPU

유형

데스크톱

PCIe 4.0 x16

버스 인터페이스

PCIe 4.0 x16

클럭 속도

765 MHz

기본 클럭

1575 MHz

1410 MHz

부스트 클럭

1770 MHz

1215 MHz

메모리 클럭

1188 MHz

메모리

40GB

메모리 크기

16GB

HBM2e

메모리 타입

GDDR6X

5120bit

메모리 버스

256bit

1555GB/s

대역폭

608.3GB/s

렌더링 설정

108

스트림 프로세서 개수

48

-

컴퓨트 유닛

-

6912

새딩 유닛

6144

432

텍스처 매핑 유닛

192

160

렌더 출력 파이프라인

96

432

텐서 코어

192

-

레이 트레이싱 코어

48

192 KB (per SM)

L1 캐시

128 KB (per SM)

40 MB

L2 캐시

4 MB

이론적 성능

225.6 GPixel/s

픽셀 속도

169.9 GPixel/s

609.1 GTexel/s

텍스처 속도

339.8 GTexel/s

77.97 TFLOPS

FP16 (반 정밀도)

21.75 TFLOPS

19.49 TFLOPS

FP32 (단 정밀도)

21.75 TFLOPS

9.746 TFLOPS

FP64 (배 정밀도)

339.8 GFLOPS

그래픽 프로세서

GA100

GPU 이름

GA104

-

GPU 변형

GA104-401-A1

Ampere

아키텍처

Ampere

TSMC

파운드리

Samsung

7 nm

제조 공정 크기

8 nm

542 억

트랜지스터

174 억

826 mm²

다이 크기

392 mm²

보드 디자인

250W

TDP

290W

600 W

권장 전원 공급 장치

600 W

No outputs

출력 포트

1x HDMI 2.1 3x DisplayPort 1.4a

8-pin EPS

전원 연결자

1x 12-pin

그래픽 기능

N/A

DirectX

12 Ultimate (12_2)

N/A

OpenGL

4.6

3.0

OpenCL

3.0

N/A

Vulkan

1.3

8.0

CUDA

8.6

N/A

쉐이더 모델

6.6

NVIDIA A100 PCIe vs NVIDIA GeForce RTX 3070 Ti 16 GB

주요 차이점

점수

벤치마크

그래픽 카드

클럭 속도

메모리

렌더링 설정

이론적 성능

그래픽 프로세서

보드 디자인

그래픽 기능

관련 GPU 비교