GPU 비교 NVIDIA A100 PCIe vs NVIDIA GeForce RTX 3070 Ti 16 GB

NVIDIA A100 PCIe vs NVIDIA GeForce RTX 3070 Ti 16 GB

AI GPU 주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 GPU와 데스크톱 플랫폼 GPU를 비교했습니다. 40GB VRAM A100 PCIe과 16GB VRAM GeForce RTX 3070 Ti 16 GB 중 어떤 GPU가 성능이 더 우수한지 알아보았습니다.

주요 차이점

NVIDIA A100 PCIe 의 장점
더 많은 VRAM (40GB 대 16GB)
더 큰 VRAM 대역폭 (1555GB/s 대 608.3GB/s)
768 개의 추가 렌더링 코어
낮은 TDP (250W 대 290W)
NVIDIA GeForce RTX 3070 Ti 16 GB 의 장점
부스트 클럭 의 성능이 26% 증가했습니다. (1770MHz 대 1410MHz)

점수

벤치마크

FP32 (float)
A100 PCIe
19.49 TFLOPS
GeForce RTX 3070 Ti 16 GB +11%
21.75 TFLOPS
VS

그래픽 카드

2020년6월
출시일
알 수 없음
Tesla
세대
GeForce 30
AI GPU
유형
데스크톱
PCIe 4.0 x16
버스 인터페이스
PCIe 4.0 x16

클럭 속도

765 MHz
기본 클럭
1575 MHz
1410 MHz
부스트 클럭
1770 MHz
1215 MHz
메모리 클럭
1188 MHz

메모리

40GB
메모리 크기
16GB
HBM2e
메모리 타입
GDDR6X
5120bit
메모리 버스
256bit
1555GB/s
대역폭
608.3GB/s

렌더링 설정

108
스트림 프로세서 개수
48
-
컴퓨트 유닛
-
6912
새딩 유닛
6144
432
텍스처 매핑 유닛
192
160
렌더 출력 파이프라인
96
432
텐서 코어
192
-
레이 트레이싱 코어
48
192 KB (per SM)
L1 캐시
128 KB (per SM)
40 MB
L2 캐시
4 MB

이론적 성능

225.6 GPixel/s
픽셀 속도
169.9 GPixel/s
609.1 GTexel/s
텍스처 속도
339.8 GTexel/s
77.97 TFLOPS
FP16 (반 정밀도)
21.75 TFLOPS
19.49 TFLOPS
FP32 (단 정밀도)
21.75 TFLOPS
9.746 TFLOPS
FP64 (배 정밀도)
339.8 GFLOPS

그래픽 프로세서

GA100
GPU 이름
GA104
-
GPU 변형
GA104-401-A1
Ampere
아키텍처
Ampere
TSMC
파운드리
Samsung
7 nm
제조 공정 크기
8 nm
542 억
트랜지스터
174 억
826 mm²
다이 크기
392 mm²

보드 디자인

250W
TDP
290W
600 W
권장 전원 공급 장치
600 W
No outputs
출력 포트
1x HDMI 2.1 3x DisplayPort 1.4a
8-pin EPS
전원 연결자
1x 12-pin

그래픽 기능

N/A
DirectX
12 Ultimate (12_2)
N/A
OpenGL
4.6
3.0
OpenCL
3.0
N/A
Vulkan
1.3
8.0
CUDA
8.6
N/A
쉐이더 모델
6.6

관련 GPU 비교

© 2024 - TopCPU.net   문의하기 개인정보 처리방침