GPU 비교 NVIDIA GeForce RTX 4090 vs NVIDIA A100 PCIe 80 GB

NVIDIA GeForce RTX 4090 vs NVIDIA A100 PCIe 80 GB

주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 데스크톱 플랫폼 GPU와 전문 시장 GPU를 비교했습니다. 24GB VRAM GeForce RTX 4090과 80GB VRAM A100 PCIe 80 GB 중 어떤 GPU가 성능이 더 우수한지 알아보았습니다.

주요 차이점

NVIDIA GeForce RTX 4090의 장점
출시일로부터 1년 3개월지연
부스트 클럭의 성능이 79% 증가했습니다. (2520MHz 대 1410MHz)
9472개의 추가 렌더링 코어
NVIDIA A100 PCIe 80 GB의 장점
더 많은 VRAM (80GB 대 24GB)
더 큰 VRAM 대역폭 (1935GB/s 대 1008GB/s)
낮은 TDP (300W 대 450W)

점수

벤치마크

FP32 (float)
GeForce RTX 4090 +323%
82.58 TFLOPS
A100 PCIe 80 GB
19.49 TFLOPS
Blender
GeForce RTX 4090 +237%
12921
A100 PCIe 80 GB
3823
OctaneBench
GeForce RTX 4090 +312%
1278
A100 PCIe 80 GB
310
VS

그래픽 카드

2022년 9월
출시일
2021년 6월
GeForce 40
세대
Tesla Ampere
데스크톱
유형
전문
PCIe 4.0 x16
버스 인터페이스
PCIe 4.0 x16

클럭 속도

2235MHz
기본 클럭
1065MHz
2520MHz
부스트 클럭
1410MHz
1313MHz
메모리 클럭
1512MHz

메모리

24GB
메모리 크기
80GB
GDDR6X
메모리 타입
HBM2e
384bit
메모리 버스
5120bit
1008GB/s
대역폭
1935GB/s

렌더링 설정

128
스트림 프로세서 개수
108
-
컴퓨트 유닛
-
16384
새딩 유닛
6912
512
텍스처 매핑 유닛
432
176
렌더 출력 파이프라인
160
512
텐서 코어
432
128
레이 트레이싱 코어
-
128 KB (per SM)
L1 캐시
192 KB (per SM)
72MB
L2 캐시
80MB

이론적 성능

443.5GPixel/s
픽셀 속도
225.6GPixel/s
1290GTexel/s
텍스처 속도
609.1GTexel/s
82.58 TFLOPS
FP16 (반 정밀도)
77.97 TFLOPS
82.58 TFLOPS
FP32 (단 정밀도)
19.49 TFLOPS
1290 GFLOPS
FP64 (배 정밀도)
9.746 TFLOPS

그래픽 프로세서

AD102
GPU 이름
GA100
AD102-300-A1
GPU 변형
-
Ada Lovelace
아키텍처
Ampere
TSMC
파운드리
TSMC
5 nm
제조 공정 크기
7 nm
76,300 million
트랜지스터
54,200 million
609 mm²
다이 크기
826 mm²

보드 디자인

450W
TDP
300W
850W
권장 전원 공급 장치
700W
1x HDMI 2.1 3x DisplayPort 1.4a
출력 포트
No outputs
1x 16-pin
전원 연결자
8-pin EPS

그래픽 기능

12 Ultimate (12_2)
DirectX
N/A
4.6
OpenGL
N/A
3.0
OpenCL
3.0
1.3
Vulkan
N/A
8.9
CUDA
8.0
6.7
쉐이더 모델
N/A

관련 GPU 비교

© 2024 - TopCPU.net   문의하기 개인정보 처리방침