GPU 비교 NVIDIA A40 PCIe vs NVIDIA H100 SXM5 80 GB

NVIDIA A40 PCIe vs NVIDIA H100 SXM5 80 GB

AI GPU 주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 데스크톱 플랫폼 GPU와 GPU를 비교했습니다. 48GB VRAM A40 PCIe과 80GB VRAM H100 SXM5 80 GB 중 어떤 GPU가 성능이 더 우수한지 알아보았습니다.

주요 차이점

NVIDIA A40 PCIe 의 장점
낮은 TDP (300W 대 700W)
NVIDIA H100 SXM5 80 GB 의 장점
출시 2년 그리고 5개월 늦었습니다
부스트 클럭 의 성능이 14% 증가했습니다. (1980MHz 대 1740MHz)
더 많은 VRAM (80GB 대 48GB)
더 큰 VRAM 대역폭 (1681GB/s 대 695.8GB/s)
6144 개의 추가 렌더링 코어

점수

벤치마크

FP32 (float)
A40 PCIe
37.42 TFLOPS
H100 SXM5 80 GB +78%
66.91 TFLOPS
VS

그래픽 카드

2020년10월
출시일
2023년3월
Tesla
세대
Tesla Hopper
데스크톱
유형
AI GPU
PCIe 4.0 x16
버스 인터페이스
PCIe 5.0 x16

클럭 속도

1305 MHz
기본 클럭
1590 MHz
1740 MHz
부스트 클럭
1980 MHz
1812 MHz
메모리 클럭
1313 MHz

메모리

48GB
메모리 크기
80GB
GDDR6
메모리 타입
HBM3
384bit
메모리 버스
5120bit
695.8GB/s
대역폭
1681GB/s

렌더링 설정

84
스트림 프로세서 개수
132
-
컴퓨트 유닛
-
10752
새딩 유닛
16896
336
텍스처 매핑 유닛
528
112
렌더 출력 파이프라인
24
336
텐서 코어
528
84
레이 트레이싱 코어
-
128 KB (per SM)
L1 캐시
256 KB (per SM)
6 MB
L2 캐시
50 MB

이론적 성능

194.9 GPixel/s
픽셀 속도
47.52 GPixel/s
584.6 GTexel/s
텍스처 속도
1045 GTexel/s
37.42 TFLOPS
FP16 (반 정밀도)
267.6 TFLOPS
37.42 TFLOPS
FP32 (단 정밀도)
66.91 TFLOPS
584.6 GFLOPS
FP64 (배 정밀도)
33.45 TFLOPS

그래픽 프로세서

GA102
GPU 이름
GH100
-
GPU 변형
-
Ampere
아키텍처
Hopper
Samsung
파운드리
TSMC
8 nm
제조 공정 크기
4 nm
283 억
트랜지스터
800 억
628 mm²
다이 크기
814 mm²

보드 디자인

300W
TDP
700W
700 W
권장 전원 공급 장치
1100 W
3x DisplayPort 1.4a
출력 포트
No outputs
8-pin EPS
전원 연결자
8-pin EPS

그래픽 기능

12 Ultimate (12_2)
DirectX
N/A
4.6
OpenGL
N/A
3.0
OpenCL
3.0
1.3
Vulkan
N/A
8.6
CUDA
9.0
6.6
쉐이더 모델
N/A

관련 GPU 비교

© 2024 - TopCPU.net   문의하기 개인정보 처리방침