GPU 비교 NVIDIA H100 CNX vs NVIDIA Quadro RTX 4000

NVIDIA H100 CNX vs NVIDIA Quadro RTX 4000

AI GPU 주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 GPU와 전문 시장 GPU를 비교했습니다. 80GB VRAM H100 CNX과 8GB VRAM Quadro RTX 4000 중 어떤 GPU가 성능이 더 우수한지 알아보았습니다.

주요 차이점

NVIDIA H100 CNX 의 장점
출시 4년 그리고 4개월 늦었습니다
부스트 클럭 의 성능이 19% 증가했습니다. (1845MHz 대 1545MHz)
더 많은 VRAM (80GB 대 8GB)
더 큰 VRAM 대역폭 (2039GB/s 대 416.0GB/s)
12288 개의 추가 렌더링 코어
NVIDIA Quadro RTX 4000 의 장점
낮은 TDP (160W 대 350W)

점수

벤치마크

FP32 (float)
H100 CNX +656%
53.84 TFLOPS
Quadro RTX 4000
7.119 TFLOPS
VS

그래픽 카드

2023년3월
출시일
2018년11월
Tesla Hopper
세대
Quadro
AI GPU
유형
전문
PCIe 5.0 x16
버스 인터페이스
PCIe 3.0 x16

클럭 속도

690 MHz
기본 클럭
1005 MHz
1845 MHz
부스트 클럭
1545 MHz
1593 MHz
메모리 클럭
1625 MHz

메모리

80GB
메모리 크기
8GB
HBM2e
메모리 타입
GDDR6
5120bit
메모리 버스
256bit
2039GB/s
대역폭
416.0GB/s

렌더링 설정

114
스트림 프로세서 개수
36
-
컴퓨트 유닛
-
14592
새딩 유닛
2304
456
텍스처 매핑 유닛
144
24
렌더 출력 파이프라인
64
456
텐서 코어
288
-
레이 트레이싱 코어
36
256 KB (per SM)
L1 캐시
64 KB (per SM)
50 MB
L2 캐시
4 MB

이론적 성능

44.28 GPixel/s
픽셀 속도
98.88 GPixel/s
841.3 GTexel/s
텍스처 속도
222.5 GTexel/s
215.4 TFLOPS
FP16 (반 정밀도)
14.24 TFLOPS
53.84 TFLOPS
FP32 (단 정밀도)
7.119 TFLOPS
26.92 TFLOPS
FP64 (배 정밀도)
222.5 GFLOPS

그래픽 프로세서

GH100
GPU 이름
TU104
-
GPU 변형
TU104-850-A1
Hopper
아키텍처
Turing
TSMC
파운드리
TSMC
4 nm
제조 공정 크기
12 nm
800 억
트랜지스터
136 억
814 mm²
다이 크기
545 mm²

보드 디자인

350W
TDP
160W
750 W
권장 전원 공급 장치
450 W
No outputs
출력 포트
3x DisplayPort 1.4a 1x USB Type-C
8-pin EPS
전원 연결자
1x 8-pin

그래픽 기능

N/A
DirectX
12 Ultimate (12_2)
N/A
OpenGL
4.6
3.0
OpenCL
3.0
N/A
Vulkan
1.3
9.0
CUDA
7.5
N/A
쉐이더 모델
6.6

관련 GPU 비교

© 2024 - TopCPU.net   문의하기 개인정보 처리방침