NVIDIA H100 CNX vs NVIDIA Quadro RTX 4000

VS

AI GPU 주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 GPU와 전문 시장 GPU를 비교했습니다. 80GB VRAM H100 CNX과 8GB VRAM Quadro RTX 4000 중 어떤 GPU가 성능이 더 우수한지 알아보았습니다.

주요 차이점

NVIDIA H100 CNX 의 장점

출시 4년 그리고 4개월 늦었습니다

부스트 클럭 의 성능이 19% 증가했습니다. (1845MHz 대 1545MHz)

더 많은 VRAM (80GB 대 8GB)

더 큰 VRAM 대역폭 (2039GB/s 대 416.0GB/s)

12288 개의 추가 렌더링 코어

NVIDIA Quadro RTX 4000 의 장점

낮은 TDP (160W 대 350W)

점수

벤치마크

FP32 (float)

H100 CNX +656%

53.84 TFLOPS

Quadro RTX 4000

7.119 TFLOPS

H100 CNX

VS

Quadro RTX 4000

그래픽 카드

2023년3월

출시일

2018년11월

Tesla Hopper

세대

Quadro

AI GPU

유형

전문

PCIe 5.0 x16

버스 인터페이스

PCIe 3.0 x16

클럭 속도

690 MHz

기본 클럭

1005 MHz

1845 MHz

부스트 클럭

1545 MHz

1593 MHz

메모리 클럭

1625 MHz

메모리

80GB

메모리 크기

8GB

HBM2e

메모리 타입

GDDR6

5120bit

메모리 버스

256bit

2039GB/s

대역폭

416.0GB/s

렌더링 설정

114

스트림 프로세서 개수

36

-

컴퓨트 유닛

-

14592

새딩 유닛

2304

456

텍스처 매핑 유닛

144

24

렌더 출력 파이프라인

64

456

텐서 코어

288

-

레이 트레이싱 코어

36

256 KB (per SM)

L1 캐시

64 KB (per SM)

50 MB

L2 캐시

4 MB

이론적 성능

44.28 GPixel/s

픽셀 속도

98.88 GPixel/s

841.3 GTexel/s

텍스처 속도

222.5 GTexel/s

215.4 TFLOPS

FP16 (반 정밀도)

14.24 TFLOPS

53.84 TFLOPS

FP32 (단 정밀도)

7.119 TFLOPS

26.92 TFLOPS

FP64 (배 정밀도)

222.5 GFLOPS

그래픽 프로세서

GH100

GPU 이름

TU104

-

GPU 변형

TU104-850-A1

Hopper

아키텍처

Turing

TSMC

파운드리

TSMC

4 nm

제조 공정 크기

12 nm

800 억

트랜지스터

136 억

814 mm²

다이 크기

545 mm²

보드 디자인

350W

TDP

160W

750 W

권장 전원 공급 장치

450 W

No outputs

출력 포트

3x DisplayPort 1.4a 1x USB Type-C

8-pin EPS

전원 연결자

1x 8-pin

그래픽 기능

N/A

DirectX

12 Ultimate (12_2)

N/A

OpenGL

4.6

3.0

OpenCL

3.0

N/A

Vulkan

1.3

9.0

CUDA

7.5

N/A

쉐이더 모델

6.6