NVIDIA H100 PCIe vs NVIDIA RTX A6000

VS

NVIDIA H100 PCIe NVIDIA RTX A6000

AI GPU 주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 GPU와 전문 시장 GPU를 비교했습니다. 80GB VRAM H100 PCIe과 48GB VRAM RTX A6000 중 어떤 GPU가 성능이 더 우수한지 알아보았습니다.

주요 차이점

NVIDIA H100 PCIe 의 장점

출시 1년 그리고 5개월 늦었습니다

더 많은 VRAM (80GB 대 48GB)

더 큰 VRAM 대역폭 (2039GB/s 대 768.0GB/s)

3840 개의 추가 렌더링 코어

NVIDIA RTX A6000 의 장점

부스트 클럭 의 성능이 3% 증가했습니다. (1800MHz 대 1755MHz)

낮은 TDP (300W 대 350W)

점수

벤치마크

FP32 (float)

H100 PCIe +32%

51.22 TFLOPS

RTX A6000

38.71 TFLOPS

Blender

H100 PCIe

4845

RTX A6000 +14%

5549

H100 PCIe

VS

RTX A6000

그래픽 카드

2022년3월

출시일

2020년10월

Tesla Hopper

세대

Quadro Ampere

AI GPU

유형

전문

PCIe 5.0 x16

버스 인터페이스

PCIe 4.0 x16

클럭 속도

1095 MHz

기본 클럭

1410 MHz

1755 MHz

부스트 클럭

1800 MHz

1593 MHz

메모리 클럭

2000 MHz

메모리

80GB

메모리 크기

48GB

HBM2e

메모리 타입

GDDR6

5120bit

메모리 버스

384bit

2039GB/s

대역폭

768.0GB/s

렌더링 설정

114

스트림 프로세서 개수

84

-

컴퓨트 유닛

-

14592

새딩 유닛

10752

456

텍스처 매핑 유닛

336

24

렌더 출력 파이프라인

112

456

텐서 코어

336

-

레이 트레이싱 코어

84

256 KB (per SM)

L1 캐시

128 KB (per SM)

50 MB

L2 캐시

6 MB

이론적 성능

42.12 GPixel/s

픽셀 속도

201.6 GPixel/s

800.3 GTexel/s

텍스처 속도

604.8 GTexel/s

204.9 TFLOPS

FP16 (반 정밀도)

38.71 TFLOPS

51.22 TFLOPS

FP32 (단 정밀도)

38.71 TFLOPS

25.61 TFLOPS

FP64 (배 정밀도)

604.8 GFLOPS

그래픽 프로세서

GH100

GPU 이름

GA102

-

GPU 변형

-

Hopper

아키텍처

Ampere

TSMC

파운드리

Samsung

4 nm

제조 공정 크기

8 nm

800 억

트랜지스터

283 억

814 mm²

다이 크기

628 mm²

보드 디자인

350W

TDP

300W

750 W

권장 전원 공급 장치

700 W

No outputs

출력 포트

4x DisplayPort 1.4a

1x 16-pin

전원 연결자

8-pin EPS

그래픽 기능

N/A

DirectX

12 Ultimate (12_2)

N/A

OpenGL

4.6

3.0

OpenCL

3.0

N/A

Vulkan

1.3

9.0

CUDA

8.6

N/A

쉐이더 모델

6.7

NVIDIA H100 PCIe vs NVIDIA RTX A6000

주요 차이점

점수

벤치마크

그래픽 카드

클럭 속도

메모리

렌더링 설정

이론적 성능

그래픽 프로세서

보드 디자인

그래픽 기능

관련 GPU 비교