NVIDIA H100 PCIe vs NVIDIA L40

VS

NVIDIA H100 PCIe NVIDIA L40

AI GPU 주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 GPU와 전문 시장 GPU를 비교했습니다. 80GB VRAM H100 PCIe과 48GB VRAM L40 중 어떤 GPU가 성능이 더 우수한지 알아보았습니다.

주요 차이점

NVIDIA H100 PCIe 의 장점

더 많은 VRAM (80GB 대 48GB)

더 큰 VRAM 대역폭 (2039GB/s 대 864.0GB/s)

NVIDIA L40 의 장점

출시 7개월 늦었습니다

부스트 클럭 의 성능이 42% 증가했습니다. (2490MHz 대 1755MHz)

3584 개의 추가 렌더링 코어

낮은 TDP (300W 대 350W)

점수

벤치마크

FP32 (float)

H100 PCIe

51.22 TFLOPS

L40 +76%

90.52 TFLOPS

Blender

H100 PCIe

4845

L40 +95%

9486

H100 PCIe

VS

L40

그래픽 카드

2022년3월

출시일

2022년10월

Tesla Hopper

세대

Tesla Ada

AI GPU

유형

전문

PCIe 5.0 x16

버스 인터페이스

PCIe 4.0 x16

클럭 속도

1095 MHz

기본 클럭

735 MHz

1755 MHz

부스트 클럭

2490 MHz

1593 MHz

메모리 클럭

2250 MHz

메모리

80GB

메모리 크기

48GB

HBM2e

메모리 타입

GDDR6

5120bit

메모리 버스

384bit

2039GB/s

대역폭

864.0GB/s

렌더링 설정

114

스트림 프로세서 개수

142

-

컴퓨트 유닛

-

14592

새딩 유닛

18176

456

텍스처 매핑 유닛

568

24

렌더 출력 파이프라인

192

456

텐서 코어

568

-

레이 트레이싱 코어

142

256 KB (per SM)

L1 캐시

128 KB (per SM)

50 MB

L2 캐시

96 MB

이론적 성능

42.12 GPixel/s

픽셀 속도

478.1 GPixel/s

800.3 GTexel/s

텍스처 속도

1414 GTexel/s

204.9 TFLOPS

FP16 (반 정밀도)

90.52 TFLOPS

51.22 TFLOPS

FP32 (단 정밀도)

90.52 TFLOPS

25.61 TFLOPS

FP64 (배 정밀도)

1414 GFLOPS

그래픽 프로세서

GH100

GPU 이름

AD102

-

GPU 변형

AD102-895-A1

Hopper

아키텍처

Ada Lovelace

TSMC

파운드리

TSMC

4 nm

제조 공정 크기

4 nm

800 억

트랜지스터

763 억

814 mm²

다이 크기

608 mm²

보드 디자인

350W

TDP

300W

750 W

권장 전원 공급 장치

700 W

No outputs

출력 포트

4x DisplayPort 1.4a

1x 16-pin

전원 연결자

1x 16-pin

그래픽 기능

N/A

DirectX

12 Ultimate (12_2)

N/A

OpenGL

4.6

3.0

OpenCL

3.0

N/A

Vulkan

1.3

9.0

CUDA

8.9

N/A

쉐이더 모델

6.6

NVIDIA H100 PCIe vs NVIDIA L40

주요 차이점

점수

벤치마크

그래픽 카드

클럭 속도

메모리

렌더링 설정

이론적 성능

그래픽 프로세서

보드 디자인

그래픽 기능

관련 GPU 비교