산업 소식

NVIDIA Blackwell GPU의 첫 번째 벤치마크 결과: 최대 2.2배 성능 향상

kyojuro 2024년 11월 15일 금요일

NVIDIA Blackwell GPU는 견고성과 뛰어난 성능으로 잘 알려져 있습니다. 공식 프로모션 데이터 외에도 AI 교육 및 추론 성능의 최고 평가 플랫폼인 MLCommons MLPerf v4.1의 실질 테스트 데이터를 처음으로 살펴봅니다.

이 비교에는 두 세대의 서버, 즉 HGX B200과 HGX H200이 포함됩니다. 전자는 최대 8개의 Blackwell GPU B200을 탑재하고 있으며, 각 GPU는 최대 1000와트의 전력 소모를 제공합니다.

GPT-3 사전 학습 벤치마크에서 Blackwell GPU는 이전 Hopper 세대에 비해 성능이 두 배 향상된 것으로 나타났습니다.

700억 개의 매개변수를 가진 Llama 2의 미세 조정 작업에서 Blackwell은 최대 2.2배의 성능 향상을 보여줍니다.

Blackwell 플랫폼은 ConnectX-7 SuperNIC, Quantum-2 InfiniBand 스위치 및 5세대 NVLink 상호 연결 버스를 통합합니다. 이러한 기능은 강력한 노드 간 통신을 보장하여 AI 교육 부하의 균형 잡힌 분배를 가능하게 하고 전반적인 효율성을 향상시킵니다.

예를 들어 GPT-3의 1750억 매개변수로 동일한 성능을 달성하려면 256개의 Hopper 세대 GPU가 필요하지만, Blackwell은 64개 매개변수로 이를 달성합니다.

관련 뉴스

© 2025 - TopCPU.net   문의하기 개인정보 처리방침