NVIDIA, GB300 판매 기대에 미치지 못해

kyojuro 2025년 4월 1일 화요일

AI 분야의 선두주자인 엔비디아는 새로운 제품 출시에서 어려움을 겪고 있습니다. GTC 2025에서 공개된 GB 300 AI 서버는 높은 성능 기대에도 불구하고, 공급망 문제와 제품 피드백에서 엇갈린 평가를 받고 있습니다. 차세대 AI 서버는 이전 버전의 성공을 이끌어내는 데 겪는 어려움, 기술적 복잡성과 기존 솔루션에 대한 시장 선호도로 인해 도전에 직면해 있습니다.

Image

GB 300은 B 300 GPU를 도입한 블랙웰 시리즈의 업그레이드입니다. 이 단일 카드는 최대 1,400W의 전력을 필요로 하며, FP 4 컴퓨팅 성능이 약 50% 향상되고 메모리 용량이 192GB에서 288GB로 확장되며, 12층 HBM 3E 스택으로 개선됩니다. 네트워킹 기능이 ConnectX-7에서 ConnectX-8로 향상되었으며 광 모듈 대역폭이 1.6Tbps로 두 배로 늘어났습니다. 이러한 개발은 AI 추론 및 훈련, 특히 에이전트 기반 및 물리적 AI와 같은 첨단 응용 분야에서 증가하는 요구를 충족시키는 것을 목표로 합니다. 그럼에도 불구하고 잘 알려진 속담이 있습니다: '너무 큰 도약은 불안정해질 수 있습니다.' 엔비디아의 중요한 기술 발전은 아직 광범위한 시장 수용으로 전환되지 않았습니다.

이전 모델인 GB 200도 문제를 겪었습니다. 2024년에 엔비디아는 약 15,000개의 GB 200 AI 서버를 출하했지만, 이는 이전 호퍼 시리즈 결과에 비해 부족했습니다. 기여한 요인으로는 GB 200의 초기 어려움인 TSMC의 첨단 패키징 기술(CoWoS-L 등)에서 낮은 수율을 들 수 있습니다. 이 장애물은 일부 해결되었지만, 배포의 어려움은 여전히 남아 있습니다.

GB 200 NVL 72 서버 랙의 배포는 복잡하게 증명되었으며, 하나의 설치에 5~7일이 소요되며 안정성 문제와 시스템 충돌이 자주 발생합니다. NVLink 구리 연결 설계는 설치당 특정 적응이 필요하며 약 5,000개의 케이블을 연결하는 것이 복잡하며, 구성에 NVIDIA 엔지니어에 의존하여 클라우드 서비스 제공업체(CSP)가 클러스터 장애를 겪을 때 좌절감을 느끼고 NVIDIA의 기술 지원에 의존하게 됩니다.

Image

GB 300의 원래 2025년 말까지 예정된 대량 생산이 연말까지 고객 테스트 샘플이 기대되고 대량 생산이 2026년까지 연기될 수 있어 공급망에 대한 압력이 상당히 커지고 있습니다. 이러한 좌절은 액체 냉각 솔루션에 대한 수요와 고들 전력 설계의 증가된 전력 요구와 같은 설계 복잡성과 관련이 있습니다. GB 300의 예상 전력 소비는 GB 200 NVL 72 랙의 140kW를 초과하는 예상 전력 소비로 데이터 센터 인프라의 도전이 되고 있으며, 이로 인해 비용이 증가하고 기존 데이터 센터를 액체 냉각 기술을 수용하기 위해 개조해야 합니다.

Microsoft, Google 및 Amazon을 포함한 주요 CSP는 GB 200과의 이전 경험으로 인해 GB 300에 대해 신중하게 접근하고 있습니다. 예를 들어, GB 200 NVL 72를 사용한 Microsoft의 테스트에서는 반복적인 하드웨어 디버깅이 필요하여 데이터 센터 용량 일정을 방해했습니다. 이러한 불만으로 인해 CSP는 HGX 시리즈와 같은 엔비디아의 안정적인 대안을 선호하게 되었습니다. HGX H 100의 호퍼 아키텍처는 랙당 60kW~80kW를 지원하며 기존의 공기 냉각 설계와 호환되며 GB 200 및 GB 300보다 뛰어난 유연성을 제공합니다. 또한 8개의 B 200 GPU를 장착한 HGX B 200은 최대 400Gbps의 NVLink를 지원하며, 하이퍼스케일러와 중소형 클라우드 공급업체에서 인기가 높은 x86 아키텍처를 사용하는 AI 플랫폼에서 널리 선호되고 있습니다.

시장의 수요 변화도 이러한 경향을 반영합니다. GB 300의 주문은 예상에 미치지 못했지만, HGX 시스템에 대한 수요는 꾸준히 증가하고 있습니다. 분석가들은 GB 300의 가격을 잠재적인 장벽으로 언급하며 GB 200 NVL 72는 단위당 약 3백만 달러의 가격으로 판매됩니다. GB 300의 액체 냉각 및 성능 기능으로 인해 비용이 더욱 높아지므로, 특히 즉각적인 ROI가 어렵다면 예산에 민감한 고객을 실망시킬 수 있습니다.

Image

AMD와 Intel과 같은 경쟁업체가 추진력을 얻고 있어서 경쟁 환경이 진화하고 있습니다. AMD의 Instinct MI 300은 강력한 가격 대비 성능 가치와 오픈 소스 플랫폼으로 진전을 이루고 있으며, 인텔의 Gaudi 3은 특정 추론 작업에서 우수함을 보입니다. 이러한 대안은 고객의 선택을 다양하게 하고 있지만 아직 엔비디아의 시장 선두를 심각하게 위협하지는 않고 있습니다.

이에 대응해 엔비디아는 리드 타임을 줄이기 위해 단일 GPU 블랙웰 변형을 출시하는 것을 고려하여 전략을 재평가하고 있습니다. 이러한 조치가 고객의 신뢰를 회복할 수 있을지 여부는 아직 불확실합니다. 엔비디아는 공급망 효율성과 안정성 및 경제성에 대한 고객의 기대의 균형을 맞추기 위해 혁신과 시장 수요를 탐색하고 있습니다. 엔비디아는 야심 찬 기업이지만, 앞으로 복잡한 길을 따라 시장 및 운영 과제를 신속하게 적응해야 할 필요성을 강조합니다.

관련 뉴스

© 2025 - TopCPU.net