인텔, 엔비디아와 협력하여 하이브리드 랙 플랫폼 출시

kyojuro 2025년 10월 19일 일요일

인텔은 최근 OCP 글로벌 서밋 2025에서 혁신적인 벤처를 공개하여 Gaudi 3 AI 칩과 NVIDIA의 Blackwell 아키텍처 GPU를 결합한 하이브리드 랙 레벨 서버 솔루션을 선보였습니다. 이러한 발전은 인텔의 AI 하드웨어 전략에서 중요한 전환을 나타내고 있으며, 단독 경쟁 접근 방식에서 보다 협업적이고 통합된 시장 입지를 포용하는 것으로 전환하고 있습니다.

Gaudi 3

가우디 3 랙 스케일 솔루션(Gaudi 3 Rack Scale Solution)으로 알려진 새로 도입된 시스템은 여러 개의 컴퓨팅 및 스위칭 트레이를 특징으로 하는 랙 마운트 디자인을 자랑합니다. 각 트레이에는 Xeon 프로세서 2개, Gaudi 3 가속기 4개, NVIDIA ConnectX – 7 400 GbE 네트워크 카드 4개, BlueField – 3 DPU 1개가 장착되어 있습니다. 랙 내에서는 16개의 컴퓨팅 트레이가 완전히 상호 연결되어 Broadcom Tomahawk 5 스위치를 통해 최대 51.2 Tb/s의 네트워크 용량을 제공합니다. 이 아키텍처는 높은 대역폭, 짧은 지연 시간 및 이더넷 중심의 수평 확장성을 강조하여 AI 추론 작업에 이상적인 견고한 인프라를 제공합니다.

특히, 이 시스템은 인텔의 생태계에만 국한되지 않으며, NVIDIA의 Blackwell B200 GPU와 원활하게 통합되어 있습니다. AI 모델을 실행하기 위해 "분해된 추론" 전략을 사용하는 Blackwell은 계산 집약적인 "프리필" 단계를 관리하는 반면 Gaudi 3은 "디코드" 단계를 다루는데, 이는 계산적으로 덜 요구되지만 지연 시간에 민감합니다. 이러한 작업 분할을 통해 두 아키텍처가 각자의 강점을 활용할 수 있습니다. Blackwell의 뛰어난 매트릭스 컴퓨팅 기능이 최대화되고, Gaudi 3은 뛰어난 메모리 대역폭과 이더넷 통신 기능 덕분에 고동시 추론 요청을 효과적으로 관리합니다. SemiAnalysis에 따르면, 이러한 소형 고밀도 랙의 사전 충전 성능은 B200 GPU만 사용하는 구성보다 약 1.7배 높습니다.

Performance

전략적으로 말하면 AI 컴퓨팅 분야에서 이미 NVIDIA가 지배하는 시장 환경에서 고독한 Gaudi 플랫폼은 경쟁 여지를 제한했습니다. 인텔은 Blackwell 플랫폼과 랙 수준에서 통합함으로써 CUDA 및 NVLink 기술을 포함한 NVIDIA의 고도로 개발된 소프트웨어 생태계를 활용하여 하드웨어 솔루션의 적용 가능성을 확장합니다. 이 전략적 파트너십은 미묘하지만 인텔이 개방형 네트워크 아키텍처와 이더넷 연결을 최적화하여 AI 가속화 생태계에서의 입지를 강화하는 실용적인 접근 방식을 강조합니다.

가우디 플랫폼의 소프트웨어 스택과 개발 도구는 아직 CUDA의 성숙도를 능가하지 못하며, 실제 애플리케이션을 위해서는 상당한 엔지니어링 노력이 필요합니다. 또한, 5nm 프로세스를 기반으로 구축된 Gaudi 3는 인텔의 로드맵에서 내년에 새로운 아키텍처로 전환할 것을 나타내는 전환 제품으로 의도되었습니다. 분석가들은 이 하이브리드 랙 솔루션이 주로 칩 수준의 경쟁을 따라잡는 것이 아니라 AI 서버 분야에서 적응력 있는 시스템 수준의 솔루션을 제공하는 인텔의 능력을 보여주기 위해 고안된 "쇼케이스 전략"으로 작용할 수 있다고 제안합니다.

NVIDIA Integration

Gaudi 3 Rack Scale 디자인은 ConnectX NIC 시리즈 및 BlueField DPU와 같은 수많은 NVIDIA 네트워킹 및 통신 구성 요소를 통합하여 고대역폭 네트워킹 및 이기종 클러스터 기술 분야에서 NVIDIA의 우위를 더욱 강화하기 때문에 NVIDIA는 이번 협력을 통해 상당한 이익을 얻을 수 있습니다. 인텔의 경우, 이 시너지는 Gaudi 제품의 출하를 증가시키고 멀티 노드 배포에서 Xeon과 AI 가속기의 상호 운용성을 보여줄 것으로 예상됩니다.

AI 하드웨어 부문이 빠르게 진화함에 따라 이러한 "크로스 캠프 공동 작업" 모델은 새로운 트렌드를 예고할 수 있습니다. 미래의 데이터 센터는 단일 엔티티에 의해 지배되는 것이 아니라 다양한 아키텍처로 구성된 고효율 컴퓨팅 클러스터를 특징으로 할 수 있습니다. 인텔의 Gaudi 3 Rack Scale은 단순한 제품 실험이 아니라 AI 인프라 환경 내에서 자체를 재배치하는 전략적 움직임으로, 고독 경쟁에서 시스템 수준 통합 및 최적화로 전환합니다.

관련 뉴스

© 2025 - TopCPU.net