최근 AMD는 DeepSeek R1의 일련의 추론 벤치마크 결과를 발표하여 많은 주목을 받았습니다. 테스트 결과에 따르면, AMD의 하이엔드 그래픽 카드인 RX 7900 XTX는 DeepSeek 모델 시리즈 실행 시 NVIDIA의 주요 모델인 RTX 4090과 RTX 4080 Super를 초과 성능을 보였습니다. RDNA 3 아키텍처를 활용한 RX 7900 XTX는 DeepSeek R1 Distil Qwen 7B 테스트에서 RTX 4090에 비해 약 13%의 성능 향상을, RTX 4080 Super에 대해선 34% 향상된 성능을 보여주었습니다. 또한 AMD는 Distil Llama 8B 및 Distil Qwen 14B 같은 다른 모델에 대한 벤치마크에서 RTX 4090이 Distil Qwen 32B 모델보다 약간 우위를 점했지만, 지속적으로 성능을 뛰어넘었습니다.
AMD의 데이터 발표에 대응하여 NVIDIA는 즉각 반발했습니다. 엔비디아의 공식 블로그에 따르면, 최근 출시된 RTX 5090은 RX 7900 XTX를 크게 웃돌아 RX 7900 XTX의 2.2배 성능을 달성했다고 주장했습니다. NVIDIA는 이러한 결과에 대해 다양한 테스트 조건, 최적화된 구성, 드라이버 버전 등을 고려한 후 자사의 제품이 중요한 작업에서 우위를 점한다고 강조했습니다. 이러한 벤치마크 결과는 현대 AI 추론 작업에서 하드웨어와 소프트웨어의 최적화의 중요성을 강조할 뿐만 아니라, 제조업체의 독점적인 테스트 조건에서의 잠재적 한계를 드러냅니다.
[이미지 출처: Nvidia]
성능 경쟁을 넘어 시장 환경은 미묘하게 변화하고 있습니다. AMD RX 7900 XTX는 가격 경쟁력을 통해 비용 효율성을 추구하는 틈새를 창출하고 있으며, 고급 그래픽 카드 선택에 대한 전통적인 논리를 변화시키고 있습니다. 통계에 따르면, RX 7900 XTX의 가격대는 NVIDIA의 유사 제품에 비해 크게 낮아, 투자 수익률을 중시하는 기술 전문가나 중소규모 AI 연구팀에게 상당히 매력적입니다. 한편, 중국 스타트업이 발표한 DeepSeek 오픈소스 모델은 낮은 훈련 비용과 높은 추론 효율성으로 글로벌 AI 인프라의 가치를 재정의하고 있습니다. 수학적 파생 및 코드 생성과 같은 분야에서의 모델 상업적 잠재력과 소비자 등급 하드웨어에서의 원활한 배포는 전통적인 AI 산술 스택 개발 모델을 혁신적으로 변화시키고 있습니다.
업계 전문가들은 하드웨어 공급 업체 간의 경쟁이 단순한 산술 능력을 넘어, 아키텍처 혁신 및 생태계적 시너지를 포괄하는 방향으로 진화하고 있다고 보고합니다. AMD의 RDNA 3 아키텍처는 향상된 컴퓨팅 단위 배치를 통해 병렬 처리 효율을 높이며, NVIDIA는 CUDA 생태계를 지속적으로 강화하여 강력한 소프트웨어 계층 구조를 구축하고 있습니다. 이러한 차별화된 경쟁 전략은 다양한 테스트 시나리오에서 성능 차이를 나타내며, 비디오 메모리 대역폭이 개선된 NVIDIA 제품이 32B 대형 모델 테스트에서 우위를 점하는 이유를 설명합니다.
DeepSeek 모델의 부상은 탐구할 가치가 있는 파급 효과를 제공하였습니다. 이 오픈소스 프로그램은 알고리즘 혁신을 통해 하드웨어의 연산 능력에 대한 의존도를 줄여, 중소기업이 제한된 예산 내에서 AI 응용 프로그램을 연구할 수 있도록 합니다. 이러한 기술 트렌드는 기존의 GPU 클러스터 구매 모델에 도전할 뿐만 아니라, 업계가 "계산 전력 독점" 비즈니스 논리의 지속 가능성을 재고하도록 촉구하고 있습니다. 일부 실리콘 밸리 기술 회사들은 하드웨어 조달 전략을 조정하여, 특정 시나리오에서 더 저렴한 하이브리드 컴퓨팅 솔루션을 탐구하기 시작했습니다.
산업 진화의 관점에서 현재의 성능 논쟁은 AI 컴퓨팅 패러다임 변화의 불가피한 결과를 보여줍니다. 최종 사용자에게 점점 더 다양한 제품 범위는 잠재적 비용 최적화를 시사할 뿐만 아니라, AI 하드웨어 시장이 가속화된 기술 발전에 대비하고 있음을 나타냅니다. 오픈소스 모델 생태계가 지속적으로 성숙되고 이기종 컴퓨팅 아키텍처가 진화함에 따라, 전체 업계가 더 효율적이고 포괄적인 방향으로 발전할 것으로 예상됩니다.