DeepSeek R1 테스트에서 AMD AI MAX+ 395, RTX 5080 대비 3배 이상의 속도 달성

kyojuro 2025년 3월 18일 화요일

AMD의 새로운 Ryzen AI MAX+ 395 "Strix Halo" APU는 DeepSeek R1 AI 벤치마크에서 NVIDIA RTX 5080의 3배 이상의 성능을 발휘하여 소비자 노트북용 AI 처리 분야에 획기적인 돌파구를 제시합니다. 견고한 하드웨어 구성과 혁신적인 메모리 디자인은 AI 워크로드에서 우수할 뿐만 아니라, 고급 얇고 가벼운 장치에 전례 없는 가능성을 열어줍니다.

Strix Halo Image

이 APU는 16개의 Zen 5 아키텍처 CPU 코어와 32개의 스레드를 통합하여 최대 5.1GHz의 속도를 제공합니다. 또한 40개의 RDNA 3.5 컴퓨팅 유닛과 50 TOPS의 컴퓨팅 성능을 제공하는 XDNA 2 뉴럴 프로세싱 유닛(NPU)을 장착한 Radeon 8060S 통합 GPU가 있습니다. 아마도 가장 인상적인 특징은 경쟁업체들 사이에서 일반적인 32GB를 훨씬 능가하는 실질적인 128GB의 통합 메모리일 것입니다. Variable Graphics Memory 기술을 통해 사용자는 최대 96GB의 VRAM을 할당할 수 있어 대규모 AI 모델 운영에 대한 광범위한 지원을 제공합니다. 대조적으로, RTX 5080은 16GB의 VRAM에 불과하며, RTX 5090은 32GB에 불과하여 Strix Halo는 메모리 사용량이 많은 작업에서 뛰어난 이점을 가집니다.

AI 성능 평가에서 Ryzen AI MAX+ 395는 놀라운 성능을 보여주었습니다. 일반 사용자가 최신 언어 모델을 로컬로 실행할 수 있도록 llama.cpp가 지원하는 응용 프로그램인 LM Studio를 예로 들어, Strix Halo의 128GB 메모리 풀은 모델 크기가 16GB VRAM 한계를 초과할 때 RTX 5080보다 최대 3.05배 높은 성능을 제공합니다. RTX 5090과 비교할 때에도, 더 많은 컴퓨팅 성능을 가지고 있음에도 불구하고 훨씬 더 많은 전력을 소비합니다: 5080과 5090은 각각 360W와 575W가 필요하지만, Strix Halo는 45W와 120W 사이에서 운영됩니다.

Neural Processing Performance

특히 AI 워크로드에서는 이 APU가 경쟁 업체를 능가합니다. 인텔 아크 140V와 비교하면 토큰 처리량이 2.2배 증가합니다. Llama 3.2 3b Instruct와 같은 소형 모델에서는 첫 번째 토큰 생성 속도가 4배 빨라지고, 7 - 8B 매개변수 모델에서는 9.1배 빨라지며, 14B 모델에서는 Intel Core Ultra 258V보다 12.2배 빨라집니다. IBM Granite 3.2 Vision 3b는 최대 7배 빨라지고, Google Gemma 3 4b와 12b는 각각 4.6배와 6배 빨라집니다. 또한 Strix Halo는 Google Gemma 3 27B Vision과 같은 대형 모델을 쉽게 처리할 수 있으며, 이는 다른 많은 APU에게도 어려운 일입니다.

AI 기능 외에도 Strix Halo의 게임 성능도 칭찬할 만합니다. Radeon 8060S 내장형 GPU는 3DMark Time Spy 테스트에서 NVIDIA RTX 4070 Mobile Edition의 성능에 근접하여 Cyberpunk 2077 및 Stars Hollow 같은 게임에서는 최고 1600p 화질 설정에서 39.4fps와 36.8fps를 달성하여 RTX 4070의 37.3fps와 34.7fps를 약간 능가했습니다.

Gaming Performance

AMD는 이 APU를 NVIDIA와 Intel의 하이엔드 제품과 경쟁할 수 있도록 포지셔닝하고 있습니다. CES 2025에서 AMD는 RTX 4090보다 2.2배 높은 AI 성능을 자랑하며 전력의 13%만 활용하여 인상적인 효율성을 자랑했습니다. Apple M4 Pro와 비교하면 Cinebench 2024 멀티 코어 테스트에서 점수가 근접했으며 (1669 대 1715) V-Ray 렌더링에서는 86% 앞서 있었습니다. 인텔의 최신 Lunar Lake 프로세서인 Core Ultra 9 288V와 비교하여 Strix Halo는 평균 1.4배 향상된 3DMark 그래픽 성능과 2.6배 빠른 렌더링 결과를 제공합니다.

하드웨어 설계 측면에서 Strix Halo의 441 평방 밀리미터의 칩 영역은 강력한 컴퓨팅 기능과 혁신적인 메모리 아키텍처를 호스팅합니다. 통합 메모리 기술은 CPU와 GPU 메모리 간의 전통적인 분리를 제거하여 최대 273 GB/s의 데이터 전송 속도를 제공하여 AI 및 그래픽 처리 지원을 최적화합니다. 이 아키텍처는 RTX 4090을 능가하는 70B 매개변수를 가진 Llama 모델을 운영하는 것과 같은 상당한 VRAM을 필요로 하는 로컬 AI 작업에 특히 적합합니다.

현재 Strix Halo는 ASUS ROG Flow Z13 및 HP ZBook Ultra 14 G1a 같은 고급 얇고 가벼운 노트북과 GMKtec의 EVO-X2 미니 PC를 포함한 여러 장치에 탑재되어 있으며, 개별 그래픽 카드가 필요하지 않음에도 불구하고 특히 복잡한 작업에 대한 휴대성과 성능에 대한 잠재력을 과시합니다. 이 APU가 구동되는 더 많은 장치는 2025년 2분기에 시장에 진출할 것으로 예상됩니다.

Ryzen AI MAX+ 395 "Strix Halo"는 우수한 AI 성능, 강력한 내장형 그래픽 및 혁신적인 메모리 디자인을 통해 고급 APU 표준을 재정의합니다. 이를 통해 기술 애호가들은 복잡한 모델을 로컬로 실행할 수 있으며, 게임 및 전문 애플리케이션에서 얇고 가벼운 장치에 대한 새로운 지평을 열 수 있습니다. 더 많은 테스트 데이터와 실제 애플리케이션 시나리오가 등장함에 따라 이 프로세서는 2025년 기술 환경의 초점이 될 것입니다.

관련 뉴스

© 2025 - TopCPU.net