A nova APU Ryzen AI MAX + 395 "Strix Halo" da AMD atingiu mais de três vezes o desempenho da NVIDIA RTX 5080 no benchmark DeepSeek R1, marcando um avanço significativo no processamento de IA para laptops de consumo. Sua robusta configuração de hardware e o design inovador de memória destacam-se não só em cargas de trabalho de IA, mas também possibilitam novas experiências em dispositivos finos e leves de ponta.
A APU incorpora 16 núcleos de CPU de arquitetura Zen 5 e 32 threads, alcançando velocidades de até 5,1 GHz. Além disso, possui uma GPU integrada Radeon 8060S equipada com 40 unidades de computação RDNA 3.5 e uma Unidade de Processamento Neural XDNA 2 (NPU) que oferece 50 TOPS de potência computacional. Talvez sua característica mais impressionante seja a substancial memória unificada de 128 GB, superando em muito os 32 GB comuns entre os concorrentes. Com a tecnologia de memória gráfica variável, os usuários podem alocar até 96 GB como VRAM, oferecendo amplo suporte para operações de modelos de IA de grande porte. Em contraste, a RTX 5080 oferece apenas 16 GB de VRAM, enquanto a RTX 5090 oferece 32 GB, conferindo ao Strix Halo uma vantagem distintiva em tarefas pesadas de memória.
Durante as avaliações de desempenho de IA, o Ryzen AI MAX + 395 exibiu uma performance notável. Usando o LM Studio como exemplo - um aplicativo alimentado por llama.cpp que permite a usuários comuns executar localmente os modelos de linguagem mais recentes - a memória do Strix Halo de 128 GB oferece até 3,05 vezes mais desempenho que a RTX 5080 quando os tamanhos do modelo excedem o limite de 16 GB de VRAM. Mesmo comparado à RTX 5090, embora tenha maiores capacidades de computação, também consome significativamente mais energia: a 5080 e a 5090 requerem 360W e 575W, respectivamente, enquanto o Strix Halo opera entre 45W e 120W, sendo uma alternativa muito mais eficiente.
Especificamente em cargas de trabalho de IA, essa APU supera sua concorrência. Em comparação ao Intel Arc 140V, seu token de transferência é ampliado em 2,2 vezes. Em modelos pequenos, como o Llama 3.2 3b Instruct, a primeira geração de tokens é 4 vezes mais rápida; em modelos de parâmetros de 7-8B, a velocidade aumenta para 9,1 vezes; e para modelos de 14B, é 12,2 vezes mais rápida que o Intel Core Ultra 258V. Para os modelos de 14B, é 12,2 vezes mais rápido que o Intel Core Ultra 258V. Nos modelos de visão, o desempenho é igualmente forte: o IBM Granite 3.2 Vision 3b é até 7 vezes mais rápido, enquanto o Google Gemma 3 4b e 12b são 4,6 e 6 vezes mais rápidos, respectivamente. Além disso, o Strix Halo pode lidar facilmente com modelos grandes como o Google Gemma 3 27B Vision, um desafio para muitas outras APUs.
Além da capacidade de IA, o desempenho em jogos do Strix Halo também é notável. A GPU integrada Radeon 8060S aproxima-se do desempenho da NVIDIA RTX 4070 Mobile Edition nos testes 3DMark Time Spy, atingindo 39,4 fps e 36,8 fps em jogos como Cyberpunk 2077 e Stars Hollow na mais alta configuração de qualidade de imagem de 1600p, superando ligeiramente os 37,3 fps e 34,7 fps da RTX 4070. Embora fique ligeiramente atrás em certos jogos como Wild Dart 2, seu baixo consumo de energia e design integrado ainda o distinguem. Ao contrário das GPUs discretas tradicionais que exigem mais energia e refrigeração adicional, o Strix Halo alcança um equilíbrio entre desempenho e eficiência em um notebook leve.
A AMD está posicionando esta APU para desafiar as ofertas de alto nível da NVIDIA e Intel. Na CES 2025, a AMD afirmou que seu desempenho em IA é 2,2 vezes maior que o da RTX 4090, utilizando apenas 13% de sua potência, o que é impressionantemente eficiente. Comparado ao Apple M4 Pro, sua pontuação no teste multicore Cinebench 2024 foi próximo (1669 vs. 1715) e estava 86% à frente na renderização de V-Ray. Comparado ao mais recente processador Lunar Lake da Intel, o Core Ultra 9 288V, o Strix Halo tem desempenho gráfico 1,4 vezes melhor e resultados de renderização 2,6 vezes mais rápidos.
Em termos de design de hardware, a área de chip de 441 milímetros quadrados do Strix Halo abriga poderosas capacidades de computação e uma arquitetura de memória inovadora. Sua tecnologia de memória unificada elimina a separação tradicional entre a memória da CPU e da GPU, oferecendo velocidades de transferência de dados de até 273 GB/s, o que otimiza o suporte à IA e o processamento gráfico. Esta arquitetura é particularmente adequada para tarefas locais de IA que exigem VRAM substancial, como a operação de modelos Llama com parâmetros de 70B, essencial para superar a RTX 4090.
Atualmente, o Strix Halo está presente em vários dispositivos, incluindo laptops finos e leves de alta qualidade, como o ASUS ROG Flow Z13 e o HP ZBook Ultra 14 G1a, juntamente com o mini-PC EVO-X2 da GMKtec, mostrando seu potencial em portabilidade e desempenho, especialmente para tarefas complexas, sem necessitar de uma placa gráfica discreta. Espera-se que mais dispositivos movidos por esta APU entre no mercado no segundo trimestre de 2025.
O Ryzen AI MAX + 395 "Strix Halo" redefine os padrões de APU de alta qualidade com desempenho superior de IA, gráficos integrados potentes e um design de memória inovador. Ele permite que entusiastas de tecnologia executem modelos complexos localmente e abre novos horizontes para dispositivos finos e leves em aplicações de jogos e profissionais. À medida que mais dados de teste e cenários de aplicação do mundo real surgem, este processador será, sem dúvida, um ponto focal no cenário tecnológico de 2025.