AMD dividirá a série MI400 em duas no próximo ano

kyojuro sexta-feira, 16 de maio de 2025

De acordo com relatos da mídia estrangeira, a AMD está planejando lançar sua próxima geração de aceleradores da série Instinct MI400 na segunda metade de 2026, com dois modelos distintos: o MI450X projetado para inteligência artificial (IA) e o MI430X adaptado para computação de alto desempenho (HPC).

MI400 Series

A série MI400 é construída na mais recente arquitetura CDNA Next da AMD. Em contraste com a série MI300, que é adequada tanto para IA quanto para HPC, mas limita o desempenho máximo devido ao seu design de propósito geral, a série MI400 aborda isso fornecendo soluções especializadas. O MI450X é otimizado para funcionalidades de IA, concentrando-se em formatos de computação de menor precisão, como FP4, FP8 e BF16, e exclui a lógica FP32 e FP64. Por outro lado, o MI430X aprimora as tarefas de HPC, suportando cálculos de alta precisão FP32 e FP64, ao mesmo tempo em que remove funcionalidades de IA de menor precisão. Essa arquitetura direcionada permite que o MI450X e o MI430X se destaquem em seus respectivos domínios, incluindo treinamento de IA, inferência e cálculos científicos.

Quanto às especificações técnicas, espera-se que a série MI400 mantenha os pontos fortes da AMD em capacidade de memória e largura de banda. Olhando para a série MI300, o MI300X inclui 192GB de memória HBM3 com largura de banda de 5,3 TB/s, com o MI325X atualizado para 256GB de HBM3E e largura de banda de 6 TB/s. A série MI400 pode adotar o HBM3E ou HBM4, alcançando até 288 GB de memória e larguras de banda ainda mais altas, acomodando modelos de IA em larga escala e aplicações de HPC. O MI300X atinge um pico teórico de 2.614,9 TFLOPS em precisão FP8, e a série MI400 é esperada para melhorar significativamente isso com atualizações de arquitetura e melhorias de processo, como a mudança para um processo de 3nm.

Technical Specifications

Uma característica destacada da série MI400 é a incorporação da tecnologia de interconexão UALink. Esta solução de interconexão de GPU de alto desempenho e escalável, desenvolvida pela AMD em colaboração com a Intel, Microsoft e outros, competirá diretamente com o NVLink da Nvidia. O UALink suporta transferências de dados de alta largura de banda e baixa latência, aptos para a construção de clusters de IA e HPC extensivos. No entanto, a sua comercialização enfrenta obstáculos, pois é improvável que fornecedores externos como Astera Labs e Enfabrica forneçam silício de comutação maduro antes de 2026. Assim, o uso da série MI400 de UALink pode ser inicialmente restringido a pequenas topologias de malha ou anel devido à dependência da AMD em parceiros para switches UALink, o que introduz incertezas de implantação. Enquanto isso, as soluções de rede mais desenvolvidas do Ultra Ethernet Consortium podem oferecer opções alternativas de escala.

Interconnection Technology

Além do UALink, a série MI400 continuará a suportar a tecnologia Infinity Fabric da AMD, que garante comunicações inter-chip de alta capacidade e baixa latência. A AMD planeja introduzir soluções de nível de sistema baseadas em Infinity Fabric, como o MI450X IF64 e o MI450X IF128, que suportam 64 e 128 GPUs, respectivamente, em configurações em cluster. Essas configurações se conectam via Ethernet, enfrentando as ofertas de nível de rack da Nvidia, como o VR200 NVL144. O Infinity Fabric já provou ser benéfico na série MI300, com as APUs MI300A alcançando até 5,3 TB/s de largura de banda através de uma estrutura de memória unificada CPU-GPU, uma capacidade que deve ser refinada na série MI400.

O design do MI400 também reflete a inovação contínua da AMD na arquitetura modular. As informações recentes revelam que o MI400 apresentará um design de chiplet com duas matrizes de interpolador ativo (AID), cada uma com quatro matrizes de computação acelerada (XCD), totalizando oito XCDs - uma expansão dos dois XCDs da série MI300 por AID. Além disso, a introdução da Multimedia IO Die (MID) visa aumentar o rendimento de dados e a eficiência do processamento, não só melhorando o desempenho, mas também minimizando as despesas de fabricação, ao mesmo tempo em que aumenta a adaptabilidade do produto.

Posicionado no mercado para competir diretamente com as arquiteturas Hopper e Blackwell da Nvidia, a série MI400 visa aumentos precisos de desempenho através de otimização de IA de baixa precisão e suporte de HPC de alta precisão. Com a GPU H100 da NVIDIA oferecendo um pico de 1978,9 TFLOPS no FP8, a MI325X da AMD já superou esse desempenho. Além disso, a plataforma de software ROCm da AMD suporta a série MI400. A versão mais recente do ROCm 6.2 melhora as eficiências de inferência e treinamento 2,4x e 1,8x, respectivamente, e incorpora recursos-chave de IA, como FP8 e Flash Attention 3, mantendo a competitividade do ecossistema de software da série MI400.

Modular Design

No entanto, os desafios persistem para a série MI400. Além das restrições da UALink, a influência da marca AMD em IA está atrás da Nvidia, que se beneficia de um ecossistema CUDA enraizado e presença no mercado precoce. A AMD procura atrair usuários através de sua plataforma ROCm aberta e propostas de preço/desempenho superiores. Além disso, o mercado de IA e HPC em rápida evolução exige a iteração consistente e o rápido desenvolvimento da AMD. Relatórios sugerem que a série MI350 (construída sobre a arquitetura CDNA 4) está definida para lançamento em meados de 2025, oferecendo formatos FP4 e FP6, e potencialmente oferecendo desempenho FP16 de até 2,3 PFLOPS.

À medida que os mercados de IA e HPC continuam a aumentar em demanda, modelos como AI Generative (por exemplo, Llama 3.1 70B) exigem maior memória e poder de computação, enquanto que os aplicativos de HPC exigem computação precisa e suporte em larga escala. A série MI400 da AMD atende a esses desafios através de uma estratégia de diferenciação e especialização. Ao mesmo tempo, os avanços nos padrões de interconexão abertos, como UALink e Ultra Ethernet, abrem o caminho para arquiteturas mais flexíveis e escaláveis, preparadas para beneficiar empresas como a AMD de forma significativa.

A série MI400 da AMD Instinct demonstra suas habilidades em IA e HPC através de designs personalizados, interconexões de ponta e arquiteturas modulares. Com o lançamento iminente do MI450X e MI430X, os usuários podem antecipar soluções especializadas, ainda mais fortalecidas pela incorporação do Infinity Fabric e UALink, que reforçam o seu potencial de implantação de clustering. Apesar dos obstáculos na tecnologia de interconexão e da rivalidade de mercado, o modelo inovador da série MI400 e a estratégia de iteração proativa da AMD colocam-a no caminho de se tornar uma presença formidável no panorama das GPUs de data center até 2026.

Notícias relacionadas

© 2025 - TopCPU.net