AMD dividirá la serie MI400 en dos el próximo año

kyojuro viernes, 16 de mayo de 2025

Según informan medios internacionales, AMD lanzará sus aceleradores de la serie Instinct MI400 de próxima generación en la segunda mitad de 2026, presentando dos modelos: el MI450X diseñado específicamente para inteligencia artificial (IA) y el MI430X para computación de alto rendimiento (HPC).

AMD MI400 Series

La serie MI400 se construye sobre la avanzada arquitectura CDNA Next de AMD. En contraste con la serie MI300, que cubre tanto IA como HPC pero limita el rendimiento máximo debido a su diseño generalista, la serie MI400 ofrece soluciones especializadas. El MI450X se optimiza para operaciones de IA, enfocándose en formatos de cómputo de menor precisión como FP4, FP8 y BF16, omitiendo los cálculos en FP32 y FP64. Por otro lado, el MI430X mejora las tareas de HPC al soportar cálculos de alta precisión en FP32 y FP64, eliminando las funcionalidades de menor precisión de la IA. Esta arquitectura específica permite que el MI450X y el MI430X sobresalgan en sus respectivos campos, abarcando desde el entrenamiento y la inferencia de IA hasta cálculos científicos.

En cuestiones técnicas, se espera que la serie MI400 conserve las fortalezas de AMD en capacidad de memoria y ancho de banda. Observando la serie MI300, el MI300X incluye 192 GB de memoria HBM3 con un ancho de banda de 5,3 TB/s, mientras que el MI325X se mejora a 256 GB de HBM3E y un ancho de banda de 6 TB/s. La serie MI400 podría integrar HBM3E o HBM4, alcanzando hasta 288 GB de memoria y un mayor ancho de banda, adecuándose para modelos IA de gran escala y aplicaciones HPC. El MI300X alcanza un pico teórico de 2614,9 TFLOPS en precisión FP8, y se anticipa que la serie MI400 superará significativamente esta cifra mediante avances arquitectónicos y mejoras de proceso, como la transición a un proceso de 3 nm.

Technology Enhancement

Una característica destacada de la serie MI400 es la incorporación de la tecnología de interconexión UALink. Esta solución de interconexión GPU escalable, desarrollada por AMD junto con Intel, Microsoft y otros, compite directamente con NVLink de Nvidia. UALink soporta transferencias de datos de alta velocidad y baja latencia, ideal para construir extensos clústeres de IA y HPC. No obstante, enfrenta desafíos comerciales debido a que es improbable que proveedores externos como Astera Labs y Enfabrica ofrezcan silicio de conmutación maduro antes de 2026. Así, el uso de UALink en la serie MI400 puede inicialmente limitarse a topologías pequeñas de malla o anillo debido a la dependencia de AMD en socios para conmutadores UALink, introduciendo ciertas incertidumbres en su despliegue. Mientras tanto, las soluciones más maduras del Consorcio Ultra Ethernet podrían ofrecer alternativas para escalar.

Network Solutions

Además de UALink, la serie MI400 seguirá apoyándose en la tecnología Infinity Fabric de AMD, que asegura comunicaciones de alto rendimiento y baja latencia entre chips. AMD planea introducir soluciones a nivel de sistema basadas en Infinity Fabric, como MI450X IF64 y MI450X IF128, soportando 64 y 128 GPUs respectivamente, en configuraciones agrupadas. Estas configuraciones se conectarán mediante Ethernet, enfrentándose a las propuestas de Nvidia a nivel de rack, como el VR200 NVL144. Infinity Fabric ya ha demostrado ser beneficioso en la serie MI300, con las APU MI300A alcanzando hasta 5,3 TB/s de ancho de banda a través de una memoria unificada CPU-GPU, una capacidad que se espera mejorar aún más en la serie MI400.

El diseño del MI400 también refleja la constante innovación de AMD en arquitectura modular. Se ha revelado que el MI400 contará con un diseño de chiplet con dos matrices de interposador activo (AID), cada una albergando cuatro matrices de computación acelerada (XCD), sumando un total de ocho XCD, una expansión respecto a los dos XCD por AID de la serie MI300. Además, la inclusión de Multimedia IO Die (MID) busca incrementar el rendimiento de datos y la eficiencia del procesamiento, mejorando el rendimiento y disminuyendo los costos de fabricación al aumentar la adaptabilidad del producto.

Posicionado para competir directamente con las arquitecturas Hopper y Blackwell de Nvidia, la serie MI400 apunta a incrementos de rendimiento a través de la optimización de IA de baja precisión y soporte a HPC de alta precisión. Con la GPU H100 de NVIDIA alcanzando un máximo de 1978,9 TFLOPS en FP8, el MI325X de AMD ya ha superado este rendimiento. Además, la plataforma de software ROCm de AMD será compatible con la serie MI400. La última versión ROCm 6.2 mejora la eficiencia de la inferencia y el entrenamiento 2,4x y 1,8x respectivamente, e incluye características clave de IA como FP8 y Flash Attention 3, manteniendo la competitividad del ecosistema de software de la serie MI400.

Competitive Landscape

Sin embargo, la serie MI400 enfrenta desafíos. Además de las limitaciones de UALink, AMD se encuentra detrás de Nvidia en términos de presencia de marca en IA, dado el arraigado ecosistema CUDA de Nvidia y su presencia anticipada en el mercado. AMD busca atraer usuarios con su plataforma ROCm abierta y sus propuestas de precio/rendimiento apetecibles. Asimismo, el rápido desarrollo del mercado de IA y HPC demanda de AMD una rápida iteración y desarrollo. Informes señalan que la serie MI350 (basada en la arquitectura CDNA 4) está planeada para lanzarse a mediados de 2025, ofreciendo formatos FP4 y FP6, y potencialmente un rendimiento FP16 de hasta 2,3 PFLOPS.

Con el aumento continuo de la demanda en los mercados de IA y HPC, modelos como el AI Generative (ejemplo: Llama 3.1 70B) requieren una mayor memoria y capacidad de computación, mientras que las aplicaciones de HPC demandan cálculos precisos y soporte de gran escala. La serie MI400 de AMD enfrenta estos desafíos mediante una estrategia de diferenciación y especialización. Simultáneamente, los avances en estándares abiertos de interconexión como UALink y Ultra Ethernet están despejando el camino para arquitecturas más flexibles y escalables, beneficiando a empresas como AMD.

La serie MI400 de AMD Instinct muestra su potencial en IA y HPC mediante diseños personalizados, interconexiones vanguardistas y arquitecturas modulares. Con el próximo lanzamiento de MI450X y MI430X, los usuarios pueden anticipar soluciones especializadas, complementadas con Infinity Fabric y UALink, mejorando su capacidad de despliegue en clúster. A pesar de los retos en tecnología de interconexión y competencia del mercado, el modelo innovador de la serie MI400 y la proactiva estrategia de iteración de AMD la encaminan a ser una presencia formidable en el entorno de GPU para centros de datos en 2026.

Noticias relacionadas

© 2025 - TopCPU.net