Além de anunciar oficialmente o acelerador MI325X, a AMD revelou o primeiro produto de sua próxima série - a geração Instinct MI350: o Instinct MI355X. Algumas especificações e dados de desempenho foram divulgados. O MI355X estará disponível na segunda metade de 2025, que está a quase um ano de distância.
A série MI350 marcará a estreia do processo TSMC 3nm e da arquitetura CADN 4, juntamente com a introdução dos tipos de dados de ponto flutuante FP6 e FP4. Enquanto continua a ser combinada com a memória HBM3E, a capacidade agora eleva-se para um impressionante 288GB. Embora os números específicos de consumo de energia não tenham sido divulgados, o MI325X atinge 1000W. A AMD indica que o MI355X alinhar-se-á com as tendências da indústria (NVIDIA B200 1000W, GB200 1700W), sugerindo que ele excederá significativamente 1000W.
Os FP6 e FP4 são formatos flutuantes de dados de ponto representando 6-bit e 4-bit de precisão, respectivamente, reduzindo substancialmente a precisão em comparação com o FP16 e FP8, mas também reduzindo o volume de dados, tornando-os ideais para quantificar grandes modelos, particularmente em casos como modelos de linguagem grande e mistura de modelos de especialistas. Se a precisão não é uma prioridade e a velocidade é desejada, o FP6 e o FP4 se destacam neste contexto.
No MI355X, o FP6 e o FP4 apresentam um desempenho de 9,2 PFlops (92 trilhões de operações por segundo), com uma melhoria de 80% no desempenho do FP16 e FP8, atingindo 2,3 e 4,6 Flops respectivamente.
As GPUs Blackwell da Nvidia também introduzem precisão FP6 e FP4, mas superam com níveis de desempenho mais elevados em 20 PFlops e 40 PFlops, respectivamente.
A generosa alocação de até 288GB de memória HBM3E em um único cartão é inigualável, com uma largura de banda chegando a 8TB/s. Comparado com o MI325X, há respectivos aumentos de 1/8 e 1/3, enquanto ambas as métricas aumentaram 50% em relação ao MI300X atualmente disponível. Em contraste, o Blackwell B200 oferece apenas 192GB de HBM3E, mas corresponde à largura de banda de 8TB/s.
O MI355X suporta oito cartões em uma única plataforma, resultando em uma enorme capacidade combinada de 2,3TB de memória HBM3E, 64TB/s de largura de banda, e desempenho atingindo até 18,5 PFlops no FP16, 37 PFlops no FP8, e 74 PFlops no FP6/FP4. Esta melhoria também estará disponível na segunda metade do próximo ano.
A série da AMD Instinct tem mostrado um progresso notável em melhorias de desempenho, apresentando avanços inovadores de uma geração para a outra com impressionantes métricas comparativas. Ao comparar o MI355X com o MI300X, o desempenho do FP16 aumenta para 7,4 vezes mais, a capacidade de HBM é 1,5 vezes maior, e a capacidade de processar parâmetros de modelo salta de 714 bilhões para 4,2 trilhões, indicando um aumento de 6 vezes.
Olhando para o futuro, o ano 2026 irá testemunhar o lançamento da próxima série - Geração Instinct MI400, que deverá incorporar a futura arquitetura CADN (possivelmente CADN 5?), levando tanto as especificações como o desempenho a um novo pináculo.