A Oracle anunciou a disponibilidade de vários clusters computacionais GPU projetados para fornecer serviços de treinamento de IA através da infraestrutura de nuvem da Oracle, com o mais poderoso cluster contendo mais de 100.000 GPUs NVIDIA Blackwell.
Ele utiliza um total de 131.072.000 aceleradores B200 BPU, alcançando um desempenho de ponto flutuante PQ8 e desempenho inteiro INT8 de até 2,4 ZFlops, ou 24 trilhões de operações por segundo.
Os nós base são NVIDIA GB200 NVL72 com resfriamento líquido, cada um abrigando 72 placas aceleradoras GPU embutidas. Esses compartimentos estão interligados usando a largura de banda NVLink de 129,6 TB/s.
Apesar do impressionante número de placas aceleradoras e desempenho máximo, esta configuração ainda não supera o Mask. No entanto, é uma novidade empolgante, já que a Oracle afirma que a NVIDIA não entregará GPUs Blackwell em grandes quantidades até o primeiro semestre do próximo ano. Ainda não há uma data de lançamento específica para este grande cluster.
Um segundo cluster está equipado com 16.384 GPUs NVIDIA H100, ostentando um desempenho de pico FP8/INT8 de 65 PFlops (650 milhões de operações por segundo) e uma largura de banda total de 13 PB/s.
O terceiro cluster apresenta 65.536 GPUs NVIDIA H200, entregando um desempenho máximo FP8/INT8 de 260 EFlops (2,6 trilhões de operações por segundo) e uma largura de banda total de 52 PB/s. Espera-se que este grupo entre em operação no final deste ano.
Organizações como WideLabs e Zoom já começaram a adotar os novos serviços de clustering da Oracle.