Oracle ha anunciado la disponibilidad de varios clústeres de computación GPU diseñados para ofrecer servicios de entrenamiento de IA a través de su infraestructura cloud. El clúster más potente cuenta con más de 100,000 GPUs NVIDIA Blackwell, marcando un hito en la capacidad de procesamiento.
Este clúster utiliza un total de hasta 131,072 GPUs de acelerador B200, alcanzando un rendimiento máximo de punto flotante e integer FP8 de hasta 2.4 ZFlops, equivalente a 24 billones de operaciones por segundo.
Los nodos base están equipados con recintos refrigerados por líquido NVIDIA GB200 NVL72, cada uno albergando 72 GPUs de acelerador. Estos recintos están interconectados mediante un bus de ancho de banda NVLink de 129.6 TB/s.
A pesar del impresionante número de GPUs y el rendimiento máximo, esta configuración aún no ha alcanzado el nivel de Mask. Sin embargo, sigue siendo un anuncio emocionante, ya que Oracle afirma que NVIDIA entregará GPUs Blackwell en grandes cantidades durante el primer semestre del próximo año. Todavía no hay una fecha de lanzamiento específica.
Un segundo clúster está equipado con 16,384 GPUs NVIDIA H100, logrando un rendimiento máximo FP8/INT8 de 65 PFlops (650 billones de operaciones por segundo) y un ancho de banda total de 13 Pbps.
El tercer clúster cuenta con 65,536 GPUs NVIDIA H200, proporcionando un rendimiento máximo FP8/INT8 de 260 EFLOPs (2.6 billones de operaciones por segundo) y un ancho de banda total de 52 Pbps. Se espera que este grupo esté operativo a finales de este año.
Organizaciones como WideLabs y Zoom ya han comenzado a adoptar los nuevos servicios de clúster de Oracle.