Las GPU Blackwell de NVIDIA son reconocidas por su robustez. Más allá de los datos promocionales oficiales, ahora disponemos de un primer vistazo a los resultados de pruebas reales proporcionados por MLCommons MLPerf v4.1, la plataforma líder para evaluar el rendimiento en entrenamiento e inferencia de inteligencia artificial.
La comparación abarca dos generaciones de servidores: el HGX B200 y el HGX H200. El primero cuenta con hasta ocho GPU Blackwell B200, cada una con un consumo energético de hasta 1000 vatios.
Los benchmarks de preentrenamiento GPT-3 muestran que las GPU Blackwell han duplicado su rendimiento en comparación con la generación anterior, conocida como Hopper.
En las tareas de ajuste fino de Llama 2, que cuenta con 70 mil millones de parámetros, Blackwell exhibe una mejora de hasta 2,2 veces en su rendimiento.
Destaca, además, que la plataforma Blackwell integra los ConnectX-7 SuperNICs, conmutadores Quantum-2 InfiniBand y el bus de interconexión NVLink de quinta generación. Estas características aseguran una comunicación sólida entre nodos, permitiendo una distribución equilibrada de las cargas de entrenamiento de inteligencia artificial y optimizando la eficiencia general.
Por ejemplo, para obtener el mismo rendimiento con los 175 mil millones de parámetros de GPT-3, se requieren 256 GPU de la generación Hopper, mientras que Blackwell logra esto únicamente con 64 GPU.