NVIDIA fait face à un revers : les ventes de GB300 en deçà des attentes

kyojuro mardi 1 avril 2025

NVIDIA, un pilier de l'industrie de l'intelligence artificielle, se retrouve face à un ensemble de défis avec le lancement de son dernier produit. Présentés au GTC 2025, les serveurs GB300 AI ont généré un flot de critiques mitigées, particulièrement à propos des problèmes de la chaîne d'approvisionnement ainsi que les retours des clients. Cela survient malgré des attentes élevées concernant leurs améliorations en termes de performance. Ce nouveau serveur d'intelligence artificielle rencontre des difficultés qui reflètent les succès de ses précédesseurs, freinés par la complexité technique et une prédilection du marché pour des solutions déjà établies.

Image

Le modèle GB300 constitue une avancée par rapport à la série Blackwell, avec l'intégration du GPU B300. Cette carte particulièrement sophistiquée nécessite jusqu'à 1400 W, offrant 50 % de performances supplémentaires en calcul FP4 et une capacité mémoire étendue entre 192 Go et 288 Go, soutenue par une pile HBM3E de 12 couches. Les capacités de réseau sont également en progrès, passant de ConnectX - 7 à ConnectX - 8, et la bande passante des modules optiques est doublée, atteignant 1,6 Tbps. Ces évolutions visent à satisfaire l'appétit grandissant des applications d'inférence et d'apprentissage en IA, en particulier dans les domaines avant-gardistes tels que l'intelligence artificielle à base d'agents et la physique. Toutefois, un adage bien connu reste pertinent : « En vouloir trop d'un coup peut résulter en instabilité. » Malgré des avancées technologiques significatives, NVIDIA doit encore prouver que le marché acceptera ces nouveautés à large échelle.

En contraste, le modèle prédécesseur, le GB200, a rencontré aussi plusieurs obstacles. En 2024, NVIDIA n'a livré qu'environ 15 000 unités de leurs serveurs d'intelligence artificielle 200 GB, un chiffre en deçà des prestations passées de la série Hopper. Cette contre-performance est due en grande partie aux premiers pas tremblants du GB200 avec les rendements faibles des nouvelles technologies d'emballage utilisées par TSMC telles que CoWoS-L. Bien que cet obstacle ait été partiellement surmonté, les problèmes de déploiement restent persistants.

Les déploiements des racks serveurs NVL72 GB200 se sont révélés complexes, une installation unique pouvant prendre entre 5 et 7 jours et rencontrer régulièrement des problèmes de stabilités et de systèmes en panne. La conception en câblage cuivre par NVLink exige des installations spécifiques pour chaque cas, compliquant ainsi le raccordement d'environ 5 000 câbles, une complication exacerbée par la dépendance à l'égard des ingénieurs NVIDIA pour l'installation, laissant de nombreux fournisseurs de services cloud frustrés par les pannes de clusters, causant une dépendance significative vis-à-vis du support technique de NVIDIA.

Image

Les défis autour de la chaîne d'approvisionnement se font aussi sentir, puisque la production en masse des unités GB300, initialement planifiée pour la fin 2025, subit maintenant des retards. Les échantillons de test destinés aux clients ne sont attendus que vers la fin de l'année, et la production de masse pourrait être repoussée à 2026. Ce revers est la conséquence de complexités nouvelles, telles que la nécessité de solutions de refroidissement liquide et une augmentation des besoins énergétiques dans les conceptions puissantes. La consommation d'électricité prévue pour le GB300 menace les infrastructures des data centers par une consommation supérieure à 140 kW pour le rack NVL72 GB200, ce qui augmente le coût de production et rend nécessaire la mise à jour des centres de données existants pour intégrer les approches de refroidissement liquide.

Des géants comme Microsoft, Google et Amazon abordent maintenant la nouvelle génération GB300 avec prudence à cause de leurs expériences passées avec le GB200, dont les résultats ont été en deçà des attentes. À titre d'exemple, les essais réalisés par Microsoft avec le NVL72 GB200 ont révélé des besoins récurrents en débogage du matériel, perturbant l'organisation des centres de données. Ce mécontentement a conduit ces fournisseurs à favoriser des options plus stables de NVIDIA telle que la série HGX. L'architecture Hopper de la HGX H100 soutient une puissance allant de 60 kW à 80 kW par rack, répondant aux designs actuels de refroidissement par air et offrant une flexibilité supérieure par rapport au GB200 et GB300. En plus, le HGX B200, équipé de huit GPU B200, prend en charge NVLink à des vitesses pouvant atteindre 400 Gbps et est largement plébiscité par les plateformes d'IA adossées à l'architecture populaire x86, plébiscitée par les hyperscalers et les fournisseurs de solutions dans le cloud de petite à moyenne taille.

Les évolutions de la demande du marché confirment cette tendance. Alors que les commandes pour le GB300 n'atteignent pas les prévisions escomptées, les demandes pour des systèmes HGX se renforcent progressivement. Les analystes soulignent que le prix élevé du GB300 pourrait être un facteur de blocage potentiel, alors que le NVL72 GB200 pèse environ 3 millions de dollars par unité. Le coût augmenté du GB300, en raison notamment de ses besoins en refroidissement liquide et de ses performances optimisées, pourrait décourager des clients soucieux de leur budget, en particulier si un retour sur investissement rapide semble peu probable.

Image

Le paysage concurrentiel se transforme aussi avec des acteurs comme AMD et Intel qui gagnent en importance. L'Instinct MI300 d'AMD progresse grâce à un solide rapport qualité-prix et une plateforme open source, tandis que le Gaudi 3 d'Intel se distingue par des tâches spécifiques d'inférence. Bien que ces alternatives élargissent le choix pour les consommateurs, elles n'ont pas encore réussi à menacer sérieusement la position dominante de NVIDIA sur le marché.

Face à ces évolutions, NVIDIA reconsidère ses stratégies et envisage de lancer une variante Blackwell avec un seul GPU afin de réduire les délais de mise sur le marché. Reste à voir si ces mesures sauront reconquérir la confiance des clients, tandis que NVIDIA navigue entre l'innovation et les attentes du marché, cherchant à concilier l'efficacité de la chaîne d'approvisionnement avec les demandes de stabilité et d'accessibilité financière des clients. Bien que visiblement ambitieuse, NVIDIA se trouve sur un parcours truffé de défis, soulignant l'urgence d'une adaptation rapide aux dynamiques du marché et des opérations.

Actualités connexes

© 2025 - TopCPU.net