
Intel a récemment révélé une initiative audacieuse lors de l'OCP Global Summit 2025 en présentant une solution de serveur en rack hybride intégrant leur puce Gaudi 3 AI avec les GPU Blackwell de NVIDIA. Ceci marque un changement stratégique notable pour Intel, qui adopte désormais une démarche plus collaborative sur le marché matériel de l'IA plutôt qu'une approche solitaire.
Le tout nouveau système, nommé Gaudi 3 Rack Scale Solution, est conçu pour être monté en rack, comportant plusieurs cadres dédiés au calcul et à la commutation. Chaque cadre comprend deux processeurs Xeon, quatre accélérateurs Gaudi 3, quatre cartes réseau NVIDIA ConnectX-7 400GbE, et un processeur BlueField-3. À l'intérieur du rack, 16 cadres de calcul sont intégralement interconnectés, délivrant jusqu'à 51,2 Tb/s de capacité réseau via les commutateurs Broadcom Tomahawk 5. Cette architecture offre une large bande passante, une latence réduite et une évolutivité horizontale axée sur l'Ethernet, offrant une infrastructure robuste, idéale pour les opérations d'inférence IA.
Ce système ne se limite pas à l'écosystème Intel : il s'intègre harmonieusement avec les GPU Blackwell B200 de NVIDIA. En adoptant une approche d'inférence décomposée pour les modèles d'IA, Blackwell gère la phase "prefill", intensive en calculs, tandis que Gaudi 3 s'occupe de l'étape "decode", moins intensive mais sensible à la latence. Cette répartition permet aux deux architectures de jouer de leurs atouts respectifs : l'exceptionnelle capacité de calcul matriciel de Blackwell et l'efficacité de Gaudi 3 pour les demandes d'inférence hautement concurrentes, grâce à sa supériorité en terme de bande passante mémoire et à ses capacités de communication Ethernet. SemiAnalysis rapporte que les performances de ces racks compacts et à haute densité surpassent d'environ 1,7 fois celles des configurations utilisant uniquement des GPU B200.

D'une perspective stratégique, dans un marché de l'informatique IA où NVIDIA est déjà prédominant, la plateforme Gaudi seule dispose de peu d'atouts pour rivaliser. En s'alliant au niveau du rack avec la plateforme Blackwell, Intel capitalise sur l'écosystème logiciel développé de NVIDIA, incluant CUDA et NVLink, élargissant ainsi la portée de ses solutions matérielles. Ce partenariat, bien que discret, montre l'approche pragmatique d'Intel : optimiser les réseaux ouverts et les connexions Ethernet pour renforcer son influence dans l'écosystème IA.
Néanmoins, des défis subsistent. La pile logicielle et les outils de développement de la plateforme Gaudi ne sont pas encore aussi aboutis que ceux de CUDA, nécessitant donc des efforts d'ingénierie substantiels pour une application pratique. De plus, avec le Gaudi 3 fabriqué sur un procédé de 5 nm et imaginé en tant que produit transitoire, la feuille de route d'Intel prévoit une transition vers une nouvelle architecture l'année prochaine. Des experts suggèrent que cette solution de rack hybride pourrait surtout servir de "vitrine stratégique" illustrant la capacité d'Intel à fournir des solutions matérielles adaptables dans l'IA plutôt qu'à court-circuiter la concurrence au niveau des puces.

Pour NVIDIA, ce partenariat présente des avantages conséquents, car la conception du Gaudi 3 Rack Scale intègre de nombreux composants de réseau et de communication de NVIDIA tels que les cartes ConnectX et les processeurs BlueField, consolidant la suprématie de NVIDIA dans les technologies de réseau haut débit et de clusters hétérogènes. Pour Intel, cette synergie devrait stimuler la distribution de produits Gaudi et mettre en avant l'interopérabilité des Xeon avec des accélérateurs IA dans des déploiements multi-nœuds.
Alors que le secteur du matériel IA évolue rapidement, ce modèle de "collaboration inter-camps" pourrait ouvrir la voie à une nouvelle tendance. Plutôt qu'une domination par une seule entité, les prochains centres de données pourraient être composés de clusters de calcul hautement performants regroupant des architectures diversifiées. Pour Intel, le Gaudi 3 Rack Scale représente non seulement une expérimentation produit mais aussi un mouvement stratégique visant à s'inscrire de manière durable dans le paysage de l'infrastructure IA. Cette stratégie marque une transition d'une compétition solitaire vers une intégration et optimisation systémiques.