Intel collabora con NVIDIA per lanciare una piattaforma rack ibrida

kyojuro domenica 19 ottobre 2025

Intel ha recentemente presentato un'innovativa iniziativa all'OCP Global Summit 2025, svelando una soluzione server ibrida a livello di rack che unisce il suo chip Gaudi 3 AI con le GPU di architettura Blackwell di NVIDIA. Questo sviluppo rappresenta un cambiamento significativo nella strategia hardware di Intel per l'IA, passando da un approccio puramente competitivo a uno maggiormente collaborativo e integrato.

Immagine del sistema

Il nuovo sistema, noto come Gaudi 3 Rack Scale Solution, vanta un design montato su rack con diversi tray di computazione e commutazione. Ogni tray è equipaggiato con due processori Xeon, quattro acceleratori Gaudi 3, quattro schede di rete NVIDIA ConnectX-7 400GbE e una DPU BlueField-3. All'interno del rack, 16 tray di calcolo sono completamente interconnessi, fornendo fino a 51,2 Tb/s di capacità di rete tramite switch Broadcom Tomahawk 5. Questa architettura si distingue per un'elevata larghezza di banda, bassa latenza e scalabilità orizzontale centrata su Ethernet, offrendo un'infrastruttura robusta ideale per operazioni di inferenza AI.

Specificamente, questo sistema non è confinato solo all'ecosistema di Intel; è integrato perfettamente con le GPU Blackwell B200 di NVIDIA. Utilizzando una strategia di "inferenza decomposta" per l'esecuzione di modelli di intelligenza artificiale, Blackwell gestisce la fase "prefill" computazionalmente intensiva, mentre Gaudi 3 si occupa della fase "decode", che, sebbene meno impegnativa computazionalmente, è critica per la latenza. Questa ripartizione del lavoro consente a entrambe le architetture di capitalizzare i loro punti di forza: le straordinarie capacità di calcolo matriciale di Blackwell sono ottimizzate, mentre Gaudi 3 gestisce efficacemente richieste di inferenza altamente simultanee, grazie alla sua superiore larghezza di banda di memoria e alle funzionalità di comunicazione Ethernet. Secondo SemiAnalysis, le prestazioni prefill di questi rack compatti e ad alta densità risultano circa 1,7 volte superiori rispetto alle configurazioni che utilizzano solo GPU B200.

Immagine del dispositivo

Dal punto di vista strategico, in un mercato già dominato da NVIDIA nel calcolo dell'intelligenza artificiale, la piattaforma Gaudi da sola ha un margine di manovra competitivo limitato. Grazie all'integrazione a livello di rack con la piattaforma Blackwell, Intel sfrutta l'ecosistema software altamente sviluppato di NVIDIA, che include tecnologie CUDA e NVLink, estendendo così l'applicabilità delle sue soluzioni hardware. Questa partnership strategica, sebbene sottile, sottolinea l'approccio pragmatico di Intel: ottimizzare le architetture di rete aperte e le connessioni Ethernet per rafforzare la sua posizione nell'ecosistema accelerato dall'intelligenza artificiale.

Tuttavia, le sfide rimangono. Lo stack software e gli strumenti di sviluppo della piattaforma Gaudi non riescono ancora a competere con la maturità di CUDA, richiedendo sforzi significativi di ingegneria per applicazioni pratiche. Inoltre, Gaudi 3, costruito su un processo a 5 nm, è inteso come un prodotto di transizione, con la roadmap di Intel che prevede un passaggio a una nuova architettura nel prossimo anno. Gli analisti suggeriscono che questa soluzione rack ibrida potrebbe servire principalmente come una "strategia vetrina" progettata per dimostrare la capacità di Intel di offrire soluzioni adattabili a livello di sistema nel mercato dei server AI, non solo per colmare il divario con la concorrenza a livello di chip.

Immagine del prodotto

NVIDIA si prepara a trarre un vantaggio significativo da questa collaborazione, poiché il design Gaudi 3 Rack Scale integra numerosi componenti di rete e comunicazione NVIDIA, come la serie ConnectX NIC e le DPU BlueField, consolidando ulteriormente il dominio di NVIDIA nelle tecnologie di rete ad alta larghezza di banda e nei cluster eterogenei. Per Intel, questa sinergia dovrebbe aumentare le spedizioni dei prodotti Gaudi e dimostrare l'interoperabilità di Xeon con gli acceleratori di intelligenza artificiale in implementazioni multi-nodo.

Man mano che il settore dell'hardware IA evolve rapidamente, questo modello di "collaborazione cross-camp" potrebbe anticipare una nuova tendenza. Piuttosto che essere dominati da una singola entità, i futuri data center potrebbero essere composti da un cluster computazionale altamente efficiente, costituito da architetture diversificate. Per Intel, il Gaudi 3 Rack Scale non rappresenta solo un esperimento di prodotto, ma una mossa strategica per riposizionarsi all'interno del panorama dell'infrastruttura AI, passando da una competizione solitaria all'integrazione e ottimizzazione a livello di sistema.

Notizie correlate

© 2025 - TopCPU.net