NVIDIA svela la roadmap fino al 2030

kyojuro mercoledì 19 marzo 2025

Durante il GTC 2025, NVIDIA ha presentato la sua pianificazione future dei prodotti, rivelando che la GPU che seguirà Blackwell e Rubin si chiama Feynman. Questa GPU all'avanguardia, che debutterà nel 2028, introdurrà una nuova generazione di memoria a elevata larghezza di banda (HBM), rafforzando ulteriormente gli sforzi nel campo dell'intelligenza artificiale e dell'elaborazione ad alte prestazioni. Denominata in onore di Richard Feynman, celebre fisico teorico statunitense noto per i suoi significativi contributi alla meccanica quantistica, elettrodinamica quantistica e fisica delle particelle, la scelta del nome perpetua la tradizione di NVIDIA di omaggiare illustri figure scientifiche.

Un aspetto distintivo di Feynman è rappresentato dalla sua tecnologia di memoria. Sebbene i dettagli specifici siano ancora riservati, NVIDIA ha confermato che utilizzerà la memoria HBM di prossima generazione, potenzialmente HBM4e o HBM5. Nota per l'elevata larghezza di banda e l'efficienza energetica, HBM è l'ideale per l'addestramento e l'inferenza nell'IA. Lo standard HBM4 punta a raddoppiare i canali per stack rispetto a HBM3, con un aumento previsto della larghezza di banda fino a 6,4 Gbps o più. Come potenziale successore, HBM5 potrebbe superare i limiti di prestazione, fornendo un robusto supporto a Feynman. Questo miglioramento nella memoria aumenterà il throughput dei dati e aiuterà le GPU a gestire compiti computazionali sempre più complessi.

A completare Feynman ci sarà la CPU Vera, già introdotta con le piattaforme Rubin e Rubin Ultra. La CPU Vera si contraddistingue per un'architettura ARM personalizzata a 88 core che supporta 176 thread, oltre a una connessione GPU ad alta velocità da 1.8 TB/s tramite l'interfaccia NVLink. Questo co-design CPU-GPU ottimizza i carichi di lavoro dell'IA, migliorando l'efficienza computazionale. NVIDIA prevede di integrare all'interno di Feynman l'ottava generazione di tecnologia di rete NVSwitch NVL-Next insieme ai componenti di rete Spectrum7 e CX10. Spectrum7 offre 204 T di throughput tramite la tecnologia CPO (co-packaged Optical), mentre CX10 migliora l'interconnettività dei data center. Questi progressi, previsti per il rilascio con Feynman entro la fine del 2028, promettono di proiettare ulteriormente NVIDIA nella sfera dei data center.

Considerando la recente traiettoria tecnologica di NVIDIA, la presentazione di Feynman non sorprende. Dall'introduzione delle GPU Blackwell nel 2024, NVIDIA ha mantenuto una cadenza di aggiornamenti annuale costante. Entro la fine del 2025, Blackwell Ultra promette 288 GB di memoria HBM3e e 15 petaflop di prestazioni di calcolo FP4. Nel 2026, la piattaforma Vera Rubin offrirà memoria HBM4, fornendo 50 petaflop di inferenza per chip; e entro il 2027, Rubin Ultra espanderà ulteriormente a 1 TB di memoria HBM4e e 15 exaflop di prestazioni di inferenza su un singolo rack. Feynman, continuando questa sequenza, erediterà e supererà le tecnologie dei suoi predecessori, puntando al mercato dell'IA e dell'HPC nel 2028.

Sebbene le specifiche precise di Feynman non siano ancora state rilasciate, i suoi predecessori offrono alcune indicazioni. Ad esempio, Rubin Ultra è equipaggiato con un design GPU di dimensioni 4 reticle accoppiato a 12 stack di memoria HBM4e, offrendo una larghezza di banda totale di 13 TB/s. Feynman potrebbe adottare un approccio simile nel packaging multi-chip o potenziare ulteriormente per soddisfare le esigenze crescenti dei modelli di IA. Inoltre, l'investimento strategico di NVIDIA nelle tecnologie avanzate di packaging non deve essere sottovalutato. Feynman potrebbe sfruttare il processo a 3 nm di TSMC, combinato con il packaging CoWoS-L, per una maggiore densità di transistor ed efficienza energetica.

Oltre all'hardware, il lancio di Feynman beneficerà dell'ecosistema software robusto di NVIDIA. La piattaforma CUDA e i NVIDIA Inference Microservices (NIM) continueranno a ottimizzare i processi di sviluppo dell'IA, assicurando un'esperienza massimizzata delle prestazioni hardware. Entro il 2024, le GPU di NVIDIA deterranno quasi il 90% della quota di mercato globale nei data center, e l'arrivo di Feynman consoliderà indubbiamente questa posizione di leadership, specialmente con l'IA generativa e la robotica in rapida evoluzione.

È significativo notare che Feynman non rappresenta la tappa finale della roadmap. NVIDIA ha previsto un successivo Feynman Ultra, il cui debutto potrebbe avvenire intorno al 2030, in grado di ampliare ulteriormente il divario rispetto ai competitor. Attualmente, la serie Instinct MI di AMD e i processori Gaudi di Intel stanno guadagnando terreno nel settore dell'IA, ma NVIDIA rimane all'avanguardia grazie alla sua vision tecnologica lungimirante e all'integrazione ecologica.

Da Blackwell a Feynman, ogni passo del percorso di NVIDIA è stato saldamente focalizzato sulle esigenze fondamentali dell'IA nel computing. Feynman non simboleggia solo l'evoluzione dell'hardware, ma anticipa anche i futuri paradigmi di calcolo. L'anno 2028 promette di portare sviluppi entusiasmanti per gli appassionati di tecnologia con l'introduzione di questa GPU, proiettando il settore verso nuove vette.

Notizie correlate

© 2025 - TopCPU.net