No GTC 2025, a NVIDIA apresentou sua visão para o futuro, revelando o roteiro para suas próximas gerações de GPUs. Após as gerações Blackwell e Rubin, surge a Feynman, planificada para estreia em 2028, que levará a computação de alta performance e inteligência artificial a novos patamares com o uso de uma nova geração de memória de alta largura de banda (HBM). Nomeada em homenagem ao físico teórico Richard Feynman, célebre por suas contribuições à mecânica quântica e física de partículas, a escolha do nome continua a tradição da NVIDIA de celebrar pioneiros da ciência.
Um dos destaques da Feynman é sua tecnologia de memória inovadora. Enquanto detalhes exatos estão em desenvolvimento, a NVIDIA confirmou o uso da próxima geração em HBM, como HBM4e ou até mesmo HBM5. Conhecido por sua alta largura de banda e eficiência energética, o HBM é excepcional para IA em treinamento e inferência. A nova versão HBM4 visa dobrar a contagem de canais por pilha em relação ao HBM3, com uma largura de banda que pode atingir ou superar 6.4 Gbps. Sendo um prospecto, o HBM5 representaria um salto em performance e eficiência, sendo crucial para as capacidades da Feynman, otimizando o fluxo e processamento de dados em tarefas computacionais complexas.
Complementando a Feynman, estará a CPU Vera, que já foi introduzida com as plataformas Rubin e Rubin Ultra. A CPU Vera conta com uma infraestrutura ARM personalizada de 88 núcleos, suportando 176 threads, acoplada a uma conexão GPU ultrarrápida de 1.8 TB/s via NVLink. Este co-desenho entre CPU e GPU aprimora a execução de cargas de trabalho de IA, sustentando uma alta eficiência computacional. A NVIDIA planeja, ainda, integrar a tecnologia de rede NVSwitch NVL-Next de 8ª geração na Feynman, junto com os componentes de rede Spectrum7 e CX10. O Spectrum7, aproveitando a tecnologia CPO (Optical co-packaged), proporciona transferência de 204T, enquanto o CX10 melhora a interconectividade nos data centers. Tais avanços, esperados para lançamento com Feynman até o final de 2028, prometem cimentar ainda mais a posição da NVIDIA no competitivo setor de data centers.
Quando observamos a trajetória recente da NVIDIA, a introdução da Feynman é um passo natural dentro de uma estratégia de inovação contínua. Desde a chegada das GPUs Blackwell em 2024, a NVIDIA mantem um ritmo consistente de lançamentos anuais. Até o final de 2025, espera-se que a Blackwell Ultra conte com 288 GB de memória HBM3e e 15 petaflops de capacidade computacional FP4. Em 2026, a plataforma Vera Rubin deve incorporar memória HBM4, oferecendo 50 petaflops de inferência por chip. Já em 2027, a Rubin Ultra planeja expandir até 1 TB de memória HBM4e, superando 15 exaflops de desempenho de inferência em um rack único. Feynman pretenderá não apenas sustentar tal progresso, mas amplificá-lo, focando nos mercados de IA e HPC ao se aproximar de 2028.
Embora detalhes técnicos da Feynman ainda estejam chegando, seus predecessores fornecem pistas valiosas. Por exemplo, o Rubin Ultra utiliza um design de 4 reticulas com 12 pilhas de memória HBM4e, atingindo uma largura de banda de 13 TB/s. A Feynman poderia adotar uma estrutura similar, maximizando seu potencial para enfrentar as necessidades do treinamento de modelos de IA emergentes. Adicionalmente, o investimento estratégico da NVIDIA em tecnologias de embalagem avançada é um diferencial não ignorável. O uso do processo de 3nm da TSMC com embalagens CoWoS-L é esperado, aprimorando densidade de transistores e eficiência energética.
Além do hardware, o lançamento da Feynman será amparado pelo fortalecido ecossistema de software da NVIDIA. A plataforma CUDA e serviços de micros referências de inferência da NVIDIA (NIM) permanecerão aprimorando processos de desenvolvimento de IA, assegurando máximo rendimento do hardware. Em 2024, a NVIDIA já comanda quase 90% do mercado global de data centers, e a chegada da Feynman só deve vir a fortificar essa liderança, particularmente à medida que a IA generativa e robótica rapidamente avançam.
Vale notar que Feynman não representa o fim do roadmap. A NVIDIA já insinuou sobre um potencial Feynman Ultra subsequente, possível de estrear em 2030, aprofundando ainda mais sua liderança de mercado frente à concorrência. Atualmente, a série Instinct MI da AMD e os processadores Gaudi da Intel ganham espaço na IA, mas a NVIDIA segura seu avanço, graças à sua visão tecnológica afiada e convergência ecológica.
De Blackwell a Feynman, cada passo na jornada da NVIDIA gira em torno da evolução na computação de IA. Feynman não apenas reflete o avanço de hardware, mas também aponta para novos paradigmas na computação que se anunciam no horizonte. O ano de 2028 promete trazer inovações dinâmicas para entusiastas tecnológicos com a chegada desta potente GPU, propulsionando a indústria a novas alturas.