Nvidia在GTC 2025(GPU技术大会)上带来AI运算领域的最新突破,CEO黄仁勋宣布了Blackwell Ultra、Vera Rubin及Feynman三大GPU架构,将于2025至2028年陆续登场,进一步提升AI训练与推理的性能。
首先登场的是Blackwell Ultra,预计在2025年下半年推出。这款GPU延续Blackwell架构的核心技术,提供与标准Blackwell相同的20 petaflops AI运算性能,但内存扩张至288GB(相较标准版的192GB),为大型AI模型运行提供更强的支持。这次改进将进一步提升Blackwell在AI推理、数据处理与高性能计算(HPC)领域的应用。
Vera Rubin是Nvidia下一代AI GPU,预计在2026年下半年问世。这款GPU采用Nvidia自家研发的Vera CPU,并集成双GPU设计,在AI训练与推理任务上带来显著提升。
相较于目前的Blackwell芯片,Vera Rubin在推理运算时性能可达50 petaflops,是Blackwell的2.5倍。此外,Vera CPU的性能也比现有的Grace Blackwell CPU提高两倍,展现Nvidia在CPU设计领域的野心。随着AI计算需求不断增长,Vera Rubin将成为Nvidia进军AI服务器市场的关键产品。
此外,Nvidia也计划在2027年下半年推出Rubin Ultra,这款GPU采用四GPU封装设计,推理性能最高可达100 petaflops,进一步强化AI运算能力。
Vera Rubin是此次发布会的重点产品。
Feynman是Nvidia未来的终极GPU架构,预计2028年推出,将接棒Vera Rubin系列。虽然黄仁勋尚未公布具体规格,但已确认Feynman也将搭载Vera CPU,显示Nvidia在AI计算架构上持续集成GPU与CPU,以提升AI训练与推理的效率。
随着Blackwell Ultra、Vera Rubin、Feynman三大架构的推出,Nvidia在AI超算领域的布局更加完整。从2025年的Blackwell Ultra,到2026年的Vera Rubin,乃至2028年的Feynman,每一代GPU都在内存、运算性能与CPU集成上带来重大突破。这些技术不仅推动AI模型的发展,也将深刻影响HPC、高速数据分析、云计算等领域,巩固Nvidia在AI芯片市场的霸主地位。