在全球人工智能(AI)运算能力与效率需求急剧攀升的浪潮下,日前GPU大厂英伟达 (NVIDIA) 正式发布两项划时代创新技术,包括新一代专为大规模场景(context)处理设计的Rubin CPX GPU,以及将成为其系统关键基础的NVIDIA MGX PCIe Switch Board with ConnectX-8 SuperNICs。两者结合,预示着AI运算正迈向高性能、高效率与高扩展性的全新时代。

英伟达Rubin CPX GPU的核心使命,是突破AI系统在“长场景”推论上的瓶颈。随着AI模型逐渐庞大,处理数百万词元的需求愈加常见,无论是大型软件项目分析、长篇文件理解,或是一小时长度的视频生成,都对传统GPU构成挑战。Rubin CPX则以全新设计打破限制,能在单一芯片上集成视频解码器、编码器与长场景推论处理,提供前所未有的速度与性能。

对此,英伟达创办人暨首席执行官黄仁勋指出,Rubin CPX是首款专为大规模场景AI设计的CUDA GPU,与Vera Rubin CPU及Rubin GPU协同运行,组成Vera Rubin NVL144 CPX平台。单一机架下可提供高达8 exaflops的AI运算能力,性能是现有GB300 NVL72系统的7.5倍。而且,该系统同时配置100TB内存与每秒1.7PB带宽,让数据能以极高速流动,支撑严苛的AI工作负载。英伟达也提供Rubin CPX运算托盘,协助客户延伸既有Vera Rubin系统的投资效益。

在性能规格上,Rubin CPX采用NVFP4精度,算力达30 petaflops,并配备128GB GDDR7内存,能以极高能源效率处理大规模AI推论。与GB300 NVL72相比,Rubin CPX系统专注力提升3倍,使AI模型能处理更长的场景串行,维持高性能而不降速。

根据Facebook专页粉丝页“Richard只谈基本面-Richard's Research Blog”所发布的内容显示,Rubin CPX具备高度弹性,能与Quantum-X800 InfiniBand横向扩展架构或Spectrum-XGS以太网络平台相结合,搭配NVIDIA ConnectX-9 SuperNICs,满足不同企业需求。对此,NVIDIA更指出,每投资1亿美元于Rubin CPX,即能带来高达50亿美元的词元收益,展现极具吸引力的投资回应,将AI技术直接转化为可观的商业价值。

为了支撑Rubin CPX的庞大性能,英伟达同步推出了PCIe Switch+CX8 I/O板。这是全球首款量产的PCIe 6.0规格I/O产品,将PCIe Switch芯片与ConnectX-8 SuperNIC集成于同一大板,搭载9个PCIe插槽与8个NIC连接器。

与传统主板不同,该I/O板不包含CPU,而是专为PCIe架构的AI GPU服务器(如RTX Pro 6000/5000系列)设计,并将在Rubin CPX系统中扮演“scale-up”与“scale-out”互联的关键角色。其技术优势,除高度集成,能将PCIe Switch与CX8 NIC二合一,简化服务器设计,降低组件数量之外,设备间可直接以PCIe 6.0速度通信,每张RTX Pro 6000 GPU速率达400Gb/s,CX8 NIC则高达800Gb/s。而且,借由8张GPU间可实现all-to-all进行高速内部通信而无需回CPU,大幅降低延迟。甚至是减少小板阻碍风流,提升服务器内部散热效率,进一步优化散热状况等。

在粉丝页的内容中指出,强化PCIe AI GPU服务器性能,降低技术门槛,并部分取代Broadcom PCIe Switch市场。此产品已量产出货,并在Rubin CPX运算托盘中发挥更深战略作用。也就是通过集成,将高密度PCB上的芯片数量减半,进一步提升规模化部署的可行性。目前,多家AI创新企业已率先展开应用。包括Cursor,通过Rubin CPX加速智能程序代码生成,协助开发者更高效创作。而Runway则是利用其性能生增长场景电影级内容,提升视频创作灵活性。至于Magic,则是借由处理亿级词元的能力,让AI代理能完整理解软件程序库与互动历史,加速自动化软件工程。

除了硬件的创新发展之外,Rubin CPX将完整支持英伟达AI技术堆栈,包括Dynamo平台(提升推论输送量并降低延迟)、Nemotron多模态模型与NVIDIA AI Enterprise组件。结合NIM微服务、AI框架与工具,企业可轻松部署于云计算、数据中心与工作站。同时,英伟达CUDA-X程序库、600万开发者社交媒体与近6000种CUDA应用,将进一步推动Rubin CPX生态扩张,确保硬件优势能快速转化为实际应用。

根据英伟达的说法,NVIDIA Rubin CPX预计于2026年底上市。虽然仍有一段时间,但其对长场景处理、系统集成及投资效益的突破,已使业界高度期待。Rubin CPX与PCIe Switch+CX8 I/O板的结合,不仅是AI硬件架构的革新,更是AI应用迈向成熟与普及的重要里程碑。

(首图来源:英伟达提供)