近期市场关注NVIDIA GB200整柜式方案(rack)各项供应进度,TrendForce最新调查指出,由于GB200 Rack高速互通界面、热设计功耗(TDP)等设计规格皆明显高于市场主流,供应链企业需要更多时间持续调校、优化,最快2025年第二季后才有机会放量。
NVIDIA GB Rack方案(包括GB200、GB300等)因导入技术层次更复杂、高成本等特性,主力用户群体将为大型CSP,其余Tier-2数据中心、国家主权云及学研单位等HPC/AI应用项目。NVIDIA大力推动下,GB200 NVL72机柜2025年成为主要采用方案,占比有望接近80%。
TrendForce表示,为提升AI/HPC服务器系整理体运算性能,NVIDIA开发NVLink提供GPU芯片高速互联,如GB200采第五代NVLink,总带宽大幅优于市场主流PCIe 5.0,今年主导市场的HGX AI服务器每柜TDP动辄达60KW-80KW,GB200 NVL72每柜更达140KW,TDP再提升一倍,故企业尝试扩大采用液冷散热解决方案。
GB200 Rack系统的更高规格,市场频传可能因部分零部件未达要求,有递延出货风险。TrendForce调查,Blackwell GPU芯片出货情形大致如预期,第四季仅少量出货,2025年第一季后逐季放量。AI服务器系统方面,因尚待供应链各环节持续调整,至今年底的出货量恐低于企业预期,2025年GB200整机柜出货高峰将略为延后。
传统气冷散热解决方案已无法应对GB200 NVL72的TDP值,液冷技术成为必须。随着GB200 Rack方案于2024年底开始小量出货,相关企业也加大液冷散热零部件研发能量,如冷却分配系统(CDU)供应商放大器柜尺寸,和采用更高效冷却板(Cold Plate)提高散热性能。TrendForce表示,目前Sidecar CDU的散热能力主要集中60KW-80KW,未来有望双倍甚至超过三倍散热表现。至于更高效液对液(L2L)型in-row CDU方案,散热力超过1.3MW,也将继续提升以应对算力增长。
(首图来源:NVIDIA)