日前外媒报道,英伟达新一代Blackwell架构AI芯片在高容量的机架服务器中存在严重的过热问题。而这些问题导致英伟达的设计调整与计划延期,使Google、 Meta和微软等主要客户对能否按计划部署搭载Blackwell架构AI芯片的服务器感到担忧。对此,全球服务器大厂戴尔(Michael Dell)在社交媒体X上贴文指出,第一台英伟达GB200 NVL72服务器现已正式出货,似乎直接反驳Blackwell架构AI芯片过热的说法,表示当前出货正常。

外媒The Information引用知情人士说法,Blackwell架构AI芯片专为AI和高性能计算(HPC)所设计,但72个处理器服务器出现过热问题,此类服务器每个机架功耗最高可达120 KW。过热问题迫使英伟达多次修改机架设计,不仅限制芯片性能,还可能损坏硬件。客户因此担心,这些问题会延后数据中心的服务器部署进程。

The 1st in the world@nvidiaGB200 NVL72 server racks are now shipping. We are thrilled to deliver our liquid-cooled PowerEdge XE9712 to@CoreWeave. The AI rocket just got a massive boost! 🤖🚀🤝pic.twitter.com/2QzlxbQE5f

— Michael Dell (@MichaelDell)November 18, 2024

由于The Information的报道被多家国际媒体引用,也造成市场上紧张的情况,使得相关类股股价受到影响。因此,身为服务器大厂的戴尔就在媒体X上贴文,就是旗下最新服务器照片,并强调“全球第一台英伟达GB200 NVL72服务器现已正式出货”的情况,也间接驳斥GB200因过热而导致出货再次延误的消息。

另外,根据市场消息指出,在英伟达GB200主要代工厂鸿海与广达的部分,鸿海内部也指出其出货进程正常的情况,没有因芯片过热而有出货延误状况。至于,广达方面也指出,根据先前说明会的说法,GB200系列服务器将在年底前小量出货,并于2025年第一季放量,时间没有改变。

甚至,鸿海方面也宣布,鸿海将与英伟达携手,打造下时代AI工厂(AI Factory),运用Omniverse平台,以数字孪生 (Digital Twins) 技术重塑制造业的未来。双方不仅革新制造流程和供应链管理,更为全球先进设备部署和提升企业韧性开辟了新途径。这显示了相关服务器的出货没有受到外传过热因素的影响,鸿海将依照计划在相关应用上进行进一步的部署。

市场另有消息指出,英伟达新一代Blackwell架构AI芯片过热的消息出现在20日英伟达新一季财报公布之前,这不禁让人联想,怀疑市场有人借此利空消息打压股价、进一步低接的意图。而根据美系外资的最新消息,重申B200出货没有任何延迟,因为经过深入渠道访查,计算芯片在第四季出货是300k,2025年第一季上升至800k。另外,H系列第四季1.5m,2025年第一季降至1m。其中,因H200上市,H100降价两成多,但整体H系列需求仍属健康,GB200 NVL72机架服务器2025年维持35k不变。

(首图来源:科技新报摄)