AMD在Hot Chips 2025披露最新Instinct MI350 GPU系列,搭载全新CDNA 4架构,针对生成式AI与HPC。

随着大型语言模型(LLM)规模急速膨胀,GPU需要更大的内存与更快带宽,而MI350正是为了解决这个问题而诞生。MI350采用台积电3nm(N3P)与6nm(N6)FinFET制程,并运用COWOS-S先进封装技术,搭配3D多晶粒封装,将高性能核心与成本效益良好的I/O晶粒结合。

(Source:AMD)

HBM容量冲上288GB,推理与训练性能全面提升

内存部分则是最大亮点,搭载8颗HBM3E堆栈,每颗高达12层(12-Hi),单颗36GB,总容量288GB,比NVIDIA B200多出约1.5倍,而带宽高达8TB/s,不论是推理或训练,都能提供卓越的数据处理性能。

FP8算力飙破80 PFLOPs,推理性能跃升35倍

在运算表现上,AMD指出,MI350系列下的MI355X支持FP8运算约80 PFLOPs,FP16/BF16也可达40PFLOPs,并添加MXFP6、MXFP4低精度格式,特别针对LLM推理优化。芯片集成256 MB Infinity Cache,再加上5.5TB/s Infinity Fabric双向带宽,实现高速互联。整体性能相较前代MI300,推理能力最高跃升35倍。

气冷vs液冷

至于散热部分,MI350系列提供两种配置版本,其中MI350X采用气冷设计,功耗为1000W,最高时脉可达2.2GHz;而MI355X则采用液冷方案,功耗提高至1400W,时脉增至2.4GHz,主要大入数据中心市场。

(Source:同上)

AMD预计MI350系列将于2025年第三季通过合作伙伴进入市场,下一代MI400系列则已在研发,计划于2026年推出。

(首图来源:AMD)