AMD MI350系列细节公开，性能比前代提升35倍

AMD在Hot Chips 2025披露最新Instinct MI350 GPU系列，搭载全新CDNA 4架构，针对生成式AI与HPC。

随着大型语言模型（LLM）规模急速膨胀，GPU需要更大的内存与更快带宽，而MI350正是为了解决这个问题而诞生。MI350采用台积电3nm（N3P）与6nm（N6）FinFET制程，并运用COWOS-S先进封装技术，搭配3D多晶粒封装，将高性能核心与成本效益良好的I/O晶粒结合。

（Source：AMD）

HBM容量冲上288GB，推理与训练性能全面提升

内存部分则是最大亮点，搭载8颗HBM3E堆栈，每颗高达12层（12-Hi），单颗36GB，总容量288GB，比NVIDIA B200多出约1.5倍，而带宽高达8TB/s，不论是推理或训练，都能提供卓越的数据处理性能。

FP8算力飙破80 PFLOPs，推理性能跃升35倍

在运算表现上，AMD指出，MI350系列下的MI355X支持FP8运算约80 PFLOPs，FP16/BF16也可达40PFLOPs，并添加MXFP6、MXFP4低精度格式，特别针对LLM推理优化。芯片集成256 MB Infinity Cache，再加上5.5TB/s Infinity Fabric双向带宽，实现高速互联。整体性能相较前代MI300，推理能力最高跃升35倍。

气冷vs液冷

至于散热部分，MI350系列提供两种配置版本，其中MI350X采用气冷设计，功耗为1000W，最高时脉可达2.2GHz；而MI355X则采用液冷方案，功耗提高至1400W，时脉增至2.4GHz，主要大入数据中心市场。