外媒报道,早在2021年,AMD就设置2025年目标,EPYC系列服务器处理器和Instinct系列AI芯片能效较2020年提高30倍,MI300X AI芯片基本上实现目标,时间还提早一年。

外媒Tom′s Hardware报道,AMD两个64核心EPYC 9575F CPU、八个Instinct MI300X AI芯片及2,304 GB DDR5内存的服务器,Llama3.1-70B(vLLM 0.6.1.post2、TP8)测试推理性能,用一组复杂计算确定系统能源效率,并与2020年未公开机器比较,新功能源效率是旧机28.3倍。

虽然AMD未透露2020年旧机规格,但可想象应是EPYC 7002系列,Zen 2架构,每个CPU最多64个核心,以及CDNA 1架构Instinct MI100 AI芯片。AMD Instinct MI100不支持FP8,但如果比较184.6TOPS算力的MI100和2,615TOPS/5,230TOP算力MI300X在INT8的性能,用FP16可观察到大致相同的差异。

然而,考虑到更好内存子系统(32GB HBM2,1.20GB/s与192GB HBM3,5.30GB/s)和更佳CPU时,AMD现有机器的速度和性能显著提高也不足为奇。AMD表示,除了强力硬件改进,更高性能效率是架构进步,加上软件优化结合,是跳跃式进展。

最近AMD推出CDNA 3架构Instinct MI325X AI芯片,有288 GB HBM3E内存子系统,2025年推出Instinct MI355X AI芯片,CDNA 4架构,与MI325X相比,FP8和FP16运算性能提升约80%。MI325X还支持AI的FP4和FP6格式,峰值性能可提高到9.2PetaFLOPS,对许多大型语言模型来说非常有用,AMD预估2025年前将运算平台能源效率较2020年提高30倍。

(首图来源:AMD)