随着摩尔定律进走向极限、数据中心功耗越来越受关注,AMD着手准备雄心勃勃的新目标,预计2030年前将AI芯片能效提高20倍,机架式架构是实现此目标的关键。
AMD在2021年宣布30×25目标,计划2025年前将用于人工智能(AI)训练与高性能计算(HPC)应用的处理器能源效率提升30倍,如今AMD已超越30×25目标,将AI训练与HPC处理器能效提高38倍,与5年前系统相比,相当于同性能产品能耗降低97%。
现在AMD宣布设立更大胆的2030年新目标,预期到2030年机架级能效提高20倍,将目前需要超过275个机架训练的典型AI模型缩减至1个机架,从而减少95%电力消耗,再结合软件与算法,新目标能将整体能源效率提高100倍。
AMD不是第一家朝此方向迈进的公司,Nvidia在去年GTC大会展示首款机架级系统GB200 NVL72,该系统利用高效NVLink互联技术将多个GPU集成为强大计算单元,使4个或8个加速器作为一个大型加速器运行。
随着MI400亮相,AMD第一个机架级运算平台预计明年推出,使用UALink互联技术,未来设计可能引入光互联技术取代传统铜线,进一步提升带宽和传输距离。
(首图来源:AMD)