芯片创业公司企业Ampere宣布将与高通(Qualcomm)合作开发一款Arm-based AI芯片,以低成本及省电等效益挑战Nvidia,并预告正在研发256核心CPU。

Ampere是一家Arm-based芯片开发商,自称开发出第一个云计算原生处理器。微软Azure、Google Cloud和Oracle Cloud都推出使用Ampere Altra CPU的云计算服务,甲骨文甚至于2023年投资Ampere1亿美元为其主要投资者之一。Ampere Altra CPU是为执行即时AI作业,像是聊天机器人、数据分析及视频内容分析而设计,具备高速推论能力,但诉求比Nvidia GPU便宜。Ampere主要最新宣布中,一是和高通合作开发AI服务器芯片,二是公告其12信道DDR5平台处理器的未来CPU产品。

首先,Ampere与高通合作集成其CPU及后者的Cloud AI 100 Ultra AI加速器,开发专为处理LLM推论作业设计的数据中心服务器芯片,目的在创造无GPU的AI推论(GPU-Free AI Inferencing)。一开始这项合作将使用7纳米的Ampere Altra,在几个月后加入更新、3纳米的AmpereOne选项。而双方合作产品第一个客户是Supermicro,双方表示以后也会再推广到其他客户。

另一项宣布是关于AmpereOne。AmpereOne为支持12信道DDR5内存的处理器平台,现有规划产品为192核心,预计今年下半推出。AmpereOne下一代为256核心产品,使用相同的气冷式散热技术,号称比现有市面上产品性能提高40%。Ampere也强调AmpereOne产品在OEM及ODM硬件平台上的性能跑分数据,比AMD服务器处理器Genoa及Bergamo系列分别高50%及15%,每机架性能则高出34%。

另外,Meta Llama 3现在也登上Oracle Cloud Ampere-based服务,后者底层为128核心Ampere Altera CPU,完全没有GPU,但该公司说,运行Llama 3的性能不输执行Nvidia A10+x86 CPU的环境,但用电量仅对手的1/3。

其他宣布包括Ampere加入AI平台联盟中新成立的UCIe(通用小芯片互联,Universal Chiplet Interconnect Express)工作小组,将秉持开放界面标准,以便在未来CPU中可集成Ampere和客户的技术;Ampere CPU结合NETINT的视频处理芯片Quadra T1U,提供360即时信道的同步转码,并使用OpenAI Whisper模型提供40道流媒体的即时翻译字幕。另外,其CPU除了内存标注(Memory Tagging)、QoS执行(QOS Enforcement)及网格拥塞管理(Mesh Congestion Management)等功能外,也添加FlexSKU功能,允许客户在横向(scale out)及向上扩展(scale up)部署场景中使用同一SKU。

图片来源/Ampere