在全球半导体产业中,Cerebras Systems最近创下新的里程碑,推出了世界上尺寸最大的AI芯片──WSE(Wafer Scale Engine),并在AI推理速度上超越了NVIDIA 。这款芯片的尺寸是8.5英寸(约22厘米)的巨大方形芯片,拥有惊人的40亿个晶体管,这使得它在AI推理运算中达到每秒2,522个token,比NVIDIA集群(Cluster)快了约2.5倍。Cerebras的资讯首席安全官Naor Penso在温哥华的Web Summit大会中表示,这是全球最快的推理速度。
推理速度对于企业客户来说至关重要,尤其是在需要即时反应的场景中,例如在购物车中添加AI引擎,以便快速提供食谱建议。随着AI技术的进步,推理速度的需求将变得更加迫切,因为未来的AI代理将需要处理更复杂的多步骤任务。
WSE芯片的设计不仅依赖晶体管的数量,还包括将所有零件集成在一个芯片上,并配备44GB的高速RAM。这种设计使得Cerebras的芯片在性能上优于NVIDIA的Blackwell芯片,Cerebras每秒可达2,522个token,而NVIDIA Blackwell为1,038个token。“我们测试过数十家厂商,Cerebras是唯一在Meta主要模型上能超越Blackwell的推论解决方案。”Artificial Analysis首席执行官Micah Hill-Smith说。

(Source:Cerebras Systems)
WSE芯片可说是计算机芯片设计的一个有趣进化,这不仅是对传统CPU和GPU架构的挑战,更是对AI计算需求的全新解决方案。Cerebras的首席营销官Julie Shin强调,这不是一项渐进式技术,而是芯片技术的一次飞跃。
(首图来源:cerebras)