谈到AI芯片,大众首先想到的往往是GPU(图形处理器)。凭借强大的并行计算能力,GPU在训练与执行大型AI模型上长期占据主导地位。然而,随着市场需求变化与技术进步,GPU在AI领域的垄断地位正逐渐受到挑战。

目前,NVIDIA(英伟达)生产的GPU主要被科技巨头垄断使用。例如,微软目前拥有75万至90万片H100 GPU,预计2025年将增加至250万至310万片;Google则拥有100万至150万片,预计明年增至350万至420万片。此外,Meta、亚马逊与创业公司xAI也积极投入,导致中小企业在获取GPU资源上面临严峻挑战。

成本飙升

高昂的价格也是一大阻碍。据估计,H100的售价约为2.5万至3万美元。即便按最低估算,微软为购买GPU的支出已超过180亿美元。巨头们的庞大投资,进一步推升GPU价格,增加资金压力。

产能瓶颈

NVIDIA的供应链限制也成为挑战。目前,GPU的生产依赖台积电的先进制程及其CoWoS封装技术,而CoWoS的产量和高带宽内存(HBM)的供应均是主要瓶颈。在巨头疯狂争夺资源的背景下,市场对替代方案的需求日益增加。

面对GPU的局限性,现场可程序化闸数组(FPGA)与特定用途集成电路(ASIC)逐渐进入大众视野。

FPGA:FPGA是一种半定制化芯片,具有灵活的硬件编译能力与较低的功耗。然而,由于开发门槛高与成本偏高,其应用仍受限制。

ASIC:ASIC专为特定应用设计,性能与能耗表现优于GPU与FPGA,但初期投入大且缺乏通用性。在AI推论与训练领域,ASIC因针对性设计而备受青睐。

随着市场需求升温,多家科技巨头加速自研芯片的步伐,寻求替代方案:

Google TPU:Google的TPU(张量处理单元)是一种专为机器学习设计的ASIC芯片。最新推出的TPU v5p具备卓越性能,为深度学习提供强大支持。

微软Maia 100:微软发布的Maia 100 ASIC芯片专为云计算AI工作负载设计,搭载1050亿个晶体管,旨在降低对NVIDIA的依赖。

博通ASIC:博通通过定制ASIC芯片服务迅速崛起,并成为Google与Meta等巨头的主要合作伙伴。博通预计到2027财年的AI相关营收将达600亿至900亿美元。

根据摩根士丹利的报告,全球AI ASIC市场规模预计将从2024年的120亿美元增至2027年的300亿美元,年均复合增长率达34%。在生成式AI与边缘AI应用的推动下,ASIC市场的需求将持续攀升。

GPU曾是AI运算的无可争议主力,但其高成本与供应瓶颈正促使市场寻求更多样化的解决方案。未来,FPGA与ASIC将成为重要的补充力量,推动AI技术的多样发展。在这场AI芯片竞争中,谁能在性能、成本与灵活性间找到最佳平衡,将决定未来的市场格局。