
AWS re:Invent 2025于拉斯维加斯进入倒数第二日,AWS公用运算高级副总裁Peter DeSantis以《基础设施创新》为题发布演讲,强调AI急速发展未改变云计算核心特质,反而令“安全性、可用性、弹性、成本与敏捷性”较以往更重要。
DeSantis指出AI应用改变企业运营,对基础设施要求也前所未见。AI工具令黑客效率更高,安全性须提升至首要位置;大型模型推论要求极高可用性,急增的AI工作负载令客户期待如Amazon S3的弹性体验。面对高昂训练与推论成本,企业对“高性价比算力”需求急升。

AWS自研芯片策略核心源于早年解决虚拟化瓶颈的经验。2010年前后业界普遍认为虚拟化性能难以媲美裸机,但AWS通过将虚拟化功能拆解至硬件层,最终开发出AWS Nitro系统,完全解决性能不稳问题。Nitro此后成为AWS自研芯片研发基石,成功案例更被纳入《Computer Organization and Design》第七版,成为计算机科学教材一部分。
Nitro成功带来两条重要自研产品线:针对通用运算的AWS Graviton系列,以及针对AI的Amazon Trainium系列。这些芯片让AWS能在安全性、性能、成本等方面做到极致优化,支持企业级AI所需云计算基础。
DeSantis同场也重点介绍Amazon Nova多模态嵌入模型及Amazon S3 Vectors。Nova模型将文本、图像、视频与音频映射至统一矢量空间,Amazon S3 Vectors直接将矢量存储能力集成至S3,让企业不必改动数据架构,即可进行规模达数十亿矢量的语义搜索。
视频AI公司TwelveLabs为典型案例,其视频理解模型基于S3 Vectors,可直接在存储视频的存储桶写入与访问矢量,不必复制或转移数据,大幅降低成本并提升回应速度。
AI专用芯片Trainium最新进展也是全场焦点。Amazon EC2 Trn3 UltraServers将144颗Trainium3芯片跨两机柜集成为单一AI超级计算机,提供高达360 PFLOPS(FP8)强大算力,吞吐量较前代提升4.4倍。Trainium3也首次在单一服务器主板集成Nitro、Graviton及Trainium三类自研芯片,整体设计目标为可维护性、弹性及自动化部署。
AWS同时预告下一代Amazon Trainium4性能将再度跃升:FP4运算能力提高6倍、内存带宽提升4倍。
DeSantis指出AI仍处于起步阶段,但企业已需面对“模型更大、推论更快、数据更多”现实挑战。AWS持续加深从Nitro、Graviton到Trainium的基础设施投资,目标是为企业移除所有技术限制,协助在AI时代安心发展。
他以一句招牌话语作结:“What will you build next?”——既是提问,也是对所有创造者的邀请。











