
12月4日,AWS re:Invent 2025进入第三日,AWS Agent AI副总裁Swami Sivasubramanian发布主题演讲,阐述构建可靠AI Agent核心技术路径。他指出AI Agent正由“技术奇迹”转变为具实际业务价值工具,惟多数企业陷入“概念验证(PoC)困局”,众多出色Agent原型未能进入生产环境。

Swami博士围绕“易于构建(Easy to Build)”、“高效(Efficiency)”、“可信(Trust)”及“可靠(Reliability)”四大支柱,发布多项创新。值得留意Amazon Nova Act服务可靠度达90%,Amazon Bedrock强化微调功能准确度提升66%,Amazon Nova Forge则开创“开放训练模型”新范式。

Swami博士表示传统Agent开发需默认所有场景流程,令程序代码难以维护,容易在意外情况下失败。多数PoC未考虑五大生产障碍:快速部署能力、复杂内存系统、身份与访问权限管理、工具互通性及可观察性。
AWS推出开源Agent开发框架Strands Agents SDK,采取模型驱动方式,允许模型自主应对任何场景,无需默认工作流程及复杂协调程序代码。此功能已在AWS内部验证,省却数千行冗余程序代码,同时提高Agent准确性与程序代码维护性。自5月发布预览版以来,Strands下载量已超过500万次。
今日发布两项核心功能令其更强大:TypeScript支持将Strands Agents SDK扩展至全球最流行编程语言之一;边缘设备支持打开汽车、游戏及机器人等领域新应用场景。

Amazon Bedrock AgentCore为托管系统,填补PoC与生产之间鸿沟。现场演示中,Swami博士展示AgentCore Identity强大功能:只需数行程序代码,即可跨AWS应用程序与Slack、Zoom等第三方服务无缝管理身份与访问权限,从零开始构建同样功能需时长周。
今日发布Episodic Memory进一步提升Agent能力。Swami博士以旅行助手为例:独行游客可能在航班起飞前45分钟到达机场便足够,若带同两个孩子及大量行李,Agent需记住上次混乱家庭旅行经历,自动调整到达时间至两小时。这不单是记住过去,更是理解“用户行为背后时机和原因”。Agent经验越丰富便越聪明。
昨日也发布两项AgentCore新功能:Policy in Amazon Bedrock AgentCore提供Agent行为控制,同时保留其推理及采取最佳行动自由;AgentCore Evaluations允许开发人员在数千个模拟场景评估测试Agent,确保正式推出前达企业级标准。
Swami博士指出现成大型语言模型(LLM)虽然智能,但非总是最高效。效率关乎成本,也涉及延迟(回应速度)、规模(峰值处理能力)及敏捷性(迭代速度)三个关键维度。
他指出大多数Agent将时间花费在编写程序代码、分析搜索结果、创建内容等常规操作,若能为这些任务定制模型,便能大幅提高效率。然而强化学习这类高端定制技术门槛极高,需要博士级专业知识、复杂分布式基础设施,开发周期长达6至12个月。
今日正式发布Reinforcement Fine-Tuning(RFT)in Amazon Bedrock,让普通开发人员也能使用强化学习,操作极为简单:选择基础模型、指向Amazon Bedrock日志,并选择奖励函数(如LLM评判器)即可完成。Amazon Bedrock自动化整个RFT工作流程,相比基础模型准确度平均提升66%,效果显著。
针对需要更多控制应用场景,今日发布SageMaker AI Serverless Model Customization提供两种体验:自助式体验适合自行管理整个流程开发人员;Agent驱动体验让用户只需以自然语言描述用例,由AI Agent建议合适微调技术、产生合成数据集、配置Serverless训练流程,并完成模型效果评估。原本需要机器学习工程师投入数月反复试验工作,现可在数天内完成。
Swami博士也宣布提高模型训练弹性新功能:Checkpointless Training on SageMaker HyperPod。传统检查点恢复会导致资源闲置数小时,此功能通过持续存积分布式集群中模型状态,实现分钟级恢复,硬件故障时无缝替换设备,获取正确节点状态,堪称范式转变。

Swami博士介绍四种定制方案:监督式微调(SFT)、模型蒸馏、人类反馈强化学习(RLHF)及AI反馈强化学习(RLAIF)。其中模型蒸馏可让小型模型模仿巨型模型决策逻辑,实现10倍加速,同时仍保持95%至98%性能;SFT则重质不重量,1万条优质Agent互动数据优于数百万通用范例。
多数企业因而仍受制于“通用模型性能不足”与“定制成本过高”两难境地。AWS突破在于将这些高端技术自动化,让普通开发人员也能使用强化学习等先进技术,大幅降低定制门槛。











