AWS在re:Invent大会宣布推出新服务Nova Forge,让企业能在Amazon Nova基础模型家族的预训练阶段就导入自家数据,从早期检查点开始打造专用模型。通过数据混合与强化学习,AWS希望在降低灾难性遗忘的同时,保留通用推理与安全能力,并最终将定制模型以私有模型方式托管在Amazon Bedrock上。

目前企业导入生成式AI做法多依赖提示工程、RAG,或对现成基础模型做监督微调与强化学习调校,这些做法虽能快速上线,但都发生在模型完整训练之后,较难把专业术语与内部流程真正写进模型底层理解。

Nova Forge则把定制化往前拉到更早的训练阶段,AWS提供Nova家族模型在预训练、中期训练与后期训练的多个检查点,企业可在Amazon SageMaker AI上持续预训练,将自家专有数据与AWS整理的Nova训练数据混合喂给模型,以减少在仅使用企业数据进行持续预训练(Continued Pre-Training,CPT)时常见的灾难性遗忘,维持原有的一般推理与指令跟随能力。

Nova Forge支持使用企业自有环境的奖励函数与多轮互动场景,让模型在更贴近实际业务的模拟环境中学习。AWS表示,该服务可用于长流程任务与代理场景,把任务成功与失败转换成强化学习信号。

针对合规与治理需求,Nova Forge内置责任式AI工具组,提供安全性与内容审查设置。企业可自订敏感内容处理规则,对金融、医疗或高度受监管产业,在导入模型时保留一定控制力,而非完全依赖云计算服务默认政策。

开发团队可在SageMaker Studio选择要承接的检查点与数据集,训练完成后再将模型导入Amazon Bedrock,以私有模型形式提供API。Nova Forge目前先在美东北维吉尼亚区域提供,AWS未公开细部定价,不过外媒CNBC报道指出,该服务订阅年费为10万美元,且不包含协助训练模型的专家服务费用。