OpenAI宣布即将在今年初夏推出自GPT-2以来首个开源语言模型,并以“开源界最强”为目标,主打推理能力强悍、能在高端消费级硬件上运行的语言模型。目前这项计划由OpenAI研究副总裁Aidan Clark领军,仍处于开发初期阶段。
根据知情人士透露,这款模型被定位为推理导向模型,类似OpenAI旗下的o系列产品。OpenAI有意采用极为宽松的开源授权条款,几乎不设商业或使用限制,与Meta的Llama或Google的Gemma相比,更具开放性,也试图避免后者因条款过于复杂而饱受批评的问题。
目前OpenAI正面对多方开源对手的竞争,尤其是来自中国的DeepSeek AI实验室等机构,这些对手通过开放模型让开发者实验、甚至允许商用,逐渐在社交媒体中累积人气。例如Meta就在三月初宣布其Llama模型下载次数突破10亿,而DeepSeek也吸引了大量用户与投资者关注。
OpenAI此次推出的开源模型将支持纯文本输入输出,并可能让开发者选择是否激活“推理模式”。该模式可提升准确度,但也会增加回应延迟,与Anthropic等近期推出的推理模型策略相仿。
若市场反应正面,OpenAI计划接下来陆续推出更多版本,包括规模较小的模型,以扩大开发者使用范围。
值得一提的是,OpenAI首席执行官Sam Altman曾坦言,公司过去在开源策略上“站在历史的错误一边”,并呼吁重新检讨。虽然目前开源并非OpenAI的首要任务,但他也表示未来将持续推出更好的模型,只是领先优势可能不如以往那么明显。
这次新模型将经过严格的“红队测试”与安全评估,OpenAI承诺会发布“模型卡片”(Model Card),清楚说明内外部测试结果与安全性分析。Altman也强调,公司将依据“模型准备度框架”进行全面评估,以避免模型在发布后产生风险。
不过,OpenAI近年也曾因安全测试过于仓促、模型卡发布延迟等问题,受到人工智能伦理专家的批评。Altman本人更在2023年底短暂遭董事会罢免,部分原因也与模型安全审查不周有关。