OpenAI预告将在初夏推出GPT-2以来“最强开源”语言模型

OpenAI宣布即将在今年初夏推出自GPT-2以来首个开源语言模型，并以“开源界最强”为目标，主打推理能力强悍、能在高端消费级硬件上运行的语言模型。目前这项计划由OpenAI研究副总裁Aidan Clark领军，仍处于开发初期阶段。

根据知情人士透露，这款模型被定位为推理导向模型，类似OpenAI旗下的o系列产品。OpenAI有意采用极为宽松的开源授权条款，几乎不设商业或使用限制，与Meta的Llama或Google的Gemma相比，更具开放性，也试图避免后者因条款过于复杂而饱受批评的问题。

目前OpenAI正面对多方开源对手的竞争，尤其是来自中国的DeepSeek AI实验室等机构，这些对手通过开放模型让开发者实验、甚至允许商用，逐渐在社交媒体中累积人气。例如Meta就在三月初宣布其Llama模型下载次数突破10亿，而DeepSeek也吸引了大量用户与投资者关注。

OpenAI此次推出的开源模型将支持纯文本输入输出，并可能让开发者选择是否激活“推理模式”。该模式可提升准确度，但也会增加回应延迟，与Anthropic等近期推出的推理模型策略相仿。

若市场反应正面，OpenAI计划接下来陆续推出更多版本，包括规模较小的模型，以扩大开发者使用范围。

值得一提的是，OpenAI首席执行官Sam Altman曾坦言，公司过去在开源策略上“站在历史的错误一边”，并呼吁重新检讨。虽然目前开源并非OpenAI的首要任务，但他也表示未来将持续推出更好的模型，只是领先优势可能不如以往那么明显。

这次新模型将经过严格的“红队测试”与安全评估，OpenAI承诺会发布“模型卡片”（Model Card），清楚说明内外部测试结果与安全性分析。Altman也强调，公司将依据“模型准备度框架”进行全面评估，以避免模型在发布后产生风险。

不过，OpenAI近年也曾因安全测试过于仓促、模型卡发布延迟等问题，受到人工智能伦理专家的批评。Altman本人更在2023年底短暂遭董事会罢免，部分原因也与模型安全审查不周有关。