OpenAI发布了名为GPT-OSS的开源模型,这是该公司自2019年GPT-2以来首个开放权重模型。该模型提供两个版本:1200亿参数的gpt-oss-120b和200亿参数的gpt-oss-20b,较大版本可在单个Nvidia GPU上运行,性能与现有o4-mini模型相近;较小版本仅需16GB内存即可运行,性能与o3-mini相当。两个版本均采用Apache 2.0授权,允许商业用途修改,并可在Hugging Face等平台免费下载。

GPT-OSS模型采用OpenAI去年秋季在o1模型中首次部署的思维链推理方法,通过多个步骤来回答提示。这些纯文本模型虽非多模态,但支持网页浏览、调用云计算模型协助任务、执行程序代码及作为AI代理程序操作软件。与ChatGPT不同,GPT-OSS可在无网络连接及防火墙后运行。

由于开放权重模型移除了使用门槛,任何人都可尝试微调模型作不当用途,OpenAI为此进行了史上最严格的安全测试。安全研究员Eric Wallace表示,团队内部对模型在风险领域进行微调测试,并测量可达到的风险程度。根据OpenAI的准备框架评估,开放权重模型未达到高风险水平。模型会显示“思维链”过程,让用户监察模型行为、欺骗和滥用情况。

研究员Chris Koch表示,gpt-oss-120b的表现与OpenAI专有的o3和o4-mini模型相近,在某些评估中甚至表现更佳。此次发布对目前开源领域领导者Meta构成挑战。Meta自2023年推出首个Llama系列模型,最近发布的Llama 4仍是市场主流。然而,Mark Zuckerberg曾暗示公司可能因安全考虑而在未来模型中放弃开源策略。

此次发布正值OpenAI与Meta等公司在AI人才争夺战持续升级之际。2025年,具备高需求技能的AI研究员正收到天价转岗offer。OpenAI的最新发布可能对Meta构成强力竞争,具体影响将取决于开发者对GPT-OSS模型的接受程度。同时,Meta正专注于超越人类认知的超级智能开发,并成立由前Scale行政总裁Alexandr Wang领导的内部实验室。

此次发布标志着AI行业竞争格局的重大变化。随着中美在AI技术领域竞争加剧,预期更多美国科技公司将跟随OpenAI脚步,推出开源模型。未来几个月内,可能会看到Google、Microsoft等公司加快开源模型发布节奏,同时各公司在安全标准和性能基准方面的竞争也将更趋激烈。

来源: OpenAI