OpenAI 15日宣布,针对AI编码代理工具“Codex”提出GPT-5-Codex新模型,对于不同开发任务能够动态调整“思考”时间,因此在编码基准测试表现更好。
GPT-5-Codex已为Codex推出,涵盖ChatGPT Plus/Pro/Business/Edu/Enterprise用户都能通过终端机、IDE、网页、GitHub甚至ChatGPT iOS版应用程序访问这款模型。OpenAI还表示,未来计划向采用API的客户开放这款模型。
We're releasing GPT-5-Codex — a version of GPT-5 further optimized for agentic coding in Codex.
Available in the Codex CLI, IDE Extension, web, mobile, and for code reviews in Github.
— OpenAI (@OpenAI) September 15, 2025
GPT-5-Codex针对Codex编码代理工具采用的模型进一步优化。
OpenAI指出,Codex性能提升很大程度归功于GPT-5-Codex的动态思考能力。首先,GPT-5内置即时分流系统,能根据用户的对话类型、问题复杂度、所需工具以及明确意图,迅速判断应该使用GPT-5哪款模型。GPT-5-Codex也有类似做法,但并不是内置分流,而是根据当下编码状况动态调整某个任务要花费的时间。
对此,Codex产品负责人Alexander Embiricos告诉外媒,这么做比内置分流更具优势,因为即时分流必须在一开始即决定投入多少算力与时间,而GPT-5-Codex例如能在处理5分钟后决定多投入1小时,他透露曾看过GPT-5-Codex在某些状况耗费超过7小时完成任务。
OpenAI表示,GPT-5-Codex在编码代理评估的产业标准SWE-Bench Verified,表现都优于GPT-5。
OpenAI训练GPT-5-Codex进行编码审查,并请经验丰富的软件工程师评估模型的审查意见。根据OpenAI说法,软件工程师发现GPT-5-Codex提出的错误评论更少,增加更多具高度影响力的评论。
GPT-5-Codex在相关基准测试的表现优于GPT-5。
除GPT-5-Codex外,OpenAI进一步升级Codex CLI。
面对Anthropic的Claude Code、Anysphere的Cursor或微软的GitHub Copilot等,OpenAI这次更新使Codex持续与其他AI编码产品竞争。
(图片来源:OpenAI)