OpenAI预告将于8月8日凌晨1点进行一场直播活动,极有可能正式发布先前传闻的全新大型语言模型GPT-5。虽然官方目前仍未明说直播主题,但从预告内容来看,英文“LIVESTREAM”中刻意将“S”改为数字“5”,暗示接下来将公布内容与GPT-5有关。
自2023年3月发布GPT-4以来,GPT-5将成为OpenAI新一代主力的大型语言模型。在过去一年,OpenAI虽然先后推出GPT-4.5、GPT-4-turbo,以及集成多模态功能的GPT-4o,甚至在2025年初间接透露GPT-4.1的存在,但主要都还是隶属GPT-4系列的延伸版本,而接下来将公布的GPT-5则预期会有“次世代”的大幅度更新。
OpenAI总裁Sam Altman先前透露,GPT-5将在推理与逻辑能力上大幅跃进,具备所谓的“链式思维”(chain-of-thought reasoning) 特性,能将复杂问题拆解为一系列逻辑步骤,并且逐步推论答案,展现更接近人类思维逻辑的运行方式。
据业界消息人士透露,GPT-5的最大创新在于能够自动选择最适合的模型来回应特定查询。该系统将统一o系列推理模型(专长于产生高品质答案)与GPT系列模型(着重时间效率)的优势,让用户无需猜测该使用哪种模型。
ChatGPT产品负责人Nick Turley表示:“计划将所有这些概念统一到类似GPT-5的产品中,使用户只需提出问题,系统会根据需要进行思考,就像与人类对话一样;有时会在回应前思考,有时会立即回应,有时会在回应的同时继续思考。”
除了将推出GPT-5主要模型,OpenAI可能也会同步发布轻量级的GPT-5 mini与GPT-5 nano,让开发者与一般用户能依不同需求与计算资源选择最合适的模型版本,并且能布局应用在诸如手提电脑、手机等终端设备。
据了解,标准版和mini版本可能会在ChatGPT中提供,而nano版本预计主要通过OpenAI的API服务企业和开发者需求。这种多层次的配置策略,实际上也与先前在GPT-4.1系列中出现多模型阶层的做法相呼应。
除此之外,GPT-5也将内置更强大的推理模块、支持深度搜索 (Deep Research) 等延伸功能,进一步强化回应精准度与多步骤任务的处理效率。在编程能力方面,GPT-4.1已在SWE-bench Verified测试中取得54.6%的分数,较GPT-4o提升21.4%,预期GPT-5将有更突出表现。
多模态能力也是GPT-5的重点升级项目。建基于先前GPT-4o的文本、图像和语音互动基础,GPT-5预计将进一步集成视频处理功能,并可能结合OpenAI的文本转视频模型SORA技术。GPT-5预计将支持更大的上下文窗口,提升长文本理解能力,并显著减少“幻觉”(hallucination) 问题,让AI回应更加可靠和准确。
目前尚不清楚GPT-5是否会取代现有GPT-4o,并且成为ChatGPT的新默认模型,或是仅提供给高端用户或以API串联服务。不过,根据以往OpenAI对免费与付费用户的布局策略,未来用户仍有可能在免费层级中获得一定程度的GPT-5使用体验。
来源:Mashdigi