Anthropic首届开发者大会“Code with Claude”22日于美国旧金山举行,正式发布全新Claude 4系列模型,包括Claude Opus 4和Claude Sonnet 4,为编码、高端推理及AI代理(AI agent)设下全新标准。
Claude Opus 4和Claude Sonnet 4均为混合模型,提供近乎即时的回应、以及延伸思考2种模式。
Anthropic称Claude Opus 4是世界上最强大的编码模型,在基准测试SWE-bench(72.5%)与Terminal-bench(43.2%)领先群雄,可对复杂、长时间运行的编码任务和代理任务提供卓越表现。
Claude Opus 4的记忆能力大幅领先其他模型,当开发者对Claude提供本机文件访问权限时,Claude Opus 4能够创建并维持记忆文件、存储关键资讯,进而确认长期任务的处理意识、连贯性及代理任务性能。
Claude Sonnet 4则是Claude Sonnet 3.7重大升级,提供更优异的程序设计和推理能力,能够精准遵循提示指令。随着Claude Sonnet 4推出,GitHub表示它在代理场景表现出色,将扮演驱动GitHub Copilot编码代理的关键角色。
Anthropic为Claude 4引进“思考摘要”,利用较小模型浓缩冗长的思考过程,这个机制只需要大约5%思考过程所花费的时间。
Claude 4在基准测试SWE-bench Verified处于领先地位。
Claude 4在编码、推理、多模态功能和代理任务表现出色。
Anthropic表示,Claude Pro/Max/Team/Enterprise方案均能使用这2款模型和延伸思考功能,Claude Sonnet 4甚至对免费用户开放使用。
这2款模型已经上架Anthropic API、Amazon Bedrock及Google Cloud Vertex AI,收费沿用先前Claude Opus和Claude Sonnet系列的价格:Claude Opus 4每百万个输入/输出词元(token)收费15/75美元,Claude Sonnet 4每百万个输入/输出词元则收费3/15美元,是前者的五分之一。
(图片来源:Anthropic)