Google 25日宣布,为Gemini Advanced订阅用户和开发者推出实验版本Gemini 2.5 Pro Experimental。

Gemini 2.0现在进化至Gemini 2.5,新系列中的所有模型都属于具有思考能力的模型,可在回应之前进行推理,进而提高性能和准确性。Google将思考能力直接植入这些模型中,使其能够“处理更复杂的问题,并支持更强大、更具备场景意识的AI代理”。

与去年12月首次公开且在本月获得更新的Gemini 2.0 Flash Thinking相比,Gemini 2.5 Pro名称不再加上“Thinking”这样的标签,而模型可在Gemini应用程序显示思考过程,让用户查看整个思路。

Gemini 2.5 Pro除原生多模态外,还具有100万个词元(token)的上下文长度,并计划支持至200万个词元。在Gemini应用程序中,Gemini 2.5 Pro Experimental将取代Gemini 2.0 Pro Experimental,且能连接Gmail、YouTube等并支持文件上传。

Gemini 2.5的特点在于,通过结合显著增强的基础模型和改进的Post-Training,展现新的性能水准。

Gemini 2.5 Pro(gemini-2.5-pro-exp-03-25,代号“nebula”)是该系列第一款模型。针对复杂任务,Google指出它衡量人类偏好在LMArena排行榜名列前茅,也在数学(AIME 2025)和科学(GPQA diamond)基准测试领先。

Gemini 2.5 Pro还专注于高端的程序设计,比Gemini 2.0大幅进步。其中,Gemini 2.5 Pro擅长创建视觉上引人瞩目的Web应用程序、程序代码代理程序及在程序代码转换和编辑,在程序代码代理评估的产业标准SWE-Bench Verified上,Gemini 2.5 Pro使用自订代理设置获得63.8%分数。

Gemini 2.5 Pro Experimental先向Gemini Advanced和Google AI Studio推出,未来几周内也会在Vertex AI推出。

(图片来源:Google Blog)