Google多模态模型再进化，Gemini 2.5 Pro内置思考能力

Google 25日宣布，为Gemini Advanced订阅用户和开发者推出实验版本Gemini 2.5 Pro Experimental。

Gemini 2.0现在进化至Gemini 2.5，新系列中的所有模型都属于具有思考能力的模型，可在回应之前进行推理，进而提高性能和准确性。Google将思考能力直接植入这些模型中，使其能够“处理更复杂的问题，并支持更强大、更具备场景意识的AI代理”。

与去年12月首次公开且在本月获得更新的Gemini 2.0 Flash Thinking相比，Gemini 2.5 Pro名称不再加上“Thinking”这样的标签，而模型可在Gemini应用程序显示思考过程，让用户查看整个思路。

Gemini 2.5 Pro除原生多模态外，还具有100万个词元（token）的上下文长度，并计划支持至200万个词元。在Gemini应用程序中，Gemini 2.5 Pro Experimental将取代Gemini 2.0 Pro Experimental，且能连接Gmail、YouTube等并支持文件上传。

Gemini 2.5的特点在于，通过结合显著增强的基础模型和改进的Post-Training，展现新的性能水准。

Gemini 2.5 Pro（gemini-2.5-pro-exp-03-25，代号“nebula”）是该系列第一款模型。针对复杂任务，Google指出它衡量人类偏好在LMArena排行榜名列前茅，也在数学（AIME 2025）和科学（GPQA diamond）基准测试领先。

Gemini 2.5 Pro还专注于高端的程序设计，比Gemini 2.0大幅进步。其中，Gemini 2.5 Pro擅长创建视觉上引人瞩目的Web应用程序、程序代码代理程序及在程序代码转换和编辑，在程序代码代理评估的产业标准SWE-Bench Verified上，Gemini 2.5 Pro使用自订代理设置获得63.8%分数。

Gemini 2.5 Pro Experimental先向Gemini Advanced和Google AI Studio推出，未来几周内也会在Vertex AI推出。