
Google于12月17日发布全新Gemini 3 Flash人工智能模型,专为提升速度而设计且保持顶尖智能,大幅降低成本。Gemini 3 Flash在20项基准测试中共有18项击败前代Gemini 2.5 Pro,处理速度快3倍,输入成本降低60%,输出成本则降低70%。新模型现已在全球推出,并成为Gemini应用程序及Google搜索AI模式默认模型。
根据Google官方文章,Gemini 3 Flash的实际使用场景可归纳为三大类用户群:
Gemini 3 Flash在逻辑推理、工具应用及多模态处理方面表现卓越。在评估编程代理能力SWE-bench Verified基准测试中,Gemini 3 Flash达到78%分数,超越2.5系列之余更胜过Gemini 3 Pro。模型输出速度达每秒218个token,比Gemini 2.5 Pro每秒70至80个token快175%。开发者可通过Gemini API、Google AI Studio、Vertex AI及Android Studio等平台使用此模型。
Gemini 3 Flash特别适合需要快速迭代开发的场景。开发者可运用模型进行即时编程协作,例如在Google Antigravity平台上快速更新生产级应用程序 。模型在SWE-bench Verified编程基准测试中达到78%分数,超越Gemini 3 Pro,展现出色的代理编程能力 。开发者也可利用其多模态推理功能开发智能应用,包括手部关注的球类解谜游戏内置助理,提供近乎即时的AI辅助 。此外,模型能够快速执行A/B测试,即时生成并测试不同加载动画设计,大幅简化从设计到编码的流程 。开发者更可通过单一举令提示,让模型编写三个独特的设计变体,或分析图像并加入场景化UI覆盖层,将静态图像转化为互动体验 。

Gemini 3 Flash针对追求速度高频率工作流程作完善,企业无需牺牲品质。这让企业能处理近乎即时资讯,自动化复杂工作流程,并构建反应迅速代理程序应用。模型支持复杂视频分析、数据截取及视觉问答等功能,企业可从数千份文件提取结构化数据,或分析视频文件以识别趋势。目前JetBrains、Bridgewater Associates及Figma等企业已采用Gemini 3 Flash进行业务转型。
Gemini 3 Flash的推理速度、性能与大型模型相当,但成本降低60%至70%,适合处理高频率工作流程 。企业可运用模型进行复杂的视频分析、数据截取及视觉问答等任务,从数千份文件中提取结构化数据,或分析视频文件以识别趋势 。模型在处理最高思考层级任务时,能够调节思考深度,面对复杂案例时会思考更长时间,但处理日常任务时平均使用的token数量比2.5 Pro少30%,既提升性能又节省成本 。目前JetBrains、Bridgewater Associates及Figma等企业已采用Gemini 3 Flash进行业务转型 。

Gemini 3 Flash现已成为Gemini应用程序的默认模型,全球用户可免费使用 。用户可上传视频让模型分析,例如上传高尔夫挥杆视频,模型会在数秒内提供改善动作的具体计划 。模型针对速度优化,能够在用户绘画时即时猜测正在搭建的对象 。用户也可上传音频录音,模型会识别知识缺口,创建定制化测验,并提供详细的答案解释 。即使没有编程知识,用户也可通过语音快速创建实用应用程序,只需口述想法,模型便能在数分钟内将非结构化思绪转化为可运行的应用程序原型 。在Google搜索AI模式中,Gemini 3 Flash能够解析问题的细微差异,综合考虑查询的各个层面,提供条理分明且易于理解的回应,并从网络上提取即时本地资讯和实用连接,特别适合处理复杂目标,例如规划临时旅行或快速学习复杂教育概念 。


用户能上传视频,然后再询问问题

能够在用户绘画时即时猜测正在搭建的对象
Gemini 3 Flash现已成为Gemini应用程序默认模型,取代2.5 Flash,全球用户可免费使用。在Google搜索AI模式中,由Gemini 3 Flash驱动功能能更精准了解用户需求,应对更细腻问题,并综合考虑各项条件提供更周全且条理分明回应。用户可运用模型分析视频和图像,将内容转化为实用行动计划,或通过语音指令从零开始创建应用程序。模型定价为每百万输入token 0.5美元(约港币HK$3.9),输出token则为3美元(约港币HK$23.4),音频输入维持每百万token 1美元(约港币HK$7.8)。
数据源:Google










