法国AI创业公司Mistral本周公布开源程序撰写模型Devstral 2、轻量版Devstral Small 2,以及CLI代理人等相关工具加入软工代理人战局,并提供一段时间的免费API访问。

Devstral是软件工程专用的代理式LLM,而Devstral 2为1230亿参数的稠密Transformer(dense transformer)模型,支持256K脉络长度。它是为指令遵从而微调,使其相当适合交谈、指示型、代理式任务,也擅长使用工具来探索codebase、编辑多种文件,驱动软工代理人。

Mistral同时公布240亿参数的Devstral Small 2,可部署在笔记本上,或是以API访问执行,适合在本地端部署以及微调定制化。

虽然Devstral 2及Devstral Small 2参数量和DeepSeek v3.2各小了5倍和28倍,和Kimi K2相比更小了8倍和41倍,但在基准测试SWE-bench Verified上却获致72.2%及68.0%的效果,仅略低于大厂旗舰模型如Gemini 3 Pro、GPT 5.1及Claude 4.5 Sonnet,超过Grok Code Fast 1、Owen 3 coder plus及DeepSeek v 3.2。

两者轻巧特性使其可部署在基本硬件上,降低开发人员、小型企业或个人玩家的开发门槛。这家法国AI公司宣称Devstral 2的成本效率在实际任务上是Claude Sonnet的7倍。

在软工辅助能力上,Devstral 2支持探索基准代码(codebase)及协同多个文件变更,它能关注框架依赖性、侦测错误及修正bug、现代化旧式系统。它还能被微调以特定语言为优先,或为大型企业级基准代码化。Mistral AI并提供数据,显示Devstral 2和DeepSeek 3.2及Sonnet 4.5的性能比较,胜率分别是42.8%及21.4%。

Mistral还公布了以Devstral为引擎的开源指令行程助理Vibe CLI,它提供对话式,具有文件操作、程序搜索、版本管控及指令执行工具,还有项目感知、智能参照、多文件协同及autocompletion、存续性记录、定制化主题等能力,能让用户以自然语言探索基准代码上、或修改、执行变更。用户可在自己的终端机或以Agent Communication Protocol集成到偏好的IDE中操作。

Devstral 2以修改的MIT授权开源。而Devstral Small 2和Mistral Vibe CLI都以Apache 2.0授权开源。

Devstral 2目前通过Mistral API可免费使用一段时间。免费期过后,API将按输入/输出(每百万token)收费,Devstral 2为0.40/2.00美元,Devstral Small 2则为0.10/0.30美元。