法国AI创业公司Mistral AI本周公布并开源新版小语言模型Magistral Small 1.2,除了提升性能,增加视觉编码功能,也能跑在MacBook计算机上。

Magistral Small 1.2为1.1版的升级,Mistral说明,它是以Mistral Small 3.2 (2506)为基础开发,具备推理能力能在回答前执行一长串推理,并且经过监督式微调(SFT),训练数据源是推理模型家族的Magistral Medium推论时产生的轨迹,之后又加上强化式学习(RL)优化而成的高效率小型推理模型。Magistral Small 1.2参数量240亿,具备最长128K脉络空间。

Magistral Small系列都能于本地部署,经过量化(quantized)后可在Nvidia RTX 4090 GPU平台的机器或是一台32GB RAM的MacBook上执行。

相较于前一版,Magistral Small 1.2添加视觉编码器,可接收多模态包括文本和图片输入,推理能力也波及视觉。性能也提升,数学和程序撰写基准测试得分增长15%。它也改进了工具使用能力,能利用外部工具上网搜索、执行程序代码或生成图片。此外,新模型更人性化,它的回应更清晰、自然,文本排版或符号使用也美观。

Magistral Small 1.2支持20多种语言,包括英、法、德、西、中、日、韩等。

Mistral同时也更新了推理模型Magistral Medium 1.2,添加视觉支持,如同Magistral Small 1.2,Medium版也具备最长128K脉络空间。二个模型都是以Apache 2.0授权开源,允许商业或非商业用途的使用和修改。