综合中媒及港媒报道,阿里巴巴开源了ZeroSearch,这是一种无需与真实搜索引擎互动即可激励大模型搜索能力的强化学习框架,其利用大模型预训练知识转化为检索模块,能动态控制生成内容品质。此外,在多个问答数据集上,其搜索能力超过Google搜索,且成本大幅降低。
研究人员在NQ、TriviaQA、PopQA、HotpotQA等7大问答数据集上进行了综合评测。结果显示,一个70亿参数的监督微调模型使用ZeroSearch后,其搜索能力达到了33.06;140亿参数的模型则达到了33.97,超过了Google搜索的32.47。
在成本方面,研究人员通过SerpAPI使用Google搜索进行约6万4,000次搜索查询的训练,成本约为586.70美元;而在四个A100GPU上使用140亿参数的大模型进行模拟时,成本仅为70.80美元,成本降低了80%以上。
(首图来源:shutterstock)