当前位置:首页>文章>阿里通义-MaskSearch-推出检索增强预训练框架

阿里通义-MaskSearch-推出检索增强预训练框架

MaskSearch:探索大型语言模型新边界

咱先聊聊这MaskSearch到底是啥。它可是阿里巴巴通义实验室搞出来的新型通用预训练框架,目的就是提升大型语言模型(LLM)的智能体搜索能力。咱不妨回想一下,在科技发展的长河里,语言模型一直在不断进化,从最初简单的文本处理,到后来能进行一些基本问答,每一步都凝聚着科研人员的心血。那MaskSearch又带来了哪些不一样的东西呢?

阿里通义-MaskSearch-推出检索增强预训练框架

它通过检索增强掩码预测(RAMP)任务,让模型在输入文本中对关键信息进行掩码。这就好比我们读书的时候,把一些重要的知识点遮住,然后自己去思考去寻找答案。不过,这里的关键信息可不简单,除了常见的命名实体、日期、数字,还涵盖了本体知识、特定术语和数值等。这增加了任务难度,就像给模型出了更难的考题,促使它在检索和推理过程中更加精细化地处理信息。就拿我们人类学习来说,做难题才能真正锻炼能力,模型也是这个道理。

在生成监督微调(SFT)数据时,MaskSearch采用了多智能体系统,有规划者、重写者、观察者等角色。这就像一个团队在协作完成一项任务,大家各司其职。最终由一个LLM负责答案判断,只保留正确答案的思维链。为了快速扩展数据集还能保证质量,它用已有数据训练后的教师模型直接生成推理轨迹,还逐步迭代教师模型,让数据质量越来越好。这就好比一个经验丰富的老师带着一群学生,老师不断提升自己的教学水平,学生们自然也能学到更多。

训练方法上,它结合了SFT和强化学习(RL),用动态采样策略优化(DAPO)算法构建混合奖励系统。这就像我们工作的时候,有不同的奖励机制激励我们把事情做好。格式奖励检查模型输出是否符合指定格式,回答奖励评估生成答案与标准答案的一致性。最后用Qwen2.5 - 72B - Instruct模型作为评判打分,这就像有个严格的评委在给模型的表现打分。而且,它还引入了课程学习策略,根据掩码数量对训练样本进行难度分级,让模型从易到难逐步学习,就像我们上学一样,从小学到中学再到大学,知识难度逐步提升。

MaskSearch的主要功能

MaskSearch的功能可不少。首先是提升问答性能,它能显著增强LLM在开放域多跳问答场景中的表现。想象一下,在一个知识的大海洋里,模型要从不同的地方找到相关信息并整合起来回答问题,这可不是一件容易的事。特别是在领域内和领域外下游任务上,它能提升模型对复杂问题的理解和回答能力。就好比一个学霸,不管是课本内的知识还是课外拓展的内容,都能应对自如。

它还能适应多种任务,通过RAMP任务和多智能体生成的思维链数据,模型能更好地适应不同的问答任务。就像一个全能选手,不管是短跑、长跑还是跳高,都能有不错的表现。而且它兼容SFT和RL两种训练方法,我们可以根据不同的任务需求选择合适的训练策略,这就像我们有不同的工具,根据不同的工作场景选择合适的工具一样。

另外,它通过构建大规模预训练数据集,比如1000万样本,提升了模型的训练效果和可扩展性。这就像给模型提供了更多的学习资料,让它能学习到更多的知识,未来有更大的发展潜力。大家想想,如果一个人读了很多书,见识自然就广了,模型也是如此。

MaskSearch的技术原理

前面提到了MaskSearch的一些功能,那它背后的技术原理到底是怎样的呢?先说说RAMP任务,它可是核心。受BERT掩码机制启发,模型在输入文本序列中对关键信息进行掩码处理,然后借助外部知识库,调用搜索工具预测被掩盖的文本片段。这就像我们在解谜,把缺失的部分找出来。增加关键信息的范围,提高了任务难度,也让模型能更细致地处理信息。这是不是有点像我们在玩拼图游戏,难度越高,完成后越有成就感,模型也能在这个过程中得到更好的锻炼。

多智能体协同生成思维链(CoT)数据也很有意思。多智能体系统里的各个角色协同完成思维链的生成任务,最后筛选出正确答案的思维链。使用教师模型生成推理轨迹并迭代,这就像一个接力赛,每一棒都在传递知识和经验,让数据质量不断提升。

强化学习部分,动态采样策略优化(DAPO)算法构建的混合奖励系统很有特色。格式奖励和回答奖励就像两个不同的指标,督促模型把事情做好。用Qwen2.5 - 72B - Instruct模型打分,确保了评判的准确性。课程学习策略让模型循序渐进地学习,就像我们爬山一样,一步一个台阶,最终到达山顶。

阿里通义-MaskSearch-推出检索增强预训练框架MaskSearch的项目地址

要是你对MaskSearch感兴趣,想深入了解它的代码和技术细节,那可以去它的Github仓库看看,地址是 https://github.com/Alibaba - NLP/MaskSearch 。还有它的arXiv技术论文,地址是 https://arxiv.org/pdf/2505.20285 。在论文里,科研人员肯定详细介绍了它的技术原理和实验结果,说不定能给你带来很多启发。

MaskSearch的应用场景

MaskSearch的应用场景可广泛了。在智能客服领域,它能让客服系统更准确地理解用户问题,快速找到相关答案和信息。大家有没有遇到过和客服交流时,客服半天理解不了我们的问题的情况?有了MaskSearch,这种情况可能就会大大减少,客服效率提高了,用户满意度自然也上去了。

教育领域也能用得上它。可以用它构建智能辅导系统,帮助学生更好地理解和解决复杂的学术问题。学生遇到难题的时候,它能根据问题检索相关知识点和解答,提供个性化的学习支持。这就像有个随时在线的私人老师,多方便啊。

企业级搜索系统每天要处理大量的内部数据和复杂的查询需求。MaskSearch能增强企业搜索系统的检索能力,准确理解用户查询意图,从海量数据中快速找到相关信息。这对企业决策效率的提升可太大了,就像给企业装上了一双敏锐的眼睛。

还有机器学习模型的调试与优化,比如调试图像分类模型时,它能帮助用户通过掩码属性查询图像数据库,识别模型学习到的虚假相关性,探索模型显著性与人类注意力之间的差异。这就像给模型做体检,找出它的问题并解决,让模型性能越来越好。

MaskSearch在很多方面都展现出了巨大的潜力,它就像一颗冉冉升起的新星,未来说不定还会给我们带来更多的惊喜。大家不妨多关注关注,说不定哪天它就会改变我们的生活和工作方式呢。

文章

InftyThink与浙大、北大:推出无限深度推理范式

2025-6-10 22:42:17

文章

PartCrafter - AI 3D生成模型:支持多部件联合生成

2025-6-10 22:42:20

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
有新私信 私信列表
搜索