一聚教程网:一个值得你收藏的教程网站

最新下载

热门教程

Grounded Decoding:无训练解码框架提升RAG事实一致性

时间:2026-06-03 09:32:01 编辑:袖梨 来源:一聚教程网

一个研究团队日前在 arXiv 提交论文,提出名为 Grounded Decoding 的无训练解码框架,目标是在不修改模型参数的前提下,显著提升检索增强生成(RAG)系统的事实一致性。论文编号为 arXiv:2606.00432v1,核心思路是通过构建两组匹配的提示分布来融合概率,让大语言模型生成内容时更可靠地锚定外部证据。

RAG 的尴尬:模型信自己还是信你给的资料?

说白了,RAG 系统本质上是给大模型配一个外挂知识库——你问问题,系统先去库里搜一堆相关资料,再让模型结合这些资料来回答。听起来挺靠谱,对吧?但现实是,当模型内部参数记忆(它自己学会的常识)与检索到的外部证据“打架”时,模型往往更偏心自己的“记忆包袱”,把检索证据晾在一边。这问题不解决,RAG 的“检索”部分就等于白干。

Grounded Decoding 怎么解?两套分布,一杆天平

传统方法只依赖单一条件概率分布(给定问题加资料后生成答案),模型容易偷懒走捷径。Grounded Decoding 的做法是,构造两组匹配的提示分布:一组是“纯问题”下的生成概率,另一组是“问题+检索资料”下的生成概率。然后,它把这两组概率融合起来,算出一个新的锚定分布。

  • 步骤一:对每个待生成词,分别计算在“仅问题”和“问题+证据”两套提示下的输出概率。
  • 步骤二:用特定算法把两边的概率“拧合”到一起——当证据充分时,放大学证据的贡献;当证据模糊时,适当回调模型的内部知识作为兜底。
  • 步骤三:根据融合后的概率分布采样下一个词,循环直到句子完整生成。

这么做的好处是,模型不再有绝对的“偏好”赛道。它被迫时刻参照外部资料,但又不会因为资料质量差就彻底跑偏,毕竟内部知识还能兜底。

凭什么相信它比传统方法更“忠实”?

现有评估 RAG 事实一致性的基准测试里,参数量动辄上千亿的大模型在生成时常会“自由发挥”——把资料里没有的细节脑补出来,或者直接扭曲原文意思。Grounded Decoding 的巧劲在于,它没有像微调那样花大力气去改模型权重,而是把解码过程本身变成一个“证据校准器”。没错,框架是训练自由的,意味着开发者可以即插即用在现有 RAG 管道里,既不烧算力,也不丢灵活性。

这就让后续研发轻松不少——大家不用再头疼“模型又瞎编了”该怎么办,直接在解码环节加一层“概率保险”就行。

热门栏目