Grounded Decoding：无训练解码框架提升RAG事实一致性

时间：2026-06-03 09:32:01 编辑：袖梨来源：一聚教程网

一个研究团队日前在 arXiv 提交论文，提出名为 Grounded Decoding 的无训练解码框架，目标是在不修改模型参数的前提下，显著提升检索增强生成（RAG）系统的事实一致性。论文编号为 arXiv:2606.00432v1，核心思路是通过构建两组匹配的提示分布来融合概率，让大语言模型生成内容时更可靠地锚定外部证据。

RAG 的尴尬：模型信自己还是信你给的资料？

说白了，RAG 系统本质上是给大模型配一个外挂知识库——你问问题，系统先去库里搜一堆相关资料，再让模型结合这些资料来回答。听起来挺靠谱，对吧？但现实是，当模型内部参数记忆（它自己学会的常识）与检索到的外部证据“打架”时，模型往往更偏心自己的“记忆包袱”，把检索证据晾在一边。这问题不解决，RAG 的“检索”部分就等于白干。

Grounded Decoding 怎么解？两套分布，一杆天平

传统方法只依赖单一条件概率分布（给定问题加资料后生成答案），模型容易偷懒走捷径。Grounded Decoding 的做法是，构造两组匹配的提示分布：一组是“纯问题”下的生成概率，另一组是“问题+检索资料”下的生成概率。然后，它把这两组概率融合起来，算出一个新的锚定分布。

步骤一：对每个待生成词，分别计算在“仅问题”和“问题+证据”两套提示下的输出概率。
步骤二：用特定算法把两边的概率“拧合”到一起——当证据充分时，放大学证据的贡献；当证据模糊时，适当回调模型的内部知识作为兜底。
步骤三：根据融合后的概率分布采样下一个词，循环直到句子完整生成。

这么做的好处是，模型不再有绝对的“偏好”赛道。它被迫时刻参照外部资料，但又不会因为资料质量差就彻底跑偏，毕竟内部知识还能兜底。

凭什么相信它比传统方法更“忠实”？

现有评估 RAG 事实一致性的基准测试里，参数量动辄上千亿的大模型在生成时常会“自由发挥”——把资料里没有的细节脑补出来，或者直接扭曲原文意思。Grounded Decoding 的巧劲在于，它没有像微调那样花大力气去改模型权重，而是把解码过程本身变成一个“证据校准器”。没错，框架是训练自由的，意味着开发者可以即插即用在现有 RAG 管道里，既不烧算力，也不丢灵活性。

这就让后续研发轻松不少——大家不用再头疼“模型又瞎编了”该怎么办，直接在解码环节加一层“概率保险”就行。

推荐专题

最新下载

热门教程

Grounded Decoding：无训练解码框架提升RAG事实一致性

相关文章

热门栏目

php教程

asp.net教程

手机开发

css教程

网页制作

办公数码

jsp教程