最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
DiG-Plan 以扩散引导缓解工具图规划早期承诺问题
时间:2026-06-07 09:06:01 编辑:袖梨 来源:一聚教程网
DiG-Plan 以扩散引导缓解工具图规划早期承诺问题
关于 AI 行业的 DiG-Plan 以扩散引导缓解工具图规划早期承诺问题,核心解决的是 AI 在生成工具使用方案时过早锁定路径的缺陷。这份来自 arXiv 预印本(编号 2606.05728)的研究指出,标准自回归解码(即逐步生成序列的方式)存在一种“早期承诺”偏差:最初选择的几个工具或步骤会过度限制后续搜索范围,导致错过更优解。

问题根源:自回归的局限
在工具图规划任务中,AI 需要从庞大的工具库中挑选合适子集并安排执行顺序。这个组合搜索的解空间呈指数级增长。研究团队通过控制实验发现,传统的自回归(AR)解码会因早期做出的 token 选择而僵化搜索轨迹。就像走迷宫时在第一个岔路口就选死一条道,可能性被大幅压缩。
DiG-Plan 的解决方案
DiG-Plan 引入了一种基于掩码去噪的扩散引导机制。与 AR 逐步生成不同,它从随机掩码的候选方案出发,通过多轮迭代去噪来逐步优化完整序列。具体做法如下:
- 先随机遮蔽工具序列中的部分 token,形成一个不完整的初始状态。
- 利用扩散模型逐步预测被遮蔽的部分,每一次迭代都参考全局上下文信息。
- 经过多次“噪声-去噪”循环,最终生成既连贯又多样化的工具计划。
性能表现:解覆盖率大幅提升
对比实验数据直接说明了效果。在匹配相同计算资源的前提下,基于掩码去噪的方法将 Pass@10 解覆盖率从 AR 采样的 0.320 提升至 0.943。这意味着在同样的尝试次数内,找到可行方案的成功率接近三倍的增长。这个结果验证了扩散引导在打破早期承诺僵局方面的实际能力。
方法优势与潜在应用
DiG-Plan 的核心并非依赖更复杂的模型,而是改变了决策机制:让 AI 在探索阶段保持对全局候选的“开放性”,而非过早锁定局部最优。对于需要动态调用 API、数据库或物理设备的自动化系统,这一方法能有效提升规划的鲁棒性和效率。