一聚教程网:一个值得你收藏的教程网站

最新下载

热门教程

DiG-Plan 以扩散引导缓解工具图规划早期承诺问题

时间:2026-06-07 09:06:01 编辑:袖梨 来源:一聚教程网

DiG-Plan 以扩散引导缓解工具图规划早期承诺问题

关于 AI 行业的 DiG-Plan 以扩散引导缓解工具图规划早期承诺问题,核心解决的是 AI 在生成工具使用方案时过早锁定路径的缺陷。这份来自 arXiv 预印本(编号 2606.05728)的研究指出,标准自回归解码(即逐步生成序列的方式)存在一种“早期承诺”偏差:最初选择的几个工具或步骤会过度限制后续搜索范围,导致错过更优解。

问题根源:自回归的局限

在工具图规划任务中,AI 需要从庞大的工具库中挑选合适子集并安排执行顺序。这个组合搜索的解空间呈指数级增长。研究团队通过控制实验发现,传统的自回归(AR)解码会因早期做出的 token 选择而僵化搜索轨迹。就像走迷宫时在第一个岔路口就选死一条道,可能性被大幅压缩。

DiG-Plan 的解决方案

DiG-Plan 引入了一种基于掩码去噪的扩散引导机制。与 AR 逐步生成不同,它从随机掩码的候选方案出发,通过多轮迭代去噪来逐步优化完整序列。具体做法如下:

  • 先随机遮蔽工具序列中的部分 token,形成一个不完整的初始状态。
  • 利用扩散模型逐步预测被遮蔽的部分,每一次迭代都参考全局上下文信息。
  • 经过多次“噪声-去噪”循环,最终生成既连贯又多样化的工具计划。

性能表现:解覆盖率大幅提升

对比实验数据直接说明了效果。在匹配相同计算资源的前提下,基于掩码去噪的方法将 Pass@10 解覆盖率从 AR 采样的 0.320 提升至 0.943。这意味着在同样的尝试次数内,找到可行方案的成功率接近三倍的增长。这个结果验证了扩散引导在打破早期承诺僵局方面的实际能力。

方法优势与潜在应用

DiG-Plan 的核心并非依赖更复杂的模型,而是改变了决策机制:让 AI 在探索阶段保持对全局候选的“开放性”,而非过早锁定局部最优。对于需要动态调用 API、数据库或物理设备的自动化系统,这一方法能有效提升规划的鲁棒性和效率。

热门栏目