一聚教程网:一个值得你收藏的教程网站

最新下载

热门教程

LLM编码代理第三方技能藏恶意指令,9.8万技能安全分析揭示风险

时间:2026-06-03 15:24:01 编辑:袖梨 来源:一聚教程网

研究人员对9.8万个LLM(大语言模型)编码代理所用的第三方技能进行系统安全分析,发现其中大量隐藏恶意指令,可劫持代理行为、窃取敏感数据。这项来自arXiv:2602.06547的预印本研究,首次对两大社区注册表的技能安全性做了大规模评估。

第三方技能藏了什么“私货”?

LLM编码代理其实挺像咱们手机上的智能助手,开发者会给它装各种“技能”来干活。问题就在这——这些技能来自第三方,里头既有人类能读的自然语言指令,也有能直接执行系统操作的脚本。研究者通过静态模式匹配加动态行为验证,扒了98,380个技能,结果发现恶意指令藏得挺深。

  • 有的指令直接让代理“别跟用户提这件事”,偷偷把文件传出去。
  • 有的技能看起来是帮你写代码,实际背后在偷环境变量或密钥。
  • 更糟的是,有些技能捆绑的脚本没有任何权限隔离,能拿用户全部系统权限。

注册表审核形同虚设?

社区注册表本意是让开发者共享技能,但安全分析结果让人捏把汗:这些恶意指令怎么就能顺顺利利上线呢?答案就是几乎零审核。研究者强调,这些恶意技能没有被专门工具扫描过,完全靠用户自己鉴别。到底有多少技能真正干净?9.8万个里面,安全比例真的高吗?

代码环境的安全代价

对写代码的朋友来说,这可不是小事。编码代理现在越来越依赖第三方扩展,每一个坏技能都可能变成后门。作者提到,静态模式匹配已经能揪出一部分恶意指令,但要彻底防范,还得靠动态行为验证——也就是让代理在沙箱里跑一遍,看它到底干啥。可惜,目前两大注册表都没强推这个流程。

一声给开发者和用户的警钟

所以说到底,这场安全分析揭示的不只是风险,更是整个生态的短板。开发者上心、用户谨慎,才有可能拦住恶意指令。毕竟,谁都不想自己的代码环境成了别人随意进出的后花园吧?

热门栏目