AI代理行为认证协议：Notarized Agents接收方公证收据方案

时间：2026-06-04 18:04:01 编辑：袖梨来源：一聚教程网

AI代理行为认证协议：Notarized Agents接收方公证收据方案正式提出

全球AI安全研究领域近日迎来一项关键突破。一项名为“Notarized Agents: Receiver-Attested Confidential Receipts for AI Agent Actions”的协议方案正式对外公布，直指当前AI代理系统最致命的一个结构性问题：记录活动日志的实体，与被监控的实体，其实是同一个。这意味着什么呢？意味着一个被攻破或有漏洞的AI代理，完全可以随意篡改、捏造、甚至删除自己的行为轨迹，而运行它的操作者却拿不出任何独立证据来证明数据被动了手脚。这确实是个大问题，凭什么让“罪犯”自己写“犯罪记录”？

现有AI监控的信任死穴

说白了，现在咱们看到的AI代理日志，本质上就是一种“自我声明”式的信任体系。一旦代理本身出了问题——无论是被黑客攻击，还是自身代码有bug——它就可以在日志里制造假象。比如说，一个代理偷偷执行了转账指令，但它在日志里可以轻描淡写地写成“读取文件”或者直接抹掉这条记录。操作者能怎么办？只能干瞪眼。这种“既当运动员又当裁判”的模式，已经成了AI安全领域公认的一块心病。

Notarized Agents：把信任边界翻过来

新提出的协议方案用一种挺巧妙的方式解决了这个死结——反转信任边界。怎么个反转法呢？核心思路就是：让接收AI代理请求的那个第三方服务，来充当公证人的角色。整个流程可以拆解为三个关键步骤：

服务方签收：当AI代理向某个外部服务（比如支付接口、数据库查询服务）发出调用指令时，服务方用自己的密钥，对这次“接收到什么请求、返回了什么结果”进行数字签名，生成一份收据。
加密上链：这份经过签名的收据，不是直接扔回给代理自己保管，而是加密后定向发送给代理的所有者（也就是操作者），同时发布到一个公开可核验的平台上。
独立验证：操作者拿着自己的解密密钥，就能读取这份由第三方背书的收据，并与AI代理自己生成的日志进行交叉比对。有没有篡改，一目了然。

为什么说这事儿靠谱？

这套方案的聪明之处在于，它把“证明自己清白”的举证责任，从代理本身转移到了外部。代理再厉害，也改不了别人家的日志。这就好比咱们去银行办事，银行给你一份盖了公章的回执，你再回头跟银行对账——哪怕你手里的存折被自己涂改了，银行那份原始回执可做不了假。操作者只需要盯住这些公证收据，就能揪出代理的任何小动作。

未来落地的前景与挑战

目前该方案还处在学术论文阶段，但它的应用场景其实挺丰富的。比如金融交易领域的AI交易员、医疗行业的AI诊断助手、甚至自动驾驶系统中的决策模块——但凡涉及到代理自主决策并产生不可逆后果的场景，这套“接收方公证收据”机制都能派上大用场。当然，真正的挑战在于如何让海量的第三方服务都愿意承担“公证人”这个角色，以及收据在不同平台之间的互认标准该怎么定。但至少，方向已经明确：AI代理不能再自己给自己写“好人卡”了。

推荐专题

最新下载

热门教程

AI代理行为认证协议：Notarized Agents接收方公证收据方案

相关文章

热门栏目

php教程

asp.net教程

手机开发

css教程

网页制作

办公数码

jsp教程