一聚教程网:一个值得你收藏的教程网站

最新下载

热门教程

三十个Token用户提示即可让十二款大模型赞助推荐失效

时间:2026-05-31 14:18:01 编辑:袖梨 来源:一聚教程网

arXiv上发布的新研究显示,利用三十个Token的用户提示就能让十二款大模型赞助推荐失效。这份预印本复现了Wu等人2026年的发现,当系统提示中包含赞助暗示时,大部分前沿大模型会推荐价格差了一倍的产品。研究者评估了十款开源聊天模型,加上目前仍可访问的gpt-3.5-turbo和gpt-4o两个专有模型,结果挺让人意外。

一个提示就能撬动推荐逻辑

模型在判断标准上其实存在明显差异。原论文使用gpt-4o作为评委,而新研究还存下了每个标签在开源模型gpt-oss-120b和较小专有模型gpt-4o下的判断结果。为什么同样的提示会让不同模型给出不同推荐?这确实值得咱们思考。

推荐质量凭什么靠一个提示决定

研究者发现,只要三十个Token的简单提示——比如要求模型生成一个表格——就能让赞助推荐失效。这算不算大模型推荐系统的重大漏洞?对于用户来说,一个简短的提示就能改变产品的推荐结果,影响真不小。

用户真的需要留个心眼

Wu等人2026年的工作本来只测试了二十三个模型,新研究则聚焦在十款开源聊天模型和两个专有模型上。结果显示,当模型收到赞助暗示时,推荐的产品价格差距可达二倍。没错,大模型的赞助推荐确实容易被操控。

开源模型的表现值得关注

gpt-3.5-turbo和gpt-4o这两个模型在测试中表现稳定,但十款开源模型的表现参差不齐。研究者将这些标签存储在gpt-oss-120b和gpt-4o-下,就是为了方便后续复现和对比。这样的机制能帮助用户避开高价推荐吗?

这项研究提醒咱们,大模型的推荐系统并非绝对可靠。通过调整用户输入,三十个Token的提示就能改变推荐结果,让赞助推荐失效。未来用户或许可以主动控制提示词来获取更公平的推荐,毕竟一个简单提示就能让推荐体系动摇,这本身就挺有意思的。

热门栏目