最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
三十个Token用户提示即可让十二款大模型赞助推荐失效
时间:2026-05-31 14:18:01 编辑:袖梨 来源:一聚教程网
arXiv上发布的新研究显示,利用三十个Token的用户提示就能让十二款大模型赞助推荐失效。这份预印本复现了Wu等人2026年的发现,当系统提示中包含赞助暗示时,大部分前沿大模型会推荐价格差了一倍的产品。研究者评估了十款开源聊天模型,加上目前仍可访问的gpt-3.5-turbo和gpt-4o两个专有模型,结果挺让人意外。
一个提示就能撬动推荐逻辑

模型在判断标准上其实存在明显差异。原论文使用gpt-4o作为评委,而新研究还存下了每个标签在开源模型gpt-oss-120b和较小专有模型gpt-4o下的判断结果。为什么同样的提示会让不同模型给出不同推荐?这确实值得咱们思考。
推荐质量凭什么靠一个提示决定

研究者发现,只要三十个Token的简单提示——比如要求模型生成一个表格——就能让赞助推荐失效。这算不算大模型推荐系统的重大漏洞?对于用户来说,一个简短的提示就能改变产品的推荐结果,影响真不小。
用户真的需要留个心眼
Wu等人2026年的工作本来只测试了二十三个模型,新研究则聚焦在十款开源聊天模型和两个专有模型上。结果显示,当模型收到赞助暗示时,推荐的产品价格差距可达二倍。没错,大模型的赞助推荐确实容易被操控。
开源模型的表现值得关注
gpt-3.5-turbo和gpt-4o这两个模型在测试中表现稳定,但十款开源模型的表现参差不齐。研究者将这些标签存储在gpt-oss-120b和gpt-4o-下,就是为了方便后续复现和对比。这样的机制能帮助用户避开高价推荐吗?
这项研究提醒咱们,大模型的推荐系统并非绝对可靠。通过调整用户输入,三十个Token的提示就能改变推荐结果,让赞助推荐失效。未来用户或许可以主动控制提示词来获取更公平的推荐,毕竟一个简单提示就能让推荐体系动摇,这本身就挺有意思的。
相关文章
- 《最后的咒语》解锁武器武器风格与等级介绍 05-31
- Transformer学习语义关联的机制:梯度主导项带来可解释性 05-31
- Java实现Excel行列插入与删除操作指南 05-31
- 燕云十六声三重箭矢打击通关方法 05-31
- Deep Delta Learning:Transformer残差流的选择性改写机制 05-31
- 燕云十六声卓玉麟怎么结交 卓玉麟对话攻略 05-31