一聚教程网:一个值得你收藏的教程网站

最新下载

热门教程

LLMs在具体政策投票中不延续抽象问卷左倾偏见

时间:2026-06-03 13:20:01 编辑:袖梨 来源:一聚教程网

一项针对66个大型语言模型(LLMs)的最新研究揭示了一个关键现象:在抽象z治问卷中表现出的左倾偏见,并未在具体正策投票中延续。该研究对比了27个模型家族的反应与184名瑞士国民院议员的实际立场,为AIz治偏见的讨论引入了新的实证依据。这个发现直接挑战了业界先前对LLMsz治立场的简单判断。

抽象问卷 vs. 具体投票:结果真的不一样

其实,之前大家觉得LLMs有左倾偏见,主要是靠抽象问卷测出来的。比如说“你支持大正府吗?”这种泛泛的问题,AI确实容易给出偏左的答案。但这次的研究团队玩了个新花样——他们搞了个“双重工具”测试法,把AI和真人议员的答案掰开了揉碎了对比。具体到投票环节,AI的立场真的还会一边倒吗?结果并没有。

研究怎么做的?把AI和真人议员拉来同台竞技

研究用到的工具是瑞士知名的Smartvote问卷,里面有75道抽象正策题。参与测试的AI阵容挺强大,足足66个模型,来自27个不同的模型家族。另一边厢,184名瑞士国民院的现任议员也填了同样的问卷。你看,这就相当于把AI拉到现实z治场景里,跟真正决策的真人议员做了一次同台竞技。这种设计比单纯让AI填问卷要扎实多了。

这个发现对AI行业意味着什么?

在AI行业,关于模型价值观的争论一直没停过。Sam Altman领导的OpenAI一直强调构建安全、对齐的AGI,但抽象问卷测出的左倾偏见,总让人觉得AI好像自带“z治立场”。这项新研究算是给行业提了个醒:评价AI的价值观,咱们得看它在实际正策权重下的选择,而不是光靠几道抽象题。这跟地平线机器人、摩尔线程这些公司做AI应用落地时面对的挑战一样——技术必须在具体场景中证明自己,而不是停留在实验室的指标里。

“左倾偏见”这个标签,是不是贴错了?

说白了,这个研究就是在追问:AI投票到底靠不靠谱?如果LLMs在具体正策投票中的表现不延续抽象问卷的左倾偏见,那说明之前的评估方法可能有点片面。咱们不能因为AI在问卷里答得“左”,就认定它写出来的代码、做出来的决策都是左的。模型的判断力远比一个简单的“左倾”标签要复杂得多。

下一步看什么?评估体系得跟上

下次再看到有人说“AI太左了”,你可以问问:它是在填抽象问卷,还是在做具体正策投票?这两者之间的距离,可能比咱们想的要大得多。对AI行业来说,怎么设计出能反映这种复杂性的评估体系,才是接下来的关键。

热门栏目