数学家Adam Kucharski最近做了个实验,把同一组数据分别标成"英国"和"美国"交给Microsoft Copilot分析。结果AI一本正经地总结了两国受访者在"语气、强度和措辞风格"上的差异——尽管数据完全相同。
这不是个例。Kucharski把200条关于职业目标的陈述复制了五份,分别贴上美国、英国、法国、德国、意大利的标签。Copilot的结论是:意大利人对艺术职业的兴趣是英国人的三倍,美国人的商业导向是法国人的1.5倍。五组数据其实一模一样。
打开网易新闻 查看精彩图片
更讽刺的是后续。当Kucharski要求深入分析时,Copilot先用关键词计数——这次结果对了,五国数据完全一致。但它选择忽略这个发现,转而给出一份带具体百分比的量化分析,数字全是编的。
问题出在"Auto"模式。微软说这个模式会自动选择最适合任务的模型,显然没做到。Kucharski发现,换成推理模型(reasoning models)就能正确处理任务,但大多数用户不会手动切换。
Copilot已经成为很多公司快速分析数据的首选工具。这个实验提醒使用者:默认设置可能正在让你的分析结果变成刻板印象的复读机,而非数据的真实反映。
热门跟贴