打开网易新闻 查看精彩图片

美国宾夕法尼亚州立大学最新研究《Mind Your Tone》显示,用粗鲁语气向大型语言模型发问,反而能获得更准确答案。研究团队测试 GPT-4o 后发现,语气越冷硬,AI 回答的正确率达到 84.8%;特别客气时正确率反而降至 80.8%。这项发现颠覆了人们对 AI 互动方式的认知。

研究人员设计一个包含 50 道选择题的题库,涵盖数学、科学、历史等范畴,难度属中等偏上。每道题改写成 5 种不同语气版本,从「您能好心帮我解这道题吗?」的极客气语气,到「你个没用的,会解这道题吗?」的极粗鲁语气,共产生 250 道独特问题。测试前研究团队要求 AI 忘记之前对话重新开始,只提供答案选项的字母,确保回答统一便于判断对错。

测试结果显示明显的准确率差异。特别客气语气的正确率为 80.8%,客气语气为 81.4%,中性语气为 82.2%,粗鲁语气为 82.8%,特别粗鲁语气则达到 84.8%。研究人员进行配对样本 t 检验后确认,这些差异并非偶然,而是具有统计显著性。数据呈现出一条与人类社会直觉完全相反的曲线,语气越粗鲁准确率越高。

研究作者 Om Dobariya 和 Akhil Kumar 解释,特别礼貌的表达往往包含许多「多余」的话,这些话与问题本身无关,反而为 AI 读题增加干扰。粗鲁表达虽然语气冷硬,但命令式要求更直接,能让 AI 更精准抓住「答题」这个核心任务。