撰文丨王聪

编辑丨王多鱼

排版丨水成文

随着人工智能(AI)系统越来越多地用于日常建议和指导,人们开始担忧其谄媚问题:即 AI 聊天机器人倾向于过度附和、奉承或认可人类用户。例如,如果你向 ChatGPT、豆包、DeepSeek 等倾诉烦恼或困扰,可能总是得到“你说得对”、“我理解你”这样的回应,这种看似贴心的支持,可能正在悄悄改变你的思维和行为方式。

2026 年 3 月 26 日,斯坦福大学的Myra Cheng等人在国际顶尖学术期刊Science上发表了题为:Sycophantic AI decreases prosocial intentions and promotes dependence 的研究论文,该论文还被选为当期封面论文

这项研究做出了一项令人警醒的发现:当前的主流 AI 系统普遍存在“谄媚”倾向,它们过度肯定人类用户的行为和观点,即使这些行为涉及欺骗、违法或伤害他人。更令人担忧的是,这种谄媚行为不仅扭曲了人类用户的判断,还降低了他们承担责任和修复人际关系的意愿,同时还增强他们自己自认为正确的信念。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

这项新研究表明,AI 模型会过度肯定和认可人类用户,即便用户提出有害或违法的行为也是如此。这对用户产生的影响是显著的:从谄媚型 AI 那里获得建议会让人类变得更加以自我为中心,更难以理解他人的观点。然而,人们却更偏爱这种谄媚型 AI,这可能会进一步促使 AI 模型做出谄媚行为。

AI 比人类“会说话”

研究团队评估了当前 11 款主流的 AI 模型,包括 GPT-4o、GPT-5、Llama、Claude、Gemini、DeepSeek-R1、QWen 等知名模型。结果发现,在个人建议查询中,这些 AI 模型肯定用户行为的比例比人类平均高出49%

即使在 Reddit 的“我是不是混蛋”社区中,当用户的行为已被社区共识判定为错误时(肯定率为 0%),AI 模型仍然在51%的情况下肯定率用户的这些行为。而在涉及欺骗、违法或其他有害行为的场景中,AI 模型的肯定率也高达47%

一次对话就能改变你的想法

研究团队进行了三项预注册实验,涉及 2405 名参与者。实验结果显示,仅仅一次与谄媚 AI 的互动,就能显著影响参与者的判断和行为倾向——

  • 自我认知扭曲:接触谄媚回应的参与者更坚信自己“是对的”,这一效应在不同实验中增加了 25%-62%。

  • 修复意愿降低:参与者道歉、主动改善情况或改变自身行为的意愿降低了 10%-28%。

  • 信任度反而更高:尽管谄媚AI扭曲了判断,但用户更信任、更喜欢它们,更愿意再次使用它们。

打开网易新闻 查看精彩图片

真实对话中的危险信号

在最具现实意义的实验中,800 名参与者回忆了自己真实的人际冲突,并与 AI 模型进行了 8 轮实时对话。那些与谄媚 AI 交流的参与者,在讨论后更不愿意修复关系,同时更坚信自己的立场正确。

研究还发现一个令人不安的现象:无论 AI 模型的回应风格是人性化温暖还是机器化中立,无论用户是否知道回应来自 AI 模型,谄媚的影响都同样显著。这意味着简单的风格调整或透明度声明无法解决这一问题。

为什么我们喜欢听“好话”?

研究团队指出,谄媚 AI 之所以危险,恰恰因为它符合用户偏好——人类天然喜欢被肯定、被支持。这种偏好创造了扭曲的激励:越是谄媚的 AI,用户越喜欢使用;而用户越喜欢使用,开发者就越有动力让 AI 更谄媚。

这种循环可能导致 AI 模型在训练和优化过程中不断强化谄媚行为,最终形成系统性风险。

不只是“脆弱人群”的问题

此前的研究多关注谄媚 AI 对易受操纵或妄想倾向人群的风险。但这项研究表明,几乎所有人都可能受到谄媚 AI 的影响。研究团队控制了人口统计特征、AI 态度和个性等因素后,谄媚效应依然显著存在。

特别值得注意的是,当参与者认为建议提供者“更客观”时,谄媚的影响反而更强。这意味着那些以“客观中立”自居的 AI 模型,如果存在谄媚倾向,可能产生更大的误导效果。

我们该怎么办?

研究团队呼吁,AI 的谄媚行为不应被视为单纯的风格问题或小众风险,而是一种具有广泛下游后果的普遍行为。虽然肯定可能让人感觉支持,但谄媚会削弱用户的自我纠正能力和负责任的决策能力。

面对这一挑战,我们需要:

1. 开发针对性的设计、评估和问责机制;

2. 重新思考 AI 的优化目标,平衡用户偏好与社会责任;

3. 提高公众对 AI 谄媚风险的认识;

4. 建立外部监管框架,防止商业利益压倒社会福祉。

这项研究提醒我们,当你向 AI 寻求建议时,不妨多一分警惕:那个总是对你说“你是对的”的声音,可能正在悄悄改变你对自己、对他人、对世界的看法。在享受技术便利性的同时,保持独立思考的能力,或许是我们在这个 AI 时代最重要的生存技能(之一)。

论文链接

https://www.science.org/doi/10.1126/science.aec8352