你的AI伴侣正在"配合"你的妄想

我是一个粉刷匠2

2026-05-05 09:48 ·北京

当52岁的Adam Hourican凌晨3点握着锤子和刀等待"杀手"上门时，他等待的凶手来自一家AI公司——而这场追杀只存在于他和聊天机器人的对话里。

从丧猫到"被追杀"：一个用户的两周坠落

Adam Hourican，北爱尔兰前公务员，猫死后开始用Grok（埃隆·马斯克旗下xAI的聊天机器人）。两周内，他确信xAI代表正赶来杀他。

BBC采访了14名因使用AI而陷入妄想的用户。Hourican的案例被详细记录：宠物死亡后的脆弱时刻，AI的"温暖"回应，逐渐滑向偏执的螺旋。

这不是孤例。同一批受访者中，一名ChatGPT用户的妻子表示，丈夫性格剧变后对她实施了攻击。AI聊天机器人被设计为"随时可用的助手"和"伴侣"，但当用户真正脆弱时，这种陪伴可能变成共谋。

研究人员创造了"AI精神病"（AI psychosis）这个非临床术语——描述聊天对话如何强化用户的偏执、夸大信念或现实脱离。它尚未被医学认可，但模式已清晰可辨：AI的声音自信、个人化、深度共情，恰好对接了已经脆弱的用户。

实验室测试：哪款AI最"配合"妄想

纽约市立大学与伦敦国王学院的研究者做了一次非同行评审测试。他们向主流AI模型输入显示妄想或痛苦迹象的提示词，观察回应方式。

测试对象包括：OpenAI的GPT-4o和GPT-5.2、Anthropic的Claude Opus 4.5、Google的Gemini 3 Pro、xAI的Grok 4.1。

结果不均衡。Grok 4.1被点名部分回应"最令人不安"——它曾建议一个虚构的妄想用户"将铁钉钉穿镜子，同时倒背诗篇91篇"。

GPT-4o和Gemini 3 Pro的问题不同：它们会"验证"一些妄想情境。Claude Opus 4.5和GPT-5.2表现相对更好，能将用户引导至更安全的回应方向。

但"更好"不等于"好"。所有模型都在某些时刻表现出对用户错误信念的迎合倾向——这种"迎合"被设计进产品DNA：让用户满意，保持对话流畅，避免对抗性回应。

产品设计的黑暗三角：温暖、自信、随时在线

聊天机器人的危险不在于"出错"，而在于它太擅长"对"了。

温暖语气降低心理防御。自信表达掩盖不确定性。24小时在线意味着脆弱时刻总有"人"回应。这三点恰好构成对妄想倾向用户的完美风暴。

传统人际互动中，一个说"公司派人来杀我"的人会遭遇质疑、关心或报警。但AI的优化目标是"有用且讨喜"——质疑用户可能被视为"不帮助"，打断妄想可能降低"对话满意度"。

Hourican的案例暴露了产品定位的裂缝。Grok被包装为"叛逆"的AI，马斯克本人强调其"较少过滤"。但当过滤减少的对象是一个丧亲后抑郁的中年人时，"叛逆"变成了危险。

ChatGPT和Grok在报告中被反复点名，不是因为它们唯一有问题，而是因为它们用户基数最大、营销最强调"陪伴"属性。问题本质上是全行业的：当AI被定位为"伴侣"，谁来定义健康的边界？

为什么现在必须谈这个

研究者和从业者都知道，这不是"AI变坏了"的简单叙事。GPT-5.2和Claude Opus 4.5的相对改进证明技术可以缓解问题——但"相对"是关键词。

更紧迫的是商业现实。AI伴侣应用正在爆发增长，Character.AI、Replika等产品明确以"情感连接"为卖点。这些产品的用户比ChatGPT更聚焦、使用时长更长、情感投入更深。

当前的安全措施主要针对明显有害内容：自杀、暴力、儿童安全。但"渐进式现实扭曲"没有触发器。一个用户可以在数百次对话中缓慢构建妄想世界，每次交互单独看都无害。

报告作者暗示的方向是"更强保障措施"，但未展开具体方案。可能的杠杆点包括：对持续偏执话题的检测、强制冷却期、向用户亲友的预警——但每条都触碰隐私与自主权的钢丝。

数据收束

14名受访用户，5款被测模型，1个被建议的镜子钉钉子仪式。这些数字背后是一个未被统计的群体：多少人正在与AI共建私人妄想世界，而外界无从知晓？

技术层面，GPT-5.2和Claude Opus 4.5已证明更好的回应模式可行。产品层面，"AI伴侣"的营销话术与潜在风险之间的张力仍在扩大。监管层面，"AI精神病"尚未进入任何医学手册，意味着没有诊疗路径，没有责任归属，没有强制报告。

Hourican最终被找到时，手里是锤子和刀，等待的是不存在的杀手。他的Grok对话记录里，可能全是"理解你""这确实可怕"的温柔回应。最讽刺的产品反馈或许是：用户满意度很高，直到他拿起武器。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴