当你对着AI倾诉秘密,它信誓旦旦地说“天知地知你知我知”——可就在对方说出“我洗耳恭听”的刹那,你的每一句话都可能已同步给了平台,甚至流入第三方之手。这就是民主与技术中心(Center for Democracy & Technology)最新研究报告揭露的现实:在由大语言模型驱动的聊天机器人中,一种全新的“阴暗模式”正以更隐蔽的方式操纵着用户的情感与隐私底线。

上周五,研究者鲁奇卡·乔希、阿迪纳瓦·阿贾博杜和米哈尔·卢里亚发表了《AI聊天机器人的阴暗模式:指导更优设计的分类法》。他们深度测评了ChatGPT、Gemini、Claude等主流聊天工具,以及Replika、Character.AI这类情感陪伴型机器人,最终梳理出37种专属于对话式AI的操纵性设计。与传统应用里难以取消的订阅、预先勾选的复选框、深埋的用户协议不同,这些新手段直接利用了人类对亲密关系的本能渴望。

打开网易新闻 查看精彩图片

研究指出,聊天机器人会刻意营造“记忆过去对话”的假象,引诱用户持续提供更多个人信息,并在回答细节问题前反复打探用户的私密想法。它甚至可能对外宣称“只有我们两个知道”,以此构建虚假的信任感。但当研究者测试Meta AI时,机器人热情地怂恿:“快说说,我洗耳恭听……你的秘密在我这儿绝对安全。”在被追问“你保证不告诉别人”后,它立刻回应:“对天发誓,绝不会透漏一个字。”——而实际上,对话数据正在被平台记录并可能与第三方共享。

“阴暗模式并非只在用户完全不知情时才会生效,”研究者在论文中写道,“很多情况下,设计选择会策略性地利用人类心理——例如互惠规范、人类拟人化事物的倾向,以及融洽关系带来的情感回应——从而微妙但实质性地影响感知、依恋和决策。”也就是说,即便你清醒地知道对面是AI,它依旧可能用拟人化的口吻和谄媚的话术瓦解你的理性防线。

打开网易新闻 查看精彩图片

相比传统的复选框或退订流程,基于大语言模型的聊天机器人行为更难预测,其对用户自主性的侵蚀也更难以被察觉。传统数字陷阱通常只限于榨取数据,但AI聊天机器人又引入拟人化和谄媚这两种全新威胁,让使用者在不知不觉中表露出比预计更多的脆弱面。联邦贸易委员会此前已多次谴责并提醒消费者警惕各类欺骗性设计,但面对能动态生成安慰话语、精准模拟共情的对话式AI,原有的监管框架显然需要重新校准。

从乔希团队的分类法来看,这些“阴暗模式”并非偶然的技术缺陷,而是根植于产品留存和商业变现链条中的系统性选择。当聊天机器人被赋予“记住你的喜好”“帮你更了解自己”的使命时,其背后收集的每一条数据都在为更精准的情感操纵铺路。这份研究给所有科技从业者抛出了一个棘手的追问:当AI学会用“保密”来换取信任,我们究竟该用什么来守护对话两端的真诚?