在生成式 AI 不断进步的今天,技术的发展几乎每天都在突破人们的想象,不过如何让 AI 准确模拟人类行为,一直是一个极具挑战性的研究课题。

一项来自美国斯坦福大学和谷歌 DeepMind 的最新研究显示,通过仅两小时的对话,AI 系统就能创建出一个人的“数字分身”,并能以最高 85% 的准确率模拟其(一部分)性格特征和决策行为。

这项研究由斯坦福大学博士生朴俊成(Joon Sung Park)带领完成,团队成员还来自 DeepMind、美国西北大学和美国华盛顿大学。

日前,相关论文以《对 1000 人的生成式代理模拟》(Generative Agent Simulations of 1000 People)为题发表在预印本网站arXiv[1] 上。

图丨相关论文(来源:arXiv)
打开网易新闻 查看精彩图片
图丨相关论文(来源:arXiv)

在传统的人类行为模拟研究中,智能体的行为通常是通过人工指定的规则来定义的。

这种方法虽然具有较好的可解释性,但往往过度简化了真实人类行为的复杂性。而本研究采用的生成式智能体架构则采取了一种全新的路径。

该团队招募了超过 1000 名来自不同年龄、性别、种族、地域、教育背景和政治倾向的志愿者。

他们通过与参与者进行深入对话,创建了他们各自的 AI 模拟智能体(Simulation Agents)。

这些对话采用半结构化的方式进行,既包含预设的标准问题,也允许根据受访者的回答进行灵活的追问,涵盖了从个人生活故事到当代社会问题的广泛话题,以期获取完整而深入的个人信息,为 AI 系统提供丰富的个性化数据基础。

图 | 采访问题的一部分(来源:arXiv)
打开网易新闻 查看精彩图片
图 | 采访问题的一部分(来源:arXiv)

实验中,研究人员设计了一套全面的测试方案。参与者需要完成性格测试(大五人格量表 44 条目版)、社会调查问卷和逻辑游戏等一系列评估,并在两周后重复相同的测试。

随后,他们让 AI 模拟智能体完成相同的测试项目。结果显示,AI 智能体的回答与真实参与者的反应具有高达 85% 的相似度。

这意味着,其预测准确度接近受访者自身在两周后重复作答时的一致性水平。在大五人格特征预测上,AI 智能体实现了 0.80 的相关性。

该研究还特别关注了 AI 系统可能存在的偏见问题。通过对政治倾向、种族和性别等敏感维度的分析发现,基于深度访谈的智能体能够有效降低预测偏差。

研究人员认为,相比仅使用人口统计信息或个人描述的基线方案,这种基于对话的 AI 智能体构建方案在各项指标上,都表现出显著的优势。

朴俊成在接受媒体采访时表示:“如果我们能让许多个‘迷你的你’在数字世界中运行,并做出与你相同的决策,这就是我认为的未来图景。”

他解释说,这种深度模拟的灵感部分来自于他在 2023 年发表关于生成式智能体的论文后,参加了大量播客访谈的经历。

“两个小时的深度对话可以产生意想不到的力量。通过这样的交谈,人们能够深入了解一个人的思维方式和价值观。”他补充道。

这项研究的主要目的,是为社会科学等领域提供更便捷的研究工具。因此,该课题组建立了包含 1000 个生成式智能体的智能体库。

通过创建行为逼真的 AI 模拟智能体,研究人员可以开展一些在现实中成本过高、难以实施或存在伦理争议的研究项目。

例如,可以利用真实人类来生成角色模型,然后以编程方式在模拟环境中使用这些模型,这是无法直接用人类直接实现的。

此外,还可以用来测试社交媒体上打击虚假信息的干预措施效果,或研究导致交通拥堵的行为模式等。这种方法不仅能够节省研究成本,还能突破传统研究方法的局限性。

图 | AI 模拟智能体的创造和评估过程(来源:arXiv)
打开网易新闻 查看精彩图片
图 | AI 模拟智能体的创造和评估过程(来源:arXiv)

特别值得注意的是,这项研究只需要两小时的访谈数据就能创建出相当准确的性格模拟,这比目前数字孪生技术需要的数据量要少得多,效率也提升了不少。

不过,这种方法尚不完美,尤其是智能体并不能完全捕捉构成个人独特性的所有细节。

例如,在测试个人价值观和公平性概念的“独裁者博弈”中,AI 的表现相对较差。这表明,在某些复杂的道德判断和价值选择方面,AI 模拟智能体仍有提升空间。

同时,这项技术也可能带来一定的滥用风险。目前,诈骗者已经开始使用音频和视频深度伪造技术,来欺骗受害者的家人、朋友和商业伙伴。如果他们能够获取个人性格的深度伪造技术,潜在危害将更加严重。

值得注意的是,这类模拟智能体与目前主流 AI 公司开发的工具型智能体有所不同。工具型智能体主要用于执行特定任务,如数据输入、信息检索或日程安排等。

包括美国客户关系管理软件服务公司 Salesforce、美国 AI 初创公司 Anthropic 等都已推出了各自的工具型 AI 产品,OpenAI 也计划于 2025 年 1 月发布相关产品。

这两类智能体虽然有所区别,但研究人员认为,对模拟智能体的研究将有助于提升 AI 智能体的整体性能,推动 AI 领域进一步发展。

而随着 AI 技术的发展,有望逐步接近更准确地模拟和理解人类行为的目标。

参考资料:

https://arxiv.org/pdf/2411.10109

https://www.biometricupdate.com/202411/ai-model-that-copies-human-personality-opens-questions-on-deepfakes

https://www.techradar.com/computing/artificial-intelligence/ai-can-now-clone-your-personality-in-only-two-hours-and-thats-a-dream-for-deepfake-scammers

运营/排版:何晨龙