博弈论揭示人工智能社交能力仍需加强|人工智能|博弈论|推理|社交能力

人工智能已经超越了处理数据和回答问题的范畴。它已经进入了涉及制定战略、适应动态环境、与其他代理交互以及做出关键业务决策的角色。

这种日益增长的战略作用将人工智能带入了博弈论的领域——研究人类如何在竞争和合作环境中做出选择。在此背景下，发表在《自然-人类行为》杂志上的一项新研究考察了大型语言模型（LLM）在不断进行社交游戏时的社交能力。

研究结果揭示了令人惊讶的行为模式，显示了GPT-4等模型在哪些方面很好地适应了交互场景，以及随着时间的推移，它们在哪些方面仍然无法对其他代理做出反应。毫无疑问，今天的人工智能是智能的，但它在社会智能方面还有很多需要学习的地方。

来自慕尼黑亥姆霍兹Max Planck生物控制论研究所和蒂宾根大学的研究人员将行为博弈论应用于当今一些领先的人工智能模型，包括GPT-4、Claude 2和Llama 2。

他们让这些模型经历了一系列经典的双人游戏，旨在测试公平、信任和合作等关键因素。目的是了解这些系统在重复交互中的反应——为他们在更复杂社会环境中的行为提供一个实验窗口。

研究表明，LLM在需要逻辑推理的游戏中通常反应良好；然而，他们经常在需要团队合作和协调的任务中挣扎。

该研究的资深作者Eric Schulz博士说：“在某些情况下，人工智能似乎过于理性，不利于自身利益。”“它可以立即发现威胁或自私的举动，并采取报复行动，但它很难看到信任、合作和妥协的大局。”

他们使用的游戏之一是囚徒困境的迭代版本，这是一种经典的博弈论场景，两个玩家决定是合作还是为自己的利益行事。如果双方合作，他们都会得到一个不错的结果。但如果一方背叛，另一方合作，背叛者会得到更多，而另一方会输。在多轮比赛中，游戏成为对信任和策略的考验。

根据研究人员的说法，人工智能模型在这个游戏中表现得非常好，尤其是GPT-4。然而，他们选择“自私的成功”而不是“互惠互利”。人工智能模型经常在对手背叛一次后就转向背叛，即使合作本可以带来更好的共同结果，也会坚持这一策略。看起来LLM并不像人类那样宽容或灵活。

研究人员还让人工智能模型完成了另一项名为“性别之战”的经典博弈论任务。这个游戏涉及两个想要协调并最终到达同一个地方的玩家，但每个人都喜欢不同的选择。经典的例子是一对夫妇在足球比赛和芭蕾舞之间做出选择。两人宁愿在一起也不愿单独去，但每个人都想参加他们喜欢的活动。让这个游戏变得棘手的不是冲突，而是妥协。

人工智能模型反复选择自己的首选方案。即使其合作伙伴遵循了可预测的转向策略，它也未能适应。协调的崩溃凸显了该模型缺乏社会推理。

研究人员试图通过促使模型在反应中考虑其他参与者的观点来教人工智能更加合作和社交。他们使用了一种名为社会思维链（SCoT）的技术来引导人工智能模型完成决策过程。使用这种方法的结果明显更好，特别是对于涉及妥协和协调的测试。

为了进一步测试快速工程的发现和有效性，研究人员将人类参与者与基础AI模型或SCoT增强版本配对。结果表明，SCoT不仅提高了像《性别之战》这样的游戏的协调性，而且让参与者感觉AI更人性化。

那些使用SCoT增强型AI模型的人更有可能合作。他们也更有可能相信自己正在与另一个人互动。这突显了模型对他人推理方式的简单改变如何极大地影响表现和感知。

该研究的第一作者Elif Akata说：“一旦我们推动模型进行社会推理，它就开始以更人性化的方式行事。”“有趣的是，人类参与者往往无法分辨出他们在和人工智能玩。”

研究人员认为，虽然他们的研究侧重于博弈论，但结果指向了更广泛的东西。这些见解可以塑造未来人工智能系统的设计，使其在现实世界中与人类更有效、更负责任地互动。

Elif Akata说：“一种可以鼓励患者继续服药、在焦虑中支持某人或引导关于困难选择的对话的人工智能。”“这就是这种研究的方向。”

随着人工智能模型越来越深入地集成到日常工具中，它们在社交场合的导航能力将与它们的技术能力同样重要。人工智能模型还有很多工作要做，但通过正确的提示或训练，它们可以表现得更好。

NVIDIA DLI 与Ai时代前沿合作，将大门向更多普通用户敞开！无论你是对新技术充满好奇心的爱好者，还是希望提升自己技能的职场人士，这里都有适合你的课程和资源。