打开网易新闻 查看精彩图片

导语

为什么许多社交智能体“写得通顺,却一眼假”?问题往往不在语言能力,而在它们既不像某个稳定的个体,也未真正嵌入社会关系网络。北京通用人工智能研究院联合北京大学研究提出自演化社交智能体 EvoBot,通过生成器与检测器的对抗博弈,让模型在社会反馈中持续升级,逐步学会更真实的个性化表达与社会化互动。

关键词:社交智能体、拟人化生成、个性化、社会化、对抗学习、自演化

孔繁奇、封雪丨作者

打开网易新闻 查看精彩图片

论文题目:Enhancing LLM-Based Social Bot via an Adversarial Learning Framework 论文链接:https://aclanthology.org/2025.emnlp-main.1185/ 发表时间:2025年11月4日 论文来源: EMNLP 2025

社交平台上,一条“像人”的动态不只取决于语法和知识,更取决于两个更隐蔽的因素:它是否贴合某个具体个体的稳定风格(个性化),以及它是否会被周围社交邻居持续塑造(社会化)。不少大模型“写得对”,却仍然“一眼假”,问题往往不在句子通不通顺,而在它不像某个具体的人在某个具体的圈子里说话。

北京通用人工智能研究院联合北京大学提出了自演化社交智能体 EvoBot,在“生成器-检测器”的对抗博弈框架下,把拟人化生成变成一个能自动升级难度的训练任务,使模型在社交网络中持续迭代。相关成果已被自然语言处理顶会 EMNLP 2025 接收并作 Oral 展示。

问题:社交智能体为什么常常“一眼假”?

当前社交智能体的一个核心瓶颈是“既个性化又社会化”。个性化关乎个体差异,同样是表达赞同,有人简短直接,有人爱用反问,有人习惯加表情或话题标签。社会化关乎邻域影响,好友关系、社区氛围与热点事件会持续改变一个人的发言内容与立场走向。只学到“通用写作能力”的大模型,往往会留下两类稳定的可识别痕迹。其一是风格过于平均,不像某个稳定个体的长期表达分布;其二是生成内容缺少社会语境,看起来像“单机写作”,而不是在关系网络里互动。针对这两个问题,本文提出了一个两阶段训练框架优化模型,先让模型更像某个具体的人,再让模型在“社会反馈”的压力下持续修正自己的表达策略。

方法:把拟人化训练变成“矛与盾”的持续博弈

EvoBot的关键设计,是把“像人”变成一场持续升级的对抗。框架里,生成器(EvoBot)负责模仿人类发布社交动态,检测器(Detector)负责区分“真实人类内容”和“AI生成内容”。具体而言,EvoBot的学习分为两个阶段:

第一阶段:监督微调(SFT),注入个体“人格”。在此阶段,本文利用真实人类用户数据对基础大模型(Llama2-7B)进行监督微调。训练任务是让模型初步学习该社区的表达方式、语言习惯等。通过这一过程,EvoBot初步具备了模仿不同个体、生成个性化内容的能力,这构成了每个智能体的“初始人格”。

第二阶段:对抗性学习,驱动动态“演化”。本文设计了一个由EvoBot(生成器)和基于关系图卷积神经网络(R-GCN)[2] 的Detector(检测器)构成的对抗性学习闭环。与传统方法不同,本文的生成器和检测器是相互适应、协同演化的。在每一轮迭代中,EvoBot生成一批新的“拟人”内容,而检测器的任务就是从这些内容和真实人类内容中,把AI的“仿冒品”揪出来。如果EvoBot生成的内容成功“骗过”了检测器,就会被标记为“更优”样本,指导模型朝这个方向优化;反之,则被标记为“较差”样本,从而构造出偏好数据对,通过直接偏好优化(DPO)[3] 技术驱动EvoBot学习。最关键的是,检测器自身也在不断升级。每一轮博弈后,检测器会将EvoBot的“更优”样本集加入自己的错题集进行再训练,提升识别能力。这就为EvoBot创造了一个任务难度持续提升的学习环境,迫使其不断学习和模仿更高级、更难以分辨的人类行为模式,最终形成一个能力持续增强的良性循环。

打开网易新闻 查看精彩图片

图1: EvoBot框架概览

实验:个体层更像人,群体层更像社会

EvoBot不是在“干净、单一”的文本集合里训练,而是直接从真实社交网络中抽取结构与语境。研究使用 TwiBot-22 数据集 [4],包含约100万用户、近1亿条推文以及好友关系等图结构信息。为了在可控成本下保留网络结构差异,研究采用 Louvain 社区发现方法切分出12个高度连接且具有代表性的社区,这些社区在拓扑形态(星形、网状等)、语言(英语、阿拉伯语、日语、土耳其语等)与话题上都呈现明显差异。这种异质性为本文训练和评估EvoBot在复杂、多元环境下的适应性和类人程度供了坚实的基础。

打开网易新闻 查看精彩图片

图2: 12个社区中用户连接关系的可视化

打开网易新闻 查看精彩图片

表1: 社区数据统计,包括用户与机器人的数量、边的数量、推文数量和代表语言

具体地,本文在这12个社区上,从个性化和社会化两个角度系统地评估了EvoBot。

个性化评估

首先,本文分析了EvoBot与检测器在4轮对抗训练中的“共同成长”过程。结果清晰地展示了两者间的协同进化。随着迭代的进行,EvoBot规避检测的能力越来越强,意味着它生成的内容越来越类人(如图3中各行所示)。与此同时,检测器的识别性能也在不断提升(如图3中各列所示)。

打开网易新闻 查看精彩图片

图3:Detector分类性能。左:F1-score;右:Accuracy。行表示检测器的版本;列表示EvoBot的版本。色块上数值越大表示EvoBot被识别出来的概率越高。

本文对比了最终版的EvoBot与六种基线模型(包括原始Bot、传统GAN、Llama2-7b、GPT-4o-mini,以及两个消融版本)。在两种不同架构(RGCN和GAT)的检测器下,EvoBot均取得了最低的被识别率,展示了其最强的拟人化生成能力。消融实验也证明,监督微调(SFT)和对抗学习(ADV)两个阶段对于最终的优异性能缺一不可。同时,进一步分析表明EvoBot在生成内容多样性和表达风格上都达到了很高的类人水平,这说明EvoBot不仅能生成类人的社交文字而且对人类社交方式有更深层次的理解。

打开网易新闻 查看精彩图片

表2: RGCN和GAT检测器下不同生成器的Accuracy和F1-Score。数值越小,说明生成器逃避检测的能力越强。

社会化评估1:群体观点模拟

实验将EvoBot置于多智能体模拟环境中,复现了真实世界中关于“COVID-19”和“俄乌冲突”两大事件的观点演变过程。实验结果表明,相比于传统的基于规则的智能体模型(如BC和Lorenz模型)以及其他LLM基线,无论是在群体平均观点还是观点多样性上,EvoBot都最接近真实数据,成功捕捉到了现实群体中复杂动态的观点变化。这些对比指标均是在事件发生的一段时间内的统计结果,充分证明了EvoBot的优势在于精准捕捉了观点的动态演变过程,而不仅是拟合某个静态的结果。

打开网易新闻 查看精彩图片

表3: 群体观点的模拟结果

社会化评估2:信息传播模拟

本文还模拟了关于“超级碗赛事”这一热点新闻在社交网络中的传播过程。结果显示,相比于基线模型,EvoBot驱动的信息传播曲线更贴近真实世界的传播模式,即“初期快速爆发,随后逐渐放缓”的典型规律。这些群体层面的涌现现象,强有力地证明了EvoBot框架在模拟复杂社会动态方面的有效性和先进性。

打开网易新闻 查看精彩图片

图4: 随着时间的推移,讨论洛杉矶公羊队超级碗夺冠的累积用户数量变化曲线

总结展望:为什么“自演化”很重要?

在“生成器-检测器”的对抗学习框架下,基于大模型的社交智能体EvoBot持续提升能力,在个性化内容生成和宏观社会现象模拟方面均表现出色,验证了该框架的有效性。

EvoBot所展示的这种自动化的、无需持续外部干预的“自演化”学习框架,为各行业构建更智能、更具适应性的AI智能体提供了一种新的思路和启发。这种通过对抗博弈创造动态学习环境、驱动智能体持续迭代的方法,为解决“如何让智能体在部署后仍能自主学习和进化”这一核心难题提供了宝贵的探索,对未来开发更稳健、更自主的人工智能系统具有一定的借鉴意义。

参考文献

[1] Kong, F., Zhang, X., Chen, X., Yang, Y., Zhu, S. C., & Feng, X. (2025, November). Enhancing llm-based social bot via an adversarial learning framework. In Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing (pp. 23246-23271).

[2] Schlichtkrull, Michael, et al. "Modeling relational data with graph convolutional networks." European semantic web conference. Cham: Springer International Publishing, 2018.

[3] Rafailov, Rafael, et al. "Direct preference optimization: Your language model is secretly a reward model." Advances in neural information processing systems 36 (2023): 53728-53741. Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 (2022): 35254-35269.

[4] Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 (2022): 35254-35269.

群体智能读书会

如果你对这些反直觉但极有用的现象感兴趣——从蚁群搭桥、鱼群同步、到无人机集群表演、集群机器人协作、群智优化与多智能体系统、网络舆论建模研究等——欢迎加入「群体智能」读书会:我们用动物—人类—机器三条线,希望把群体智能的涌现这件事讲清楚、讲透彻;用物理学、数理逻辑、多主体建模、计算传播等多学科视角,去追问同一个核心:集群何以比个体更聪明?群体智能又在何时涌现?

集智俱乐部联合北京师范大学系统科学学院韩战钢教授、暨南大学计算传播研究中心赵甜芳副教授、新疆大学物理科学与技术学院玉素甫·艾比布拉副教授等来自11所高校的学者,共同发起本次,尝试用一条普适的线索,把自然界的鸟群蚁群、人类社会的集群行为、以及人工智能时代的多智能体与群智优化,放在同一张地图上重新理解。读书会自2026年1月17日开始,安排在每周六下午 14:00–16:00,欢迎所有对群体智能如何涌现、如何被理解、以及如何被设计,感兴趣的朋友一起加入:带着问题来,带着更有趣的问题去。

打开网易新闻 查看精彩图片


详情请见:

1.

2.

3.

4.

5.

6.

7.