本期为TechBeat人工智能社区730线上Talk。

北京时间12月3日(周三) 20:00,清华大学博士生徐泽来的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是“大模型智能体可以玩好狼人杀吗?”,届时将介绍团队如何通过强化学习和博弈论方法提升大模型智能体的决策能力,并实现人类决策水平的狼人杀智能体。

Talk·信息

主题:大模型智能体可以玩好狼人杀吗?

嘉宾:清华大学 · 博士生 - 徐泽来

时间:北京时间12月3日(周三) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

随着大模型的发展,语言智能体在许多场景中展现出了巨大的潜力。然而,在多智能体的复杂博弈任务中,大模型智能体仍然面临着决策的固有偏好和有限探索的挑战。本次分享将介绍我们如果通过强化学习和博弈论方法提升大模型智能体的决策能力,并实现人类决策水平的狼人杀智能体。

Talk大纲

1. 背景:大模型智能体的快速发展

2. 动机:大模型智能体在决策中的固有偏好和有限探索

3. 工作1:强化学习驱动的策略语言智能体

4. 工作2:基于迭代微调的隐空间策略优化

Talk·预习资料

打开网易新闻 查看精彩图片

论文链接: https://arxiv.org/abs/ 2310.18940

打开网易新闻 查看精彩图片

论文链接: https://arxiv.org/abs/ 2502.04686




Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

打开网易新闻 查看精彩图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

打开网易新闻 查看精彩图片

徐泽来‍‍‍‍‍‍‍‍‍‍‍

清华大学 · 博士生
‍‍‍

徐泽来,清华大学电子系博士生,研究方向为大模型智能体和多智能体强化学习,导师为汪玉老师和吴翼老师。徐泽来的研究专注于多智能体强化学习和大模型智能体的交叉方向,完成了策略语言智能体系列工作,通过将大模型和强化学习结合,在狼人杀这一多智能体博弈中实现了平均人类决策水平的智能体,相关工作发表于ICML 2024和ICML 2025中。

个人主页: https://www.techbeat.net/grzytrkj?id=45990 ‍‍‍‍

-The End-

打开网易新闻 查看精彩图片

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>

预约本期Talk