打开网易新闻 查看精彩图片

本期为TechBeat人工智能社区734线上Talk。

北京时间12月11日(周四) 20:00,清华大学博士生朱少廷的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是:MoE-Loco - 基于混合专家模型的多任务运动控制。该方法创新性地引入混合专家(MoE)架构,让单一策略通过“动态路由”将不同任务分配给特定专家网络 。

Talk·信息

主题:MoE-Loco - 基于混合专家模型的多任务运动控制

嘉宾:清华大学 · 博士生 - 朱少廷

时间:北京时间12月11日(周四) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

传统多任务强化学习在处理复杂地形与不同步态(双足/四足)融合时,常因“梯度冲突”导致模型难以收敛 。MoE-Loco 创新性地引入混合专家(MoE)架构,让单一策略通过“动态路由”将不同任务分配给特定专家网络 。该方法不仅有效解决了梯度冲突,还让机器人实现了多种地形和不同步态的平滑切换,更展现出通过组合专家实现“运球”等新技能的零样本泛化能力 。

Talk大纲

1. 背景与挑战 - 介绍机器人运动控制从单任务向多任务(Multitask RL)演进中的核心痛点:多任务学习间的“梯度冲突”及其对性能的负面影响。

2. 核心方法 - 详解 MoE-Loco 架构设计,如何将 MoE 模块整合进 Actor-Critic 网络,以及利用 Gating Network 实现任务特征的自动提取与专家分配。

3. 机制分析与实验 - 展示 Unitree Go2 真机在多种复杂地形下的表现,通过梯度相似度分析验证冲突的消除,并可视化不同专家(Experts)的专业分工。

4. 技能组合与展望 - 探讨 MoE 的可解释性优势,演示如何通过手动调整专家权重 Zero-shot 合成新技能(如踢球/运球),并总结在持续学习中的潜力。

Talk·预习资料

打开网易新闻 查看精彩图片

论文链接: https://arxiv.org/abs/2503.08564

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

打开网易新闻 查看精彩图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

打开网易新闻 查看精彩图片

朱少廷‍‍‍‍‍‍‍‍‍‍‍

清华大学 · 博士生
‍‍‍

现于清华大学交叉信息院博士二年级在读,师从赵行老师。

研究方向为具身智能,足式机器人,三维重建与机器人融合,在RA-L, ICRA, IJCV, IROS, ICCV等期刊及会议上发表多篇论文,并担任RA-L, IROS, RA-M等学术期刊及会议审稿人。代表工作有: VR-Robo, Robust-robot-walker, SARO等。

个人主页: https://www.techbeat.net/grzytrkj?id=46001

-The End-

打开网易新闻 查看精彩图片

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>

预约本期Talk