Talk预告 | 清华大学朱少廷：MoE-Loco - 基于混合专家模型的多任务运动控制

将门创投

2025-12-10 08:24 ·北京 ·优质互联网领域创作者

本期为TechBeat人工智能社区第734期线上Talk。

北京时间12月11日(周四) 20:00，清华大学博士生朱少廷的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是：MoE-Loco - 基于混合专家模型的多任务运动控制。该方法创新性地引入混合专家（MoE）架构，让单一策略通过“动态路由”将不同任务分配给特定专家网络。

Talk·信息

主题：MoE-Loco - 基于混合专家模型的多任务运动控制

嘉宾：清华大学 · 博士生 - 朱少廷

时间：北京时间12月11日(周四) 20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

传统多任务强化学习在处理复杂地形与不同步态（双足/四足）融合时，常因“梯度冲突”导致模型难以收敛。MoE-Loco 创新性地引入混合专家（MoE）架构，让单一策略通过“动态路由”将不同任务分配给特定专家网络。该方法不仅有效解决了梯度冲突，还让机器人实现了多种地形和不同步态的平滑切换，更展现出通过组合专家实现“运球”等新技能的零样本泛化能力。

Talk大纲

1. 背景与挑战 - 介绍机器人运动控制从单任务向多任务（Multitask RL）演进中的核心痛点：多任务学习间的“梯度冲突”及其对性能的负面影响。

2. 核心方法 - 详解 MoE-Loco 架构设计，如何将 MoE 模块整合进 Actor-Critic 网络，以及利用 Gating Network 实现任务特征的自动提取与专家分配。

3. 机制分析与实验 - 展示 Unitree Go2 真机在多种复杂地形下的表现，通过梯度相似度分析验证冲突的消除，并可视化不同专家（Experts）的专业分工。

4. 技能组合与展望 - 探讨 MoE 的可解释性优势，演示如何通过手动调整专家权重 Zero-shot 合成新技能（如踢球/运球），并总结在持续学习中的潜力。

Talk·预习资料

论文链接： https://arxiv.org/abs/2503.08564

Talk·提问交流

在Talk界面下的【交流区】参与互动！留下你的打call和问题，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

朱少廷‍‍‍‍‍‍‍‍‍‍‍

清华大学 · 博士生
‍‍‍

现于清华大学交叉信息院博士二年级在读，师从赵行老师。

研究方向为具身智能，足式机器人，三维重建与机器人融合，在RA-L, ICRA, IJCV, IROS, ICCV等期刊及会议上发表多篇论文，并担任RA-L, IROS, RA-M等学术期刊及会议审稿人。代表工作有: VR-Robo, Robust-robot-walker, SARO等。

个人主页: https://www.techbeat.net/grzytrkj?id=46001

-The End-

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择！

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投，是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验，加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地，分享自己最新工作的沃土，在AI进阶之路上的升级打怪的根据地！

更多详细介绍>>

预约本期Talk

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴