本期为TechBeat人工智能社区第734期线上Talk。
北京时间12月11日(周四) 20:00,清华大学博士生朱少廷的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是:MoE-Loco - 基于混合专家模型的多任务运动控制。该方法创新性地引入混合专家(MoE)架构,让单一策略通过“动态路由”将不同任务分配给特定专家网络 。
Talk·信息
主题:MoE-Loco - 基于混合专家模型的多任务运动控制
时间:北京时间12月11日(周四) 20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
Talk·介绍
传统多任务强化学习在处理复杂地形与不同步态(双足/四足)融合时,常因“梯度冲突”导致模型难以收敛 。MoE-Loco 创新性地引入混合专家(MoE)架构,让单一策略通过“动态路由”将不同任务分配给特定专家网络 。该方法不仅有效解决了梯度冲突,还让机器人实现了多种地形和不同步态的平滑切换,更展现出通过组合专家实现“运球”等新技能的零样本泛化能力 。
Talk大纲
1. 背景与挑战 - 介绍机器人运动控制从单任务向多任务(Multitask RL)演进中的核心痛点:多任务学习间的“梯度冲突”及其对性能的负面影响。
2. 核心方法 - 详解 MoE-Loco 架构设计,如何将 MoE 模块整合进 Actor-Critic 网络,以及利用 Gating Network 实现任务特征的自动提取与专家分配。
3. 机制分析与实验 - 展示 Unitree Go2 真机在多种复杂地形下的表现,通过梯度相似度分析验证冲突的消除,并可视化不同专家(Experts)的专业分工。
4. 技能组合与展望 - 探讨 MoE 的可解释性优势,演示如何通过手动调整专家权重 Zero-shot 合成新技能(如踢球/运球),并总结在持续学习中的潜力。
Talk·预习资料
论文链接: https://arxiv.org/abs/2503.08564
Talk·提问交流
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
Talk·嘉宾介绍
朱少廷
清华大学 · 博士生
现于清华大学交叉信息院博士二年级在读,师从赵行老师。
研究方向为具身智能,足式机器人,三维重建与机器人融合,在RA-L, ICRA, IJCV, IROS, ICCV等期刊及会议上发表多篇论文,并担任RA-L, IROS, RA-M等学术期刊及会议审稿人。代表工作有: VR-Robo, Robust-robot-walker, SARO等。
个人主页: https://www.techbeat.net/grzytrkj?id=46001
-The End-
如果你也想成为讲者
自荐 / 推荐
单人Talk | 团队专场 | 录播or直播 | 闭门交流
多种方式任你选择!
推荐讲者成功也有奖励哦~
关于TechBeat人工智能社区
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>
预约本期Talk
热门跟贴