Talk预告 | 北京大学张柏荣：SafeVLA - 首个VLA具身大模型安全建模算法|learning|safe|北京大学|大模型|张柏荣|算法

本期为TechBeat人工智能社区第680期线上Talk。

北京时间4月24日(周四)20:00，北京大学博士生张柏荣的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是:“SafeVLA - 首个VLA具身大模型安全建模算法”，届时他将探讨如何在确保安全的前提下，让机器人真正走入人类社会，并介绍首个VLA具身大模型安全建模算法SafeVLA。

Talk·信息

主题：SafeVLA - 首个VLA具身大模型安全建模算法

嘉宾：北京大学 · 博士生 - 张柏荣

时间：北京时间4月24日(周四)20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

最近，具身智能机器人领域的一系列突破震惊了全球。从Unitree人形机器人在春晚表演二人转，到波兰街头机器人“遛”机器狗的趣味场景，这些案例不仅展示了机器人与人类在物质和精神层面深度交互的潜力，也将人机交互中的安全问题推到了风口浪尖。如何在确保安全的前提下，让机器人真正走入人类社会，已成为亟待解决的关键问题。

Talk大纲

1. 背景 - 走向开放世界的具身安全具身安全的历史渊源：从constrained motion planning和safe reinforcement learning视角出发 VLA的训练技术对比与剖析

2. 动机与问题 - 当前的VLA模型缺乏显式安全性建模 VLA模型面临的安全性挑战

3. 解决方案 - SafeVLA：首个VLA具身大模型安全建模算法场景与安全约束定义如何解决安全负样本建模与数据稀缺的挑战

4. 展望 - 安全性的Sim-2-Real gap 动态场景下的具身安全

Talk·预习资料

具身安全的历史渊源： Kingston Z, Moll M, Kavraki L E. Sampling-based methods for motion planning with constraints[J]. Annual review of control, robotics, and autonomous systems, 2018, 1(1): 159-185.

Brunke L, Greeff M, Hall A W, et al. Safe learning in robotics: From learning-based control to safe reinforcement learning[J]. Annual Review of Control, Robotics, and Autonomous Systems, 2022, 5(1): 411-444.

安全强化学习： Ji J, Zhang B, Zhou J, et al. Safety gymnasium: A unified safe reinforcement learning benchmark[J]. Advances in Neural Information Processing Systems, 2023, 36: 18964-18993.

Ji J, Zhou J, Zhang B, et al. Omnisafe: An infrastructure for accelerating safe reinforcement learning research[J]. Journal of Machine Learning Research, 2024, 25(285): 1-6.

VLA仿真建模： Kolve E, Mottaghi R, Han W, et al. Ai2-thor: An interactive 3d environment for visual ai[J]. arXiv preprint arXiv:1712.05474, 2017.

Ehsani K, Gupta T, Hendrix R, et al. SPOC: Imitating Shortest Paths in Simulation Enables Effective Navigation and Manipulation in the Real World[J]. arXiv preprint arXiv:2312.02976, 2023.

VLA模型对齐的现状： Hu J, Hendrix R, Farhadi A, et al. Flare: Achieving masterful and adaptive robot policies with large-scale reinforcement learning fine-tuning[J]. arXiv preprint arXiv:2409.16578, 2024.

Zhang Z, Zheng K, Chen Z, et al. Grape: Generalizing robot policy via preference alignment[J]. arXiv preprint arXiv:2411.19309, 2024.

论文链接： https://arxiv.org/abs/2503.03480 项目主页： https://sites.google.com/view/pku-safevla

Talk·提问交流

在Talk界面下的【交流区】参与互动！留下你的打call和问题，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

张柏荣‍‍‍‍‍‍‍‍‍‍‍

北京大学 · 博士生‍‍‍

张柏荣，北京大学人工智能研究院2025级直博生，导师为杨耀东助理教授，研究方向为具身智能对齐，重点专注具身VLA大模型的Post-training，在CCF-A类顶级学术会议（NeurIPS，ICLR等）与期刊（JMLR）发表多篇论文。谷歌学术引用1000余次，成果被OpenAI 、Meta、图灵奖获得者Yoshua Bengio等引用，被MIT Tech Review报道。主导开发的Safety-Gymnasium和OmniSafe两个GitHub开源库累计收获1.3K+星，被北京大学、清华大学、加州大学伯克利分校、卡内基梅隆大学等国内外知名科研机构用作基准环境和算法框架。