打开网易新闻 查看精彩图片

本篇文章被 ICRA 2026 接收并获得 IROS 2025 双料 Workshop 最佳论文,第一作者张子哲(site: zizhe.io)是宾夕法尼亚大学机器人学硕士生,同时在 GRASP 实验室担任科研助理,导师为 Nadia Figueroa 教授,研究兴趣涵盖机器学习,安全控制以及人机交互。

打开网易新闻 查看精彩图片

  • 论文标题:Viability-Preserving Passive Torque Control
  • 论文链接:https://arxiv.org/abs/2510.03367
  • 项目主页:https://vpp-tc.github.io/webpage/

一、一句话总结

本文提出了VPP-TC(Viability-Preserving Passive Torque Control),一种基于可行性(viability)理论的被动力矩控制框架。该框架在关节位置 - 速度的增广状态空间中预计算安全集合,将可行性约束转化为关节加速度(进而力矩)的仿射约束,通过二次规划(QP)实时求解,确保机器人在无限时间范围内始终处于安全集合内。相比基于控制屏障函数(CBF)的基线方法,VPP-TC 无需计算边界函数的二阶导数,控制回路频率更高、轨迹更平滑、路径更短。

打开网易新闻 查看精彩图片

图 1:VPP-TC 控制框架示意图。关节限位的力矩约束通过解析方法推导,自碰撞和外部碰撞约束通过数据驱动方法学习。

二、研究背景与动机

在物理人机交互(pHRI)场景中,机器人需要在与人类近距离协作时保持被动性(passivity)—— 即吸收的能量不少于释放的能量,从而保证在外部扰动下的鲁棒性和稳定性。经典的阻抗 / 导纳控制框架、Port-Hamiltonian 方法以及基于动力系统(DS)的被动力矩控制器已被广泛研究。

然而,这类被动控制器通常缺乏显式的约束处理能力,无法保证在整个任务执行过程中的碰撞避免和关节限位满足。先前工作 CPIC 利用控制屏障函数(CBF)框架和指数控制屏障函数(ECBF)来约束被动力矩控制器,但存在以下问题:

  • 硬约束之间可能互相冲突,导致 QP 不可行;
  • QP 框架易陷入死锁和关节空间的局部最小值;
  • ECBF 需要计算边界函数的 Hessian 矩阵(二阶导数),当边界由神经网络表示时,实时性难以保证。

正是这些局限性,促使作者提出了基于可行性理论(viability theory)的全新安全控制框架。

三、方法详解

3.1 核心思想:从 CBF 到 Viability

VPP-TC 的核心创新在于:在关节位置 q 和关节速度 q̇的增广状态空间中引入安全边界,而非仅在关节位置空间中。在这个增广空间中操作的好处是,安全约束可以直接推导为关节加速度 q̈的仿射约束,再通过机器人动力学方程转化为力矩约束 —— 整个过程无需计算边界函数的二阶导数

可行性的定义(Definition 1)是:从可行集 V 中的任意初始状态出发,存在一个控制序列(加速度序列),使得产生的无限长状态序列始终在可行集内。这比单纯的「可行」(feasible)更强 —— 一个可行状态可能在未来的控制下离开可行集,但一个 viable 状态保证能永远留在安全集内。

打开网易新闻 查看精彩图片

图 2:可行性(viability)概念。状态 s1 既可行又 viable,而 s2 可行但不 viable—— 虽然当前满足约束,但不存在一个控制序列能保证它永远留在安全集内。

3.2 自碰撞避免约束(SCA)

作者保守地定义了自碰撞可行性(Definition 2):如果从当前状态出发,以最大减速反向制动至完全停止的整条制动轨迹上都不发生自碰撞,则认为该状态是自碰撞安全的。

为学习这个可行集,作者使用了一个基于 Transformer 的神经网络分类器 Γ(q, q̇)。训练数据通过仿真生成:采样 300 万组 (q, q̇) 状态对,模拟制动过程并标注 —— 若制动轨迹无自碰撞则标为 viable,否则标为 non-viable。网络采用标准 Transformer-Encoder 架构(前馈维度 128、2 个注意力头、4 层堆叠),训练 30 个 epoch,测试集准确率达 99.27%,召回率达 99.74%。

打开网易新闻 查看精彩图片

图 3:自碰撞可行性数据生成。从状态 (q₀, q̇₀) 出发执行制动直至静止 (qₑ, 0):若整条轨迹无自碰撞,标记为 Safe;否则标记为 Self-Collide。

约束的实施通过 Taylor 展开将 ΔΓ(q, q̇) ≥ 0 线性化为关于 q̈的仿射约束,再通过动力学方程转化为力矩约束。关键公式为:

g_se・M⁻¹τ ≥ g_se・M⁻¹(Cq̇ + G) − b_s

其中 g_se 和 b_s 由边界函数 Γ 对 q 和 q̇ 的一阶梯度与时间步长计算得到。

3.3 外部障碍物碰撞避免约束(ECA)

对于外部碰撞,作者采用Bernstein 多项式表示的符号距离函数(SDF)编码每个机器人连杆的几何。定义可行性保持 SDF 为制动轨迹上的最小瞬时 SDF:

S_v (p, q₀, q̇₀) = min_{t∈[0,T_br]} S (p, q (t))

类似地,通过 Taylor 展开得到关于 q̈的仿射约束,并转化为力矩约束。值得注意的是,该约束通过 Δp 项隐式地纳入了障碍物速度信息,因此 VPP-TC 天然具备处理动态障碍物的能力。

3.4 关节位置与速度限位约束

受 Del Prete (2018) 启发,作者通过解析推导获得关节加速度的上下界 q̈_lb 和 q̈_ub,取位置可行性约束、速度约束和硬件加速度限制的交集,再通过动力学方程转化为力矩约束。

3.5 统一的 QP 控制框架

最终的控制框架将所有约束统一到一个二次规划(QP)问题中:目标函数最小化实际力矩与名义被动控制器力矩的偏差,约束条件包括关节限位(始终激活)、自碰撞约束(靠近边界时激活)、外部碰撞约束(靠近边界时激活)和力矩硬件限制。外部碰撞约束通过松弛变量软化以保证 QP 可行性。

打开网易新闻 查看精彩图片

图 4:平面 3-DoF 示例。左:工作空间轨迹。右:在硬件限制 [−10, 10] rad/s² 下的可行加速度域。当外部碰撞约束激活时,允许的加速度域收缩。

四、实验结果

4.1 仿真实验

在 7 自由度 Franka Panda 机械臂上(PyBullet 仿真),作者设计了三组对比实验:仅自碰撞避免(SCA)、仅外部碰撞避免(ECA)、以及全约束(ALL)。与基线 CPIC 的定量对比如下表:

打开网易新闻 查看精彩图片

表 1:CPIC 与 VPP-TC 在不同约束设置下的性能对比(5 次实验平均值)

VPP-TC 在所有设置下都显著优于 CPIC:控制频率提升 1.4–2.4 倍,轨迹长度更短,轨迹抖动降低了一个数量级以上(特别是在 ECA 和 ALL 场景下)。

4.2 真机实验

作者在 7-DoF Franka Panda 真机上验证了三个场景:

  • 自碰撞避免(SCA):未启用 SCA 时,机械臂因自碰撞预警触发 Reflex Mode 停止运动;启用 SCA 后安全到达目标。更换 UMI 夹爪后重训网络,控制器仍有效。

  • 外部碰撞避免(ECA):面对静态和动态障碍物,机械臂在被外力推向障碍物时能抵抗运动并保持安全间距;动态障碍物接近时主动退避。在约 200Hz 的控制频率下实现真正的全身碰撞避免。

  • 综合场景:遥操作按台灯开关任务 —— 仅提供粗略目标位置,无预计算的避障轨迹。VPP-TC 同时处理外部碰撞(台灯灯体)和自碰撞约束,安全完成任务。

打开网易新闻 查看精彩图片

图 5:真机实验。上排:自碰撞避免(a-c)。下排:外部碰撞避免(d-f)。轨迹叠加显示约束激活后机械臂保持正向间距。

打开网易新闻 查看精彩图片

图 6:遥操作任务 —— 仅提供粗略目标位置,VPP-TC 确保近灯安全并防止自碰撞,成功完成按灯开关任务。

五、技术亮点与讨论

1. 无需二阶导数。通过在 (q, q̇) 增广状态空间中操作,安全约束被表达为关于加速度的仿射函数,仅需要边界函数的一阶梯度。这大幅降低了计算负担,是实现高控制频率的关键。

2. 统一框架处理多类约束。关节限位、自碰撞、外部碰撞三类约束在同一 QP 中统一处理,约束按需激活,框架简洁优雅。

3. 天然支持动态障碍物。外部碰撞约束的 Taylor 展开中包含障碍物位移 Δp 项,隐式编码了障碍物速度,无需额外处理即可应对动态环境。

4. 全身碰撞避免。得益于 Bernstein 多项式 SDF 的高效计算,VPP-TC 能考虑所有机器人连杆的几何,而非像 CPIC 那样仅考虑末端几个连杆。

5. 被动性保证。论文在附录中证明了即使在约束激活时,控制器输出的力矩仍保持任务空间被动性 —— 约束反作用力要么被阻尼耗散,要么被约束反力吸收,不向环境注入净能量。

未来方向:当前框架假设精确的动力学模型。作者计划在未来工作中考虑有界的模型不确定性,设计在建模误差下仍能保证可行性的鲁棒控制器。

六、总结

VPP-TC 为被动力矩控制的安全性问题提供了一套优雅而高效的解决方案。它将可行性理论与数据驱动学习相结合,在增广状态空间中构建安全集合,并通过 QP 实时求解力矩约束。这一框架在 IROS 2025 两个 Workshop 上分别获得 Best Contribution Award 和 Best Student Paper Award,并被 ICRA 2026 录用,充分体现了其学术价值和应用潜力。对于关注人机交互安全、力矩控制以及机器人安全保障的研究者而言,这是一篇值得深入研读的工作。