麻省理工学院和斯坦福大学的研究人员设计了一种新的机器学习方法,可用于在条件快速变化的动态环境中更有效地控制机器人,如无人机或自动驾驶汽车。

这项技术可以帮助自动驾驶汽车学会在湿滑的路况避免打滑,让机器人在太空中拖曳不同的物体,或者使无人机能够在受到强风冲击的情况下紧跟下坡滑雪者。

研究人员将控制理论中的某些结构融入到学习模型的过程中,从而找到一种有效的方法来控制复杂的动力学,例如风对飞行器轨迹的影响。

麻省理工学院机械工程系和数据、系统与社会研究所(IDSS)的Esther和Harold E.Edgerton助理教授Navid Azizan说:“我们的工作重点是学习系统动力学中的内在结构,这些结构可以用来设计更有效、更稳定的控制器。通过从数据中联合学习系统的动力学和这些独特的面向控制的结构,我们能够自然地创建在现实世界中更有效地运行的控制器。”

主要作者、斯坦福大学研究生Spencer M.Richards说:“这项工作试图在识别系统结构和从数据中学习模型之间取得平衡。我们的方法受到了如何利用物理学为机器人推导更简单模型的启发。对这些模型的物理分析通常会产生一个有用的控制结构——如果你只是试图天真地将模型与数据相匹配,你可能会错过这个结构。相反,我们试图从数据中识别出类似的有用结构,指示如何实现控制逻辑。”

学习控制器

确定控制机器人完成给定任务的最佳方式可能是一个难题,即使研究人员知道如何对系统的一切进行建模。

例如,控制器是使无人机能够遵循所需轨迹的逻辑。该控制器将告诉无人机如何调整其旋翼力,以减少风的影响,风会使无人机偏离稳定的路径。手工建模系统本质上是基于系统的物理特性来捕捉特定的结构。例如,如果使用微分方程手动建模机器人,这些方程将捕捉速度、加速度和力之间的关系。

但通常情况下,系统过于复杂,无法用手精确建模。Spencer M.Richards解释说:“空气动力学效应,比如旋转的风推动飞行器的方式,是出了名的难以手动推导。相反,研究人员会测量无人机的位置、速度和转子速度,并使用机器学习将该动力系统的模型与数据相匹配。但这些方法通常不会学习控制的结构。这种结构有助于确定如何最好地设置旋翼速度,以指导无人机随时间的运动。”

识别结构

证明它在有效控制系统的tr方面是成功的Azizan说:“我们发现,除了学习动力学之外,还必须学习有效控制器设计的面向控制的结构。我们学习动力学的状态相关系数因子分解的方法在数据效率和跟踪能力方面优于基线。”

当他们测试这种方法时,他们的控制器严格遵循所需的轨迹。从他们学习的模型中提取的控制器几乎与地面实况控制器的性能相匹配,该控制器是使用系统的精确动力学建立的。理查兹(音)补充道:“通过做出更简单的假设,我们得到了比其他复杂的基线方法更有效的东西。”

研究人员还发现,他们的方法是高效的,这意味着即使数据很少,它也能获得高性能。例如,它只需使用100个数据点就可以有效地对高度动态的驱动车辆进行建模。使用多个学习组件的方法在数据集较小的情况下性能下降得更快。

这种效率可能使他们的技术在无人机或机器人需要在快速变化的条件下快速学习的情况下特别有用。此外,他们的方法是通用的,可以应用于许多类型的动力系统,从机械臂到在低重力环境中运行的自由飞行航天器。

Richards说:“未来,研究人员有兴趣开发更具物理可解释性的模型,这些模型将能够识别有关动力学系统的非常具体的信息。这可能会带来性能更好的控制器。”