人机协作潜入水下：AUV与潜水员联合作业技术探索|auv|人机协作|传感器|机器人|潜水员

岛屿电力中断。为了找到水下电缆的断裂点，通常需要将整条线路拖出水面，或者派遣遥控潜水器（ROV）沿线逐段排查。但如果自主水下航行器（AUV）能够自主绘制线路图并精确定位故障点，再由潜水员前往修复，情况会怎样？

这种水下人机协作模式，正是麻省理工学院林肯实验室一个研究项目的核心方向。该项目由实验室内部管理的自主系统研发资金支持，由先进水下系统与技术小组负责执行，旨在充分发挥人类与机器人各自的优势，优化美国军方的海洋任务执行能力，涵盖关键基础设施检查与维修、搜救行动、港口进入及反水雷作战等场景。

"潜水员与AUV在水下通常完全不协作，"首席研究员麦德琳·米勒表示，"需要人类参与的水下任务，往往是因为涉及机器人无法完成的操作，比如修复基础设施或拆除水雷。即便是遥控潜水器，在需要高度精细操控的任务中也存在明显局限，因为其机械臂的灵活性远远不够。"

水下人机协同搜救作业

视频来源：林肯实验室

除了更强的操控灵活性，人类在水下目标识别方面同样具有优势。然而，水下作业的人类无法进行复杂运算，行动速度也相对缓慢，在携带重型设备时尤为明显；而机器人则在计算能力、高速机动性和持久耐力方面占据优势。为了将两者的优势结合起来，米勒及其团队正在研发用于水下导航和感知的硬件与算法——这是实现有效人机协作的两项核心能力。

正如米勒所解释的，潜水员在水下往往只能依靠罗盘和脚蹼踢水次数来判断方向。由于水下缺乏明显参照物，加之水深处光线不足或水柱中含有生物物质导致能见度低，潜水员很容易迷失方向。要让机器人协助潜水员导航，首先需要机器人具备对环境的感知能力。然而，在黑暗与浑浊的条件下，光学传感器（摄像头）无法成像，而声学传感器（声呐）生成的图像缺乏色彩，仅能显示场景中物体的轮廓与阴影。长期以来，大规模有标注声呐图像数据集的缺乏，严重制约了水下感知算法的训练。即便数据充足，动态变化的海洋环境也可能掩盖物体的真实面貌，从而干扰AI的判断。例如，一架坠落后解体为多块碎片的飞机，或一只被贻贝大量附着覆盖的轮胎，其外观可能已与原本面目大相径庭。

"我们最终希望为远征环境中的导航与感知任务提供解决方案，"米勒说，"对于我们所设想的任务场景，提前对区域进行测绘的机会非常有限，甚至完全没有。以港口进入任务为例，可能有卫星地图可供参考，但水下地图往往付之阙如。"

在导航方面，米勒团队延续了麻省理工学院海洋机器人小组（由约翰·伦纳德领导）的前期工作，致力于开发潜水员与AUV的协作导航算法。伦纳德团队在理想条件下完成了仿真测试，并在平静水域中以人力划桨的皮划艇分别模拟潜水员和AUV进行了实地测试。米勒团队随后将这些算法集成到与实际任务相关的AUV中，在更接近真实海况的条件下展开测试——起初以支援船作为潜水员的替代物，之后再与真实潜水员协同作业。

"当我们将海洋洋流因素纳入考量后，很快意识到需要在潜水员端配备更强的感知能力，"米勒解释道，"麻省理工演示的算法中，AUV只需定期计算与潜水员的距离（即测距），就能解决估算双方随时间变化位置的优化问题。但在真实海洋力量的影响下，这一优化问题会迅速变得极为复杂。"

在感知方面，米勒团队正在开发一套AI分类器，能够在任务执行过程中实时处理光学与声呐数据，并在遇到不确定分类结果时主动向人类寻求输入。

"设想的机制是：分类器向潜水员传递部分信息——比如图像中的一个边界框——并提示'我认为这是一个轮胎，但我不确定，你怎么看？'潜水员可以回应：'对，你判断正确'，或者'不对，看这里，这样可以帮你改善分类结果'，"米勒说。

这一反馈闭环需要水下声学调制解调器来支撑潜水员与AUV之间的通信。目前，水下声学通信的最高数据传输速率，将一张未压缩图像从AUV传输到潜水员需要数十分钟。因此，团队正在探索的一个重点方向，是如何在水下通信低带宽、高延迟的约束条件下，以及商用现货（COTS）硬件体积小、重量轻、功耗低的限制下，将信息压缩到足以有效传达的最小量。针对原型系统，团队主要采购了商用现货传感器，并构建了一套传感器载荷模块，可便捷集成到美国海军常用的AUV平台中，以期推动技术的顺利转化。除声呐和光学传感器外，该载荷还配备了用于测量潜水员距离的声学调制解调器，以及多块数据处理与计算板卡。

米勒团队在新英格兰沿海地区对搭载传感器的AUV及相关算法进行了测试，测试地点包括：新罕布什尔州朴次茅斯附近的开阔海域（以新罕布什尔大学的"Gulf Surveyor"号和"Gulf Challenger"号沿海科考船作为潜水员替代物），以及波士顿地区的查尔斯河（以麻省理工学院帆船馆的一艘小帆船作为替代物）。

"新罕布什尔大学的船只配备完善，能够进入接近真实的海洋环境。但用一艘大船来模拟潜水员实在勉强。用小帆船的话，我们可以移动得更慢，让相对运动更接近潜水员与AUV协同导航的真实状态。"

去年夏天，团队开始在密歇根理工大学五大湖研究中心与真实潜水员协同测试设备。尽管潜水员尚无向AUV反馈信息的操控界面，但每位潜水员都手持一个团队研发的管状原型终端，内部称之为"tube-let"。该设备配备了气压与深度传感器、惯性测量单元（用于追踪相对运动）以及测距调制解调器——这些都是导航算法求解优化问题的必要组件。

"测试过程中的一大挑战在于协调潜水员与AUV的运动，因为两者目前尚未实现真正的协同，"米勒说，"一旦潜水员下水，就无法与水面团队保持通信。因此，必须事先规划好潜水员与AUV各自的位置，以避免发生碰撞。"

团队同时推进了感知问题的研究。彼时五大湖的水体能见度较高，允许使用光学传感器进行水下成像。林肯学者计划博士生卡罗琳·基南同时在实验室先进水下系统与技术小组及麻省理工学院伦纳德研究小组联合开展研究，她借此机会深化了光学传感器向声呐传感器的知识迁移研究。她正在探索：光学分类器能否训练声呐分类器识别那些尚无声呐数据的目标物体，以期减少人工标注声呐数据和训练声呐分类器所带来的繁重工作量。

随着内部资助的研究项目接近尾声，米勒团队目前正在寻求外部资金支持，以进一步打磨技术并推动其向军事或商业合作伙伴转化。

"现代世界的运转依赖于水下电信电缆和电力电缆，这些基础设施极易遭受破坏性行为者的攻击。随着越来越多的国家开发并提升自主海洋系统的能力，水下领域的竞争日趋激烈。维护全球经济安全与美国在水下领域的战略优势，将需要充分发挥并整合AI与人类能力各自的最大优势，"米勒表示。

Q&A

Q1：AUV和潜水员在水下如何实现协同导航？

A：目前团队基于麻省理工学院海洋机器人小组的算法，通过AUV定期测算与潜水员的距离来估算双方的实时位置。但在真实海洋洋流干扰下，这一优化问题会迅速变得复杂，因此需要在潜水员端配备更多感知设备，如惯性测量单元和测距调制解调器，才能保证导航算法正常运作。

Q2：水下AI分类器如何处理声呐图像识别不确定的情况？

A：当AI分类器对某个目标物体的识别结果存在不确定性时，它会将相关信息（例如图像中的边界框）通过水下声学调制解调器传递给潜水员，并询问潜水员的判断。潜水员可以确认或纠正分类结果，形成人机反馈闭环，从而提升识别准确率。这一机制的挑战在于水下通信带宽极低、延迟较高，需要对传输信息进行高效压缩。

Q3：光学传感器的知识能否迁移到声呐传感器的目标识别训练中？

A：这正是研究人员卡罗琳·基南正在探索的方向。由于大规模有标注声呐数据集长期匮乏，她的研究尝试用光学分类器来训练声呐分类器，使其能够识别目前尚无声呐数据的物体，从而大幅降低人工标注声呐数据的工作量，提升水下感知系统的训练效率。