1月27日,蚂蚁集团旗下具身智能公司灵波科技宣布,正式开源高精度空间感知模型LingBot-Depth。这也是蚂蚁灵波科技在2025外滩大会后首次亮相后,时隔半年在具身智能技术基座方向公布重要成果。
据介绍,该模型旨在提升环境深度感知与三维空间理解能力,为机器人、自动驾驶汽车等智能终端赋予更精准、更可靠的三维视觉支持。
LingBot-Depth模型基于奥比中光Gemini 330系列双目3D相机提供的芯片级原始数据研发。在NYUv2、ETH3D等权威评测中,其相对误差降低超70%,稀疏深度补全任务RMSE误差下降约47%。
针对家庭和工业环境中常见的玻璃器皿、镜面、不锈钢设备等透明和反光物体,传统深度相机常因光学物理特性导致深度图数据丢失或产生噪声。据悉,蚂蚁灵波科技研发了“掩码深度建模”(Masked Depth Modeling,MDM)技术。当深度数据出现缺失或异常时,LingBot-Depth模型能够融合彩色图像(RGB)中的纹理、轮廓及环境上下文信息,对缺失区域进行推断与补全,输出相对完整、致密的三维深度图。
实验显示,奥比中光Gemini 330系列在应用LingBot-Depth后,面对透明玻璃、高反光镜面等场景时,输出的深度图在平滑度、完整性及物体轮廓边缘清晰度上有所提升。
[上图]搭载 LingBot-Depth 后,奥比中光 Gemini 330系列在透明及反光场景下深度图的完整性和边缘清晰度效果对比
据悉,灵波科技还将开源包含200万组真实深度配对数据的核心数据集(包括2M 真实世界深度数据和1M 仿真数据),并计划本周陆续发布多款具身智能方向开源模型。此外,蚂蚁灵波科技已与奥比中光达成战略合作意向,奥比中光计划基于LingBot-Depth的能力推出新一代深度相机。(袁宁)
热门跟贴