德塔智能试图为双足人形机器人构建能够理解空间、协调全身并完成真实任务的基础模型。
作者丨高景辉
编辑丨林觉民
AI科技评论独家获悉,原生人形机器人基础模型公司德塔智能(Delta Intelligence)近日已连续完成种子+轮、天使轮及天使+轮融资。
具体来看,种子+轮由元禾控股、复星锐正共同投资;天使轮由华映资本、华盖资本、联想创投联合领投,老股东元禾控股、复星锐正超额追投;天使+轮获得珠海科技产业集团、海望资本、梅花创投等财务投资机构支持,半导体产业方交源资产及某汽车产业方深度参与,老股东华映资本继续加注。
加上此前北京通研院、乐聚机器人、智元机器人、星海图和高瓴创投参与的两轮融资,德塔智能在成立不到半年的时间内已连续完成五轮融资。
但相比融资速度,更值得关注的是,多家头部人形机器人本体厂商、市场化投资机构,以及汽车、半导体产业资本,正在同时押注同一个命题:
双足人形机器人已经能够走路、奔跑和跳舞,下一步,如何让它真正进入家庭和工厂干活?
01
双足人形机器人已经“会跳舞”,
但还不真正“会干活”
过去几年,双足人形机器人的运动能力取得了显著进展。从稳定行走、奔跑,到跳舞、空翻和一系列高难度动作,正在越来越接近人类的外形和运动方式。
但公众的真正期待,并不是看到更多文娱表演,而是机器人能够进入人类的生活和工作空间:整理房间、搬运物料、操作工具、在产线上完成装配,或者在复杂环境中持续执行任务。
从完成一段预先设计的动作,到自主、稳定、连续地完成一项工作,中间仍然存在巨大的技术鸿沟。
怎样才能让双足人形机器人从“会跳舞”走向“真正干活”?德塔智能给出的答案聚焦在技术路线和产业推进,主要体现在五个方面。
▎第一,人形机器人不能只会“走”,也不能只会用手“拿”,真正难的是全身协同作业。
当前,大量具身智能模型仍主要在固定机械臂或轮式双臂机器人上训练和验证,重点解决局部空间内的抓取与操作。双足人形机器人则需要在移动和保持平衡的同时,协调双手、双腿、腰部和躯干,并处理位置、受力、重心与环境变化。
行业通常将这种能力称为Loco-manipulation,即全身协同操作,亦可进一步概括为“全身智能”(Whole-Body Intelligence):让机器人具备“边走边干活”的能力,从单点展示走向连续、复杂、可复制的真实作业。
德塔智能研发人形机器人基础模型,便是从一开始就把人形机器人的完整身体作为建模对象,围绕 Loco-manipulation 构建从 3D 场景理解、任务推理、全身控制到力位交互的模型闭环,让机器人在理解任务的同时,也能知道身体该如何配合完成任务。
▎第二,机器人要在真实世界里干活,先要看懂三维空间。
人形机器人要在工厂、能源、商业和家庭等开放空间中完成任务,仅识别二维画面中的物体还不够,更需要理解物体之间的三维空间关系、环境变化以及动作可能带来的后果,比如开门时,机器人不仅要知道门在哪里,还要判断门把手的位置、门的打开方向、身体站位以及动作之后可能发生什么。
德塔智能自研的 3D 世界引擎,解决的就是这类问题:让机器人在行动前先理解空间关系、环境变化和动作后果,再去完成开门、搬运、分拣、巡检、质检等任务。
▎第三,机器人不只是要“想明白”,还要“动得稳”。
在德塔智能的模型体系里,大脑负责场景理解、任务推理和动作决策,小脑将任务意图转化为全身多关节的连续控制,力位混合控制则帮助机器人在接触真实物体时兼顾位置精度、力反馈和身体稳定性。三者协同,解决的是机器人如何从“知道要做什么”,走向“在真实环境中稳定地把事情做成”。
▎第四,训练人形机器人,不能只采一双手的数据。
德塔智能已完成自研全身全景数据采集设备的规模化部署,同时收集手、躯干、腿、脚与环境交互关系的全身数据,为全身协同、长序列任务执行和跨任务泛化提供数据基础。目前,德塔智能团队深度参与了国内最大的数据采集场建设,加速人形机器人全身数据的采集。
▎第五,模型能力不能只绑定在一台机器人上。
德塔智能正通过与多家头部人形机器人本体厂商合作,在不同硬件和真实任务中持续验证模型能力,由此提升人形机器人基础模型的通用性,也让模型反过来参与本体设计、数据采集标准和场景落地流程的优化。
02
多家头部本体厂商共同布局,
产业协同与分工成为行业关键词
据AI科技评论了解,德塔智能是目前唯一一家同时获得智元机器人、乐聚机器人和星海图三家头部人形机器人本体厂商投资的具身基模公司;同时,德塔智能所依托的北京通研院是最早与宇树成立联合实验室的团队之一。
这不仅意味着德塔智能正在与国内头部本体厂商形成一种协同布局,也预示着具身智能行业正在形成更清晰的分工:本体厂商持续提升硬件性能、可靠性和量产能力,模型公司则需要解决机器人如何理解三维环境、如何进行任务推理,以及如何调动手、腰、腿、脚完成全身协同作业。
而德塔智能的目标,则是在不同人形机器人本体上提供可迁移、可泛化的人形机器人基础模型,并通过与本体厂商的联合验证,缩短技术从模型训练走向真实场景的路径。
另一方面,德塔智能正在持续迭代人形机器人基础模型核心架构,并在宇树、智元、乐聚等多类人形机器人本体上完成跨本体适配与性能验证。
围绕工业制造与能源等场景,德塔团队已经完成了一汽红旗产线协作、南方电网配电站巡检、SMT 料盘分拣等真实任务验证,并在任务成功率、连续作业时长及跨场景泛化能力上取得阶段性进展。
在模型与数据侧,德塔已形成“3D 世界引擎大脑+全身控制小脑+力位混合控制”的技术闭环,推动人形机器人基础模型从短任务能力向长序列任务和多任务连续执行演进。
03
公司成立不到半年,
团队却已沿这条路线积累多年
德塔智能成立时间不长,但创始团队已在人形机器人领域持续积累多年,能力覆盖空间智能、具身基础模型、全身控制、机器人系统与产业交付,形成了相对稀缺的“AI基础模型×机器人控制×真实场景交付”组合。
创始人兼CEO马晓健,本科毕业于清华大学计算机系,博士毕业于UCLA,曾在Google Robotics、NVIDIA Research从事机器人学习和大规模机器学习研究,回国后在通研院主导原生空间通才具身智能体、跨本体数据采集及具身基础模型等项目。
联合创始人刘航欣,博士毕业于UCLA,现任北京大学助理教授,长期从事机器人系统、软硬件协同与产业交付,曾参与美国DARPA、ONR、NSF机器人项目,牵头多项人形机器人工业及特种场景应用,并主导研发全手掌视触觉灵巧手F-TAC。
联合创始人兼首席科学家黄思远,本科毕业于清华大学自动化系,博士毕业于UCLA,现任北京通用人工智能研究院具身机器人中心主任,曾在DeepMind、Meta从事前沿研究,提出空间智能“生成—理解—规划”统一模型及力—位混合控制统一理论,相关成果获得CoRL最佳论文奖。
双足人形基础模型既需要大模型和三维空间理解,也离不开机器人动力学、全身控制、硬件系统与真实场景交付。三位创始人的互补能力,构成了德塔智能攻克人形机器人全身协同难题的核心基础。
德塔智能创始人马晓健向AI科技评论表示:“本轮融资后,我们将继续把资源集中投入人形机器人基础模型研发,推动机器人从‘会动’走向‘能干活’,并让这一能力适配更多本体、进入更多真实场景。”
上车,带你看遍全球 AI 顶会精华
可独家畅览:
专家演讲PPT
大会报告全文
热门论文解读
学术新星访谈
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
热门跟贴