近日,智象未来(HiDream.ai)与诺亦腾机器人(Noitom Robotics)宣布正式达成战略合作,双方将在高质量、规模化具身智能视频数据的生成上展开深度合作,从而开启拓宽具身智能行业数据入口的全新模式探索。
高可用的训练数据是目前发展迅猛的具身智能产业的瓶颈。不同于大语言模型可海量获取文本数据,具身智能需整合视觉、运动、触觉等多模态数据,传统采集成本高效率低,合成数据因此成为关键。随着产业爆发,训练数据正从小体量演示转向大体量、可规模化交付的需求,数据的获取、结构化与工程化能力,正决定系统上限。
基于这一判断,智象未来携手诺亦腾机器人,将多模态大模型的毫米级可控视频生成能力与真实数据基础设施结合,以“真实数据+生成式视频数据”融合,预计双方年内合作生成的具身智能视频数据将达到数万小时以上,这将开辟出可规模化供应行业亟需的高质量具身训练数据的全新路径。
仪式现场,诺亦腾机器人创始人兼首席执行官戴若犁、智象未来创始人兼首席执行官梅涛等共同出席,见证了这一重要时刻。
诺亦腾机器人:构筑具身智能数据底座
诺亦腾机器人是一家面向具身智能与人形机器人产业的数据公司。公司以“数据”为核心交付界面,基于高精度人体动作捕捉与多模态数据采集能力,为机器人企业、具身智能模型团队等提供高质量、可规模化的训练数据与相关基础设施能力。随着具身智能产业加速发展,高质量、多模态的训练数据正在成为推动行业进步的关键基础要素。基于对具身智能发展路径与数据瓶颈的判断,诺亦腾机器人从数据基础设施这一底层环节切入,专注构建面向产业的技术与平台能力,推动具身智能从“数据获取”走向“数据工程化与体系化”。
诺亦腾机器人联合创始人、首席科学家韩磊博士表示:“具身智能的发展,本质上是一个以数据为核心驱动的系统工程。单一来源的数据难以支撑模型在复杂物理世界中的泛化能力。我们希望通过与智象未来的合作,将真实世界中高精度采集的人类动作数据,与可规模化生成的多样化视频数据相结合,构建兼具真实性与多样性的训练数据体系。这将有助于突破当前数据规模与质量之间的瓶颈,加速具身智能模型从‘可用’走向‘好用’。”
智象未来:用毫米级高可控视频大模型打开具身智能数据入口
作为全球领先的多模态生成式人工智能企业,智象未来专注底层架构的持续创新,在生成质量、语义理解与艺术表现力上不断突破边界,定义行业新标杆。在本次合作中,智象未来充分发挥其领先的高可控视频生成技术,将利用高精度动作捕捉设备采集的原始传感数据进行了百倍以上的精细化放大。这一过程并非简单的素材堆砌,而是通过可控视频生成技术将精准的动作指令与极其丰富的视觉场景深度融合,它不仅赋予了具身智能训练数据在场景、光影变化及人体形态肤色上的超高复杂度,更确保了生成的每一帧视频与底层操作数据之间的精准配对。
智象未来联合创始人兼 CTO 姚霆博士表示:“普通的通用视频生成模型通常是为了好看,容易产生幻觉或物理不一致。为了让生成的视频数据能够达到具身智能产业需求的物理一致性,我们基于智象自研的多模态大模型,对传感动捕设备采集的数据进行了高可控性的生成式优化,使之更加符合具身智能企业进行高精度训练的要求。这种‘数据炼金术’打破了传统动捕数据的局限,为具身智能的进化提供了取之不尽的高质量‘燃料’。”
合作展望:共筑具身智能数据新范式
未来,双方将围绕高质量底层数据构建、VLA 模型规模化演进,以及视频建模与动作预测协同驱动的世界模型展开全方位的深度合作。
智象未来将发挥多模态大模型的零样本生成优势,携手诺亦腾机器人对高精度多模态 Human-centric 数据进行规模化扩展与视觉精细度增强;诺亦腾机器人将利用其高精度动作捕捉与多模态数据基础设施,为模型提供真实精准的物理反馈数据。双方将携手构建从虚拟生成到物理验证的完整数据闭环,共同加速具身智能时代的到来。
热门跟贴