作者:吕鑫燚
出品:具身研习社
具身智能百亿俱乐部意味着什么?
首先,这绝不是资本盲目押注的产物,也不是风口捧起来的新星。而是在具身智能进入下半场时,杜绝无法落地的PPT故事,不断用更前沿的技术给产业新惊喜,用能落地的产品给终端一个提质增效的新生产力。
这才是具身智能百亿俱乐部成员的内核,也是具身智能真正实现产业化的关键支撑。
如果要找更具象的答案,则可以通过近期的一则新闻来透视。近日,千寻智能连续完成两轮融资近20亿,估值破百亿。由云锋基金、某头部国资机构、混沌投资(葛卫东)、红杉中国等机构入局;Synstellation Capital、TCL创投、明荟投资(汇川技术董事长朱兴明家办)等产业资本协同加注;重庆产业投资母基金、杭州金投等国有资本支持;360基金、厚雪资本等战投机构共同参与,形成覆盖顶级资本、产业巨头、国有资本及战投大咖的全方位赋能格局。
此外,顺为资本、Prosperity7、达晨财智、柏睿资本、弘晖基金、华泰紫金、东方嘉富、千乘资本、广发信德等老股东全部选择继续大额认购。
这样的资本认可度,绝非单纯的风口追逐,背后是千寻智能在模型技术与场景价值上的扎实积累,也印证了百亿俱乐部“技术成熟度+产品落地性”的核心准入门槛。更向市场传递明确信号:只有真正能解决产业痛点、创造实际价值的企业,才能实现具身智能生产力时刻,也具备冲击AGI的底气。
而这,正是具身智能百亿俱乐部的核心意义所在。
但跻身百亿俱乐部只是千寻智能的新起点,这意味着其来到了更大的舞台大展拳脚,在20亿融资的加持下,千寻智能将突破阈值,触碰到具身智能的Scaling Law。
如果说具身智能百亿俱乐部成员都有一个鲜明的标签,那千寻智能身上一定是“模型”,而且是越来越聪明的模型。
强有力的佐证是,千寻智能的Spirit v1.5是首个超越pi0.5的具身模型。
具体来看,在同样的桌面清理任务上,面对桌面随意摆放的不同尺寸、不同形状、不同材质且极易形变操作物体时(透明塑料瓶、碗碟、纸巾等),Spirit v1.5能有条不紊地将桌面垃圾分别收纳进垃圾桶或桌面上的整理箱中,还和人类收纳惯性相同,把小碗一一叠起来。而pi0.5则在该任务上有明显失误。
这不是精心排练后的成果,而是模型自我驱动的现实验证。
能轻松应对多项随机的复杂任务,靠的是千寻智能一条“反常识”的逻辑。
大多数厂商在训练模型时更偏向于“干净数据”,即准确性高、环境高结构化的完美数据。这类数据足够干净,能让模型快速理解现实世界,并在同样可控的环境中复现。但如果现实环境不够完美或有随机因素发生,吃惯了干净数据的模型,则很容易出现失误。就好像现实出了一道不在考试范围内的考题一般,模型没学过,所以很难能答上来。
基于此,千寻智能开始思考如何能让模型真正应对随机复杂任务,拿捏意外情况。毕竟,这才是具身智能落地的最高门槛。
最终千寻智能提出“干净数据是打造卓越具身基础模型的敌人”。
通俗来说,用干净数据训练出来的模型,学到的只是一个个孤立、标准化的正确动作,本质上是一座座彼此割裂的数据孤岛,而非连贯统一的任务逻辑。而千寻智能让模型学习的,不是被脚本规定好的指令式操作,而是由数据采集员自主规划、自然完成的完整任务流。模型由此掌握的是一整套做事逻辑,而非零散的机械动作。
换句话说,具身智能模型,已经进入学“骨架”而非学“动作”的时候。
这种数据训练模式得到的利好反馈,还体现在收敛速度和实际效果中,数据显示千寻智能采用的多样化模型在相同性能所需的迭代次数比基线模型少了40%。
从千寻智能在数据颠覆性实践不难看出,其在模型层面推进的并非局部优化式的基础创新,而是一场自下而上、重构底层逻辑的范式革命。
这种路径跃迁,不仅为千寻智能锻造出更具通用智能、更适应真实世界“大脑”,更通过全球顶级真机评测的硬核成绩验证:中国团队正在全球具身大模型的激烈竞争中,争夺话语权。
得益于模型能力的跨越式提升,千寻智能也加速走进真实工作场景中。目前,千寻智能的墨子机器人在宁德时代的电池PACK真实量产线上稳定工作,在实际运行中,其插接成功率稳定在99%以上,作业节拍已达到熟练工人水平,已经生产近千块电池。
据具身研习社了解,墨子机器人在宁德时代执行的具体工序是EOL&DCR。该工序体现了墨子机器人能精准适应来料位置偏差、插接点位变化等不确定性,并及时调整操作姿态;在插拔柔性线束时,能实时调节力度,确保连接可靠。
这便意味着,千寻智能啃下的不仅是单一终端场景,而是具有极强的场景复制性。
未来,千寻智能能面向工业场景中所有多品种、小批量、高柔性特点的需要频繁切拉换型的生产组织模式下的场景。还能走向商用、家庭等真实场景。
从超越pi0.5,到宁德时代的产线验证,再到全场景的复制潜力,千寻智能用“模型驱动”的核心逻辑证明:具身智能的终极竞争,本质是“模型能力”的竞争。当模型能像人类一样在真实世界中学习、进化,中国具身智能便真正掌握了话语权转变。
透过Spirit v1.5大胆采用“脏数据”这事就能看出,千寻智能的底色并非在技术参数上追求极致堆砌,它的“强迫症”更多体现在对“可落地、可规模化”结果的偏执坚守。
这个结果的实现分为清晰的两步:其一,让技术真正走出实验室,具备应对真实世界不确定性的能力;其二,让成熟技术突破成本瓶颈,实现规模化复制。前者是“能用”的基础,后者是“好用”的关键,而千寻智能的核心创新,正是围绕这两个目标构建起闭环的技术体系。
在“让技术真正落地”的第一重目标下,“脏数据”的运用只是其中一环。千寻智能还搭建起“互联网视频+遥操+真机Rollout”的架构。这条架构指向的是“以数据为中心”(Data-Centric AI, DCAI)的路线,与行业普遍依赖的“算法驱动”不同,它让数据成为模型迭代的核心引擎,通过数据质量与规模的双提升,替代单纯的算法参数优化,实现更高效的能力跃迁。
这种三层架构的精妙之处,在于通过多源数据的互补形成“能力闭环”,互联网视频数据的“泛”解决了覆盖度,遥操数据的“精”保证了操作质量,真机数据的“实”验证了落地效果。形成三种数据互相补齐短板的闭环数据架构。又通过Data-Centric的思路,让模型在数据的持续滋养中不断进化出更高的智商,最终实现“越用越聪明”的自我迭代。
而在“实现规模化落地”的第二重目标上,千寻智能使出的“奇招”,是对数据采集成本的极致压缩,这正是破解具身智能产业化瓶颈的关键。
当前行业面临的核心痛点之一,便是数据采集的高成本与低效率。为了解决产业痛点,同时也是遵循对数据Scaling Law技术路线的长期投入,千寻智能着手进行可穿戴数采设备的研发和相应理论的验证。
截至目前,千寻智能的可穿戴式数采设备已经迭代到第5个大版本和第20个小版本。得益于自研设备,千寻智能实现了从低成本硬件设计,到高质量数据采集、数据清洗链路搭建。基于该可穿戴式设备,千寻智能将具身智能的数据成本降低了10倍,仅为遥操成本的10%。
更为重要的是,千寻智能在低采集成本和三层数据架构协同中,碰撞出了“涌现”。基于互联网人类视频数据和可穿戴设备数据的量级,其已经具备了Scaling的条件(目前已累计20w小时数据)。千寻智能不仅验证了数据的质量和效率,并且已经跑通了批量化复制这些数据的管线。
当数据成本不再成为制约,当技术不再需要为客观条件“让渡性能”,千寻智能打破的不仅是具身智能的产业化瓶颈,更是技术与物理世界高频交互的“次元墙”,数据成本突破后,技术潜力将迎来集中爆发。
20亿元融资的到位,对千寻智能而言,是企业规模扩张与技术爬坡的重要资金支撑,也是其冲击AGI的关键资源保障。
作为全球第一批坚定投入VLA(视觉-语言-动作)模型的具身智能厂商,千寻智能一直在探索VLA更多的可能性,致力于让模型走进现实世界中。
而这一路线正与全球顶尖科技巨头形成“同频共振”。放眼国际,Google Brain以及长期霸榜的Pi团队,均已将核心研发资源押注于通用操作型大脑的构建,不约而同地在VLA的赛道上持续深耕。
这并非巧合,而是行业对具身智能的共识:唯有打通视觉感知、语言理解与动作执行的全链路,才能让机器人真正具备 “理解意图、规划动作、应对复杂” 的通用能力。
更具行业印证意义的是,Pi近期公开的基于人类视频学习的技术成果,从实践层面佐证了千寻智能两年前的预判。该成果清晰显示,人类视频数据凭借其海量性、场景多样性与操作原生性,能够为模型提供最贴近真实世界的学习样本。
而想要保持技术引领,除了团队自身还需要外部的推波助澜。
无论是扩容算力,还是持续加码研发、吸引全球顶尖人才,关键燃料的到账,都让千寻智能更有底气有验证更前沿的技术,夯实底层技术壁垒。
将这次融资放到更高维度来看,或许这笔融资的意义,早已超越企业自身的发展。当下,全球具身智能竞争已进入“规模决胜”的关键阶段,数据规模、算力储备与资金实力,直接决定了企业能否触达Scaling Law的核心拐点。
从这个角度看,千寻智能这轮融资,既是企业冲刺AGI路上的一次关键加油,也将是改写全球具身智能模型梯队洗牌的变量之一。
热门跟贴