Jay 发自 凹非寺
量子位 | 公众号 QbitAI
近日,中国具身智能史上最高单轮融资纪录,诞生了。
4月16日,成立仅一年的它石智航,宣布完成Pre-A轮融资,金额4.55亿美金。
一年前,它石斩获了行业最大天使轮融资的标签;
一年后,这家公司的Pre-A轮,刷新中国具身最高单轮融资。
更引人瞩目的,是此次堪称顶配的投资方阵容:
高瓴创投,与红杉中国本次联合领投它石智航。
与此同时,美团战投重额加注并继续领投,北京机器人产业发展投资基金、上海国投先导等国资联合入局……
共20余家机构,横跨财务、战略、产业、国资四大维度。
而且据了解,这个投资方阵容完全是它石主动设计的结果。
因为技术已经交卷了,它石很清楚自己想要什么,只有那些有长期价值、有明确产业诉求、赋能清晰的投资方,才能上桌。
30亿,怎么花?
据悉,主要投往两个方向:大脑和人才。
大脑方面,它石的战略重心在预训练,这部分算力消耗极大。
人才方面,它石将持续推进「TARS STAR」全球顶尖人才引进计划,提供行业TOP级待遇。
用它石自己的话说就是:
已经准备好「有格局地用大钱」了。
这是家有能力、有野心、有潜力不断「创纪录」的公司。
豪华的创始人团队,技术斩获吉尼斯,全球首个能干活的具身大模型,全球首创「以人为中心」的数采范式……
如今,潜心钻研具身大脑一年有余的它石智航,用最大单轮融资额,又一次刷新了纪录。
在两轮融资和技术首次交卷后,它石已经不仅仅是稳坐具身智能第一梯队——
更是国产具身大脑赛道的头号玩家。
没有大脑的本体,就只是一具躯壳
具身智能正在经历一场剧变。
过去两年,行业热闹非凡。市场的喜好出奇统一,只要哪家公司的机器人能上台翻个跟头、跳段舞,展台瞬间就会被围得水泄不通。
包括春晚也是一群机器人在上面热热闹闹地跳舞。
本体形态是否酷炫、关节是否灵活、运控是否流畅……这些最「前端」的指标,抢走了所有聚光灯。
然而,自去年年中开始,一个更尖锐的问题开始反复出现:
机器人到底啥时候能进厂干活??到底有什么价值?
风向,开始不可逆地转变了。
到了今年年初,这股「务实主义」的风,同样刮到了资本市场的最前沿。
相比本体和小脑,以Skild AI、Sunday、Generalist等一批专攻智能上限的大脑玩家,开始成为新的资本宠儿。
资本市场的嗅觉永远是最灵敏的。
当顶级基金集体掉头转向,便释放了一个清晰的信号:单纯或重点比拼本体硬件和底层运动控制(小脑)的竞赛,或许已经基本结束了。
下半场的胜负手,是大脑。
而这个大脑要解决的,正是具身智能必须跨越的下一个阶段——
真干活,而不是披着干活外衣的表演。
这同样也是它石对其大脑的期许:能干活的具身通用大模型,
那么,它石的大脑,到底长什么样?
答案是:AWE 3.0,全称AI World Engine,即「AI世界引擎」。
是的,不是VLA,也不是3D资产生成模型。
这是一个从底层架构就统一了感知、决策与行动的原生具身大模型,并搭配了全球首个视触觉世界模型OmniVTA。
视觉、语言、动作,三种模态天然对齐,训练时可以在任意模态之间互相转换——
「视觉」到「视觉」就是视频预测,「视觉-语言」到「动作」就是端到端,「视觉-语言」到「视觉-动作」就是世界模型。
更直观一点来说,这个模型拥有一项叫Faliure Recovery(自我纠错)的能力。
面对柔性操作中层出不穷的突发状况,模型不再简单模仿动作轨迹,而是在隐空间里持续推演未来的多种可能,再据此做出决策。
当插接的力度或角度出现异常,机器人会主动把线拔出来,换个角度再试一次。
正如人类的做法一样。
对于真实工业场景而言,这是一个象征着应用成熟度的关键信号:
「机器人会反思了」。
这大概是2026年具身大脑浮出水面后,为行业送上的第一份厚礼。
更关键的是,这一切的实现没有用到一秒钟的遥操数据。
长期以来,关于具身训练数据,行业有个共识:遥操数据精度最高 。
它石却觉得,这个结论完全站不住脚。
遥操作根本干不了亚毫米级的事。
在此前与量子位的对话中,它石首席科学家丁文超直言,在对精度有极高要求的场景下,人工遥操过程中的犹豫、抖动,反而会变成训练数据中的「噪声」。
这也是它石反复强调Human-centric的真正原因。
线束这个场景实在太恐怖了。孔位极窄,容错性非常低。
但人能完成这个任务。
虽然不能百分百零偏差,但人的纠错能力极强,所以可以在操作中感受阻力并据此迅速调整角度和力度。
从第一性原理出发,丁文超指出,想要习得这种局部微调的能力,唯一的方式就是从真人身上采集数据。
如今,这个想法已完全落地,并且凝练成一整套以人为本的数据采集套件——SenseHub。
仅需一双轻便的数采手套,加上一枚第一视角摄像头,佩戴即开工。劳动者在日常作业中,便能顺手完成数据采集。
回过头来看它石的布局,逻辑就非常清晰了:
数据-本体-模型全栈自研,不是为了生态,而是遵循「第一性原理」设计出来的。
在行业蛮荒期,技术路线尚未收敛,既无标杆案例,亦无成熟的横向分工。
而产业的每个变量又都会直接影响大脑能力。
所以必须有一定程度的完美主义,全栈自研,抓紧每个细节。
这是从第一性原理推导出的必然。
全栈大脑这个概念,最有魅力的地方也在于此。
做大脑的每家公司都在围绕自身的哲学思考,从数据-本体-模型三个维度全线出发,将各自的信念极致化。
这注定是一场极为精彩,同时也极为残酷的淘汰赛。
吉尼斯纪录背后,是落地的领先
具身大脑这条赛道上,所有玩家,无论从哪条路径出发,最终都会不可避免地交叉在一起。
因为这场比赛,大家都是奔着泛化去的。
真实世界是混沌且极度复杂的。如果一个机器人只能像复读机一样执行预设的单一脚本,那它与传统自动化产线上的机械臂并无本质区别。
LLM让人兴奋的原因正是如此,我们第一次拥有了具备泛化可能的智能。
虽然它在特定单一任务上可能不如硬编码的脚本极致,但真实世界中那些无法用脚本逻辑描述的种种长尾任务,必须依靠智能的「涌现」来解决。
但这也意味着——赢家通吃。
具身智能之所以被视为下一个万亿级赛道,其核心前提正是泛化能力、跨场景复制能力以及成本可控的规模化能力。
而它石智航从成立的第一天起,所有的战略重心都在为这个前提做准备,所以他们选择了线束。
线束装配,工业自动化界的「哥德巴赫猜想」。长程操作、柔性操作、亚毫米精度,「不可能三角」全部集齐于此……堪称「地狱」级别的工厂场景。
它石选择这个高价值x高难度场景作为交卷的技术,本身就极具深意。
大多数具身智能公司在选择落地场景时,往往会遵循「易落地、快见效」的路径,比如叠毛巾、搬箱子、摆货架。
这些任务实打实存在着海量需求,同时对精度的要求也没那么恐怖。
但它石,偏要反其道而行之。要打,就打最难的仗。
对此,丁文超曾表示:
没有Plan B。
毕竟,如果连最柔软、最易变形的线束都能实现精准装配,那么工厂里其他那些常规装配任务,则无异于降维打击。
而事实证明,它石不仅做到了,更是直接把这个场景彻底「打爆」——
1小时内,完成百余次亚毫米级柔性线束完整装配任务,一举刷新吉尼斯世界纪录。
甚至,还在高速装配的过程中,保证了拟人的「观赏性」。
在它石发起的业内首个「机器人柔性操作图灵测试」,超过50%的投票者竟然分不清:究竟哪个是机器人。
其中,Human-centric的重要性不言而喻。
这种数据采集方式,天然具备全场景覆盖的基因。因为它捕捉的是人在真实环境中的工作流,不再受限于特定硬件或封闭的数采中心。
这意味着,AWE 3.0从诞生之初,便是具备跨场景迁移潜力的。
在它石看来,模型层的过拟合只是技术瑕疵,但方法论的过拟合是致命的。
因此,从成立第一天开始,它石就拒绝了走捷径,全力押注Human-centric这条路。
一年过去,它石曾经许诺的BP现在正一一化为现实,并且他们仍然在坚持最初的理念。
在AI这个技术日新月异的赛道,敢于「不变」,或许比「求变」需要更大的定力。
如今,这份对初心的坚守终于迎来了回响。它石智航凭借线束场景一战成名。
但事实上,聚光灯之外,它石智航从创立之初便同步启动了工厂、物流、仓储、洗衣房、酒店等多场景的数据采集。
从一开始,它石就是奔着泛化去的。
目前,它石已手握超十万小时Human-centric数据,并正式发起「具身数据星火计划」,并邀请生态伙伴共建产业级数据共享生态,直指1亿小时级别的数据共享。
而基于这些可迁移的训练数据,它石内部已有多个落地场景在并发推进,蓄势待发。
一颗足够优秀的大脑,能够填平从工业到家庭的泛化鸿沟。
这,正是具身智能从实验室走向千行百业的关键。
资本下半场风向标:大脑强,则具身强
具身智能,正在从「百花齐放」的喧嚣,走向百川归海。
踏入2026年,资本不再普降甘霖,而是开始精准滴灌。
而滴灌的靶心,正是全栈布局、大脑为核的公司——这个粮草先行、兵家必争的战略高地。
没有大脑的本体公司,本质上是一具精致的躯壳,只能等待别人来注入灵魂,上限从一开始就被锁死了;
而不做本体的纯算法团队,无法打通数据反馈的商业闭环,最终就会沦为技术外包商。
在残酷的淘汰赛里,技术收敛后,市场只会需要第一名。
这也是垂直整合在这个行业早期的必要性所在。想把技术做到极致,唯一的解法,只有把变量全部握在自己手里。
核心零部件和硬件供应链固然会有专业化分工,但整个产业的定价权与标准制定权,必将向拥有「最强大脑」的全栈企业高度集中。
赢家,一定是全栈大脑公司。
高瓴与红杉的联手押注,正是对这一终局判断最有力的印证。
对于长期主义机构而言,不怕投得晚,但一旦押注,就说明对其已经有了笃定的未来画像。
这也是两家顶级机构经历了对它石超过一年的跟踪深度调研后,最终决定联合出手的原因。
因为具身大脑,就是那个正在逐渐收敛的确定性。
而在这条新赛道上,它石无疑是当下最具竞争力的头号玩家之一。
4.55亿美金,是资本对这个终局判断的抢先投票。
在下半场,全栈大脑会成为具身智能下一阶段竞赛的胜负手。
枪响了。
热门跟贴