Jay 发自 凹非寺
量子位 | 公众号 QbitAI

近日,中国具身智能史上最高单轮融资纪录,诞生了。

4月16日,成立仅一年的它石智航,宣布完成Pre-A轮融资金额4.55亿美金

打开网易新闻 查看精彩图片

一年前,它石斩获了行业最大天使轮融资的标签;

一年后,这家公司的Pre-A轮,刷新中国具身最高单轮融资。

更引人瞩目的,是此次堪称顶配的投资方阵容:

高瓴创投,与红杉中国本次联合领投它石智航。

与此同时,美团战投重额加注并继续领投,北京机器人产业发展投资基金、上海国投先导等国资联合入局……

共20余家机构,横跨财务、战略、产业、国资四大维度。

而且据了解,这个投资方阵容完全是它石主动设计的结果

因为技术已经交卷了,它石很清楚自己想要什么,只有那些有长期价值、有明确产业诉求、赋能清晰的投资方,才能上桌。

30亿,怎么花?

据悉,主要投往两个方向:大脑和人才。

大脑方面,它石的战略重心在预训练,这部分算力消耗极大。

人才方面,它石将持续推进「TARS STAR」全球顶尖人才引进计划,提供行业TOP级待遇

用它石自己的话说就是:

已经准备好「有格局地用大钱」了。

打开网易新闻 查看精彩图片

这是家有能力、有野心、有潜力不断「创纪录」的公司。

豪华的创始人团队,技术斩获吉尼斯,全球首个能干活的具身大模型,全球首创「以人为中心」的数采范式……

如今,潜心钻研具身大脑一年有余的它石智航,用最大单轮融资额,又一次刷新了纪录。

在两轮融资和技术首次交卷后,它石已经不仅仅是稳坐具身智能第一梯队——

更是国产具身大脑赛道的头号玩家。

没有大脑的本体,就只是一具躯壳

没有大脑的本体,就只是一具躯壳

具身智能正在经历一场剧变。

过去两年,行业热闹非凡。市场的喜好出奇统一,只要哪家公司的机器人能上台翻个跟头、跳段舞,展台瞬间就会被围得水泄不通。

包括春晚也是一群机器人在上面热热闹闹地跳舞。

本体形态是否酷炫、关节是否灵活、运控是否流畅……这些最「前端」的指标,抢走了所有聚光灯。

然而,自去年年中开始,一个更尖锐的问题开始反复出现:

机器人到底啥时候能进厂干活??到底有什么价值?

风向,开始不可逆地转变了。

到了今年年初,这股「务实主义」的风,同样刮到了资本市场的最前沿。

相比本体和小脑,以Skild AI、Sunday、Generalist等一批专攻智能上限的大脑玩家,开始成为新的资本宠儿。

资本市场的嗅觉永远是最灵敏的。

当顶级基金集体掉头转向,便释放了一个清晰的信号:单纯或重点比拼本体硬件和底层运动控制(小脑)的竞赛,或许已经基本结束了。

下半场的胜负手,是大脑。

而这个大脑要解决的,正是具身智能必须跨越的下一个阶段——

真干活,而不是披着干活外衣的表演。

这同样也是它石对其大脑的期许:能干活的具身通用大模型,

那么,它石的大脑,到底长什么样?

答案是:AWE 3.0,全称AI World Engine,即「AI世界引擎」。

打开网易新闻 查看精彩图片

是的,不是VLA,也不是3D资产生成模型。

这是一个从底层架构就统一了感知、决策与行动的原生具身大模型,并搭配了全球首个视触觉世界模型OmniVTA

视觉、语言、动作,三种模态天然对齐,训练时可以在任意模态之间互相转换——

「视觉」到「视觉」就是视频预测,「视觉-语言」到「动作」就是端到端,「视觉-语言」到「视觉-动作」就是世界模型。

更直观一点来说,这个模型拥有一项叫Faliure Recovery(自我纠错)的能力。

面对柔性操作中层出不穷的突发状况,模型不再简单模仿动作轨迹,而是在隐空间里持续推演未来的多种可能,再据此做出决策。

当插接的力度或角度出现异常,机器人会主动把线拔出来,换个角度再试一次。

正如人类的做法一样。

对于真实工业场景而言,这是一个象征着应用成熟度的关键信号:

「机器人会反思了」。

这大概是2026年具身大脑浮出水面后,为行业送上的第一份厚礼。

更关键的是,这一切的实现没有用到一秒钟的遥操数据。

长期以来,关于具身训练数据,行业有个共识:遥操数据精度最高 。

它石却觉得,这个结论完全站不住脚。

遥操作根本干不了亚毫米级的事。

在此前与量子位的对话中,它石首席科学家丁文超直言,在对精度有极高要求的场景下,人工遥操过程中的犹豫、抖动,反而会变成训练数据中的「噪声」。

这也是它石反复强调Human-centric的真正原因。

线束这个场景实在太恐怖了。孔位极窄,容错性非常低。

但人能完成这个任务。

虽然不能百分百零偏差,但人的纠错能力极强,所以可以在操作中感受阻力并据此迅速调整角度和力度。

从第一性原理出发,丁文超指出,想要习得这种局部微调的能力,唯一的方式就是从真人身上采集数据。

如今,这个想法已完全落地,并且凝练成一整套以人为本的数据采集套件——SenseHub

打开网易新闻 查看精彩图片

仅需一双轻便的数采手套,加上一枚第一视角摄像头,佩戴即开工。劳动者在日常作业中,便能顺手完成数据采集。

回过头来看它石的布局,逻辑就非常清晰了:

数据-本体-模型全栈自研,不是为了生态,而是遵循「第一性原理」设计出来的。

在行业蛮荒期,技术路线尚未收敛,既无标杆案例,亦无成熟的横向分工。

而产业的每个变量又都会直接影响大脑能力。

所以必须有一定程度的完美主义,全栈自研,抓紧每个细节。

这是从第一性原理推导出的必然。

全栈大脑这个概念,最有魅力的地方也在于此。

做大脑的每家公司都在围绕自身的哲学思考,从数据-本体-模型三个维度全线出发,将各自的信念极致化。

这注定是一场极为精彩,同时也极为残酷的淘汰赛。

吉尼斯纪录背后,是落地的领先

吉尼斯纪录背后,是落地的领先

具身大脑这条赛道上,所有玩家,无论从哪条路径出发,最终都会不可避免地交叉在一起。

因为这场比赛,大家都是奔着泛化去的。

真实世界是混沌且极度复杂的。如果一个机器人只能像复读机一样执行预设的单一脚本,那它与传统自动化产线上的机械臂并无本质区别。

LLM让人兴奋的原因正是如此,我们第一次拥有了具备泛化可能的智能。

虽然它在特定单一任务上可能不如硬编码的脚本极致,但真实世界中那些无法用脚本逻辑描述的种种长尾任务,必须依靠智能的「涌现」来解决。

但这也意味着——赢家通吃

具身智能之所以被视为下一个万亿级赛道,其核心前提正是泛化能力、跨场景复制能力以及成本可控的规模化能力。

而它石智航从成立的第一天起,所有的战略重心都在为这个前提做准备,所以他们选择了线束

线束装配,工业自动化界的「哥德巴赫猜想」。长程操作、柔性操作、亚毫米精度,「不可能三角」全部集齐于此……堪称「地狱」级别的工厂场景。

它石选择这个高价值x高难度场景作为交卷的技术,本身就极具深意。

大多数具身智能公司在选择落地场景时,往往会遵循「易落地、快见效」的路径,比如叠毛巾、搬箱子、摆货架。

这些任务实打实存在着海量需求,同时对精度的要求也没那么恐怖。

但它石,偏要反其道而行之。要打,就打最难的仗。

对此,丁文超曾表示:

没有Plan B。

毕竟,如果连最柔软、最易变形的线束都能实现精准装配,那么工厂里其他那些常规装配任务,则无异于降维打击。

而事实证明,它石不仅做到了,更是直接把这个场景彻底「打爆」——

1小时内,完成百余次亚毫米级柔性线束完整装配任务,一举刷新吉尼斯世界纪录。

打开网易新闻 查看精彩图片

甚至,还在高速装配的过程中,保证了拟人的「观赏性」。

在它石发起的业内首个「机器人柔性操作图灵测试」,超过50%的投票者竟然分不清:究竟哪个是机器人

打开网易新闻 查看精彩图片

其中,Human-centric的重要性不言而喻。

这种数据采集方式,天然具备全场景覆盖的基因。因为它捕捉的是人在真实环境中的工作流,不再受限于特定硬件或封闭的数采中心。

这意味着,AWE 3.0从诞生之初,便是具备跨场景迁移潜力的。

在它石看来,模型层的过拟合只是技术瑕疵,但方法论的过拟合是致命的。

因此,从成立第一天开始,它石就拒绝了走捷径,全力押注Human-centric这条路。

一年过去,它石曾经许诺的BP现在正一一化为现实,并且他们仍然在坚持最初的理念。

在AI这个技术日新月异的赛道,敢于「不变」,或许比「求变」需要更大的定力。

如今,这份对初心的坚守终于迎来了回响。它石智航凭借线束场景一战成名。

但事实上,聚光灯之外,它石智航从创立之初便同步启动了工厂、物流、仓储、洗衣房、酒店等多场景的数据采集。

从一开始,它石就是奔着泛化去的。

目前,它石已手握超十万小时Human-centric数据,并正式发起「具身数据星火计划」,并邀请生态伙伴共建产业级数据共享生态,直指1亿小时级别的数据共享。

而基于这些可迁移的训练数据,它石内部已有多个落地场景在并发推进,蓄势待发。

一颗足够优秀的大脑,能够填平从工业到家庭的泛化鸿沟。

这,正是具身智能从实验室走向千行百业的关键。

资本下半场风向标:大脑强,则具身强

资本下半场风向标:大脑强,则具身强

具身智能,正在从「百花齐放」的喧嚣,走向百川归海。

踏入2026年,资本不再普降甘霖,而是开始精准滴灌。

而滴灌的靶心,正是全栈布局、大脑为核的公司——这个粮草先行、兵家必争的战略高地。

没有大脑的本体公司,本质上是一具精致的躯壳,只能等待别人来注入灵魂,上限从一开始就被锁死了

而不做本体的纯算法团队,无法打通数据反馈的商业闭环,最终就会沦为技术外包商

在残酷的淘汰赛里,技术收敛后,市场只会需要第一名。

这也是垂直整合在这个行业早期的必要性所在。想把技术做到极致,唯一的解法,只有把变量全部握在自己手里。

核心零部件和硬件供应链固然会有专业化分工,但整个产业的定价权与标准制定权,必将向拥有「最强大脑」的全栈企业高度集中。

赢家,一定是全栈大脑公司。

高瓴与红杉的联手押注,正是对这一终局判断最有力的印证。

对于长期主义机构而言,不怕投得晚,但一旦押注,就说明对其已经有了笃定的未来画像。

这也是两家顶级机构经历了对它石超过一年的跟踪深度调研后,最终决定联合出手的原因。

因为具身大脑,就是那个正在逐渐收敛的确定性。

而在这条新赛道上,它石无疑是当下最具竞争力的头号玩家之一。

4.55亿美金,是资本对这个终局判断的抢先投票。

在下半场,全栈大脑会成为具身智能下一阶段竞赛的胜负手。

枪响了。