当公司估值超过200亿、融资近30亿的时候,你会选择什么?
大多数人会继续待在船上,把故事讲完,把饼画圆。但许华哲不一样。
2025年底,他做出了一个让很多人意外的决定:离开星海图,放弃首席科学家兼联合创始人的头衔,自己创业。
许华哲是清华叉院的助理教授,也是圈子里有名的"伯克利归国四子"之一。他的履历很漂亮:伯克利博士、斯坦福博士后、清华任教,2023年加入星海图当首席科学家。按理说,这条路已经够好了。
但他心里一直有个念头挥之不去——做To C。
"初高中读完《乔布斯传》《迪士尼传》,就想创业了。"他后来说,"一直想做To C。"
这个念头藏了十几年。现在,他觉得时机到了。今年3月初创立了破壳机器人,做能在家庭场景干活的、真正有泛化性的具身智能机器人。
4月27日,破壳机器人宣布近期已完成数千万美元天使轮融资,由云启资本领投,顺为资本、弘晖基金等一线美元基金,小米战投、星海图等知名产业方,以及BV百度风投、英诺天使基金、水木清华校友种子基金、东方嘉富等一线市场化基金跟投。
PART.01
巅峰离场:为什么是2026年?
许华哲离开星海图的时候,公司正处在最风光的时候。估值200亿,融资近30亿,媒体追捧,资本追逐。
但许华哲有自己的判断:2026年,比2023年更适合创业。
说实话,这个判断不是空穴来风。2023年他想做To C通用机器人的时候,条件确实不成熟。硬件供应链还没跑通,数据采集方式单一,融资环境也不如现在。
但三年过去,情况变了。
硬件供应链成熟了。2023年做一个能稳定运行的机械手,可能要找十几家供应商逐一对接;现在找两三家就能搞定。成本降了,迭代快了,创业门槛低了。
数据更丰富了。2023年大家都在用"遥操作"——用人戴着VR手套远程控制机器人采集数据。现在有了外骨骼采集、UMI硬手套、第一人称视角视频等多种方式,数据来源多元化了。
融资环境也变了。具身智能从"讲故事"变成了"看落地",投资人更愿意为技术买单。
许华哲看到了这个机会。他不是盲目入场,而是等了三年,等条件成熟。
这才是真正的创业者心态:不是盲目冲,而是看准时机再出手。
PART.02
放弃主流,让机器人真正理解物理世界
在具身智能圈子里,VLA是绝对的主流。但许华哲选择了一条不同的路:放弃VLA,走向世界模型+原生机器人模型。
VLA的问题在哪?许华哲打了个比方:VLA就像让一个人学做饭,先看视频里厨师怎么切菜、怎么颠勺、怎么调味,然后模仿。这个方法在简单任务上有效,但一旦任务复杂、场景多变,就容易"掉链子"。
更关键的是,VLA的泛化能力有限。机器人能学会"切土豆丝",但未必能学会"切萝卜丝"——它学的是表面动作,不是背后的物理逻辑。
许华哲想做的,是让机器人真正理解物理世界。
他的方案叫UAG(Unconditioned Action Guidance,非条件动作引导)。核心思路是:先对动作本身做预训练,再做整体联合训练。
也就是说,传统VLA是"看视频学动作",UAG是"先搞懂动作本身,再看视频理解场景"。
UAG的优势在于训练效率。他说,用这种方式,训练效率提升了5倍以上。
这不是小改进。在具身智能领域,训练效率直接决定了谁能先跑出来。
许华哲还引入了一个关键元素:强化学习。
强化学习的本质是让模型自己判断什么是"好数据"、什么是"次优数据"、什么是"失败数据"。这样模型就不会死板地模仿人类示范,而是能突破人类数据的上限。
当人类示范"擦桌子"的时候,动作可能不够干净、速度可能不够快。传统VLA学到的就是"这样擦",效果和人类差不多。但强化学习能让机器人在反复尝试中,找到比人类更干净、更快速的方法。
这才是真正的泛化能力——不是模仿动作,而是理解任务本身。
PART.03
To C才是通用AGI的终局?
许华哲的判断很明确:通用AGI应该用在家里,不是工厂。
当前,很多具身智能公司都在扎堆做工厂,因为工厂场景相对可控,任务相对标准化,看起来更容易落地。
但许华哲认为,这是"捡了芝麻丢了西瓜"。
工厂的"混乱"和管理有关,不是任务本身的混乱。传送带上零件乱扔、人走来走去,这些都是管理问题,不是任务问题。任务本身是确定的:上下料就是上下料,装配就是装配。
但家庭不一样。
家里的"混乱"是任务本身的混乱。衣服可能团成一团,碗筷可能堆成小山,桌面可能一片狼藉——机器人需要通过工作把混乱恢复成秩序。
说实话,这听起来是缺点,但许华哲认为这恰恰是优点。"混乱才是训练通用模型的最佳土壤。"他说。
工厂里的机器人学会了"标准动作",但换到另一个工厂可能就不行了。家里的机器人需要应对千变万化的场景,这种"不标准"反而能训练出真正的泛化能力。
所以许华哲选择To C,选择了更难但更有价值的方向。
PART.04
数据的三层方案:破壳的核心壁垒
目前,具身智能的核心问题之一是数据。没有足够多、足够好的数据,再好的模型也跑不起来。
许华哲设计了一套三层数据采集方案:
第一层是外骨骼数据采集。这种方式是"提着机器人手臂直接操作"。人穿着外骨骼设备,真实地去做动作,机器人跟着学。这种方式精度高,但成本也高,数据量有限。
第二层是UMI硬手套。和外骨骼类似,但设备和人的手构型完全一致,戴上手套干活就能采集数据。成本低,数据量大,是目前最主流的方式。
第三层是第一人称视角。人在家里干活,头戴摄像头记录整个过程。这种方式能采集海量自然行为数据,而且是人"真实生活"中的数据,不是刻意表演的数据。
但许华哲加了一个差异点:大量使用机器人自己测试探索的数据。
这批数据很有意思。它不是"完美示范",而是包含失败和次优的尝试。传统方法会把这些"不完美"的数据扔掉,但许华哲认为,这些数据恰恰是强化学习的养料。
"模型需要知道什么是错的,才能真正学会什么是对的。"他说。
三层方案加上机器人自测数据,构成了破壳的核心数据壁垒。这个壁垒不是靠钱能砸出来的,需要时间和迭代。
PART.05
五位数定价:家庭机器人的商业逻辑
许华哲给破壳的产品定了个价:五位数起步。
这个定价很有意思。五位数意味着最低一万,贵的可能要几万甚至更高。对普通消费者来说,这不是个小数目。
但许华哲不打算降价。他说,这不是成本问题,是定位问题。
"家庭机器人不是替代人力算账。"他说,"它是科技潮品+家庭助手+管家的复合体。用户购买的不是工具,是一种先锋生活方式。"
说实话,这个定位有点意思。
意味着破壳不打算和扫地机器人、洗碗机竞争。那些产品是"工具",解决的是特定问题。破壳想做的是"助手",能处理多种任务,能适应环境变化。
当然,这不是万能机器人。许华哲说得很清楚,有些事破壳不做——比如抱婴儿,比如烧热水。
"不是技术做不到,是产品定义的时候就决定不做了。"他说,"做减法比做加法难,但只有学会不做,才能真正把核心能力做好。"
这种产品逻辑听起来有点反直觉。但仔细想想,它其实很务实:什么都做的产品,往往什么都做不好。
许华哲判断,两年内中国会出现可用的家庭机器人。这个时间表比很多人预期的要快。
但他并不是盲目乐观。"技术还没收敛,仍有机会。"他说,"后发优势是基础设施更成熟、时间压力更小。"
这就是许华哲的策略:不是第一个吃螃蟹的人,但是是最有可能把螃蟹吃好的人。
PART.06
破壳能否成功破壳而出?
破壳机器人刚刚起步。20人左右的团队,32B参数模型刚完成首轮训练,数据采集手套迭代了5-6个版本。
这远不是终点。
但从许华哲的选择里,我们能看到一种难得的清醒。他没有选择最容易的路,没有选择最安全的位置,而是选择了一条更难但更接近初心的路。
"追求美和影响力。泛化性的本质是美。"
这是许华哲的价值观。用最简洁优雅的模型解决复杂问题,这不仅是技术追求,也是一种审美取向。
破壳能不能破壳而出,现在下结论还太早。但有一点可以确定:在这个所有人都想快速跑出"第一"的赛道上,有人愿意慢下来,想清楚再做,这本身就值得尊重。
文章来源:GEIA全球具身智能观察
热门跟贴