200亿巅峰离场！清华教授再创业，all in家庭机器人，2个月干出27亿估值

算法与数学之美

2026-04-29 16:36 ·北京 ·优质互联网领域创作者

当公司估值超过200亿、融资近30亿的时候，你会选择什么？

大多数人会继续待在船上，把故事讲完，把饼画圆。但许华哲不一样。

2025年底，他做出了一个让很多人意外的决定：离开星海图，放弃首席科学家兼联合创始人的头衔，自己创业。

许华哲是清华叉院的助理教授，也是圈子里有名的"伯克利归国四子"之一。他的履历很漂亮：伯克利博士、斯坦福博士后、清华任教，2023年加入星海图当首席科学家。按理说，这条路已经够好了。

但他心里一直有个念头挥之不去——做To C。

"初高中读完《乔布斯传》《迪士尼传》，就想创业了。"他后来说，"一直想做To C。"

这个念头藏了十几年。现在，他觉得时机到了。今年3月初创立了破壳机器人，做能在家庭场景干活的、真正有泛化性的具身智能机器人。

4月27日，破壳机器人宣布近期已完成数千万美元天使轮融资，由云启资本领投，顺为资本、弘晖基金等一线美元基金，小米战投、星海图等知名产业方，以及BV百度风投、英诺天使基金、水木清华校友种子基金、东方嘉富等一线市场化基金跟投。

PART.01

巅峰离场：为什么是2026年？

许华哲离开星海图的时候，公司正处在最风光的时候。估值200亿，融资近30亿，媒体追捧，资本追逐。

但许华哲有自己的判断：2026年，比2023年更适合创业。

说实话，这个判断不是空穴来风。2023年他想做To C通用机器人的时候，条件确实不成熟。硬件供应链还没跑通，数据采集方式单一，融资环境也不如现在。

但三年过去，情况变了。

硬件供应链成熟了。2023年做一个能稳定运行的机械手，可能要找十几家供应商逐一对接；现在找两三家就能搞定。成本降了，迭代快了，创业门槛低了。

数据更丰富了。2023年大家都在用"遥操作"——用人戴着VR手套远程控制机器人采集数据。现在有了外骨骼采集、UMI硬手套、第一人称视角视频等多种方式，数据来源多元化了。

融资环境也变了。具身智能从"讲故事"变成了"看落地"，投资人更愿意为技术买单。

许华哲看到了这个机会。他不是盲目入场，而是等了三年，等条件成熟。

这才是真正的创业者心态：不是盲目冲，而是看准时机再出手。

PART.02

放弃主流，让机器人真正理解物理世界

在具身智能圈子里，VLA是绝对的主流。但许华哲选择了一条不同的路：放弃VLA，走向世界模型＋原生机器人模型。

VLA的问题在哪？许华哲打了个比方：VLA就像让一个人学做饭，先看视频里厨师怎么切菜、怎么颠勺、怎么调味，然后模仿。这个方法在简单任务上有效，但一旦任务复杂、场景多变，就容易"掉链子"。

更关键的是，VLA的泛化能力有限。机器人能学会"切土豆丝"，但未必能学会"切萝卜丝"——它学的是表面动作，不是背后的物理逻辑。

许华哲想做的，是让机器人真正理解物理世界。

他的方案叫UAG（Unconditioned Action Guidance，非条件动作引导）。核心思路是：先对动作本身做预训练，再做整体联合训练。

也就是说，传统VLA是"看视频学动作"，UAG是"先搞懂动作本身，再看视频理解场景"。

UAG的优势在于训练效率。他说，用这种方式，训练效率提升了5倍以上。

这不是小改进。在具身智能领域，训练效率直接决定了谁能先跑出来。

许华哲还引入了一个关键元素：强化学习。

强化学习的本质是让模型自己判断什么是"好数据"、什么是"次优数据"、什么是"失败数据"。这样模型就不会死板地模仿人类示范，而是能突破人类数据的上限。

当人类示范"擦桌子"的时候，动作可能不够干净、速度可能不够快。传统VLA学到的就是"这样擦"，效果和人类差不多。但强化学习能让机器人在反复尝试中，找到比人类更干净、更快速的方法。

这才是真正的泛化能力——不是模仿动作，而是理解任务本身。

PART.03

To C才是通用AGI的终局？

许华哲的判断很明确：通用AGI应该用在家里，不是工厂。

当前，很多具身智能公司都在扎堆做工厂，因为工厂场景相对可控，任务相对标准化，看起来更容易落地。

但许华哲认为，这是"捡了芝麻丢了西瓜"。

工厂的"混乱"和管理有关，不是任务本身的混乱。传送带上零件乱扔、人走来走去，这些都是管理问题，不是任务问题。任务本身是确定的：上下料就是上下料，装配就是装配。

但家庭不一样。

家里的"混乱"是任务本身的混乱。衣服可能团成一团，碗筷可能堆成小山，桌面可能一片狼藉——机器人需要通过工作把混乱恢复成秩序。

说实话，这听起来是缺点，但许华哲认为这恰恰是优点。"混乱才是训练通用模型的最佳土壤。"他说。

工厂里的机器人学会了"标准动作"，但换到另一个工厂可能就不行了。家里的机器人需要应对千变万化的场景，这种"不标准"反而能训练出真正的泛化能力。

所以许华哲选择To C，选择了更难但更有价值的方向。

PART.04

数据的三层方案：破壳的核心壁垒

目前，具身智能的核心问题之一是数据。没有足够多、足够好的数据，再好的模型也跑不起来。

许华哲设计了一套三层数据采集方案：

第一层是外骨骼数据采集。这种方式是"提着机器人手臂直接操作"。人穿着外骨骼设备，真实地去做动作，机器人跟着学。这种方式精度高，但成本也高，数据量有限。

第二层是UMI硬手套。和外骨骼类似，但设备和人的手构型完全一致，戴上手套干活就能采集数据。成本低，数据量大，是目前最主流的方式。

第三层是第一人称视角。人在家里干活，头戴摄像头记录整个过程。这种方式能采集海量自然行为数据，而且是人"真实生活"中的数据，不是刻意表演的数据。

但许华哲加了一个差异点：大量使用机器人自己测试探索的数据。

这批数据很有意思。它不是"完美示范"，而是包含失败和次优的尝试。传统方法会把这些"不完美"的数据扔掉，但许华哲认为，这些数据恰恰是强化学习的养料。

"模型需要知道什么是错的，才能真正学会什么是对的。"他说。

三层方案加上机器人自测数据，构成了破壳的核心数据壁垒。这个壁垒不是靠钱能砸出来的，需要时间和迭代。

PART.05

五位数定价：家庭机器人的商业逻辑

许华哲给破壳的产品定了个价：五位数起步。

这个定价很有意思。五位数意味着最低一万，贵的可能要几万甚至更高。对普通消费者来说，这不是个小数目。

但许华哲不打算降价。他说，这不是成本问题，是定位问题。

"家庭机器人不是替代人力算账。"他说，"它是科技潮品＋家庭助手＋管家的复合体。用户购买的不是工具，是一种先锋生活方式。"

说实话，这个定位有点意思。

意味着破壳不打算和扫地机器人、洗碗机竞争。那些产品是"工具"，解决的是特定问题。破壳想做的是"助手"，能处理多种任务，能适应环境变化。

当然，这不是万能机器人。许华哲说得很清楚，有些事破壳不做——比如抱婴儿，比如烧热水。

"不是技术做不到，是产品定义的时候就决定不做了。"他说，"做减法比做加法难，但只有学会不做，才能真正把核心能力做好。"

这种产品逻辑听起来有点反直觉。但仔细想想，它其实很务实：什么都做的产品，往往什么都做不好。

许华哲判断，两年内中国会出现可用的家庭机器人。这个时间表比很多人预期的要快。

但他并不是盲目乐观。"技术还没收敛，仍有机会。"他说，"后发优势是基础设施更成熟、时间压力更小。"

这就是许华哲的策略：不是第一个吃螃蟹的人，但是是最有可能把螃蟹吃好的人。

PART.06

破壳能否成功破壳而出？

破壳机器人刚刚起步。20人左右的团队，32B参数模型刚完成首轮训练，数据采集手套迭代了5－6个版本。

这远不是终点。

但从许华哲的选择里，我们能看到一种难得的清醒。他没有选择最容易的路，没有选择最安全的位置，而是选择了一条更难但更接近初心的路。

"追求美和影响力。泛化性的本质是美。"

这是许华哲的价值观。用最简洁优雅的模型解决复杂问题，这不仅是技术追求，也是一种审美取向。

破壳能不能破壳而出，现在下结论还太早。但有一点可以确定：在这个所有人都想快速跑出"第一"的赛道上，有人愿意慢下来，想清楚再做，这本身就值得尊重。

文章来源：GEIA全球具身智能观察

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴