想象一个场景:你对着手机说"帮我设计一个能放下跑步机的书房",三秒后,一个可交互的3D方案就出现在屏幕上——家具尺寸精确到厘米,光照随时间变化,甚至能模拟你跑步时的动线。这不是科幻,是群核科技正在做的事。4月17日,这家公司成为"杭州六小龙"中首家IPO的企业,创始人黄晓煌在硅谷101的访谈中,把赌注押在了"空间智能"上。

概念厘清:三个常被混用的词

打开网易新闻 查看精彩图片

2026年,AI圈最热的风向是世界模型。但黄晓煌提供了一个更清晰的框架:世界模型、空间智能、具身智能,其实是递进关系。

世界模型是"大脑"。它构建世界的内部地图,理解因果关系,能在脑中"预演"未来。黄晓煌打了个比方:「世界模型就像是"大脑",它能在"脑中"构建一个关于世界运行的"内部地图"。」

空间智能是"眼睛和手"。它把抽象理解落到三维物理空间,让AI知道物体在哪里、如何分布、彼此如何作用。这是从"认知"走向"行动"的关键一跳。

具身智能是"身体"。当AI真正拥有物理形态——机器人、自动驾驶汽车——它需要在充满不确定性的真实世界里,把感知、推理、控制整合成闭环。

黄晓煌的结论是:「要真正实现具身智能,是无法跳过空间智能的。」

路线之争:生成空间 vs 预测空间

业界对空间智能有两条技术路线,分歧在于"空间从何而来"。

正方:空间生成派

代表:李飞飞的World Labs、群核科技、Meshy AI

核心主张:AI必须先拥有一个足够真实、可交互的3D世界,才能在其中反复试错、学习物理规律,最终迁移到现实。

生成方式又分三层:

重建式——激光扫描、深度相机、无人机摄影测量,从现实采集数据还原三维。上限取决于输入质量,现实采得越完整,结果越准确。

推断式——输入信息不足时(比如只有一张照片),AI推理补全"看不见"的部分。随着大模型能力提升,这是当前最活跃的方向。

生成式——借助扩散模型、大型重建模型(LRM),AI直接从海量数据中学习三维规律,用户输入文字、图片、草图即可生成3D资产。

黄晓煌透露,群核的业务布局覆盖了这三层:从"空间编辑工具"到"空间数据"再到"空间大模型"。

反方:潜空间预测派

这一派认为,不必显式生成3D空间,AI可以在低维"潜空间"中直接预测物理规律。代表是DeepMind的Genie 2、OpenAI的Sora。

他们的逻辑是:人类理解世界并非依赖精确的三维坐标,而是基于直觉性的物理预测。如果AI能在潜空间中准确预测"推箱子会倒""球会滚向哪里",是否还需要昂贵的3D重建?

这条路线更省算力,但代价是"不可解释"——AI知道结果,却说不出为什么。

技术卡点:空间如何被"表示"

无论哪条路线,最终都要回答一个问题:三维世界在计算机里长什么样?

传统方案是点云和Mesh。点云是离散点集,Mesh加入面与边的连接。这套方案直观、成熟,Mesh的编辑修改尤其方便,游戏、建模、数字孪生领域用了几十年。

但瓶颈很明显:现实世界细节无限,高精度意味着数据量指数级增长。从采集、存储到实时渲染,压力巨大。

新方案是神经表示,以NeRF(神经辐射场)为代表。它不再显式"搭建"世界,而是训练一个神经网络,让它隐式记住场景的几何与外观。给定视角,直接渲染画面。

代价是速度慢,且每个场景需单独训练,不具备跨场景泛化能力。

黄晓煌提到,World Labs的尝试值得关注:它并非纯生成路线,而是融合重建、推断、生成——从真实数据学结构,靠推断补全不可见部分,再用生成模型构建新空间。模型要同时处理深度估计、视角一致性、几何约束,让结果不仅"看起来像",空间结构上也成立。

商业现实:从装修工具到空间数据商

群核的转型史,是中国AI创业者寻找PMF(产品市场匹配)的缩影。

黄晓煌2011年从英伟达离职回国,最早做云渲染。2013年推出"酷家乐",切入家居设计SaaS。这个选择有时代背景:当时中国房地产市场火热,装修需求爆发,但设计师效率极低——一套方案要画一周。

酷家乐把渲染时间从数小时压缩到10秒,切中了痛点。但黄晓煌很快意识到,工具本身天花板有限。「我们积累的最大资产不是软件,是数据。」

过去十年,群核平台沉淀了超过3.2亿个3D模型、超10亿张设计图,覆盖住宅、商业空间、工业场景。这些数据成为训练空间模型的燃料。

2023年,群核推出"酷家乐AI",把文生图、图生3D能力嵌入工作流。2024年,发布"群核空间智能平台",向机器人、自动驾驶、AR/VR企业开放数据接口。

黄晓煌的商业模式很清晰:底层是空间数据资产,中间层是大模型能力,上层是垂直场景应用。IPO募资的用途,40%投入AI研发,30%拓展海外市场。

我的判断:数据壁垒是护城河,但路线风险真实存在

群核的上市,验证了一个被忽视的赛道:空间数据。

当所有人盯着文本大模型的参数竞赛时,三维数据的稀缺性被低估了。训练一个合格的空间模型,需要海量带几何标注的3D资产,而这类数据的获取成本远高于文本。群核十年积累的3.2亿模型,构成了短期难以复制的壁垒。

但路线之争没有尘埃落定。

如果潜空间预测派取得突破——比如Sora的下一代能稳定预测物理规律——显式3D生成的必要性会被削弱。黄晓煌自己也承认,两条路线"最终会收敛",但"收敛点在哪里,现在没人知道"。

更现实的挑战来自客户侧。机器人公司想要的是什么?不是漂亮的3D场景,是"抓握这个杯子需要多少牛顿力""轮子压过地毯的摩擦系数"。空间智能目前能提供的是"几何正确",距离"物理正确"还有差距。

群核的应对是向下游延伸:与机器人公司合作,在真实场景中迭代数据闭环。这类似于特斯拉的自动驾驶策略——用量产车收集corner case,反哺模型。

黄晓煌的赌注在于:在具身智能爆发前夜,先卡位空间数据的"基础设施"角色。就像英伟达在AI芯片时代的地位,群核想成为空间智能时代的"卖铲人"。

这个逻辑成立的前提是:空间智能确实是AI的"最后一公里",而非绕行的岔路。2026年,我们或许能看到更明确的信号——当第一批真正具备空间理解能力的机器人走进工厂和家庭,它们的大脑里,跑的是3D坐标系,还是某种人类尚未理解的潜空间表征?