群核上市：空间智能是AI的"最后一公里"吗？

算力游侠

2026-04-17 19:41 ·北京

想象一个场景：你对着手机说"帮我设计一个能放下跑步机的书房"，三秒后，一个可交互的3D方案就出现在屏幕上——家具尺寸精确到厘米，光照随时间变化，甚至能模拟你跑步时的动线。这不是科幻，是群核科技正在做的事。4月17日，这家公司成为"杭州六小龙"中首家IPO的企业，创始人黄晓煌在硅谷101的访谈中，把赌注押在了"空间智能"上。

概念厘清：三个常被混用的词

2026年，AI圈最热的风向是世界模型。但黄晓煌提供了一个更清晰的框架：世界模型、空间智能、具身智能，其实是递进关系。

世界模型是"大脑"。它构建世界的内部地图，理解因果关系，能在脑中"预演"未来。黄晓煌打了个比方：「世界模型就像是"大脑"，它能在"脑中"构建一个关于世界运行的"内部地图"。」

空间智能是"眼睛和手"。它把抽象理解落到三维物理空间，让AI知道物体在哪里、如何分布、彼此如何作用。这是从"认知"走向"行动"的关键一跳。

具身智能是"身体"。当AI真正拥有物理形态——机器人、自动驾驶汽车——它需要在充满不确定性的真实世界里，把感知、推理、控制整合成闭环。

黄晓煌的结论是：「要真正实现具身智能，是无法跳过空间智能的。」

路线之争：生成空间 vs 预测空间

业界对空间智能有两条技术路线，分歧在于"空间从何而来"。

正方：空间生成派

代表：李飞飞的World Labs、群核科技、Meshy AI

核心主张：AI必须先拥有一个足够真实、可交互的3D世界，才能在其中反复试错、学习物理规律，最终迁移到现实。

生成方式又分三层：

重建式——激光扫描、深度相机、无人机摄影测量，从现实采集数据还原三维。上限取决于输入质量，现实采得越完整，结果越准确。

推断式——输入信息不足时（比如只有一张照片），AI推理补全"看不见"的部分。随着大模型能力提升，这是当前最活跃的方向。

生成式——借助扩散模型、大型重建模型（LRM），AI直接从海量数据中学习三维规律，用户输入文字、图片、草图即可生成3D资产。

黄晓煌透露，群核的业务布局覆盖了这三层：从"空间编辑工具"到"空间数据"再到"空间大模型"。

反方：潜空间预测派

这一派认为，不必显式生成3D空间，AI可以在低维"潜空间"中直接预测物理规律。代表是DeepMind的Genie 2、OpenAI的Sora。

他们的逻辑是：人类理解世界并非依赖精确的三维坐标，而是基于直觉性的物理预测。如果AI能在潜空间中准确预测"推箱子会倒""球会滚向哪里"，是否还需要昂贵的3D重建？

这条路线更省算力，但代价是"不可解释"——AI知道结果，却说不出为什么。

技术卡点：空间如何被"表示"

无论哪条路线，最终都要回答一个问题：三维世界在计算机里长什么样？

传统方案是点云和Mesh。点云是离散点集，Mesh加入面与边的连接。这套方案直观、成熟，Mesh的编辑修改尤其方便，游戏、建模、数字孪生领域用了几十年。

但瓶颈很明显：现实世界细节无限，高精度意味着数据量指数级增长。从采集、存储到实时渲染，压力巨大。

新方案是神经表示，以NeRF（神经辐射场）为代表。它不再显式"搭建"世界，而是训练一个神经网络，让它隐式记住场景的几何与外观。给定视角，直接渲染画面。

代价是速度慢，且每个场景需单独训练，不具备跨场景泛化能力。

黄晓煌提到，World Labs的尝试值得关注：它并非纯生成路线，而是融合重建、推断、生成——从真实数据学结构，靠推断补全不可见部分，再用生成模型构建新空间。模型要同时处理深度估计、视角一致性、几何约束，让结果不仅"看起来像"，空间结构上也成立。

商业现实：从装修工具到空间数据商

群核的转型史，是中国AI创业者寻找PMF（产品市场匹配）的缩影。

黄晓煌2011年从英伟达离职回国，最早做云渲染。2013年推出"酷家乐"，切入家居设计SaaS。这个选择有时代背景：当时中国房地产市场火热，装修需求爆发，但设计师效率极低——一套方案要画一周。

酷家乐把渲染时间从数小时压缩到10秒，切中了痛点。但黄晓煌很快意识到，工具本身天花板有限。「我们积累的最大资产不是软件，是数据。」

过去十年，群核平台沉淀了超过3.2亿个3D模型、超10亿张设计图，覆盖住宅、商业空间、工业场景。这些数据成为训练空间模型的燃料。

2023年，群核推出"酷家乐AI"，把文生图、图生3D能力嵌入工作流。2024年，发布"群核空间智能平台"，向机器人、自动驾驶、AR/VR企业开放数据接口。

黄晓煌的商业模式很清晰：底层是空间数据资产，中间层是大模型能力，上层是垂直场景应用。IPO募资的用途，40%投入AI研发，30%拓展海外市场。

我的判断：数据壁垒是护城河，但路线风险真实存在

群核的上市，验证了一个被忽视的赛道：空间数据。

当所有人盯着文本大模型的参数竞赛时，三维数据的稀缺性被低估了。训练一个合格的空间模型，需要海量带几何标注的3D资产，而这类数据的获取成本远高于文本。群核十年积累的3.2亿模型，构成了短期难以复制的壁垒。

但路线之争没有尘埃落定。

如果潜空间预测派取得突破——比如Sora的下一代能稳定预测物理规律——显式3D生成的必要性会被削弱。黄晓煌自己也承认，两条路线"最终会收敛"，但"收敛点在哪里，现在没人知道"。

更现实的挑战来自客户侧。机器人公司想要的是什么？不是漂亮的3D场景，是"抓握这个杯子需要多少牛顿力""轮子压过地毯的摩擦系数"。空间智能目前能提供的是"几何正确"，距离"物理正确"还有差距。

群核的应对是向下游延伸：与机器人公司合作，在真实场景中迭代数据闭环。这类似于特斯拉的自动驾驶策略——用量产车收集corner case，反哺模型。

黄晓煌的赌注在于：在具身智能爆发前夜，先卡位空间数据的"基础设施"角色。就像英伟达在AI芯片时代的地位，群核想成为空间智能时代的"卖铲人"。

这个逻辑成立的前提是：空间智能确实是AI的"最后一公里"，而非绕行的岔路。2026年，我们或许能看到更明确的信号——当第一批真正具备空间理解能力的机器人走进工厂和家庭，它们的大脑里，跑的是3D坐标系，还是某种人类尚未理解的潜空间表征？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴