打开网易新闻 查看精彩图片

全球观察者深度出品

纵横寰宇,洞察时代风云

最近AI圈讨论最火的话题,除了ChatGPT的迭代,就得算空间智能了。

简单说,就是让AI像人一样看懂三维空间,还能生成可交互的虚拟场景。

这个领域里,国外有Sora炸场,斯坦福李飞飞团队有理论突破,国内却有一家低调了十四年的公司突然站到了台前群核科技。

打开网易新闻 查看精彩图片

他们靠做装修设计软件起家,现在却成了空间智能赛道的种子选手。

要聊群核科技的突围,得先看看现在空间智能有哪几条路。

最出圈的肯定是OpenAI的Sora。

这哥们的玩法简单粗暴,就是看海量视频,学里面像素块怎么动。

打开网易新闻 查看精彩图片

比如人走路时胳膊怎么摆,杯子掉地上怎么碎,它都靠像素规律硬"猜"。

Sora生成的视频确实唬人,瀑布流动的质感,人物表情的细节,乍一看跟真的没两样。

但仔细琢磨就有问题了它不懂物理规律,全是像素层面的"模仿"。

之前网上流传的demo里,有人数出人物第三只手,还有杯子飞到半空突然变形的,都是这个毛病。

打开网易新闻 查看精彩图片

说白了,它只有"看起来像物体的像素",没有对三维世界的真实理解。

面对Sora的这些问题,斯坦福大学的李飞飞团队提出了另一种思路。

他们搞的"隐式世界"模型,不是直接学像素,而是想在神经网络里建一个"思维中的世界"。

打开网易新闻 查看精彩图片

简单讲,就是把物理法则、空间关系这些东西,压缩成神经网络的"激活状态"。

这就有点像"缸中之脑"的意思AI不用真的看见世界,靠内部模拟就能知道"苹果掉下来会砸到头"。

据说这种模型能补全场景的各个角度,比如给一张房间正面照,它能算出天花板什么样子,桌子底下有什么。

打开网易新闻 查看精彩图片

但问题是,这个"隐式世界"藏在神经网络黑盒里,人想改个细节,比如把桌子颜色换成红色,基本做不到。

而国内的群核科技,走了一条和前两者都不一样的路。

他们不玩像素,也不搞纯隐式模拟,而是搞"显式3D"。

简单说,就是先搭好3D的"数字舞台",再在上面"拍电影"。

打开网易新闻 查看精彩图片

比如要生成一个客厅场景,他们会先建沙发、茶几、吊灯这些3D模型,每个模型都有真实物理参数沙发多软,茶几多高,灯怎么亮,全都标得清清楚楚。

这种方法最大的好处就是稳。

因为每个物体都是"真3D"的,不会出现第三只手,杯子也不会随便变形。

打开网易新闻 查看精彩图片

更关键的是,群核在这个3D舞台上留了"把手"。

设计师想把沙发挪个位置,或者换个颜色,直接在系统里拖一拖、点一点就行。

这种可控性,恰恰是Sora和李飞飞模型最缺的。

群核敢走这条路,不是拍脑袋决定的。

打开网易新闻 查看精彩图片

他们攒了十四年的"家底",现在成了最硬的护城河。

说出来你可能不信,这家公司手里有几亿张中国真实户型图。

从老北京四合院的厢房布局,到广州城中村的握手楼结构,甚至连哪些墙能拆、哪些是承重墙,都标得明明白白。

打开网易新闻 查看精彩图片

光有户型图还不够,他们还有海量商品模型。

小到一个马克杯,大到一套定制衣柜,每个模型都带着物理参数。

比如这个杯子是陶瓷的,易碎,那个椅子承重多少公斤,坐上去会不会晃。

这些数据不是买的,是过去十四年服务设计师时,用户一点点"喂"进来的。

打开网易新闻 查看精彩图片

设计师画方案时标个尺寸,调个材质,这些都成了群核的"物理底稿"。

有了这些数据,他们去年推出的Aholo空间智能平台才算有了底气。

打开网易新闻 查看精彩图片

本来这些能力是给设计师用的,帮他们画图效率提高十倍。

但最近群核发现,这些技术突然被机器人公司盯上了。

你想啊,机器人进了陌生房间,得知道哪个是花瓶(易碎,得绕着走),哪个是凳子(能坐,可以放东西)。

群核的3D模型带着物理属性,正好能帮机器人"看懂"世界。

打开网易新闻 查看精彩图片

数据价值从"画图"到"识途",这步跨得有点意思。

不过技术再牛,也得赚钱活下去。

这方面群核最近挺头疼。

他们以前是做SaaS软件的,按设计师座位收费,一年几万块一个账号,模式成熟。

打开网易新闻 查看精彩图片

现在搞空间智能,用户变成了机器人公司、游戏厂商,这些客户可不是按座位付费的他们要调用API接口,生成100个场景付100次钱。

所以群核正在摸索"年费+Token"的混合模式。

基础功能收年费,保证公司现金流,生成复杂场景按Token计费,用得多付得多。

但国内客户对这种"预算外支出"特别敏感。

打开网易新闻 查看精彩图片

有次他们去谈一个机器人客户,对方说"我们一年预算就这些,你按次收费,超出部分谁来批?"这种问题,怕是最有体会的就是做ToB生意的同行。

如此看来,群核的突围之路,有点"摸着李飞飞过河"的意思。

方向上肯定是对的,空间智能早晚是AI的必争之地毕竟人类80%的信息都和空间有关。

但路径上得接地气,不能照搬国外的模式。

打开网易新闻 查看精彩图片

李飞飞团队可以纯搞理论研究,群核不行,它得在技术投入和商业回报之间找平衡。

其实群核的故事,挺像中国很多垂直领域企业的缩影。

早期靠一个具体场景(装修设计)扎根,默默攒数据、磨技术。

等AI浪潮来了,突然发现自己手里的"脏活累活"经验,反而成了别人抢不走的优势。

打开网易新闻 查看精彩图片

当然,能不能真的突围,还得看接下来两年技术代际演进这么快,稍微慢一步,可能就被甩在面了。

现在的群核,有点像2012年的字节跳动。

当时大家都觉得做新闻客户端没前途,结果张一鸣靠推荐算法杀出一条路。