12月28日,由创业黑马主办的“第17届创业家年会”在北京举办,年会主题为“智业革命 —— 跨越断层,成为新物种 ”。会上, 英诺基金创始合伙人李竹以《具身智能:一个还未达成共识的行业》为主题做了演讲。
他认为,具身智能是中美未来十年竞争的关键高地,但技术范式尚未收敛,行业共识未形成。尽管中国具身智能企业估值快速上升,但技术路径仍多元且未定型,投资界和技术界对其看法不一。具身智能是未来十年的核心竞争领域。
他表示,真正的具身智能需实现“场景无关、本体无关、摆脱数据依赖”的自我进化能力,其市场空间远超语言大模型。他强调,理想的具身智能应该能像孩子一样自我成长,开箱即用、自我适应环境、记忆每个个体,而非依赖特定场景、本体或大量训练数据。行业期待“下一个ChatGPT时刻”的出现,即具身智能基础模型的突破。
以下内容为创业家&i黑马编辑过的演讲节选:
01
AI超级周期中的焦点
现在AI已经从数字世界开始转向物理世界,这是大家关注的一个重点。我为什么讲具身智能还没有达成共识呢?
无论技术界,还是投资界对它的看法也是众说纷纭,朱总(朱啸虎)之前说“机器人有泡沫”,确实机器人的本体有泡沫;现在具身智能的竞争开始往软件方面转移,也就是大脑、小脑、感知,技术范式也没有完全收敛。
但这个事情非常重要,中国和美国在博弈智能制造,美国开始强调制造业回归,中国今年制造业出海继续增长,也带来前11个月的贸易顺差突破了1万亿美元,这是非常令人惊异的数值。
智能制造成为一个国家最重要的底色,这肯定跟具身智能的发展紧密相关,我认为能救美国制造业的就是具身智能,所以这是未来十年竞争的高地。
中国的具身智能企业估值今年涨得非常快,尤其是最近银河通用到了30亿美金,这是一件好事,这对中国的具身智能企业的估值起到标杆作用。
02
具身智能的技术范式还未收敛
共识还未达成
在这个竞争中,大家最关注的是人形机器人,还有世界模型。具身智能的技术范式在过去发生了很多变化,有强化学习和模仿学习,产生了宇树、云深处等公司;还有Diffusion(扩散模型)、VLA(视觉-语言-动作模型)、合成视频数据等其他技术路径。
大家都在讨论技术范式的未来,我们在这些类型上都投了公司,也在观察这些公司的发展,猜想未来哪些公司是最终的答案。不管是哪种范式,我们都能让其他公司通过学习快速跟上这波潮流。
03
未来两年
将出现下一个ChatGPT时刻
重点还是具身大脑,也就是具身智能的基座模型。下一个ChatGPT时刻,肯定来自具身智能的基础模型,这件事确实很难。我们用语言描述世界,但物理世界的很多行为与动作没有办法用语言来描述。
如果一个机器人到了一个环境,无论是工业还是家庭,是否需要改变环境?如果需要改变环境,说明这个机器人还不够智能;是否需要重新训练?如果需要重新训练,说明机器人的智能也不够。
有一天,机器人到了家里,你开箱使用之后,它可以自我进化,自己适应环境。它像孩子一样成长,可以记忆每一个人,这才是真正的智能,这才是想象中的智能。绝对不是拍一个视频,或给一个命令,它才会做一个动作,而应该是给它一个任务,它可以用一段时间把这个任务包含的内容都做好,例如整理家务。非常刚性的需求在于,场景无关、本体无关,还要摆脱对训练数据的依赖。
具身智能是对创业者最友好的创业方向,它跟大模型不一样。
大企业在语言大模型赛道基本把人才都吸引走了。数字世界里的应用、数字世界里的基座大模型,大厂会占据大部分市场。李丰总讲资金流动,很多钱流到了美国,60%的钱配置在了美国的二级市场。美股七姐妹,吸引了大部分钱,原因就在于此。中国也是如此。有个投资中国新经济平台企业的KWEB指数基金新增了几十亿美元资金,资金开始流向中国受益于AI的大公司。
如果我们没有机会投ChatGPT,我们没有机会投DeepSeek,那我们未来应该寻找什么样类似的企业?答案是具身智能的基础模型。
中国跟过去不一样了,中国很多方面在跟美国并跑。在并跑的同时,我们要有自信。
现在具身基座大模型的研究,每月都有进展和论文出现,首先从大量视频中学习和做预训练,从三维世界的角度学习三维世界,再加上数据的仿真与合成、真机数据。如果只是一维世界的训练方法,是肯定不行的。
我们投了4家公司,如何提升具身智能的上限变得非常重要。你不能只谈应用,因为现在技术范式还没有收敛。我们想找能够打开具身智能上限的公司。牛文文总做的科学家社群,也可以助力这些公司。
我们投了千诀,这是清华类脑中心孵化的项目,它用类似大脑的机制和解耦方式,来实现样本效率极大地提高。
他们在过去几年采集了20亿条数据,如果是在语言基座大模型上训练,这个数据量很小。但是千诀把样本效率提高了1万倍,乘上1万倍,这个数据量就是语言基座大模型训练需要的数据量。它同时把端侧执行的速度提高5倍,而且现在已经开始应用,赋能了很多机器人本体。
04
攀登悬崖,还是盘山而上?
我们还投了流形空间,做世界模型的公司。他们拥有全栈数据处理能力,通过大规模数据的预训练做世界模型,一步到位,类似攀登悬崖直达顶峰的方式。
而右边的图是千诀,盘山而上。它用1000多张卡训练,就能达到相当好的效果。当有信息智能、具身智能时,我们不要忘记还有类脑智能。从底层芯片一直到上面的算法,类脑智能都是达成AGI的第三条路径。
讲到应用,具身智能能够赋能所有机器人。但To B的应用,对创业者来说,选择的时候要想清楚核心能力是什么。因为这些场景有大量上一代机器人公司,这些创业公司经历了不断的搏斗,最后脱颖而出。像我们投的镁伽科技,在具身智能的产业研发和商业化应用都取得了很大的进展,一年有几亿美元的订单,也快上市了,这类企业拥抱AI和具身智能的速度非常快,实现了自我进化。
比如,To B 的应用场景,工业场景的坑比较多,在整个产线上只有对节拍要求不高、需要泛化性的部分场景需要导入具身智能。前段时间,我们投资机构在一起讨论,也有一些共识:工业领域具身智能应用对早期投资机构的窗口可能已经过去了。你要投工业落地的具身智能公司,它要跨越的不只是技术,更重要的是把握市场。
AI硬件,也是应用的载体之一,我们觉得投硬要看软,具身智能的核心还是大小脑这些软的东西。具身智能、AI硬件,最后卷的是什么?从硬件到软件、具身大模型。
做具身大模型的,想在现实世界变现,也需要物理载体,需要端侧芯片、板卡,需要新的机器人、AI硬件的产品形态,这些新 终端会改变交互方式,带来情绪价值或者效率提升。
对于创业者来说,做好其中的关键软件,使用合适的硬件载体定义产品,进行销售,这是最好的模式之一。
05
具身智能比语言大模型的空间更大
高盛预计,2035年市场规模达到2050亿美元;摩根士丹利预计,2050年全球具身智能市场(人形机器人、自动驾驶汽车、无人机等)规模将达到25万亿美元,其中人形机器人达到7.5万亿美元。
整体来讲,具身智能的市场空间非常大。去年汽车产业的GDP是13万亿,跟汽车产业相比,具身智能的市场肯定更大,大水有大鱼,将来也一定会跑出一批千亿企业。
当下,就跟当年的新能源汽车一样。所以未来的新终端可能是眼镜、进入家庭的机器人,也可能是汽车,但一定不再是手机。
未来的机会在哪里?未来的市场在哪里?只要坚持寻找,这个世界总会给你机会。人工智能来了,具身智能来了,如果创业者在这个赛道里面去耕耘,抓住超级周期,未来十年肯定会有更好的收获 。
链接创业黑马的
创业家、投资家、科学家群体
热门跟贴