打开网易新闻 查看精彩图片

概念的火热程度跟它实际在全世界吸引到的真实资源有误差。

近日,HICOOL全球创业者峰会举行了一次围绕“人工智能的新物种与老伙计”的圆桌讨论,特别聚焦于具身智能的发展前景。这场讨论邀请了逐际动力的联合创始人兼首席运营官张力、他山科技CEO马扬和美团配送部无人车算法总监穆北鹏作为嘉宾,甲子光年创始人兼CEO张一甲作为主持。

张一甲首先提出了具身智能是否已成为风口赛道的问题。张力认为具身智能在研发上是风口,但应用上尚未成熟,他强调了机器人在操作层面的技术路线尚未明确。穆北鹏则认为具身智能是风口,但距离商业化应用还有很长的路要走。马扬也认为“风才刚刚开始,还没有到最大”。在未来的3到5年,随着基于具身智能的硬件和软件的逐渐成熟,我们会陆续体会到具身智能在生活当中的各种应用。

接着,讨论转向了具身智能在实际应用中的进展和挑战。穆北鹏提到,尽管具身智能吸引了大量的资本和关注,但真正的商业化应用还有待时日。马扬指出,资本现在更关注解决机器人核心瓶颈的技术,如触觉感知。张力则强调了硬件和软件在具身智能发展中的交替作用。

在预测具身智能未来发展的时间线时,张力认为具身智能将在特定商业场景中先行落地。而穆北鹏则认为可能需要15到20年,她通过自动驾驶的发展历史来类比具身智能的发展前景。马扬则提出了一种折中的观点,认为具身智能的某些专长可能在2到3年内得到应用,但全面的商业化和家庭应用则需要更长时间。

在对未来的期待上,三位嘉宾都表达了坚定的信念和决心,也反映了业界对于这一新兴技术的热情和期待。以下是这场圆桌讨论的全部内容,经过编辑整理:

张一甲:今天非常开心也非常荣幸,因为我也曾经是HICOOL大赛的参赛者,今天换了个身份重新来到这里。过去十年来,具身智能和无人车都是全球经济发展的创新主动脉。所以我们今天还是进入这些话题,希望听一听大家最新,最独立的思考,还有真相。首先请三位嘉宾分别来做一下自我介绍,讲一下个人背景以及正在做的事情。

打开网易新闻 查看精彩图片

张一甲

张力:我叫张力,目前是逐际动力的联合创始人兼首席运营官。两年以前的我也站在舞台上参加了HICOOL 2022年的比赛,获得了二等奖。五年半以前,我在文远知行担任首席运营官,参与了无人驾驶项目从0到1的过程。在此之前,我在思科工作了19年,离开的时候是思科大中华区的资深副总裁。

马扬:我是马扬,是他山科技的CEO,过去20年一直在做人工智能触觉感知方向的研究。头十年我们做了很多算法以及算法模型的事情。10 年前,我们感觉到人工智能触觉感知应用到汽车和机器人行业中时,还缺少很好的底层硬件的支持。所以我们成立了他山科技,现在做的是人工智能触觉感知芯片的开发,我们在两年前完成了首颗芯片的开发,目前也把数据感知技术作为底层的方案,应用到包括机器人、汽车以及更多场景中去。

穆北鹏:大家好,我叫穆北鹏,我十几年前在麻省理工学院读博士的时候开始接触机器人和自动驾驶相关行业,导师是Jonathan How院士。我毕业后短暂地在Meta从事过 AR/VR 空间智能的研究。回国后一直在自动驾驶这个领域工作,现在是美团自动车配送部的算法总监,我们希望用自动驾驶等相关技术提升配送环节的安全度、效率和体验。

打开网易新闻 查看精彩图片

穆北鹏

张一甲:今天圆桌的主题是“人工智能的新物种与老伙计”,我觉得我们都符合这两个词。我在这个行业十年,各位嘉宾也只比我长不比我短。另外我们在做的事情迭代也非常快,尤其是2023年到2024年,人工智能已经变成全世界范围内无人不晓的创新引擎。它的蝴蝶效应所煽动的全球经济风暴,不仅仅在科技,而且到了千行百业,包括各种各样的零售,传统的材料等经济的竞争。但越是在蝴蝶效应席卷的浪潮,可能越需要正本清源,抠一抠字眼,理清定义,达成共识,才能让我们整体做到知行合一。所以我接下来的问题可能会有一些基本框架和基本概念的讨论,希望得到一些比较清晰的回答。

第一个就是关于具身智能。2024年初具身智能成为了今年非常受期待的风口赛道之一。3月的时候我去硅谷参加了英伟达GTC大会,看到了黄仁勋背后的9个机器人,于是社交网络上很多人说人形机器人在 2024 年步入真正的风口。我们甲子光年今年5月发布《AI创生时代》的大报告,也给出关于具身智能的一些想象和担心,接下来这是一个封闭式的选择题,三位嘉宾认为,具身智能现在是风口,还是说不是风口?

张力:我觉得是风口但也不是风口。是研发的风口,但还不是应用的风口。我自己理解是,在机器人的移动能力上,它所具备的能力在技术路线上是明确的。通过基于感知运动控制算法加上强化学习,就能够保证机器人移动的稳定性。但是在操作层面,具身智能的能力还没有形成真正明确的技术路线。目前学术界也还在研究。所以说我认为在具身智能跟物理世界的交互,其实有很多东西我们还没有形成真正的技术路线。

张一甲:理解。封闭式问题,先说是风口还不是风口。

马扬:我肯定认为具身智能是现在的风口,而且我的理解其实跟张总是类似的。我认为这个风才刚刚开始,还没有到最大。因为过去一年在AGI的支持下,我们可以基于各种感知数据,包括视觉,触觉,我们可以融合各种维度的数据来建立新的融合模型。这就为具身智能的应用提供很好的硬件及软件的基础。

那为什么成为风口?也是因为AGI能够在大模型下对更多的机器人做整合式的训练。这样比原来的训练速度要快很多,包括像我们应用在汽车的方向上,我们会看到过去两年里,汽车很强调智能座舱的应用。其实我们可以把汽车理解为一个移动的机器人。而人就像《环太平洋》电影一样坐在这个机甲里面。上一代车我们更多强调自动驾驶的能力,而下一代更多强调在智能座舱里面,人与车,车对人的感官判断之后,能够做出注重交互的回应。所以我想在未来的3到5年,随着基于具身智能的硬件和软件的逐渐成熟,我们也会陆续体会到具身智能在生活当中的各种应用。

打开网易新闻 查看精彩图片

马扬

张一甲:好的。是风口还是不是风口?

穆北鹏:是风口。我对风口这个字的理解是,一个技术在短时间之内取得了一定的进展和突破之后,取得了整个社会,大众、资本,媒体的短时间之内的关注,那它肯定是一个风口。但是跟前面两位嘉宾一致的是,它距离商业化应用,在特定的商业领域产生很好的价值,能够走进千家万户,抵达被大家所熟悉和应用的阶段,还是有很长的路要走。所以我对于风停了,浪退了,留在沙滩上的那些有价值的东西还是满怀期待。

张一甲:我想再继续就这个问题补充问一下三位。如果我们谈的是在大众心中的认知影响力、媒体选题的集中度,舆论的号召力、资本的吸引力、人才的吸引力,商业计划书的密度等等。我相信这是一个风口,从真实的结果来看,今年1月份到8月份,全世界范围内的大资本进入具身智能大概是一个什么样的量级?

事实上,当我们在感受到一个概念很热的时候,这跟它实际上在全世界范围内吸引到的真实资源是有误差的。我天天说我现在是风口上的猪,但我并没有觉得今年赚钱比去年容易,这是我作为一个创业者的感受。站在全球视野范围内,具身智能有没有让真实掉到你们口袋里的钱发生变化?能不能给我一些可以看得见摸得着的数据,证明它是风口。

穆北鹏:从这个新出来的这个公司上面,我感觉几十家上百家是有的。大家的融资额应该是在1亿人民币到1亿美金之间,然后估值在1亿美金这个量级算是比较头部的。

马扬:我们其实是在底层。从企业端来讲,我的体会是可能有些机器人在过去一年刚起来的时候,融资方很关注机器人本体的制造商。今年尤其是下半年的这个阶段,更多的资方谈的是我们更关注解决机器人的核心瓶颈,尤其是在感知方向上。所以像我们做触觉感知这样的企业,我感觉到会受到更多关注。这也是为什么我觉得风口好像来了的原因。

张力:今天我是从亦庄的世界机器人大会赶过来,今年大会聚集了27款人形机器人。我相信随着时间的推移,到年底估计大家能看到更多可能50个或者100个不同的人形机器人。如果你去调研一下今天最头部的机器人企业,你会看到大部分的营收都来自教育和科研,说明好多机构都在研究机器人。

以前在自动驾驶里面,我们把具身智能体现在车和路、车和道路上的使用者之间的交互,是在结构化的道路上进行交互,但是在机器人领域里,整体情况则不太一样。因为当你跟物理世界发生交互的时候,移动是需要跟地面发生交互,通过调整自己的姿态保持平衡。当你进行操作的时候,你要通过自己的动作去改变物理环境的状态,改变对方的状态和所交互的对象。这里面包括你的动作,抓取以及移动所完成的具体的工作,同时还有在各种不同的地形上移动。这是为什么今天你看到众多的机构中,大家都从不同的角度切入,开展研究。

张一甲:让我印象非常深刻的其实是黄仁勋和李开复老师对具身智能完全相反的态度。不知道三位是否有所耳闻。

张力:我自己的看法,其实具身智能体现在人形机器人上,是利用人形机器人去表现它的通用性和泛化性,来呈现具身智能的能力。这跟我们人是一样的。但是具身智能的能力不是完全只能依靠人形机器人去体现出来。如果把具身智能的能力放在其他形态的机器人的产品上,也能提高它的效率。因为大多数机器人都是专用机器人,而我们今天把它放在人形机器人去研究,它就会类似我们人类,在各种场景下展现通用性和泛化性。

我自己喜欢比喻说,今天的具身智能人形机器人更像一个2岁的小孩,包括他的智力,他的体力都是。今天跟他讲说怎么去扛100斤的东西,怎么15秒跑100米,是不现实的。你更多的是要把一个两岁的小孩培养到16岁、18岁的时候,在这个过程当中不断培养他知识,不断训练他的体能,他才能够达到一个16岁或18岁所具备的能力。

张一甲:在您的判断里,具身智能已经构成了一个可塑婴儿的基本雏形,已经变成了一个两三岁的像人类一样的可塑之才,那什么时候才能长到18岁?

张力:这取决于什么样的应用场景。有一些垂直类的场景它会提早去落地,比如像商业场景或者工业场景,可能在未来的2年到5年的时间,就可以看到具身智能或者甚至于人形机器人进入这些应用场景。但是真正走到C端,我自己更乐观的判断大概8到10年。

张一甲:所以短期内在一些明确的商业场景就已经可以有应用了。但如果进入寻常百姓家,可能要8到10年。这个8到10这个数字怎么出来的?是用什么样的预测逻辑?

张力:预测的逻辑是根据具身智能研发的整个过程当中的算法能力的提升。

张一甲:在另外一场的会议上,他们会说6年或者7年。我问这个定义怎么来的?他说是因为OpenAI的商业计划书写的是6到7年,意思就是说如果到时候OpenAI都没有做成,那它就破产了,就没有实现对投资人的承诺。可是我想什么时候定义是靠给投资人的承诺来计算了?

张力:其实这种To C的应用产品落地,取决于硬件和算法软件能力的这种不断的提升。目前这个时间点,硬件是上限,软件能力是下限,所以现在需要通过算法不断地迭代来提升机器人的能力。

张一甲:在您看来软件的话,任何时候起跑线都差不多,然后硬件是决定了这个事情的天花板。

张力:其实具身智能的机器人,它是硬件跟软件不断交替的,像两只脚一样交叉往前走的。在现在这个时间点,硬件不是障碍,更多是一个工程化的问题,已经能够实现一些商业化的能力,而今天的软件能力是还有更大的提升空间。

打开网易新闻 查看精彩图片

张力

张一甲:北鹏有没有什么不一样的观点和看法?我发现张老师可能有科学家背景,导致他迟迟都不肯给我具体的答案。大部分科学家都是过于严谨,而不会给我以终为始的答案。

穆北鹏:我觉得会大于10年,15-20年。如果拿自动驾驶做横向比较,咱们回顾自动驾驶的历史,2007年打的DARPA挑战赛,2009年的时候谷歌开始做这个事情,Cruise是2013年成立的。国内的大部分自动驾驶公司是2016年成立的,通用的具身智能会更长,但是专用的一些机器人肯定是快很多的。

张一甲:我们今天都看到全世界的科学家都经历了所谓的AIfor science。由于AI的加持,科学研发本身推动边界的效率在指数级提升。比如说施一公老师原来可能做一项科研成果要两年,现在可能两个礼拜。原来是自己干,现在可能学生拿着AI工具就干了。用最朴素的话说,AI加速一切。所以现在的1年跟过去的1年不是一回事。

穆北鹏:如果不考虑加速的话,十年肯定不止。但是具体到某一个场景的专用机器能力的落地,这个肯定要更快。

马扬:我的看法跟两位大方向上是类似的。我们都认为机器人是具身智能很好的载体。如果没有这样的概念,或者这样的应用支持,机器人是很难真正走到商业化的。但是我们在真正应用机器人的时候,我们不会让它像人一样是一个多面手,它是一个单面手,或者说它的某一个技能上它具有专长,所以我们可能会看到在未来比较短的时间,可能两到三年就有具备部分具身智能能力的机器人在一些领域得到很好的应用,来替代人做一些比较简单的工作。真的走到家庭当中,具有跟人类一样的思考能力以及执行能力,那还是有很长的路要走。不管是 10 年还是 8 年还是 20 年,我想大家提的都是一个虚数词,这里面不仅有硬件,里面也有模型的建立,然后有的地方还会有一些目前是天花板的地方,可能大家还在想怎么去突破。

张力:我们回到具身智能来讲,其实具身智能在今天这个时间点是在找开关的阶段。如果未来从上帝的视角来看的话,可能三年、五年以后我们可以看到这个找开关的过程,实际上现在最关键的是要做对的事情,怎么去找到对的开关?如果开关找错了,那我们就要重新再干,所以我们自己要找开关;第二步是看清楚,第三步要做出来,第四,做规模。

现在不是说看到具身智能到工厂里搬多少箱子,而是如何找到具身智能形成自主操作的开关,这个是关键。

张一甲:但凡最近参加过科技类的大会,我们就会发现每一个会场都有非常多机器人。后来我就跟我的同事讲去去就行了,不要迷恋这种。我们会发现很多机器人现在就是To展位,说得夸张一点,生产出来就是去展览的。

我自己仍然是坚定的具身智能支持者,也投资了一家公司。只不过我反过来跟团队降火说,咱们千万不要以为风口来了,风口来了可能就是考验的开始,歧路复歧路的开始,因为风口一来诱惑就多,诱惑一多岔路口就多,载坑的概率指数级上升。

打开网易新闻 查看精彩图片

张一甲

我们再聊一个比较清爽的事情。你们认为走进千家万户的机器人,最好的交互可能是什么?

张力:我通常用三句话来形容未来最成功的具身智能。第一,去人能去的地方,第二,做人能做的事,第三能够抓取人能抓取的东西。

马扬:未来走到家庭中的这种明星机器人可能不只是一个。可能会把人的功能拆解成有不同优势的机器人,每个机器人可能会帮助我们的生活完成一部分功能,它们的集合帮助人完成了简单的操作,让人可以去做更多有创造性的工作。

穆北鹏:我想象中的是一个宠物+保姆的角色。它能帮我干很多家务,同时它又能像宠物一样逗乐和陪伴。

张一甲:最后我们再用一两句话说一下对未来的期待。

穆北鹏:道阻且行,行则将至。

马扬:看远方,走脚下。

张力:这条路不容易走,但我们会坚定地走下去。

(封面图及文中图片来源:HICOOL全球创业者峰会)