近日,在2024 AI创造者大会上,四位来自机器人制造、软硬件开发及解决方案等层面的企业代表,进行了一场以「产业链协同创新」为主题的对话,这四位嘉宾包括:
地瓜机器人CEO-王丛
加速进化商业化负责人-李超逸
优必选科技首席品牌官-谭旻
清博元宇宙研究室执行主任-柳春阳
他们对话的主题不光包括公司自身的最新动态,还全面解读了机器人产业链过去、现在与未来。RoboX对他们对话内容的高价值信息点进行了提炼:
产业链的变化与协同
谭旻:优必选创业13年,经历了三个阶段:
1、完全没有产业链的阶段。
在15年前,也就是创立优必选之前,我们就在做核心零部件自研,例如舵机的研发。因为相比海外来看,国内当时还没有相关产业链。直到能做出中国自己的舵机了,才成立了优必选。
2、做好舵机之后,开始做机器人的全身模型(那时也叫大模型)。
现在的机器人本体,全身大概有3000-5000多个零件。而在早期,优必选还是先从相对简单的小机器人做起。之所以没有做全尺寸机器人,是因为当时尚未突破「大功率输出峰值高」的逻辑。
3、产业链质变,软硬件融合。
一路迭代到第四代机器人,优必选见证了中国人形机器人产业链的发展。其中最大的变化,是软件与硬件的融合。此时产业已经发生了翻天覆地的变化,并真正进入到中国机器人百家争鸣的阶段。
产业链没有成熟之前,优必选一直抱着「两条腿走路」的心态:
1、自己探索核心技术,以求与产业链进行协同。例如机器视觉,语音互动,步态算法,核心零部件等。从舵机到灵巧手,再到整机结构性设计、操作系统等等,优必选都有专门的团队去做。
2、在自研基础上,开放与整个全产业链的合作。例如与天工的合作。
李超逸:「加速进化」作为一家初创公司,「加速进化」对于产业链想法很简单——优先选择市面上的成熟零部件。如果市面没有的话,就只能自己做。
随着机器人行业的发展,产业链出现了越来越多的客户,零部件成本在迅速下降。例如,在刚进入行业时,机器人一体化关节的成本非常高,大扭矩大功率的普遍要一万元左右。后来,越来越多的百元级关节出现,大功率关节中也会出现一两千元的产品。
可以看到的是,中国在这一领域有着巨大优势。例如,在中东和北美,很难快速实现人形机器人的制造,其周期要比国内长得多。因此,与国内相对成熟的供应链一起发展,是非常有价值的。
不过整体来看,机器人行业还是处于很初步的阶段,尚未成立标准。对于各家机器人公司来说,就是要不断选择,做大量的适配,确保最终给客户的产品是足够完整,体验足够好的产品。
柳春阳:清博智能的机器人团队是从2021年开始策划的,我们做机器人比较年轻,但在人工智能大数据领域,已经有十年多的工作和创业经验了,一直在做自然语言处理方向的工作。
这两三年是人工智能和机器人赛道高速发展的阶段,产业链也有了雄厚的基础,我们需要的控制器和传感器都非常成熟。
同时,正好大模型这两年发展比较快,我们将机器人和大模型结合,也能更好地满足前台接待、智能客服等功能。
机器人赛道更新也比较快,波士顿动力做了十年,今年推翻重做了,他们基于大数据和大模型重新训练机器人。而清博智能还要早两年,在成立之初就已经在基于AI和大模型训练机器人。
以前,训练机器人要去工地,现在则可以利用数字孪生场景。感谢这个时代,让我们起得晚,还赶得比较巧。
王丛:地瓜机器人,是一家不做机器人的机器人公司。我们关注的,是机器人大脑芯片里面的核心算法,还有与数据整合相关的Pipeline工具链。
其实,已经有上百家机器人公司在使用地瓜的芯片和方案。在此过程中,我们能看到,无论是大公司还是小公司,想做一款并非demo的、真正能有产品化价值的机器人,还是一件非常痛苦的事情。
在走向量产的过程中,有大量的方案被推翻重来。同时也并没有好的工具,基本上都是各做各的,用开源的东西改改,不好用就凑合,这种情况比比皆是。
我们一直认为,未来世界应该就像科幻电影一样,有形形色色的机器人。但要想到达这一天,一定需要经过大量的尝试,那我们如何让这种尝试变得更快一点?
就像互联网产品一样,要想作出形形色色的机器人,一定需要做大量的基建工作。于是地瓜要做的是各种各样的工具,但凡真正能帮助到大家的,我们都愿意去尝试,天生就是和所有人都是朋友。
关于人形机器人的争议
谭旻:「为什么非要做人形机器人?」这个问题我们以前基本上100%会被问到,但它如今已经很好地被马斯克给解答了——当他投入人形机器人,并两次修正对机器人未来的预判之后,再问优必选「为何做人形」的人骤减了99%。
在两年时间中,中国人形机器人从屈指可数,已发展到数不清。对于优必选来说,有两个原因:
1、物以类聚。要想寻找一种能够替代人类去做所有事情的机器人,那一定是人形。因为这是百万年进化的结果——我们不会为不同形态的机器人去改变所有的世界规则和参数。要想更好地赋能于人,那一定要用人形机器人。
2、人形目前只是机器人的形状,未来会很快出现真正的仿生人。现在大家都讨论关节,讨论全身结构,仿生材料却被忽视了。仿生材料很快会成为人形机器人很重要的供应链,这是下一个阶段。
同时,我们都要寻找「另一个我」,一个能进行情感互动、有一定协同效应的人或智能体。
柳春阳:这个世界本身是人类创造的。未来的AI和机器人,都是要更好地辅助人类完成一些工作,不可能重构物理世界和规则。
很多既有的工作模式和场景,都是为人类服务的。机器人如果长得更像人,就能直接融入到现有的生活和工作方式中。
另外,我们不光要做一个冰冷的机器人,还需要它有情感有温度,所以清博就做了高仿真的仿生机器人,目前这一赛道上的企业还不多。
王丛:两年前,在具身智能刚火的时候,我们就在谈这个问题。到了现阶段,我觉得不用太关注到底是不是人形。
我也呼吁大家,我们该更关注一些更具体的问题,例如到底能解决哪些事情,失败多少次才能操控,场景怎么泛化……这些问题都是当下的阻碍,不管是人形还是非人形。
机器人AI的最终范式
谭旻:AI一直是限制整个产业链的重要挑战。在我们商业化的最早期,就已经发现一定要做软硬件结合——仅仅有软件是不行的。
到了今天,我们也可以很负责任告诉大家:大模型也没有想象中那么厉害。真正大模型结合到硬件的时候,短板就出现了。在评价智能化水平时,需要结合软硬件去衡量:
从软件维度看,从软件去解决思考推理等等,我们叫仿人也好,仿生也好,哪个点切入都不重要,最重要的是它有一个很范式的参考标准。
实际上,通过美国硅谷实验室EQ测试,AI的能力已经介于120到140之间,是很夸张的,至少我认为我没有到达120到140智商的水平。但即使它已经超过大部分人的智商水平,也并不意味着真正的智能。
真正的智能,是能在真实环境中去解决问题,这个就是为什么软件跟硬件的结合这么重要。我认为所有颠覆性技术,最后它都要跟硬件结合。通用人工智能一定要通过具身智能才能实现,这是毫无疑问的。
王丛:不同的范式是多种任务的,从跨视角的,到跨本体刚性结构的。我们每一块都看一下,目前做的效果都还不错。
我们不纠结「涌现」这个词,我们只纠结于泛化性有多好,以及到底能给产业带来多少价值。例如端到端等热门路线,根据我们过去做自动驾驶的经验,能体会到任何一个复杂系统和复杂工程,从来不会纠结于它是不是端到端,它一定是各种工程的集合体,历史上所有的工程都是如此。
地瓜是这种风格——不纠结于任何一个学术方向,最后缝合所有有用的东西,就OK。
至于产品阵列,我们相信机器人会产生各种形态。每种形态也不可能用单独的一个芯片,而是一定会有不同的性能等级。
目前,我们一方面在扫地、割草、陪伴等成熟消费产品上大量出货,同时也在相对不那么成熟的高阶产品中持续开发,包括在从数据生成到验证的平台上,注入核心算法部件。
谭旻:我们做机器人的时候,会与大量AI开发者沟通。其中既有做世界模型的,也有做完全端到端的。
根据我们自己的判断,无论哪一种开发者,最终都要落实到好用的平台上,这个平台应当把底层复杂度全部屏蔽掉,让大家能在该基础上做出各种应用。
如果类比大模型的发展,可以看到其中有做基座大模型的,也有做垂直大模型的。而对于机器人,初期也会有各个领域的能力出现;但长期来看,这些领域的能力会越来越泛化,甚至呈现融合。
这一阶段的时间会非常长,而且在此过程中,仍然需要不同行业和分布式的系统,而非集中式的状态。这一过程中,还是需要各行各业的开发者,能够有足够好的平台,让他们共同推动。
柳春阳:在大模型和机器人的结合上,我们可能与大多数做机器人的公司都不一样——90%以上的机器人公司都是先有机器人,再逐步加入AI;抑或者其早期的AI,就是基于视觉和深度学习来进行控制。
我们则是先有AI,后做的机器人,与大模型深度融合。我们机器人的应用场景需要与人打交道,90%以上的应用都是在工业场景,所以我们跟大模型是相辅相成、天生依赖的。
热门跟贴