中国战略新兴产业融媒体记者 杜壮
业界认为,具身智能作为人工智能的下一个浪潮,已进入落地应用前的加速期。在清华大学教授、人工智能研究院视觉智能研究中心主任邓志东看来,人工智能的发展已从单模态文本大型语言模型演进至多模态大型语言模型,并进一步向具身智能和交互式通用人工智能迈进。
>>“天工”1.1PRO,国家地方共建具身智能机器人创新中心供图。
被认为是人工智能发展最终载体的具身智能在近段时间持续火热。
11月15日,华为(深圳)全球具身智能产业创新中心宣布正式运营,并与16家人工智能企业签署了战略合作备忘录。据悉,本次签约企业包括乐聚机器人、兆威机电、深圳市大族机器人、墨影科技、拓斯达、自变量机器人、华龙讯达、深圳华成工业控制、中坚科技、埃夫特、北京创新乐知信息技术、数字华夏深圳科技、北京中软国际教育、浙江强脑科技、佛山奥卡机器人、禾川人形机器人等。
值得注意的是,上述公司已在具身智能相关技术方面展开布局,如中坚科技投资了全球知名人形机器人科技公司1X Holding AS、拓斯达成立控股子公司开展通用机器人高性能运动控制平台研发等。在机器人硬件发展迅速的同时,业界已经认识到大脑对于机器人发展的重要性,开始了“强强联合”之路。
业界认为,具身智能作为人工智能的下一个浪潮,已进入落地应用前的加速期。在清华大学教授、人工智能研究院视觉智能研究中心主任邓志东看来,人工智能的发展已从单模态文本大型语言模型演进至多模态大型语言模型,并进一步向具身智能和交互式通用人工智能迈进。
01为什么这么火?
产业界在谈到人形机器人的发展时,往往还会提到另一个词——具身智能。
在上述发布会上,华为方面表示,具身智能由具身智能大模型提供技术赋能,而具身智能大模型由NLP(自然语言处理)大模型、CV(计算机视觉)大模型、多模态大模型、预测大模型、科学计算大模型等多个大模型组成。具身智能可广泛应用于工业领域的智能制造、家庭领域的智能家居、商业服务领域的巡检服务接待配送等。
国家地方共建具身智能机器人创新中心(以下简称“创新中心”)总经理熊友军曾用一个形象的比喻来描述具身智能与机器人之间的关联。熊友军表示:“具身智能是人工智能与机器人技术深度结合的产物,它是‘长了身体的智能’,标志着技术发展的一个巨大进步。”他认为,具身智能能够直接与物理世界进行交互,将带来生产力的巨大提升和生活方式的改变。
不同于传统基于数字环境的AI,具身智能具备感知、行动,并对外界物理刺激作出反应的能力。目前英伟达、特斯拉等企业纷纷布局“大模型+具身智能”赋能的机器人业务,并视智能机器人为企业的第二增长曲线。以全球AI算力龙头企业的英伟达为例,在智能机器人领域的布局主要围绕着大模型、数据、开发平台三大核心领域展开,终极目标是打造机器人底层开发生态。
纵观国内人形机器人市场,优必选、达闼机器人、非夕科技、宇树科技等企业在技术、产品以及市场上日趋成熟;智元机器人、有鹿机器人、逐际动力和银河通用则在发展方向上将重点放在了AI与机器人的深度融合上,这些企业虽然成立时间不长,但吸引了众多投资者的目光。从投资市场来看,今年以来,具身智能初创企业融资背后不乏百度、阿里、美团、科大讯飞、小米、联想、京东等科技巨头的身影。
创新中心品牌公关负责人魏嘉星告诉本刊记者,具身智能最近之所以如此火爆,是因为大模型技术的爆发,为具身智能的实现带来了前所未有的落地可能性。大模型通过深度学习和大量数据训练,使得AI系统能够更好地理解和预测复杂环境,当AI具备了身体之后,便能在物理世界中执行更加精细和复杂的任务。具身智能的提升,将极大提高生产力和生产效率,改善人们的日常生活体验。
与具身智能不同,传统机器人每一项智能都是人来定义和编程实现的。相关业内人士认为,机器人拥抱AI大模型的过程就是具身智能机器人的实现过程。
在2024世界人工智能大会上,宇树科技CEO王兴兴表示,具身智能是实现AGI(通用人工智能)的最有效途径,OpenAI的大方向大概率是错的。他认为,未来5-10年肯定会有很大的技术突破,只有尽可能地相信AI,才会有更好的未来。
据高盛预测,到2035年,人形机器人市场或将达到1540亿美元,成为继智能驾驶电动车后的又一AI落地场景。
02与人形机器人的概念一样吗?
具身智能这一概念早在1950年就被提出,进入21世纪后,具身智能开始在机器人领域进一步发展。英伟达创始人兼CEO黄仁勋在ITF World 2023半导体大会上称,“具身智能”将引领下一波人工智能浪潮,引发了全球范围内对“具身智能”的关注。黄仁勋表示,人工智能的下一个浪潮将是具身智能,即能理解、推理并与物理世界互动的智能系统。
对于具身智能和人形机器人这两个概念的理解,工信部赛迪研究院赛迪顾问先进制造业研究中心副总经理高超告诉本刊记者,这两个概念的出发点和视角不同,但在特定情况下会出现重叠。
具体来说,高超认为,人形机器人的出发点是机器人,机器人是指“可编程且具有感知、决策、操作能力的机器”,通俗地说,是一种具有强大功能的“硬件”,人形机器人是一种硬件结构与人相近的机器人。人形机器人的关键技术包括“大脑”“小脑”“机器肢”“机器体”等,当其“大脑”足够“聪明”时,就可以称为一种具身智能。
而具身智能的出发点是智能,核心是通过与环境交互获得知识并泛化迁移的能力,通俗地说是一个聪明智慧的“大脑”。与常见的人工智能的区别在于,具身智能拥有了硬件载体,“大脑”可以指挥硬件更好地收集环境信息并执行实际操作,这个载体可以是汽车、无人机、工程机械等各种硬件,当其载体是结构近似于人的机器人时,也可以称为人形机器人。
“人形机器人的概念侧重于机械机构,强调的是近似于人的‘躯壳’。具身智能的概念更侧重于智能算法,强调的是可以通过硬件载体与物理世界交互的数字智能。”高超表示。
03未来趋势在哪儿?
如今,在人工智能技术加持下,代表了人工智能和机器人两大前沿技术深度融合的具身智能产业正成为多地发展新重点。
11月11日,创新中心启动“天工开源计划”,将陆续把本体、数据集、运动控制等方面的技术成果面向行业开源开放。就在一个多月前的10月10日,北京具身智能机器人创新中心正式升级为“国家地方共建具身智能机器人创新中心”。
“更名后的创新中心,将研发领域扩展为具身智能全产业链。”魏嘉星告诉本刊记者,作为引领具身智能技术突破与产业协同的关键平台,创新中心将围绕通用机器人母平台“天工”、多能具身智能体平台“开物”两大任务加速技术突破。
从创新中心的平台建设规划来看,主要是成为行业资源组织者、产业发展培育者和落地应用推动者。具体来说,魏嘉星表示,作为行业资源组织者,创新中心牵头承担多项国家级和行业揭榜挂帅任务,联通产业链上下游开展关键共性技术联合攻关。作为产业发展培育者,创新中心牵头及参与编写多项国际、国家及团体级标准,并设立涵盖产业全链条的测试体系,为具身智能机器人提供全面测试验证平台。作为落地应用推动者,创新中心联合场景应用方,在多个领域开展试点,打造具备应用价值的落地案例。
“未来,创新中心将持续完善具身智能生态圈,推动具身智能机器人赋能千行百业,加快具身智能时代的到来。”魏嘉星说。
据《2024年具身智能产业发展研究报告》显示,预计未来五年,具身智能的市场规模将持续增长,有望在2026年突破万亿元规模。
不只是北京、广东等地,上海在2023年印发的《上海市促进智能机器人产业高质量创新发展行动方案(2023-2025年)》明确提出,将重点攻关具身智能等先进技术。国家地方共建人形机器人创新中心也计划成立总额超100亿元的人形机器人产业基金,通过资本端的运营,形成产业合力,推动行业生态产业链的建立和发展。
谈及多地建立以具身智能为主的创新中心的缘由时,高超告诉本刊记者,一是推动创新突破,创新中心广泛汇聚产业链上下游和生态各环节合作伙伴,统筹优势力量、开展协同创新,提速关键技术突破进程。二是减少重复投入,创新中心通过打造公共或开源硬件平台、软件算法、开发工具等方式,使更多机构企业能够基于此直接开展更进一步的细分领域创新研发工作,而不是首先投入大量资源开发与其他机构同质化的基础平台。三是打牢发展地基,创新中心投入许多资源做“公益性”事业,包括制定标准、构建测试平台、打造通用开发工具、开展关键技术验证等。
实际上,当前具身智能机器人仍处于比较早期的阶段,底层还有诸多技术亟待突破。配天机器人CTO郭涛公开表示,具身智能发展的重点难点还是在于算力、数据和模型结构。这个阶段,产业格局尚不清晰,还需要整个生态的合作伙伴通力协作,共同推进产业的发展。
热门跟贴