来源:市场资讯
(来源:智能纪元AGI)
今年4月,2026北京亦庄人形机器人半程马拉松赛场上演了一场年度名场面:
身着红色战衣的人形机器人“闪电”,以50分26秒的净用时强势夺冠,一举打破人类半程马拉松纪录;而“具身天工Ultra”则把半马成绩缩短1小时25分钟。
这一幕看似是机器人硬件突破,但真正的行业变革藏在细节里,对比往年就能看出天壤之别:
今年参赛的300多款人形机器人当中,数百款机器人彻底告别了去年依赖人工遥操作的运行模式,真正实现了全程自主奔跑,不再是人类操控的“提线木偶”。
表面看,是机器人的步态、平衡硬件在飞速迭代,但核心是来自飞速成熟的AI大模型感知、云端算力。就像夺冠的“闪电”,依靠AI大脑核心算法实时调整动态平衡,遇到路况波动、姿态偏移时无需任何人干预,就能瞬间自主修正。
很多人只盯着终端机器人卷外观、卷硬件、卷竞速数据,却忽略了一个最残酷的行业真相:
现在终端本体的硬件差距早已越卷越小,真正拉开行业鸿沟、决定机器人能不能规模化落地的,根本不是机身硬件,而是背后的AI云底座。
作为机器人底层支撑,如今的AI云,早已不是单纯提供算力的“工具配角”,而是撑起整个具身智能产业的核心底座,搭建起整套数据、端云协同等能力,从而让机器人能自主识环境、做判断、处理任务,也让具身智能走出实验室,真正落地现实场景。
显然,AI云厂商的技术深度与行业适配能力,正成为拉开具身智能行业差距的核心变量,也预示着行业内卷下半场已然到来。
“曾经被认为是小众研究方向的具身机器人,如今已走出实验室,成为一个万亿级别赛道。但具身要落地,数据、模型、本体三座大山必须跨越,其中数据和模型,是AI基础设施要解决的问题。”百度集团执行副总裁、百度智能云事业群总裁沈抖在5月13日表示,AI云需要帮助本体企业构建物理AI时代的 Scaling 能力。
放眼长期,具身智能赛道即将成为万亿级市场:
摩根士丹利预测,到2036年,全球人形机器人采用量将达到2440万台;到2050年,全球人形机器人保有量将达到10亿台,同时全球人形机器人市场年收入将高达7.5万亿美元。
显然,未来10亿台(摩根士丹利数据)机器人落地的背后,必然是海量的数据训练、端云协同、智能迭代需求。
可以确定的是,未来人形机器人的行业竞争,终端只是入场券,AI云智能底座才是最终的决胜底牌。
330亿具身智能引爆“资本狂潮”
早在2025年3月,知名投资人、金沙江创投主管合伙人朱啸虎公开表示,已“批量退出”其人形机器人投资。
核心原因在于,他认为当下具身智能与人形机器人项目的商业化路径尚不清晰。
紧随其后,经纬创投创始合伙人张颖在朋友圈发文委婉反驳:人形机器人本就是顶级大赛道,行业百花齐放,发展过程中出现适度泡沫也实属正常。拉长时间维度来看,这条赛道一定会诞生重量级龙头企业。
两位顶级投资人的隔空辩论,瞬间把具身智能与人形机器人行业推上舆论焦点。
但有趣的是,这场朱张之争,并未让具身智能陷入融资寒冬,反而这两年行业投融资热度愈发高涨:
日均两起融资、单日超4亿元资金涌入,具身智能赛道已然上演“资本核爆”。
公开数据显示,2025 年,中国具身智能和人形机器人初创公司共完成325笔风投交易,同比增长216%;投融资总额超过398亿元,同比增长326%。
进入2026年初,行业更是迎来一轮超级资本热潮。
据智能纪元AGI从多个渠道不完全统计,2026年第一季度,具身智能和机器人领域披露的融资事件数量超过200个,其中包括16起单笔金额10亿元及以上的融资;融资规模已超过330亿元。
其中,国内数十家具身智能企业单轮融资超10亿元,20余家企业估值破百亿,宇树、智元等头部企业估值更是突破300亿元。
摩根士丹利研报指出,今年全球人形机器人创投规模已超越2025年全年,规模已超过450亿元,增长速度远超市场预期。其中,中国市场贡献了全球约46%的创投资金,成为资本角逐的核心阵地。
显然,具身智能和人形机器人行业已经进入了一个特定的周期阶段:与当年电动车、移动互联网的崛起阶段如出一辙,行业共识快速凝聚,持续吸引海量资本涌入。
数据、模型和本体三大挑战
尽管产业巨头与头部投资机构纷纷加速布局入场,但朱张之争也暴露出行业深层现状:
赛道内企业的具身智能、人形机器人商业化闭环仍未跑通,开源数据集暂不具备落地商用价值,真实场景数据采集、VLA 模型迭代、通用场景任务落地等核心环节,仍处于早期阶段,至今仍难以实现通用化、规模化商业应用。
数据、模型和本体,依然是中国具身智能从场景探索到产业落地过程中需要攀登的三座大山。
首先是数据。
星海图创始人、CEO高继扬在Create 2026百度AI开发者大会上表示,“具身模型之外,我们看到最主要的问题还是数据的问题。其实现在很多算法层面的要素已经具备,而算法+数据等于模型。”
实际上,无论是人形机器人的灵巧操作、服务机器人的场景适配,还是工业机器人的精密作业,核心能力落地,全都依赖大规模、高质量、多模态的场景化数据。
但眼下,模型、数据与实际落地之间,仍横亘着现实鸿沟:
现有训练数据体量不足、模态单一、质量参差,很难满足模型复杂感知与行为学习需求;开源数据集本身规模有限,又缺少统一采集标注标准,直接制约了模型跨任务、跨场景的泛化能力;而且,真实场景数据采集成本高昂,又和模型视觉泛化需求形成矛盾,现实环境复杂多变、任务充满不确定性;以及国内各家机构、企业数据相互割裂,缺少共建共享机制,很难搭建起规模化、标准化的行业数据底座。
业内普遍认为,当前具身智能领域正处于2.0阶段,若具身智能迈向GPT-3阶段,所需数据量将高达2000万小时。
其次是模型。
VLA、VLM模型即成产品,但需要整机和实际应用结合,高质量数据稀缺下,模型框架也未收敛,而评测体系缺失、不公正情况成为行业对于具身智能模型发展的阻力。
北京大学助理教授、银河通用机器人创始人及CTO王鹤也指出,当前人形机器人仍停留在千台级出货规模,真实产出能力与自动驾驶百万级车队的数据量存在数量级差距。
最后是本体。
沈抖今年3月提到,当前具身智能与人形机器人行业虽热度高涨,但仍存三大挑战——本体稳定性、耐用性、灵巧性仍不足;而且,行业未形成统一技术底座,远未迎来产业的ChatGPT爆发时刻;此外,具身智能数据未形成规模化正向循环,仍停留在实验采集阶段,没能落地生产生活、跑通商用闭环。
正如智平方科技创始人郭彦东所言,未来机器人需要跨越的第二个关键门槛是走向量产——做出几万台、几十万台且保持高一致性,才是真正成功闭环与否的关键所在。
如何破局:AI云支撑具身智能
眼下,具身智能正从“实验室能力验证”,迈向“真实场景规模化落地”阶段。
2026年,具身智能已经分化出两条清晰发展主线:
1、攻坚可泛化的通用大脑与世界模型,瞄准通用 AI 方向,让机器人真正具备物理级智能大脑;
2、加速商业化落地,从真实场景痛点切入,通过技术调优、结构适配、数据模型重构,让产品真正贴合市场需求。
高继扬表示,具身智能已经走到了“上半场”的结尾,正在迎来“下半场”。2026年下半年,是具身智能行业成果验证期,能否实现真正的人工替代、产生商业价值,是所有具身智能企业的生死线。
而对于百度智能云巨头来说,其在具身模型训练、算力基建、技术生态、场景落地等维度,早已形成天然底层优势,可以帮助更多具身智能公司实现数据、模型和本体能力的升级。
首先是具身模型训练和算力基建层面。
要想数据训练更精准、更好用,就必须依托强大算力平台,支撑多样化训练范式高效运转。
以星海图为例。其研发的具身模型研发工作跑在百度智能云上,后者提供高性能、稳定可靠的AI基础设施,百度百舸AI计算平台在算力高效调度、数据高效流转、模型训推加速等方面的技术积累,提升模型开发效率。双方开发团队密切协作,对世界模型Fast-WAM的单步推理延迟进行优化,将进一步缩短到90毫秒以内。
百度智能云主任架构师应茹近期对智能纪元AGI表示,百度百舸目前提供了一套完整的具身智能Workflow。
她认为,具身智能的迭代闭环远不止”训练一个模型”,而是从数据处理、模型训练到仿真评估、部署推理的完整工作流,任何一个环节的低效都会拖慢整体节奏。而百舸把在LLM和多模态大模型爆发阶段积累的完善AI Infra基础设施,快速迁移和适配到具身智能领域,帮助客户跳过底层基础设施建设,专注算法创新和产品落地,从而在时间窗口中赢得竞争优势。
“这套 Workflow 的最大价值本身也是百度百舸产品的定位和核心价值。”应茹表示。
数据环节,百度智能云集成了行业大规模无本体数据集(如RealOmni),支持客户直接挂载使用;
而开发训练层面则提供云端开发机,并提供全套开源模型的加速套件,针对具身场景的多模态训练做了深度优化,训练吞吐相比开源基线提升 1~5倍;
仿真评测层面,百度智能云预置了 Isaac Sim、ManiSkill3等主流仿真引擎,进行了深度性能调优,并沉淀了不同 GPU 平台与具身场景的适配选型建议,让工程师专注算法而非调试环境。
据悉,百度智能云已经把VLA这种典型具身智能模型的训练速度提高了70%,在世界模型推理上的时延降低了50%;原本按周计的训练,现在可以按小时来训练。
在场景应用层面,百度智能云深耕多年,已在科研教育、康养服务、智能制造、物流能源、商业服务、生命科学等领域,沉淀了大量 AI 落地与规模化经验。
例如,靠着百度智能云的技术加持,北京人形的天工人形机器人,已经率先闯进电力行业,能全程自主做巡检、干实操活儿,成为业内首款能在电力行业独立完成作业与巡检任务的人形机器人。
这也成为国家电网今年集中采购约8500台具身智能设备、投入68亿元布局的重要原因,业内更预判,2026年,国内电力行业具身智能投资规模有望突破100亿元。
本质上,百度智能云并不下场做硬件本体,也不直接做终端应用,而是定位于行业技术赋能者与场景连接者,以 AI 基础设施和产业协同平台为核心,已经助力上百家具身智能和人形机器人企业,在具身大脑、运控小脑、数据集建设、整机研发等关键环节完成技术突破。
Omdia《中国具身智能AI云市场》报告显示,百度智能云以35%的市场份额位居中国具身智能AI云服务市场第一。
而在我们看来,百度智能云在具身智能领域的核心竞争优势,在于市场地位够强。目前,百度智能云已支持北京、上海、浙江、四川等地的具身智能创新中心,以及智元机器人、宇树科技等产业链上超过30家重点企业。据悉,采用百度智能云异构高性价比架构方案,成功突破原有框架瓶颈,将整体训练吞吐性能提升5倍以上。
今年人形半马比赛中,超过六成参赛机器人采用百度智能云技术支撑赛事与研发。
Create 2026百度AI开发者大会还同期开展了具身智能分论坛。其中,北京人形机器人创新中心与百度智能云联合启动“天工开物”黑客松,构建运动控制、VLA两类任务能力,冠军奖励现金5万元以上,以及天工硬件、创新中心深度合作等,当然还有近15位具身智能企业CXO、学界专家与产业生态代表集中亮相,围绕世界模型、具身数据、机器人训练以及产业落地展开讨论。
而星海图GalaxeaOpenWorld开源数据集也已在百度百舸平台上线,开发者在百舸平台上即可一键调取用于模型训练任务等,进一步强化百度智能云在具身智能产业中的平台角色与生态影响力。
当前,具身智能仍处在“表面热度拉满、实际投入不足、落地艰难”的早期周期,除了表演展示之外,具身智能和人形机器人在工业和家庭场景的商业化远未跑通闭环。
正如沈抖所说,具身智能的发展是一个循序渐进的过程,不会出现类似大模型那样的爆发式“ChatGPT 时刻”。而家庭场景落地,更是具身智能商业化的终极场景,对技术能力有更高要求,落地周期十分漫长,属于十年维度的长期目标。
对于百度智能云而言,已形成从数据采集、训练到应用部署的完整链路能力,并以“芯云模体”全栈能力筑牢具身智能底座,依托百舸算力、文心大模型与数据超市,为本体厂商提供云端大脑、训练加速与数据闭环服务。依托算力、模型、数据、生态与场景的全栈积淀,其恰好站在了“AI基础设施+具身智能产业生态”的核心枢纽位置,成为支撑整个具身产业往前发展的底座能力。
2026年,既是具身智能与世界模型的爆发起点,也是行业商业化洗牌、优劣分化的关键一年。资本只是这场具身智能竞赛的入场券,真正决定长期格局的,是硬核技术、落地能力,以及能否训练出比肩GPT-5层级的通用具身智能。
在我看来,距离真正通用具身机器人落地依然还有数年时间,而对于百度这类AI云厂商来说,他们将成为行业背后的核心赋能者,使得具身智能产业拐点将加速到来。
©本文为智能纪元AGI原创内容
热门跟贴