具身智能正在进入自己的数据Scaling Law 时代,而光轮正在领跑这个时代。
作者|王艺
编辑|栗子
「甲子光年」获悉,具身数据与仿真基础设施公司光轮智能近日完成A++与A+++轮融资10亿元融资。本轮融资完成后,光轮智能正式进入独角兽行列,成为全球首家以具身数据为核心业务的独角兽公司,也是目前全球具身数据规模最大、对具身数据生成与评测方法理解最深的企业之一。
本轮融资引入了多家产业场景方与财务机构,包括新希望集团、鼎邦投资(三安光电董事长家办)、奥克斯、鼎石资管等产业投资机构,以及建投华科、国方创新、道禾长期投资、清新资本等财务投资机构。
2024年是硬件元年,2025年是模型元年,而2026年正在成为具身数据的规模化元年。在这一转折点上,一批以数据为核心能力的基础设施公司开始崛起,其中光轮智能已经成为全球具身数据规模最大的企业。
如果说2026是具身数据规模化元年,那么光轮智能已经成为这一轮规模化浪潮的领跑者。
行业竞争的焦点,正在从“模型能力”转向一个新的核心变量:
数据。
但更准确地说,决定胜负的并不只是“谁拥有更多数据”,而是“谁更清楚什么样的数据真正有效、什么样的评测真正可信”。
「甲子光年」认为,2026年行业竞争的胜负手不会再主要体现在“谁的Demo更惊艳”,而会越来越集中在一个更朴素、也更本质的问题上:谁能以更高的可复用性,持续构建覆盖更广世界与更复杂交互、并经过有效评测验证的高质量具身数据体系,支撑万台级交付后的指数级数据需求。这背后拼的已经不只是数据生成能力,更是对“什么样的数据会转化成模型能力”这件事的理解深度。
1.2026,具身数据规模化元年
过去两年,具身智能赛道融资最常见的主角是“机器人本体公司”与“端到端大模型团队”:一个讲交付、一个讲能力。但到了2026年,融资故事正在出现第三种主角:数据与仿真基础设施公司。
光轮智能此次完成10亿元融资,本质上意味着市场开始用更“底层”的方式给具身智能定价:不再只为某个单点能力或某个炫目Demo付费,而是为“可复制的工程体系”付费。
在具身智能行业里,真正稀缺的并不是单次训练数据,而是能够持续运转的数据系统。现实世界中的机器人训练往往依赖具体场景与设备条件,很难形成稳定的数据循环。而仿真合成数据的核心价值,在于把这些离散训练过程转化为可并行、可复制、可统计的数据系统。当真实世界数据尚未形成规模化循环时,谁能把仿真资产、数据生成与评测流程构建成持续运转的数据系统,谁就更接近行业的基础设施层。
这一转向正在工业界得到验证:在机器人操作领域,数据扩展规律已经被更系统地研究与量化——去年11月,Generalist发布了GEN-0模型(用27万小时的数据训练而成)的同时,声称首次在机器人领域验证了类似语言模型的Scaling Law,即随着预训练数据和计算量的增加,下游任务性能呈现可预测的幂律提升。
预训练期间模型规模与下游零样本任务计算量之间的关系,图源:Generalist
换句话说,具身智能的Scaling变量不再是token数量,而是世界覆盖度——环境、物体与交互分布的多样性。具身智能正在进入自己的数据Scaling Law时代。
这也解释了为什么2026年会被很多产业方视作“具身数据规模化元年”:一方面,越来越多机器人厂商提出“万台级”交付目标,任务场景将从实验室扩展到家庭、工厂与门店,数据分布随之迅速扩张;另一方面,交付规模越大,模型迭代节奏越依赖稳定的数据供给。行业对数据的需求因此不是线性增长,而更接近指数级增长:本体越多、场景越杂、任务越长,数据缺口就越大。
于是,行业也在探索不同的具身数据体系:有人押注人类视频扩大行为覆盖,有人提升采集效率,也有人通过real-to-sim缩小真实与仿真之间的差距。
这些路线看似不同,指向的却是同一个终点:把具身数据从“一次性采集”变成“持续运转的数据系统”。
2.构建规模化具身数据引擎
光轮智能是一家数据与仿真基础设施公司,也是目前全球具身数据规模最大的企业。和专注于大模型的企业不同,他们的核心目标不是简单地“生成更多数据”,而是建立一套能够持续定义、生成、验证高质量具身数据的方法论与工程体系,帮助AI更好地理解和进入物理世界。
「甲子光年」认为,在通用策略的数据Scaling Law开始显性化、行业竞争焦点从“秀模型”转向“抢数据/抢评测标准”的当下,光轮智能正在领跑具身智能数据规模化时代。这其中,最值得行业关注的,是光轮智能的产品路线。他们把具身的研发流程“工程化”——像软件行业的CI/CD(持续集成/持续交付部署)一样,让资产、数据、评测生成形成高频闭环。更重要的是,光轮试图把“什么样的世界值得构建、什么样的行为值得采集、什么样的评测才真正有效”也一并工程化。
光轮在产品层面所建立的,是目前行业规模最大的具身数据引擎体系:World-Behavior-Eval。这套框架的关键不只在于它能规模化生成数据,更在于它试图回答具身智能领域最核心的三个问题:什么样的世界值得被建模,什么样的行为值得被采集,什么样的评测才能真实反映能力进步。它是一条“可规模化生成数据、也可规模化定义数据质量与衡量进步”的自动化流水线,并打通Real2Sim2Real。
光轮智能具身数据引擎体系,图源:光轮智能
光轮智能创始人兼CEO谢晨博士告诉「甲子光年」,“具身数据不是采集问题,而是系统工程问题。World定义数据分布,Behavior通过人工示范、自动化策略与Agent系统生成训练信号,Eval提供能力反馈。只有三者形成闭环,数据系统才能持续驱动模型能力提升。”
在“World”层面,具身的“世界”难点不在于画面好看,而在于物理与空间结构可信,以及能否把真实世界的物理属性(材料、摩擦、接触等)规模化地映射到可复用的仿真资产中。
训练机器人,首先要给它一个足够真实的“练习场”。仿真的核心难题在于物理可信——布料、液体、金属摩擦,任何参数偏差都会让机器人到了真实场景中“水土不服”。光轮围绕求解、测量、生成三位一体的全栈自研技术架构,自研求解器支持刚体、柔体、流体等多物理场高精度实时求解;首创物理测量工厂与虚实对标方法论,将真实物理参数系统数字化;配合大规模非刚体资产生成能力,形成从物理真实到数据规模化的完整自研闭环。
更关键的是,光轮并不把“测量”理解为简单采集更多参数,而是要判断哪些物理属性真正决定策略泛化、哪些世界细节必须被精确保留、哪些长尾交互最值得优先进入训练分布。
在“Behavior”层面,具身数据的结构性矛盾是:行业还没有足够多的机器人在真实场景里持续产生日志数据,因此“预训练燃料”很难像自动驾驶那样自然涌现。
当前机器人仍缺乏稳定的数据来源,具身数据尚未形成类似自动驾驶那样的规模化数据循环。光轮构建了全球最大规模的非本体数据引擎,通过仿真合成数据与人类行为数据(EgoSuite)两条路径构建具身数据体系。国际主要具身智能团队中超过80%的仿真资产与合成数据来自光轮,这也使得光轮成为目前全球具身仿真数据规模最大的供应方。
但在光轮的理解里,Behavior的核心并不是“采更多视频”或“堆更多Demo”,而是扩大有效行为分布并提升行为信号密度。:哪些动作模式有助于泛化,哪些示范存在重复冗余,哪些交互分布是模型真正缺失的,这决定了数据的真实价值。在这一过程中,Behavior层也在逐渐从人工示范走向自动化策略与Agent系统,通过程序化方式持续生成、筛选与扩展交互数据。
如果说“World”与“Behavior”解决的是“能不能生成数据”的问题,那Eval解决的则是“数据生成是否真的在推动能力提升”的问题。
数据有了,还得知道“训练究竟有没有用”。没有统一严苛的标准,各家进展就像用不同尺子量长度,无从比较。去年年底,光轮推出了RoboFinals评测标准。这是业内首个工业级、可规模化、真实可信的具身仿真评测平台,专为尖端机器人基础模型评测而生。某种意义上,RoboFinals不只是“测模型”,更是在定义具身智能里什么才算真正的能力进步。
光轮智能RoboFinals评测产品,视频来源:光轮智能
其核心Benchmark RoboFinals‑100覆盖100项任务,面向家庭、工厂、零售等真实应用域,重点覆盖刚体、关节体以及电缆/布料/液体等可变形材料的交互难题,并支持桌面机械臂、移动操作、全身locomanipulation等多类机器人本体评测。
World、Behavior与Eval三层系统协同,构成具身数据引擎。
通过World、Behavior与Eval三层系统协同,机器人模型的训练、评测与数据生成能够形成持续迭代的数据引擎。光轮是目前业内唯一同时覆盖三要素的企业,使得世界生成、行为信号与能力评测能够在同一系统中形成稳定闭环,从而构建难以被单点复制的数据基础设施。
3.三项“国际交付冠军”
在具身AI进入数据规模化时代的背景下,光轮智能已经率先跑出。
据「甲子光年」了解,光轮智能已经在仿真合成数据、仿真评测、人类视频数据三个维度均摘得全球交付冠军,成为目前全球唯一同时覆盖三类具身数据能力并实现规模化交付的企业。
在合成数据领域,光轮已建成全球交付规模最大的仿真合成数据Pipeline,覆盖海量物体、场景与物理属性组合,为机器人模型训练提供高多样性的世界数据,全球主要具身团队的仿真资产体系中,超过80%建立在光轮提供的资产与合成数据之上。
在仿真评测领域,光轮推出工业级机器人评测平台RoboFinals,并携手NVIDIA联合开源发布Isaac Lab-Arena具身评测基准框架,逐步确立具身AI领域的标准化评测体系;联合通义千问共建可复现、可诊断的工业级评测闭环,合力推动具身智能评测行业基座的确立。
在人类视频数据领域,光轮的行为数据节点系统已覆盖全球7个国家、2500+个不同环境,执行50000多种多样化任务,每周稳定生成超过50000小时具身行为数据,累计交付超100万小时高质量人类行为数据。
“真正的具身数据基础设施不是‘数据工厂’,而是一个自动化闭环:生成数据、验证能力、理解行为,然后再反向优化数据。”谢晨博士表示。
在不少业内人士看来,光轮已经成为具身AI研发流程中不可或缺的数据与仿真基础设施。这些国际顶尖具身团队之所以持续选择光轮,也并不只是因为其交付规模大,更因为它能够帮助团队回答一个更关键的问题:什么样的数据最值得生成,什么样的评测最值得相信。
其客户名单堪称全球AI界的“全明星阵容”——不仅深度覆盖了NVIDIA、DeepMind、字节跳动、阿里等全球最顶尖的大模型公司,还包括Figure AI、1X Technology、智元机器人、银河通用等机器人本体厂商,以及Toyota、BOSCH、比亚迪、吉利等全球汽车巨头。全球前五的世界模型团队均已与光轮展开合作。
光轮智能的商业化进展也势如破竹。据悉,光轮智能2025年的营收预期将是2024年的10倍,且今年预计Q1收入就已超过去年全年。这不仅证明了其商业模式的极高健康度,更标志着在商业交付上的巨大成功。
4.物理AI时代的数据与仿真基础设施
随着具身数据规模化时代的到来,机器人产业的基础设施格局,或许正在被光轮智能这样的公司重新定义。
光轮智能的目标,从来不是制造某一款机器人,而是成为物理AI时代的数据与仿真基础设施。凭借在仿真数据、行为数据与评测体系上的领先规模,光轮已经成为全球具身数据领域最重要的基础设施企业之一。如果说规模定义了光轮的产业位置,那么对“什么是好具身数据”的理解,则定义了它的行业高度。
“在物理AI时代,基础设施的定义在发生改变:它不只是算力,而是能够训练世界、生成行为数据并评测智能能力的数据与仿真系统。”谢晨博士说。
「甲子光年」认为,物理AI时代的“基础设施”有一个与互联网时代完全不同的前提:数据不只来自传感器采集,更来自对真实世界物理属性的系统化测量与可规模复现。在机器人任务中,决定策略能否稳定泛化的往往不是“有没有画面”,而是“有没有物理”——材质、摩擦、阻尼、形变、接触、碰撞、柔性物体与液体等长尾交互细节,决定了同一个动作在不同场景下会不会变成失败样本。要把这些“物理细节”变成可训练的数据供给,必须建立从物理测量到资产生成、再到数据生成的工程闭环,而不是停留在一次性项目交付。
在这一意义上,本轮融资的股东结构值得被单独点出来:光轮智能本轮融资引入了多家产业场景方与财务机构,包括新希望集团、鼎邦投资(三安光电董事长家办)、奥克斯、鼎石资管等产业投资机构,以及建投华科、国方创新、道禾长期投资、清新资本等财务投资机构。
「甲子光年」的判断是:产业场景方的进入,不仅是资金层面的支持,更意味着一种“数据边界”的外扩——当产业方把真实业务场景、真实物体、真实流程带入合作链条,光轮的具身数据生成与物理测量能力就能被延伸到更广泛的真实应用场景,进而大幅拓展具身数据与仿真资产的来源边界:哪些物体值得被测量、哪些场景值得被资产化、哪些交互应当优先被规模化覆盖,会从“技术判断”变成“产业共建”的系统工程。
完成A++与A+++轮融资后,光轮智能计划进一步扩大其全球数据生成能力,并持续投入物理仿真引擎研发与全球数据生成网络建设;公司正在多个国家和地区布局行为数据节点,目标是构建一个覆盖不同文化、不同场景、不同物体类型的全球化行为数据网络。
「甲子光年」认为,这种“全球节点+产业场景共建”的路径,本质上是在为万台级机器人交付做准备:只有当数据供给具备网络化扩展能力,行业迭代速度才可能保持可控。
在物理AI时代,决定行业上限的不再只是模型能力,而是数据与仿真基础设施。 光轮智能,正在构建这一基础设施层。
如果说2026是具身数据规模化元年,那么光轮智能已经在这一轮规模化浪潮中率先跑出。
(封面图来源:AI生成)
热门跟贴