6月13日,智平方创始人兼CEO郭彦东在2026北京智源大会上推出全球首个类脑式具身智能系统NeuroVLA,并宣布该系统在AlphaBrain Platform开源。

NeuroVLA架构仿生人类大脑的“皮层-小脑-脊髓”三层体系。皮层负责语义理解和任务规划,通过大规模语言模型解析指令;小脑负责高频运动协调与动态修正,将抽象规划转化为连续动作;脊髓负责毫秒级运动执行与安全反射,在碰到障碍物时直接触发应急响应。

智平方公布的数据显示,NeuroVLA可将机器人运动抖动降低75%以上,碰撞发生后20毫秒内完成反射响应。脊髓层平均功耗仅0.4瓦。

这套系统由智平方联合香港科技大学(广州)共同研发,是AlphaBrain具身大模型体系下的最新版本。

在此之前,智平方于2025年4月发布了全域全身VLA(GOVLA)大模型,并在同年11月推出了融合4D世界模型的Video2Act架构。据第三方评测,后者的性能较硅谷同类标杆高出30%以上。

智平方成立于2023年4月,是国内最早提出端到端VLA技术路线的企业之一。创始人郭彦东博士先后任职于微软、小鹏汽车和OPPO,担任首席科学家与研发高管。

公司融资节奏较快,2025年完成7轮数亿级融资,估值突破10亿美元跻身独角兽阵营;后续B轮系列融资金额超10亿元,估值突破百亿元。

产线方面,公司已建成年产2000台以上的半自动化产线,并计划建设2万至3万台产能的新产线。商业化已覆盖汽车工业、半导体显示、生物制药等领域,“智魔方”机器人店员已落地全国十余省份。

在VLA技术路线上,业内有多家公司在并行推进。美国Figure AI的Helix模型采用双模块架构,系统2是基于70亿参数视觉语言模型的语义理解模块,系统1是8000万参数的视觉运动控制模块。该模型可在嵌入式低功耗GPU上本地运行,训练数据仅为同类模型的5%。

美国家具身智能公司Physical Intelligence的π*0.6模型通过强化学习方法大幅提升了机器人操作的成功率和吞吐量。

宇树科技发布了WVLA2.0具身大模型并开源UnifoLM-VLA-0,搭载该模型的G1人形机器人可在真实办公环境中自主完成会议室整理。千觉机器人则从触觉感知维度切入,开发VTLA模型驱动双臂长序列柔性操作。

VLA与视觉、语言、触觉等多模态感知的融合趋势日趋明显,行业正在从单一视觉主导的控制范式,向多模态协同的方向演进。

此外,多家具身智能厂商正尝试将世界模型与VLA结合来提升泛化能力与执行成功率,如PI最新发布的π0.7模型已融合世界模型BAGEL。

数据质量与数量仍然是普遍瓶颈,智平方在智源研究院的双臂机器人真机数据集RoboCOIN中,旗下两款机器人贡献数据占比超过35%。

NeuroVLA是VLA技术路线演进至第三阶段的产物,从早期的端到端VLA逐渐发展为更具生物模仿特征的三级架构。

值得观察的是,这一架构能否在工业产线和公共服务等真实场景中,持续验证其性能和可靠性。NeuroVLA已开源,行业开发者可以实际测试其主动感知、故障自恢复与时序记忆等功能的效果。

打开网易新闻 查看精彩图片