来源:市场资讯

(来源:AI 前沿早知道)

博主新上线的小程序:进击的AI圈,欢迎大家一起评测

自变量机器人(X Square Robot)正式宣布开源其最新研发的VLA(视觉-语言-动作)模型Wall-OSS-0.5。

这不是一次普通的模型迭代,而是直接砸碎了困扰行业多年的“微调魔咒”——不需要任何针对性任务微调,预训练完成就能直接部署在真实机器人上,完成从未见过的复杂任务。

业内人士直言:这一天,具身智能真正告别了“脚本时代”,迎来了属于自己的“通用大脑元年”。

⚠️ 扎心真相:你见过的机器人,99%都是“背脚本的演员”

打开网易新闻 查看精彩图片

在Wall-OSS-0.5出现之前,整个具身智能行业都被困在一个心照不宣的死循环里。

你以为机器人会拧螺丝、会送餐、会跳舞是因为它“聪明”?错了。

它们只是背会了特定场景的“操作脚本”。

业内把这个过程叫做“微调”(Fine-tuning):给模型喂大量特定任务的数据,让它反复练习,直到能熟练完成这一件事。

这就像一个学生,考试前只刷一套题,刷到能背下所有答案。只要题目稍微变一下,就直接交白卷。

这种模式带来了两个致命问题:

泛化能力为零:工厂里的机械臂只会拧同一种螺丝,换个型号就得重新训练几个月

落地成本极高:一个简单的分拣任务,光调试成本就可能超过几十万

能力无法叠加:学会了拧螺丝,就忘了怎么拿杯子,越训练越“偏科”

所以我们看到,机器人诞生了几十年,却始终只能在封闭、固定的场景里打转,永远走不出工厂和实验室。

Wall-OSS-0.5有多强?用数据说话:没刷过题,照样考高分

打开网易新闻 查看精彩图片

自变量机器人用Wall-OSS-0.5,给了整个行业一个全新的答案。

这个模型在超过20种机器人形态、百万条真实轨迹数据、9000万条多模态语料库上完成了预训练。然后,研究人员没有做任何针对性微调,直接把它装在了真实机器人身上。

测试结果,震惊了所有人:

✅ 零样本部署:真正的“物理直觉”觉醒

在17个涵盖语义理解、刚性/柔性物体操作、精细化操作的挑战性任务中:

4个任务得分直接超过80分(满分100)

最恐怖的是“绳子收紧”任务——这个任务从未在预训练数据中出现过,模型却凭借对物理世界的直觉,拿到了82分的高分

这意味着,它不再是“背题机器”,而是真的理解了“绳子是软的,用力拉两端会收紧”这个基本物理规律。

✅ 微调上限:学习效率碾压行业标杆

在需要针对性优化的场景中,Wall-OSS-0.5展现出了惊人的学习速度:

对比行业标杆π0.5,同等数据预算下,平均任务进度领先17.5分

在精密插入这类精细化操作任务中,成功率提升了近乎一个数量级

✅ 反常识突破:越训练越聪明

更颠覆认知的是,实验证明:

该模型在高强度动作训练后,其多模态感知能力不仅没有受损,反而在视觉定位和推理能力上获得了“重塑式”进化。

这和人类的学习方式几乎一模一样——我们在学会骑自行车的同时,也提升了平衡感和空间感知能力。

四项黑科技,构建真正的“通用机器人大脑”

打开网易新闻 查看精彩图片

Wall-OSS-0.5的突破,不是靠堆参数堆出来的,而是来自四项底层技术的革命性创新:

1

梯度桥接(Gradient Bridging)把动作监督信号直接注入预训练主干,在底层表征上统一了“看、说、动”。就像人看到杯子掉了会下意识伸手去接,不需要经过“看到-理解-思考-动作”的漫长过程。

2

视觉对齐Tokenizer确保每一个动作Token都承载了明确的视觉语义。模型知道“拿起杯子”这个动作对应的视觉画面是什么,而不是在执行一串无意义的数字指令。

3

动作空间监督把训练重心聚焦于轨迹的整体结构,而不是每个关节的琐碎细节。就像人走路不会刻意想每一步迈多大,而是关注“要走到哪里”。

4

DMuon分布式优化通过底层系统优化,将异构计算开销降低了100倍。这意味着,这种复杂的训练配方不再是大厂的专利,普通实验室也能复现和改进。

行业里程碑:具身智能进入“可复现”新时代

目前,自变量机器人已经将Wall-OSS-0.5的模型权重、训练代码、数据集接口全栈开源。

这才是这次发布最有价值的地方。

行业分析人士指出,Wall-OSS-0.5的出现,重新定义了具身智能的开发范式:

从单纯追求“单项任务的成功率”,转向“通用物理直觉的迁移”。

在此之前,很多公司发布的具身模型,都因为闭源和不可复现,被质疑是“实验室玩具”。而Wall-OSS-0.5的开源,标志着具身智能基座模型正式进入了**“可复现、可验证、可挑战”**的新阶段。

全世界的研究者和开发者,都可以站在这个基础上继续前进。这将极大地加速通用机器人在复杂真实环境中的落地步伐。

未来已来:我们离真正的通用机器人还有多远?

打开网易新闻 查看精彩图片

Wall-OSS-0.5是0.5版本,不是最终答案。它还有很多不足:比如在极端复杂环境下的表现,长时间任务的稳定性,还有多机器人协作的能力。

但它迈出了最关键的一步。

想象一下未来:

工厂里的机器人,不需要再花几个月调试,只要用自然语言说“把这批零件组装起来”,它就能自己完成

家里的服务机器人,你说“把桌子收拾一下”,它就能识别不同的物品,分类整理到对应的地方

救援机器人,可以直接进入未知的灾难现场,根据实际情况自主决策,完成救援任务

这些曾经只存在于科幻电影里的场景,现在离我们只有一步之遥。

而这一次,中国科技公司走在了世界的最前沿。

最后问大家一个问题:

你觉得第一个真正普及的通用机器人,会出现在哪个行业?是制造业、服务业,还是家庭?

欢迎在评论区留下你的看法,我们一起聊聊