我们采访了春晚秀武术的宇树机器人，发现它还挺有人味儿的。。。

差评XPIN

2026-02-17 00:07 ·浙江 ·知否计划特邀作者·《差评》官方网易号

跑酷、跳马、后空翻、双截棍、醉拳。。。如果只看这几个关键词，你八成以为这是哪家武术学校的招生简章。

但这回，差评君说的是春晚节目《武 BOT 》。

几十个机器人依次排开，动作连贯、节奏紧凑，上台就是一套零帧起手的丝滑连招。

弹幕一开，惊起 6 声一片。

微博这边更是直接炸锅，评论区盖了几百层楼，大伙儿纷纷表示：震惊，再看亿遍。

连见多识广的编辑部，都忍不住倒吸一口凉气。

说实话，对比去年的原地站桩，今年春晚的宇树机器人连翻带打、招招到位，不说和人一模一样，这简直是在超越人类的边缘反复试探。。。

那么问题来了，机器人到底是怎么做出这么炫酷的动作的？机器人，是怎么做到这么有人味儿的？

这回，差评君提前潜入春晚排练间，采访到了这次登台的宇树 G1 机器人 —— 笨笨，听它给各位差友讲讲幕后的故事。

刚溜进屋，差评君一眼锁定全场目光的焦点。笨笨上来就是狠活儿，原地空翻 high 到不行。

紧跟着又是一段关节丝滑，身体摇摆起伏控制恰到好处的螳螂拳：

最后一套武术连招收尾，铁甲钢拳一身蛮力，这压迫感各位差友感受一下：

但走下舞台的笨笨，也只是普通 “ 人 ” 罢了。

要在镜头聚焦下做到万无一失，背后还有更多无人知晓的艰辛。

在排练间脱下外套，它的身上满是练习留下的伤痕。好在越努力越幸运，这句话对硅基打工人同样适用。

想必大伙儿看得出，今年春晚的表演难度极高。如果说去年机器人还只会站桩模仿人类，今年的机器人，已经在超越人类的路上了。

即使动作从去年的站桩输出，变成了今年的高难特技，宇树科技 CMO 王其鑫在采访中表示，笨笨和兄弟们在春晚大规模彩排里，次次成功零翻车。

而在完美演出的背后，是一整套技术预案在疯狂兜底。

小到不起眼的舞鞋，都是实打实的工程装备。为了不把春晚的玻璃舞台踩出心理阴影，这双鞋既要能吸收冲击，又要保证落地稳定，胶水材料都要精挑细选。

大到机器人的控制算法，也做了一波大优化。

以前大家总觉得机器人不太聪明，但实际上，今年春晚台上每个动作的成功，都是它们自己听音乐、看舞台、理解环境，最后实时驯服四肢的结果。

也就是说，腿要抬多高，下一步队形往哪走，都要机器人自己来观察调整。而这种感知、决策、行动的闭环，一直是具身智能的长期难点之一。

说实话，刚开始差评君也以为这就是全部了。直到我们把机器人演员笨笨抓来唠两句，才发现春晚台前这些 “ 武将 ” 背后居然还有没见过的文戏，而且开口就是高情商。。。

这背后，是宇树和火山引擎一起调教的语音对话能力，在智力、眼力和嘴皮子上都下了不少功夫。

比如我们问起它和成龙谁更厉害，笨笨立刻谦虚起来了：

这回答和笑声一搭配，求生欲拉满：

不知道各位差友是啥感觉，反正差评君觉得，会说话的笨笨不再像个冰冷的跳舞机，多少带点感情。

我们能明显感觉出，笨笨不止声线和真人差不多，对不同的内容，它的情绪表达是不一样的。好事语调高，语速快；坏事语调低，心情低落。

深入问了火山引擎的技术团队，笨笨说话的背后，全靠豆包语音合成模型在发力。

机器人每一句输出前，模型都要先理解上下文的语义和情绪，再决定表达方式。语速是急是缓，语调是高是低，甚至停顿的位置、情感参数都在动态生成。这也是为什么它听起来没有棒读感，更像人一样在说话。

声线也不是随便生成，而是专门按宇树 G1 的气质捏出来的，主打一个青春男大。

不过，光有感情还不够，真正让笨笨开窍的，是豆包大语言模型。

不只语音识别精准，你让它整段春节祝词，十秒钟不到，吉祥话直接批发式输出：

代表机器人群体的发言也是滴水不漏：

笨笨还向差评君透露，豆包大模型的视觉理解能力，甚至能让机器人看懂世界。

之前邪恶豆包的穿搭指导不知道各位差友刷到没，蓝高跟配红丝袜，直男推荐荷叶边，短裙当披肩。。。开了眼的豆包没干啥好事，纯纯报复人类。

好在笨笨挺老实，让它评价一下过年走亲戚的穿搭，不是瞎夸，它真能看懂你身上穿了啥，再把情绪价值直接给足：

但大家对机器人和大模型的结合，显然不止这些期待。差评君采访了火山引擎的幕后团队，“ 一方面是想让机器人更有情绪，能聊天陪伴；但更重要的，是验证一套更通用的能力 —— 让机器听懂人话，再把理解变成行动。”

当然，这话有点儿玄。差评君当场发问：现在看起来，不就是用嘴下个命令嘛？

这下技术人员坐不住了，这事儿要做好，可比外行人看起来的复杂多了。

人轻飘飘一句 “ 你往前走一点 ”，可 “ 前 ” 是相对谁的方向？“ 一点 ”是几厘米？这就是语音识别 + 大模型语义推理的第一关，把模糊的人话变成精确意图。

接下来，模型还得负责把指令翻译给机器人听，拆成细致的动作安排。腿先抬多少、身体往哪偏、脚什么时候落地，全都得精确计算。同时规划几十个关节，复杂的协同控制，是大模型的第二关。

虽然现在语音控制机器人能做的事还不是很多，也许只能给你一个拥抱。

但这只是机器人听懂人话的第一步。说不定有一天，只要一声令下，承包家务、辅导作业、外出打工补贴家用都成机器人的标配，就跟现在打开手机让豆包监督小孩写作业、教穿搭一样轻松。

只不过，那时候的小孩哥搞不好已经学会反向攻略机器人，让硅基生命心甘情愿沦为作业代写了。。。

宇树科技 CMO 王其鑫在采访中也提到，这次和火山引擎的合作，提升了机器人交互的亲切感和生动性，本质上，是在补齐机器人和人沟通的那块短板。

但机器人真正的变化，其实不止停留在 “ 说话更像人 ”。从外到内，机器人正在开始像人一样学习。

通过强化学习和动作模仿，它们可以把人类的视频和行为拆解、吸收，再转化成自己的动作逻辑。换句话说，它不再只是按剧本执行预设程序，而是在理解环境、适应变化的过程中，自己长本事。这一步，是未来机器人进入现实复杂场景的技术基础。

短期内，机器人会优先进入商用与展示类场景；3 到 5 年，将在工业与高危环境大规模替代人工；而当可靠性与交互能力进一步成熟后，5 到 10 年内，人形机器人可能有机会真正走进家庭。

换句话说，我们今天在春晚看到的，正是它们能力验证的第一步。而未来机器人的目标，是逐步成为人类生产生活的长期搭档。

回看 2025 年，AI 和具身智能已经成了全民话题。即使你没有刻意关注，不可否认的是，我们每个人都在被科技的浪潮席卷向前。

而这一次，舞台同款能走能聊的宇树机器人，也通过春晚豆包 APP 抽奖互动送出了 25 台，就像一封投递向我们的未来请柬。

很多人担忧在飞速发展的时代里迷失，但差评君相信，科技发展的终点，是人类更美好的生活。

过去，也许你经历过不少烦恼与困惑。那些无人倾诉的深夜，我们选择把问题交给了 AI。

而在未来，可能就像 Seedance 2.0 制作的春节宣传片一样，当我们拖着一年的疲惫推开家门，机器人早就把房间收拾妥当，做好饭菜。那些在琐事中消失的时间，终于可以还给身边更重要的人。

祝各位差友新春快乐。新的一年，希望技术继续进步，也希望它带来的，是实实在在的轻松。

愿未来的智能更贴近生活，你的日子也因此多一点从容。

撰文：莫莫莫甜甜

编辑：江江 & 面线

美编：素描

图片、资料来源：

火山引擎官方、豆包 APP

春晚官微、b站

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴