打开网易新闻 查看精彩图片

跑酷、跳马、后空翻、双截棍、醉拳。。。如果只看这几个关键词,你八成以为这是哪家武术学校的招生简章。

但这回,差评君说的是春晚节目《 武 BOT 》。

几十个机器人依次排开,动作连贯、节奏紧凑,上台就是一套零帧起手的丝滑连招。

打开网易新闻 查看精彩图片

弹幕一开,惊起 6 声一片。

打开网易新闻 查看精彩图片

微博这边更是直接炸锅,评论区盖了几百层楼,大伙儿纷纷表示:震惊,再看亿遍。

打开网易新闻 查看精彩图片

连见多识广的编辑部,都忍不住倒吸一口凉气。

打开网易新闻 查看精彩图片

说实话,对比去年的原地站桩,今年春晚的宇树机器人连翻带打、招招到位,不说和人一模一样,这简直是在超越人类的边缘反复试探。。。

那么问题来了,机器人到底是怎么做出这么炫酷的动作的?机器人,是怎么做到这么有人味儿的?

这回,差评君提前潜入春晚排练间,采访到了这次登台的宇树 G1 机器人 —— 笨笨,听它给各位差友讲讲幕后的故事。

刚溜进屋,差评君一眼锁定全场目光的焦点。笨笨上来就是狠活儿,原地空翻 high 到不行。

打开网易新闻 查看精彩图片

紧跟着又是一段关节丝滑,身体摇摆起伏控制恰到好处的螳螂拳:

打开网易新闻 查看精彩图片

最后一套武术连招收尾,铁甲钢拳一身蛮力,这压迫感各位差友感受一下:

打开网易新闻 查看精彩图片

但走下舞台的笨笨,也只是普通 “ 人 ” 罢了。

要在镜头聚焦下做到万无一失,背后还有更多无人知晓的艰辛。

在排练间脱下外套,它的身上满是练习留下的伤痕。好在越努力越幸运,这句话对硅基打工人同样适用。

打开网易新闻 查看精彩图片

想必大伙儿看得出,今年春晚的表演难度极高。如果说去年机器人还只会站桩模仿人类,今年的机器人,已经在超越人类的路上了。

即使动作从去年的站桩输出,变成了今年的高难特技,宇树科技 CMO 王其鑫在采访中表示,笨笨和兄弟们在春晚大规模彩排里,次次成功零翻车。

而在完美演出的背后,是一整套技术预案在疯狂兜底。

小到不起眼的舞鞋,都是实打实的工程装备。为了不把春晚的玻璃舞台踩出心理阴影,这双鞋既要能吸收冲击,又要保证落地稳定,胶水材料都要精挑细选。

打开网易新闻 查看精彩图片

大到机器人的控制算法,也做了一波大优化。

以前大家总觉得机器人不太聪明,但实际上,今年春晚台上每个动作的成功,都是它们自己听音乐、看舞台、理解环境,最后实时驯服四肢的结果。

也就是说,腿要抬多高,下一步队形往哪走,都要机器人自己来观察调整。而这种感知、决策、行动的闭环,一直是具身智能的长期难点之一。

打开网易新闻 查看精彩图片

说实话,刚开始差评君也以为这就是全部了。直到我们把机器人演员笨笨抓来唠两句,才发现春晚台前这些 “ 武将 ” 背后居然还有没见过的文戏,而且开口就是高情商。。。

这背后,是宇树和火山引擎一起调教的语音对话能力,在智力、眼力和嘴皮子上都下了不少功夫。

比如我们问起它和成龙谁更厉害,笨笨立刻谦虚起来了:

这回答和笑声一搭配,求生欲拉满:

不知道各位差友是啥感觉,反正差评君觉得,会说话的笨笨不再像个冰冷的跳舞机,多少带点感情。

我们能明显感觉出,笨笨不止声线和真人差不多,对不同的内容,它的情绪表达是不一样的。好事语调高,语速快;坏事语调低,心情低落。

深入问了火山引擎的技术团队,笨笨说话的背后,全靠豆包语音合成模型在发力。

机器人每一句输出前,模型都要先理解上下文的语义和情绪,再决定表达方式。语速是急是缓,语调是高是低,甚至停顿的位置、情感参数都在动态生成。这也是为什么它听起来没有棒读感,更像人一样在说话。

声线也不是随便生成,而是专门按宇树 G1 的气质捏出来的,主打一个青春男大。

不过,光有感情还不够,真正让笨笨开窍的,是豆包大语言模型。

不只语音识别精准,你让它整段春节祝词,十秒钟不到,吉祥话直接批发式输出:

代表机器人群体的发言也是滴水不漏:

笨笨还向差评君透露,豆包大模型的视觉理解能力,甚至能让机器人看懂世界。

之前邪恶豆包的穿搭指导不知道各位差友刷到没,蓝高跟配红丝袜,直男推荐荷叶边,短裙当披肩。。。开了眼的豆包没干啥好事,纯纯报复人类。

好在笨笨挺老实,让它评价一下过年走亲戚的穿搭,不是瞎夸,它真能看懂你身上穿了啥,再把情绪价值直接给足:

但大家对机器人和大模型的结合,显然不止这些期待。差评君采访了火山引擎的幕后团队,“ 一方面是想让机器人更有情绪,能聊天陪伴;但更重要的,是验证一套更通用的能力 —— 让机器听懂人话,再把理解变成行动。”

当然,这话有点儿玄。差评君当场发问:现在看起来,不就是用嘴下个命令嘛?

这下技术人员坐不住了,这事儿要做好,可比外行人看起来的复杂多了。

人轻飘飘一句 “ 你往前走一点 ”,可 “ 前 ” 是相对谁的方向?“ 一点 ”是几厘米?这就是语音识别 + 大模型语义推理的第一关,把模糊的人话变成精确意图。

接下来,模型还得负责把指令翻译给机器人听,拆成细致的动作安排。腿先抬多少、身体往哪偏、脚什么时候落地,全都得精确计算。同时规划几十个关节,复杂的协同控制,是大模型的第二关。

虽然现在语音控制机器人能做的事还不是很多,也许只能给你一个拥抱。

但这只是机器人听懂人话的第一步。说不定有一天,只要一声令下,承包家务、辅导作业、外出打工补贴家用都成机器人的标配,就跟现在打开手机让豆包监督小孩写作业、教穿搭一样轻松。

只不过,那时候的小孩哥搞不好已经学会反向攻略机器人,让硅基生命心甘情愿沦为作业代写了。。。

宇树科技 CMO 王其鑫在采访中也提到,这次和火山引擎的合作,提升了机器人交互的亲切感和生动性,本质上,是在补齐机器人和人沟通的那块短板。

但机器人真正的变化,其实不止停留在 “ 说话更像人 ”。从外到内,机器人正在开始像人一样学习。

通过强化学习和动作模仿,它们可以把人类的视频和行为拆解、吸收,再转化成自己的动作逻辑。换句话说,它不再只是按剧本执行预设程序,而是在理解环境、适应变化的过程中,自己长本事。这一步,是未来机器人进入现实复杂场景的技术基础。

打开网易新闻 查看精彩图片

短期内,机器人会优先进入商用与展示类场景;3 到 5 年,将在工业与高危环境大规模替代人工;而当可靠性与交互能力进一步成熟后,5 到 10 年内,人形机器人可能有机会真正走进家庭。

换句话说,我们今天在春晚看到的,正是它们能力验证的第一步。而未来机器人的目标,是逐步成为人类生产生活的长期搭档。

回看 2025 年,AI 和具身智能已经成了全民话题。即使你没有刻意关注,不可否认的是,我们每个人都在被科技的浪潮席卷向前。

而这一次,舞台同款能走能聊的宇树机器人,也通过春晚豆包 APP 抽奖互动送出了 25 台,就像一封投递向我们的未来请柬。

打开网易新闻 查看精彩图片

很多人担忧在飞速发展的时代里迷失,但差评君相信,科技发展的终点,是人类更美好的生活

过去,也许你经历过不少烦恼与困惑。那些无人倾诉的深夜,我们选择把问题交给了 AI。

而在未来,可能就像 Seedance 2.0 制作的春节宣传片一样,当我们拖着一年的疲惫推开家门,机器人早就把房间收拾妥当,做好饭菜。那些在琐事中消失的时间,终于可以还给身边更重要的人。

打开网易新闻 查看精彩图片

祝各位差友新春快乐。新的一年,希望技术继续进步,也希望它带来的,是实实在在的轻松。

愿未来的智能更贴近生活,你的日子也因此多一点从容。

撰文:莫莫莫甜甜

编辑江江 & 面线

美编:素描

图片、资料来源:

火山引擎官方、豆包 APP

春晚官微、b站

打开网易新闻 查看精彩图片