消费级具身智能跨越式新品:算力提1000倍,对标英伟达Jetson Thor

机器之心Pro

2026-05-18 14:15 ·河北 ·《机器之心》官方网易号

机器之心发布

刚刚，蔚蓝科技发布了新款机器狗。

外表看起来像 "玩具"，但性能堪比服务器。

它不翻跟头，不跑障碍，过去五年行业 "卷" 的炫技，它没跟。

但它可能是消费级具身智能第一次真正配得上 "智能" 两个字的产品

早在 2023 年，这家公司就发布了全球首款家庭陪伴四足机器人 BabyAlpha，卖了 2.5 万多台。

有人觉得酷，有人觉得鸡肋。褒贬不一。

3 年后，他们把那些质疑都用技术砸了回去。

这代产品干了一件非常底层的事 —— 给机器狗装上一套超越人类的感知系统，外加一套能撑起端侧大模型的异构算力架构，相较上一代算力提升 1000 倍，对标英伟达 2,070 TFLOPS 算力的 Jetson AGX Thor T5000 芯片，但成本仅为英伟达的约 1/10

颠覆性创新之父 Clayton M. Christensen 曾说："The next big thing will start out looking like a toy." （下一个颠覆时代的伟大事物，起初看上去都像一件玩具。）

今天，当我们谈论感知与思考的突破时，真正的指向并非一台更具噱头的机器狗，而是通用人工智能机器人的原点 —— 人造劳动力。

而这台万元级机器狗的背后，或许藏着 “人造劳动力” 从概念走向落地的关键一步。

国产算力方案如何撕开一道口子

先看行业现状。

四足机器人常用的几款芯片 ——RK3588、Orin NX、S100P—— 算力上限 6-128 TOPS（每秒万亿次操作）。

单芯片要同时跑视觉感知、3D 建图、运动控制、大模型交互、安全冗余，少说 5-6 个任务，根本分配不过来。

最直接的体现就是端侧大模型。

行业产品跑个 15 亿参数模型，TPS（每秒处理的 Token 数）最高也就 20 几；70 亿参数的，大多数直接跑不动。

参数稍微大一点就卡成 PPT，你跟它对话得等好几秒才有反应，还谈什么交互体验。可是参数要小的话，跑是跑得动了，但智能表现宛如 "智障"。

BabyAlpha A3 是怎么破这个局的？

它没有继续沿用行业通用的单芯片方案，而是搞了一套自己的具身智能边缘端混合异构计算集群

简单说，就是6 颗芯片分布式协同：2 颗 5 纳米 + 2 颗 8 纳米 + 2 颗 3D 堆叠，一共 22 核 CPU。

核心逻辑：不同任务分配给最擅长的芯片 ——5 纳米跑大模型推理，8 纳米处理感知数据，3D 堆叠管运动控制。三者通过高速总线互联，任务切换延迟控制在毫秒级。

对比行业主流方案，不是同一个量级。

15 亿参数 TPS，从行业最高的 23 飙到 617，70 亿参数 TPS 能到 280，意味着端侧大模型在消费级产品上第一次真正可用

数据声明

1: 以上参数均为各型号消费级旗舰款规格参数。

2: 本表格数据来源于各品牌官方网站产品页及技术文档中心 (2026 年 5 月获取)、第三方公开评测报告。如有误差，请联系更正。

3: 各产品持续迭代，配置以最新官方信息为准。

关键的是：这套方案完全采用国产芯片设计与制造工艺，突破了美国高端芯片、先进制程对国内企业的封锁。

对标英伟达 Jetson AGX Thor T5000（售价约 3000 美金），蔚蓝用国产方案实现更高算力，成本仅 300 余美金。

而这条路线一旦跑通，带来的不只是成本优势。

蔚蓝自研算法模型架构 + 蔚蓝自研算法模型架构 + 异构计算架构，实现了对传统 GPU 路线的效率代际领先：更高算力下成本仅为英伟达的约 1/10，同等成本下算力大幅领先。

这个技术路径的突破不止适用于机器人 ——它具备通用性，可以拓展到数据中心级大规模算力场景。

按照行业 12-18 个月算力成本下降一半的节奏，近 10 倍的成本效率优势意味着：把行业 3-4 年后的算力能力，提前拉到今天。

感知指标超人类：比人更安全自主行动的前提

算力突破是脑子，但光有脑子不够。

机器人要在家庭场景里安全行动，感知能力必须超过人类

不是 "接近人类"，是超过。

人靠常识兜底 —— 拖鞋是软的、线缆不能踩、玻璃门要绕开，看不清也猜得到。

机器没有常识，感知不够就真的看不见、听不明，行动如 “摸瞎”。

行业现在是什么水平？

视觉 100-300 万像素、HDR 不到 90db，逆光暗光就糊。空间靠 16 线激光雷达，3-8 万点 / 秒，相当于马赛克地图导航。听觉单麦或 4 麦，定位声源基本做不到。

感知天花板太低，"看清" 都做不到，更别说 "看懂"。

BabyAlpha A3 是如何打破这一瓶颈的呢？

他们拿出了一套非常硬核的硬件配置：

数据声明

1: 以上参数均为各型号消费级旗舰款规格参数。

2: 本表格数据来源于各品牌官方网站产品页及技术文档中心 (2026 年 5 月获取)、第三方公开评测报告。如有误差，请联系更正。

3: 各产品持续迭代，配置以最新官方信息为准。

视觉：6600 万像素、HDR 140dB、480fps，多维度超过人眼

8K+4K+4K 三组高清摄像头，360 度环视，总像素 6600 万 —— 像素水平飙到行业平均水准的 30 + 倍！

HDR 140dB，超过人眼 100-120dB 的动态范围，逆光窗边、阴影交错处单帧内同时捕捉高光和暗部细节。

帧率最高 480fps，远超人眼 60fps，这意味着 A3 能以极致慢镜视野，清晰捕捉每一瞬的动态细节。

人眼约 200 度视野，脑后和侧面都是盲区。A3 能实现 360 度全覆盖，不需要 "回头" 就能感知身后环境。

空间感知：360° 环视面阵，从马赛克地图到厘米级 3D 地图

5 组 3D TOF 和 3D 结构光构成 360° 环视面阵，点云密度 223.2 万点 / 秒 —— 行业主流 3-8 万，几十倍差距。

8 万点看到模糊轮廓，223.2 万点能看清地板上的充电线、扁平的拖鞋、玻璃门半开的那条缝。

点云密度够高，才能构建厘米级精度的 3D 环境地图 —— 这不是 "看到了"，是 "看清了、测准了、能导航了"。

自动测距、实时标注，自主导航的物理基础全靠这个精度。

听觉：12 麦立体阵列 —— 仿生猫头鹰，360 度声源精确定位

行业方案惯用 1-4 颗麦克风，只能判断声源大概方向。A3 用了 12 颗。

12 颗麦克风按 3D Mesh 拓扑分布在头部，不是平面排列，而是立体覆盖 —— 类似猫头鹰双耳左右不对称的原理，通过空间 "错位" 产生时间差和音量差，同时解算声源的方位角、俯仰角和距离，3D 空间中精确定位

定位之后是聚焦。波束成形在目标方向形成极窄波束，只收目标声源，其他方向全部抑制 —— 电视声、空调声、旁边人的聊天声，不影响它听你的。4~8kHz 儿童高频段衰减更小，孩子的高音调呼唤也认得准。

配合超声波雷达环形阵列，全球首次消费级量产应用

总之，感知系统的 “革命性” 创新，不是炫技，而是安全底线

机器没有常识兜底，感知必须比人更强，才可能在家庭里真正安全地自主行动。

当机器人的运动终于摆脱遥控和指令

行业过去五年卷的是运动 —— 翻跟头、跑障碍、后空翻，这些确实做到了。

但问题从来不是 "跑不动"，而是 "不知道往哪跑"。

算力不够，自主导航跑不了复杂算法；感知不够，看不清环境细节，遇到透明物体就懵、碰到细小障碍就绕不开。

结果就是：运动能力很强，但只能用在遥控和简单场景下。用户评价 ——"不是不能用，是还不太好用"。

而从 "能跑" 到 "能用"，差的不是运动参数，是自主能力。

数据声明

1: 以上参数均为各型号消费级旗舰款规格参数。

2: 本表格数据来源于各品牌官方网站产品页及技术文档中心 (2026 年 5 月获取)、第三方公开评测报告。如有误差，请联系更正。

3: 各产品持续迭代，配置以最新官方信息为准。

A3 的运动能力 ——3.5 m/s 最高速度、45° 爬坡、28cm 越障，参数尚佳却不咋稀奇，行业已经卷了好几年。

真正与众不同的是：全天候全自主智能。

过去四足机器人的运动参数再漂亮，也得人操控。

A3 靠算力调度和感知精度，在家庭里自主判断怎么过楼梯、过门槛、上斜坡。

行业里大多还停留在 “伪自主” 阶段：

要么依赖 UWB 测距 + 用户佩戴定位标签，一旦摘下标签，机器人就无法定位你；

要么是 “发指令→执行” 的半自主模式，你不主动操控，它就原地不动，和遥控玩具没有本质区别。

而 BabyAlpha A3，彻底告别了这些限制：

它不需要任何外部标签或基站，通过 360° 环视面阵，搭配超声波近场避障，由端侧 Physical AI 算法独立完成建图、定位与路径规划 —— 真正实现“自己看、自己认、自己走”，遇到障碍主动躲避绕行。

跟随体验也迎来了质的飞跃：它不再被动等待你的指令，而是主动适配你的节奏 —— 你加快脚步它就提速，你转弯它提前预判，始终跟在你身边，随需而动。

这种 “真自主” 的背后，是行业首次在消费级四足机器人上，打通感知、决策、运动三大子系统的全闭环。

安全不是加分项，是准入门槛

机器人进家庭，用户最关心的问题永远只有一个 ——安全吗？

行业现有的安全思路，基本是做加法：加急停按钮、加物理围栏、加碰撞检测。

本质是能力不够，用冗余来补。机器人看不清、想不明白，只能靠事后补救。

A3 的逻辑不同 —— 安全不是外挂的防护层，而是算力、感知、架构一体化设计的自然结果。

不是一句 "我们承诺不泄露" 的空话，而是从架构上让你不需要信任任何人的承诺：

物理安全—— 形态上消除隐患。关节全隐藏，夹不到，撞不伤。独立安全制动系统，故障时毫秒级响应
系统安全—— 端云双重守护。端侧 360 安全大脑拦住攻击，云端等保三级 + 阿里云 + Azure 护航
数据和隐私安全—— 算力在本地，数据不外传。每一步启动可验证，存着加密，传着加密

七年前，蔚蓝选择发力家庭机器人赛道 ——不是 Demo，不是展厅款，而是面向普通家庭真实使用场景 —— 有老人、小孩、宠物的那种。

七年七代产品，目前已有超 1 万活跃家庭使用产品，累计运行时长超 1500 万小时。

所有安全设计均来自真实用户反馈，突然窜出的猫、地上的拖鞋和线缆、蹒跚学步的小孩 —— 这些场景，实验室模拟不出来。

唯一的方法，是在真实家庭里一台一台跑，跑足够长的时间，积累足够多的 corner case，然后用这些 case 反过来迭代安全设计。

为什么是这家公司

说了这么多技术方案，一个自然的问题：为什么是蔚蓝科技先做到了？

行业或许不是不知道异构架构的潜力。

问题在于，异构计算集群没法靠集成来做——6 颗芯片的分布式调度、不同制程之间的数据通路、算力任务在不同芯片间的实时分配，这些东西没有现成方案可以买。

你得自己设计架构、自己选芯片、自己写调度、自己做底层集成。

任何一环外包，都调不通。这不是战略选择，是能力门槛。

这帮人干过类似的事。

创始人刘维超毕业于德国波恩大学人工智能机器人专业，曾以队长身份拿下 RoboCup 人形机器人国际三连冠。其核心技术团队来自宾夕法尼亚 GRASP Lab、UIUC AI Lab、哈工大等顶尖机构。

蔚蓝科技创始人曾带队拿下 RoboCup 三连冠

蔚蓝科技成立 7 年，机械、电子、执行器、软件、算法、智能体操作系统 —— 关键领域全部自研。

2021 年，第 2 代工程机 C200 打破美国 MIT 四足机器人奔跑速度世界纪录 —— 证明中国团队做得出顶尖运动控制

2022 年，国内首个四足机器人量产工厂建成投产，关键部件全部自主研发制造

2023 年，BabyAlpha 以手机价格带上市 —— 全世界第一款真正进入千家万户的机器狗

2024 年，全国首家消费级具身智能零售门店落地南京德基广场，产品完成规模化市场验证

2025 年，BabyAlpha 在家庭消费市场始终保持销量第一、使用时长第一、用户活跃度第一

初代 BabyAlpha 量产下线

这么多 "第一"，蔚蓝不是拿来炫耀。每一个第一，都是在回答同一个问题：机器人怎么才能真正走进家庭。

而 BabyAlpha A3，就是这些问题走到今天给出的答案。

消费级量产，才是真正的 AI 炼金炉

蔚蓝坚定选择从消费级切入 —— 万元左右零售价，不依赖 ToB/ToG 先跑规模。

这是最难的路。

ToB/ToG 订单大、付款稳，但场景封闭、迭代慢。

消费级意味着：技术必须便宜到普通人买得起、可靠到普通人敢放在家里、聪明到普通人愿意天天用。

行业很多公司还在 Demo 阶段，蔚蓝已经卖出了 2.5 万多台（其中家庭用户占比 90%）。用户累计使用时长超9.5 亿分钟，累计交互次数超6,500 万次

这并不是简单的市场数据，而是一个飞轮的起点 ——

每卖出一台，真实场景数据就多一分，算法就迭代一步，产品就更聪明一程。

智能算法不是在实验室走廊里调的，是在真实家庭的拖鞋、线缆、玻璃门之间迭代出来的。

后发者要追赶的，不只是技术，是上万台设备先跑出来的真实世界经验。

“The next big thing will start out looking like a toy”

三年前有人说 BabyAlpha 是玩具，三年后我们或许正在见证这句话的后半段。

感知、算力、自主能力，A3 把这三条线第一次在消费级产品上拧成了一股绳。

不是实验室里的三个 demo，是同一台万元机器狗上的完整系统。

这意味着什么？

消费级具身智能的临界点，不在实验室，在普通人的客厅。

不是 "看起来像智能" 的遥控玩具，不是 "参数很好看" 但跑不动大模型的摆设，是一个普通家庭买得起、放在家里真正有用、每天用会越来越懂你的智能伙伴。

Q3正式上市，到时候见真章。

关注官方渠道获取更多新品资讯:

https://mp.weixin.qq.com/s/tVHOJiCf2Ot1qYVMP5sinA?scene=25#wechat_redirect

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴