机器之心发布
刚刚,蔚蓝科技发布了新款机器狗。
外表看起来像 "玩具",但性能堪比服务器。
它不翻跟头,不跑障碍,过去五年行业 "卷" 的炫技,它没跟。
但它可能是消费级具身智能第一次真正配得上 "智能" 两个字的产品
早在 2023 年,这家公司就发布了全球首款家庭陪伴四足机器人 BabyAlpha,卖了 2.5 万多台。
有人觉得酷,有人觉得鸡肋。褒贬不一。
3 年后,他们把那些质疑都用技术砸了回去。
这代产品干了一件非常底层的事 —— 给机器狗装上一套超越人类的感知系统,外加一套能撑起端侧大模型的异构算力架构,相较上一代算力提升 1000 倍,对标英伟达 2,070 TFLOPS 算力的 Jetson AGX Thor T5000 芯片,但成本仅为英伟达的约 1/10
颠覆性创新之父 Clayton M. Christensen 曾说:"The next big thing will start out looking like a toy." (下一个颠覆时代的伟大事物,起初看上去都像一件玩具。)
今天,当我们谈论感知与思考的突破时,真正的指向并非一台更具噱头的机器狗,而是通用人工智能机器人的原点 —— 人造劳动力。
而这台万元级机器狗的背后,或许藏着 “人造劳动力” 从概念走向落地的关键一步。
国产算力方案如何撕开一道口子
先看行业现状。
四足机器人常用的几款芯片 ——RK3588、Orin NX、S100P—— 算力上限 6-128 TOPS(每秒万亿次操作)。
单芯片要同时跑视觉感知、3D 建图、运动控制、大模型交互、安全冗余,少说 5-6 个任务,根本分配不过来。
最直接的体现就是端侧大模型。
行业产品跑个 15 亿参数模型,TPS(每秒处理的 Token 数)最高也就 20 几;70 亿参数的,大多数直接跑不动。
参数稍微大一点就卡成 PPT,你跟它对话得等好几秒才有反应,还谈什么交互体验。可是参数要小的话,跑是跑得动了,但智能表现宛如 "智障"。
BabyAlpha A3 是怎么破这个局的?
它没有继续沿用行业通用的单芯片方案,而是搞了一套自己的具身智能边缘端混合异构计算集群
简单说,就是6 颗芯片分布式协同:2 颗 5 纳米 + 2 颗 8 纳米 + 2 颗 3D 堆叠,一共 22 核 CPU。
核心逻辑:不同任务分配给最擅长的芯片 ——5 纳米跑大模型推理,8 纳米处理感知数据,3D 堆叠管运动控制。三者通过高速总线互联,任务切换延迟控制在毫秒级。
对比行业主流方案,不是同一个量级。
15 亿参数 TPS,从行业最高的 23 飙到 617,70 亿参数 TPS 能到 280,意味着端侧大模型在消费级产品上第一次真正可用
数据声明
1: 以上参数均为各型号消费级旗舰款规格参数。
2: 本表格数据来源于各品牌官方网站产品页及技术文档中心 (2026 年 5 月获取)、第三方公开评测报告。如有误差,请联系更正。
3: 各产品持续迭代,配置以最新官方信息为准。
关键的是:这套方案完全采用国产芯片设计与制造工艺,突破了美国高端芯片、先进制程对国内企业的封锁。
对标英伟达 Jetson AGX Thor T5000(售价约 3000 美金),蔚蓝用国产方案实现更高算力,成本仅 300 余美金。
而这条路线一旦跑通,带来的不只是成本优势。
蔚蓝自研算法模型架构 + 蔚蓝自研算法模型架构 + 异构计算架构,实现了对传统 GPU 路线的效率代际领先:更高算力下成本仅为英伟达的约 1/10,同等成本下算力大幅领先。
这个技术路径的突破不止适用于机器人 ——它具备通用性,可以拓展到数据中心级大规模算力场景。
按照行业 12-18 个月算力成本下降一半的节奏,近 10 倍的成本效率优势意味着:把行业 3-4 年后的算力能力,提前拉到今天。
感知指标超人类:比人更安全自主行动的前提
算力突破是脑子,但光有脑子不够。
机器人要在家庭场景里安全行动,感知能力必须超过人类
不是 "接近人类",是超过。
人靠常识兜底 —— 拖鞋是软的、线缆不能踩、玻璃门要绕开,看不清也猜得到。
机器没有常识,感知不够就真的看不见、听不明,行动如 “摸瞎”。
行业现在是什么水平?
视觉 100-300 万像素、HDR 不到 90db,逆光暗光就糊。空间靠 16 线激光雷达,3-8 万点 / 秒,相当于马赛克地图导航。听觉单麦或 4 麦,定位声源基本做不到。
感知天花板太低,"看清" 都做不到,更别说 "看懂"。
BabyAlpha A3 是如何打破这一瓶颈的呢?
他们拿出了一套非常硬核的硬件配置:
数据声明
1: 以上参数均为各型号消费级旗舰款规格参数。
2: 本表格数据来源于各品牌官方网站产品页及技术文档中心 (2026 年 5 月获取)、第三方公开评测报告。如有误差,请联系更正。
3: 各产品持续迭代,配置以最新官方信息为准。
视觉:6600 万像素、HDR 140dB、480fps,多维度超过人眼
8K+4K+4K 三组高清摄像头,360 度环视,总像素 6600 万 —— 像素水平飙到行业平均水准的 30 + 倍!
HDR 140dB,超过人眼 100-120dB 的动态范围,逆光窗边、阴影交错处单帧内同时捕捉高光和暗部细节。
帧率最高 480fps,远超人眼 60fps,这意味着 A3 能以极致慢镜视野,清晰捕捉每一瞬的动态细节。
人眼约 200 度视野,脑后和侧面都是盲区。A3 能实现 360 度全覆盖,不需要 "回头" 就能感知身后环境。
空间感知:360° 环视面阵,从马赛克地图到厘米级 3D 地图
5 组 3D TOF 和 3D 结构光构成 360° 环视面阵,点云密度 223.2 万点 / 秒 —— 行业主流 3-8 万,几十倍差距。
8 万点看到模糊轮廓,223.2 万点能看清地板上的充电线、扁平的拖鞋、玻璃门半开的那条缝。
点云密度够高,才能构建厘米级精度的 3D 环境地图 —— 这不是 "看到了",是 "看清了、测准了、能导航了"。
自动测距、实时标注,自主导航的物理基础全靠这个精度。
听觉:12 麦立体阵列 —— 仿生猫头鹰,360 度声源精确定位
行业方案惯用 1-4 颗麦克风,只能判断声源大概方向。A3 用了 12 颗。
12 颗麦克风按 3D Mesh 拓扑分布在头部,不是平面排列,而是立体覆盖 —— 类似猫头鹰双耳左右不对称的原理,通过空间 "错位" 产生时间差和音量差,同时解算声源的方位角、俯仰角和距离,3D 空间中精确定位
定位之后是聚焦。波束成形在目标方向形成极窄波束,只收目标声源,其他方向全部抑制 —— 电视声、空调声、旁边人的聊天声,不影响它听你的。4~8kHz 儿童高频段衰减更小,孩子的高音调呼唤也认得准。
配合超声波雷达环形阵列,全球首次消费级量产应用
总之,感知系统的 “革命性” 创新,不是炫技,而是安全底线
机器没有常识兜底,感知必须比人更强,才可能在家庭里真正安全地自主行动。
当机器人的运动终于摆脱遥控和指令
行业过去五年卷的是运动 —— 翻跟头、跑障碍、后空翻,这些确实做到了。
但问题从来不是 "跑不动",而是 "不知道往哪跑"。
算力不够,自主导航跑不了复杂算法;感知不够,看不清环境细节,遇到透明物体就懵、碰到细小障碍就绕不开。
结果就是:运动能力很强,但只能用在遥控和简单场景下。用户评价 ——"不是不能用,是还不太好用"。
而从 "能跑" 到 "能用",差的不是运动参数,是自主能力。
数据声明
1: 以上参数均为各型号消费级旗舰款规格参数。
2: 本表格数据来源于各品牌官方网站产品页及技术文档中心 (2026 年 5 月获取)、第三方公开评测报告。如有误差,请联系更正。
3: 各产品持续迭代,配置以最新官方信息为准。
A3 的运动能力 ——3.5 m/s 最高速度、45° 爬坡、28cm 越障,参数尚佳却不咋稀奇,行业已经卷了好几年。
真正与众不同的是:全天候全自主智能。
过去四足机器人的运动参数再漂亮,也得人操控。
A3 靠算力调度和感知精度,在家庭里自主判断怎么过楼梯、过门槛、上斜坡。
行业里大多还停留在 “伪自主” 阶段:
要么依赖 UWB 测距 + 用户佩戴定位标签,一旦摘下标签,机器人就无法定位你;
要么是 “发指令→执行” 的半自主模式,你不主动操控,它就原地不动,和遥控玩具没有本质区别。
而 BabyAlpha A3,彻底告别了这些限制:
它不需要任何外部标签或基站,通过 360° 环视面阵,搭配超声波近场避障,由端侧 Physical AI 算法独立完成建图、定位与路径规划 —— 真正实现“自己看、自己认、自己走”,遇到障碍主动躲避绕行。
跟随体验也迎来了质的飞跃:它不再被动等待你的指令,而是主动适配你的节奏 —— 你加快脚步它就提速,你转弯它提前预判,始终跟在你身边,随需而动。
这种 “真自主” 的背后,是行业首次在消费级四足机器人上,打通感知、决策、运动三大子系统的全闭环。
安全不是加分项,是准入门槛
机器人进家庭,用户最关心的问题永远只有一个 ——安全吗?
行业现有的安全思路,基本是做加法:加急停按钮、加物理围栏、加碰撞检测。
本质是能力不够,用冗余来补。机器人看不清、想不明白,只能靠事后补救。
A3 的逻辑不同 —— 安全不是外挂的防护层,而是算力、感知、架构一体化设计的自然结果。
不是一句 "我们承诺不泄露" 的空话,而是从架构上让你不需要信任任何人的承诺:
- 物理安全—— 形态上消除隐患。关节全隐藏,夹不到,撞不伤。独立安全制动系统,故障时毫秒级响应
- 系统安全—— 端云双重守护。端侧 360 安全大脑拦住攻击,云端等保三级 + 阿里云 + Azure 护航
- 数据和隐私安全—— 算力在本地,数据不外传。每一步启动可验证,存着加密,传着加密
七年前,蔚蓝选择发力家庭机器人赛道 ——不是 Demo,不是展厅款,而是面向普通家庭真实使用场景 —— 有老人、小孩、宠物的那种。
七年七代产品,目前已有超 1 万活跃家庭使用产品,累计运行时长超 1500 万小时。
所有安全设计均来自真实用户反馈,突然窜出的猫、地上的拖鞋和线缆、蹒跚学步的小孩 —— 这些场景,实验室模拟不出来。
唯一的方法,是在真实家庭里一台一台跑,跑足够长的时间,积累足够多的 corner case,然后用这些 case 反过来迭代安全设计。
为什么是这家公司
说了这么多技术方案,一个自然的问题:为什么是蔚蓝科技先做到了?
行业或许不是不知道异构架构的潜力。
问题在于,异构计算集群没法靠集成来做——6 颗芯片的分布式调度、不同制程之间的数据通路、算力任务在不同芯片间的实时分配,这些东西没有现成方案可以买。
你得自己设计架构、自己选芯片、自己写调度、自己做底层集成。
任何一环外包,都调不通。这不是战略选择,是能力门槛。
这帮人干过类似的事。
创始人刘维超毕业于德国波恩大学人工智能机器人专业,曾以队长身份拿下 RoboCup 人形机器人国际三连冠。其核心技术团队来自宾夕法尼亚 GRASP Lab、UIUC AI Lab、哈工大等顶尖机构。
蔚蓝科技创始人曾带队拿下 RoboCup 三连冠
蔚蓝科技成立 7 年,机械、电子、执行器、软件、算法、智能体操作系统 —— 关键领域全部自研。
2021 年,第 2 代工程机 C200 打破美国 MIT 四足机器人奔跑速度世界纪录 —— 证明中国团队做得出顶尖运动控制
2022 年,国内首个四足机器人量产工厂建成投产,关键部件全部自主研发制造
2023 年,BabyAlpha 以手机价格带上市 —— 全世界第一款真正进入千家万户的机器狗
2024 年,全国首家消费级具身智能零售门店落地南京德基广场,产品完成规模化市场验证
2025 年,BabyAlpha 在家庭消费市场始终保持销量第一、使用时长第一、用户活跃度第一
初代 BabyAlpha 量产下线
这么多 "第一",蔚蓝不是拿来炫耀。每一个第一,都是在回答同一个问题:机器人怎么才能真正走进家庭。
而 BabyAlpha A3,就是这些问题走到今天给出的答案。
消费级量产,才是真正的 AI 炼金炉
蔚蓝坚定选择从消费级切入 —— 万元左右零售价,不依赖 ToB/ToG 先跑规模。
这是最难的路。
ToB/ToG 订单大、付款稳,但场景封闭、迭代慢。
消费级意味着:技术必须便宜到普通人买得起、可靠到普通人敢放在家里、聪明到普通人愿意天天用。
行业很多公司还在 Demo 阶段,蔚蓝已经卖出了 2.5 万多台(其中家庭用户占比 90%)。用户累计使用时长超9.5 亿分钟,累计交互次数超6,500 万次
这并不是简单的市场数据,而是一个飞轮的起点 ——
每卖出一台,真实场景数据就多一分,算法就迭代一步,产品就更聪明一程。
智能算法不是在实验室走廊里调的,是在真实家庭的拖鞋、线缆、玻璃门之间迭代出来的。
后发者要追赶的,不只是技术,是上万台设备先跑出来的真实世界经验。
“The next big thing will start out looking like a toy”
三年前有人说 BabyAlpha 是玩具,三年后我们或许正在见证这句话的后半段。
感知、算力、自主能力,A3 把这三条线第一次在消费级产品上拧成了一股绳。
不是实验室里的三个 demo,是同一台万元机器狗上的完整系统。
这意味着什么?
消费级具身智能的临界点,不在实验室,在普通人的客厅。
不是 "看起来像智能" 的遥控玩具,不是 "参数很好看" 但跑不动大模型的摆设,是一个普通家庭买得起、放在家里真正有用、每天用会越来越懂你的智能伙伴。
Q3正式上市,到时候见真章。
关注官方渠道获取更多新品资讯:
https://mp.weixin.qq.com/s/tVHOJiCf2Ot1qYVMP5sinA?scene=25#wechat_redirect
热门跟贴