你敢信吗,看起来就是个高级玩具的机器狗,居然把困住整个消费级机器人行业多年的算力问题给解决了。要知道之前多少玩家卡在这儿,连70亿参数的大模型都跑不起来,更别说放进普通家庭日常用了。这次新出的威宾阿尔法A3,路子野得很,根本不跟着别人卷空翻跑酷,专啃最核心的硬骨头。
现在市面上大部分四足机器人,用的芯片算力上限也就6到128TOPS。一颗芯片要同时扛视觉处理、3D建图、运动控制、跑大模型还要留安全冗余,五六个高负载活儿堆一块儿,根本忙不过来。别说70亿参数的大模型,很多产品连门儿都摸不到,算力就是勒住机器人智能的紧箍咒,摘不掉就别想真正走进家庭。
A3没跟风用大家都用的单芯片方案,搞了个六颗芯片分布式协同工作的混合异构计算集群。六颗芯片里有两颗5纳米、两颗8纳米,还有两颗3D堆叠芯片,加起来一共22个CPU核心。说白了就是不同的活儿分给最擅长它的芯片干,专业芯片干专业事儿,各司其职配合起来效率拉满。
这么搞下来,A3在机器狗本体端侧就能流畅运行70亿参数的大模型,整体算力直接干到了280TOPS以上。更提气的是,这套高性能方案完全国产,直接打破了国外高端芯片的封锁。对标英伟达Jetson AGX Orin,在多模型输出速度等好几个关键指标上都明显领先,成本才只有人家方案的十分之一,核心部分算下来才110,这价格谁看了不心动。
算力够了只是基础,机器狗要在真实的家庭环境里安全自由行动,眼睛和耳朵得比人类还敏锐才行。A3的视觉系统有6600万像素,支持HDR,帧率能达到480fps,直接超越了人眼的极限。对比行业平均才200万像素的水平,这差了整整30倍,啥概念?原来同行看东西是打了马赛克,它看就是无压缩的高清大片。
空间感知这块它每秒能输出223.2万个点云,行业主流水平才每秒3万到8万个点。差了几十倍的差距,相当于从看VCD直接飞跃到了看高清IMAX。家里地板上的细充电线、放在地上的薄拖鞋、玻璃门半开的那条细缝,这些人类都容易忽略的小细节,它看得一清二楚。
除了眼睛好使,它还首创了“十二脉仿生立体听觉”系统。能在3D空间里精准定位声源的位置。家里开着电视吹着空调,旁边还有人聊天,也不耽误它找准你说话的方向,准确接收到你的指令。
之前整个行业都在卷运动能力,比谁翻的跟头高,比谁过障碍快,可实际上机器狗要进家庭,根本不需要你天天翻跟头耍帅。问题从来不是跑不动,是不知道该往哪儿跑。A3走的完全是另一条路,它靠纯视觉就能实现自主导航,还能持续感知做到自主跟随。
不用提前铺设二维码,也不需要人手一直拿着遥控器操控,你走到哪儿它就能跟到哪儿,还能智能避开沿途的所有障碍。这是第一次,算力、感知、决策、运动四个核心子系统,在消费级具身智能产品上凑出了完整的智能闭环。
能做出这个突破的是蔚蓝科技,这家公司做这行整整七年,没瞎蹭热度赶风口,干了件看起来很“笨”的事儿。从机械、电子、执行器到软件算法、大模型、智能体、操作系统,七个核心技术领域全都是自研,一点没偷懒得过且过。
前两代产品已经有超过2.5万台在真实家庭中运行,积累了9.5亿分钟的使用时长和650万次人机交互数据。这些数据不是实验室里模拟出来的,是消费级具身智能产品能拿到的最真实、最宝贵的行业数据,这就是他们敢啃硬骨头的底气。
创新理论里有个说法,颠覆性技术最初看起来都像玩具。三年前好多人说机器狗就是骗钱的玩具,只能摆着拍照根本没用。放到现在来看,这句话的后半段说不定就要应验了。
当算力和感知不再是限制,四足机器人凭借更高的“价值价格比”,能更快搭建起具身通用人工智能的技术栈。往远了说,这条路最终指向的就是能帮人分担事务的“人造劳动力”。之前想都不敢想的落地普及,说不定真的要从机器狗这儿打开缺口。
这次的威宾阿尔法A3预计今年第三季度正式上市,到底是真突破还是炒概念,市场到时候会给出最真实的答案。现在只能说,国产机器人这次玩真的,把成本打下来,把技术提上去,消费级具身智能的拐点,说不定真的已经在眼前了。
参考资料:澎湃新闻 国产四足机器人突破算力封锁 入局消费级具身智能
热门跟贴