作者|林易
编辑|重点君
科技巨头间的AI大战,正在从基础模型、手机端超级入口,迅速烧向AI硬件。
阿里、OpenAI两家分别代表全球最强开源与闭源模型阵营的巨头,都在加速发力AI硬件生态。据阿里内部人士透露,千问计划年内推出多种形态的硬件产品,除即将上市的千问AI眼镜外,还会陆续发布AI指环、AI耳机等产品,并面向全球市场发售。
无独有偶,多方消息显示AI硬件同样是OpenAI 2026年的核心战略之一。近期,据The Information爆料,OpenAI正在开发一款配备摄像头的智能音箱,并支持类似苹果Face ID的人脸识别。此前,OpenAI已被曝出正在开发智能眼镜、智能灯、甚至可穿戴别针等多种形态的设备,其硬件团队规模已达200人,且仍在疯狂扩张。
放眼全球市场,Meta、Google等科技巨头纷纷加码AI消费级硬件。目前,AI硬件市场正在以三位数的年化增长率迅速扩大。
根据IDC预计,2025年全球AI可穿戴设备出货量同比增长达到127%,其中AI智能眼镜出货量同比增长超过300%,预计2026年全球AI消费级硬件市场规模将突破500亿美元,未来五年复合年增长率将保持在80%以上。Canalys的数据同样显示,2025年第四季度,全球支持端侧AI的可穿戴设备出货量占比已达到42%,预计2026年底这个比例将超过70%。
趋势已经非常明显,AI硬件正在成为APP之后,决定AI终局的第二核心入口
困在屏幕的AI,需要感知物理世界的“器官”
手机APP是AI触达消费者的初始形态,但并非终局。作为移动互联网时代的超级入口,手机无法完整覆盖AI全场景需求。
比如,用户开车时想订咖啡,逛街时想查看餐厅评价,户外运动时想规划返程路线,拿出手机操作的过程,要么存在安全隐患,要么破坏了当下的场景体验,这些都是手机形态无法突破的场景限制。
要让AI真正成为像水电煤一样无处不在的基础设施,需要让AI能够参与并读懂物理世界,而硬件正是AI感知物理世界的“器官”。
目前行业的广泛共识是:短期内手机仍是绝对主力,但以AI眼镜、AI耳机为代表的解放双手的硬件正蓬勃发展。长期来看,以语音和视觉为主的语言用户界面(LUI)有望取代图形用户界面(GUI),推动全新的硬件形态诞生。
这也意味着,未来AI入口的竞争态势,注定是手机APP与多形态硬件的全方位较量。抢占AI硬件,就是抢占通往下一个时代的船票。
如果将AI的任务执行场景划分为数字世界与物理世界两个维度。在数字世界中“办事”,核心考验的是底层模型的智力水平,包括coding能力、上下文理解以及多模态处理能力。当这些能力达到领先标准时,AI在解题、编写代码、做研报等生产力场景下的表现会得到极大加强 。
然而,一旦涉足物理世界,仅靠基模的智力水平便显得捉襟见肘。AI硬件的真正价值在于“软硬结合”,硬件作为24小时在线的传感器,高频采集物理世界数据,有效解决大模型上下文缺失问题。
阿里计划年内推出多种形态的硬件产品,核心目标就是让千问跳出单一的手机屏幕限制,去捕获更多物理世界的信息,并在复杂的生活场景中理解用户意图。通过AI眼镜、耳机、指环等设备,千问能够深入真实世界感知,通过对大量模糊的用户需求和多模态信息的捕捉与交互验证,迅速提升千问“办事”的效率和准确性。
最新消息是,在即将在西班牙巴塞罗那举行的2026年世界移动通信大会(MWC)上,千问将正式发布首款同名AI眼镜。这标志着阿里正在将千问打造为软硬一体、跨多种终端形态的AI助手。在这一构想下,千问APP中业已成熟的点外卖、打车等能力,也将无缝连接至千问AI眼镜等终端设备。
从Chat到Agent,“办事”能力决定胜负
2023年,ChatGPT开启了通用人工智能的商业化元年,初期的竞争主要集中在基础大模型的技术迭代与云端能力的建设上。随后,战火蔓延至C端,手机APP成为各家争夺用户的核心阵地,日活跃用户数(DAU)一度被视为衡量AI产品竞争力的核心指标。
但行业很快转变得更为理性。纯对话式AI APP难以成为用户的刚性高频需求,无法深度嵌入日常的生活与工作流。用户需要的从来不是“能聊天的AI”,而是“能办事的AI”。
在刚刚过去的春节,国内三大互联网巨头投入百亿资金掀起了规模空前的AI战役。但行业在经历了初期的流量狂欢后意识到:目前主流的AI产品如果服务1亿日活用户,每天的模型推理成本高达几千万元。如果大模型始终停留在聊完就走的形态,AI就只能是一个消耗巨额算力的成本中心。
千问在春节期间的表现,揭示了用户习惯和AI价值重心的转移——从Chat为代表的聊天对话,转向Agent为代表的任务执行。
数据显示,春节活动期间,全国超过1.3亿人第一次体验了AI购物。用户在千问上“一句话下单”近2亿次,全国平均每10人中就有1人在千问完成下单,跃升国民级AI助手。QuestMobile的数据进一步指出,2月7日千问DAU达到7352万,逼近行业第一的7871万规模,用3个月时间追平了后者3年的用户积累。
相比传统的点选式下单,“一句话下单”极大简化了交互逻辑,仅需2-3轮对话即可完成任务,比传统操作节省了超过50%的步骤。例如在购买电影票时,千问能在两轮对话内完成推荐、选座、购票及支付的完整动作。面对一次性提出滑雪、漂流、看极光等五种玩法的复杂旅行需求,千问更能直接生成涵盖交通、酒店、景点门票的完整出行方案并关联订单。
千问之所以能“办事”,并实现活跃用户的大幅跃升,背后是其依托阿里生态完成的商业模式重构。通过将AI能力无缝融入买奶茶、订机票、看电影等日常高频生活场景,千问打通了从需求识别到线下真实履约的完整链路。这种极低门槛的交互方式,有效触达了非传统科技受众;仅在春节期间,就有超过400万的60岁以上用户使用千问帮忙下单,享受到了AI生活带来的实质便利。
千问双王牌:“多终端入口”与“强办事能力”
前端极简的“一句话下单”体验,离不开后端硬核的技术支撑,千问的底气来自于阿里不断迭代的基础模型、持续繁荣的开源生态和全栈护城河。
在底层模型端,阿里于2月16日除夕当天,正式开源了全新一代大模型千问Qwen3.5-Plus。该版本实现了底层模型架构的全面革新,总参数量达到3970亿,激活仅170亿。凭借以小胜大的架构设计,其性能足以媲美Gemini 3 Pro,部署显存占用大幅降低了60%,最大推理吞吐量可提升至19倍。此外,Qwen3.5-Plus的API调用价格每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。
在开源生态方面,阿里已开源400多个千问模型,覆盖全尺寸与全模态。目前,千问全球下载量突破10亿次,基于其开发的衍生模型超20万,稳固了全球第一开源模型的地位。为适应全球化扩张,千问3.5扩展支持了201种语言,将词表大小从15万扩展到25万,最高可提升小语种60%的编码效率。
让AI在物理世界“办事”最难的一环是下游履约。千问的护城河正是其在物理世界的基础设施履约能力,这是纯AI创业公司难以复制的壁垒。当用户通过千问点一杯奶茶时,考验的是淘系供应链对门店和库存的精准匹配,以及菜鸟和淘宝闪购庞大配送队伍在运力紧张时将数字指令转化为物理交付的能力。而支撑这种履约能力的,是阿里“通云哥”(通义大模型、阿里云、平头哥)的全栈布局,为海量并发提供了算力保障。
依托强大的底层模型、开源生态和全栈能力,千问打出了两张王牌:
一是多终端入口,抢占物理世界先机。通过年内陆续推出的AI眼镜、指环、耳机等产品,千问加速打破手机屏幕的物理界限,让AI拥有深入物理世界的感知触角。
二是硬件反哺,实现“办事”能力全面提升。布局AI硬件的根本目的在于全面加强千问的核心“办事”能力。依靠多形态终端对物理世界信息的敏锐捕捉,千问在复杂生活场景中理解意图、处理任务的效率将得到质的飞跃。
从更深层的商业变现逻辑来看,AI 硬件从根本上改变了人机交互的范式,这为阿里的庞大生态服务拓展了全新的流量入口。人机交互的商业价值更大,它能够带来新的流量,而在这个流量池里,可以探讨和尝试极其丰富的商业合作与履约路径。
可以预见到:千问在手机APP上跑通的点外卖、打车等能力,将自然延伸至AI眼镜等终端。用户购买硬件后,高频调用本地生活、电商、出行等服务,将形成持续的商业变现。硬件销售收入,叠加基于伴随式服务衍生的服务佣金或订阅制模式,有望彻底打破纯AI产品高度依赖API调用或广告收入的单一变现困境。
结语
从比拼模型参数、APP用户,到角逐全场景办事能力,AI下半场的较量已经从单纯的参数和用户,延伸到了复杂的真实物理世界。
无论是OpenAI蓄势待发的硬件生态,还是阿里千问通过“多入口”形态全面提升的“AI办事”能力 ,都指向了明确的行业终局:未来的AI,一定是跳出手机、全场景深度渗透的。
未来的入口之争,关键在于谁能让AI最自然、最无感地长在用户的眼睛和耳朵上,实现全天候的伴随式感知和服务。在这场战争中,谁能率先完成从数字底座到物理感知硬件的生态闭环,谁就能在下一个技术周期中掌握绝对的话语权。
热门跟贴