打开网易新闻 查看精彩图片

作者 | 高允毅

2026 年,AI 真正“下地干活”的第一战,被阿里打响了。

1 月 15 日,在杭州阿里园区举行的千问 App 发布会上,阿里巴巴集团总裁吴嘉做了一次并不复杂、却很直观的演示:他用千问给现场嘉宾点了 40 杯“伯牙绝弦”奶茶。整个过程没有人工介入。千问自行匹配附近奶茶店,下单,并调用支付宝完成支付。没一会儿,淘宝闪购的骑手把奶茶送进会场。发布会的气氛,也在这一刻被彻底点燃。

事后,有杭州的网友恍然大悟“怪不得刚刚西溪附近叫不动外卖!”

打开网易新闻 查看精彩图片

相比 PPT 上的参数和模型指标,这个场景更容易被理解:AI 第一次在公开场合,完整地替人把一件现实中的事情办成了。

在这次更新中,阿里将千问定位成“每个人的生活助手”。路径也很明确:不从新场景做起,而是直接接入阿里现有的业务体系,让 AI 先把眼前的事干好。

日常生活层面,千问首批接入了淘宝闪购、支付宝、淘宝、飞猪和高德五大业务,可以一句话外卖、买东西、订机票、订酒店、查路线,这些原本需要在多个 App 之间来回切换的操作,现在可以交给一句话来完成。

打开网易新闻 查看精彩图片

“办事”这一层,千问的能力被进一步拉长。它开始尝试处理更复杂的任务,比如打电话订餐厅、整理调研资料、处理财务文件、辅助搭建网站等。这类功能目前仍处于定向邀测阶段,

吴嘉在发布会上表示:“AI 在拥有超强大脑之后,正在长出能够触达真实世界的手和脚,在生活中实实在在地替用户‘干活’。千问的优势在于‘最强的 Qwen 模型’与‘阿里最完整的商业生态’的结合。AI 办事的时代才刚刚开始,我们会持续探索,把千问打造成真正有用的个人 AI 助手。”

自千问上线两个月以来,月度活跃用户已突破 1 亿。吴嘉认为,随着 AI coding、全模态理解以及超长上下文等关键能力逐步成熟,AI 正在走出手机屏幕,进入更复杂、也更真实的生产与生活场景。

把阿里折叠进千问中,通过统一的 AI 入口,让千问拥有400余项办事能力,在生活、办公、教育等方面全场景覆盖,让千问成为 AI 时代的超级应用入口,这正是阿里的野心。

办事之上如何理解需求,

才能判断是不是一个合格的助手

伴随着模型能力的跃迁,思考让 Agent 做事,已经是近几年行业的集体共识。但干的活好不好,这才是能否放心 AI 当助手的关键。

阿里此次的更新方向,既在意料之中,又有些意料之外的惊喜,这个惊喜的落脚点就在于对需求的理解

在对千问用户数据观察中,用户主动询问商品推荐的月环比高达 300%,这引起了阿里的注意,利用好千问与淘宝的链接,让千问拥有更可用的商品推荐能力,这确实踩中了不少人的真实需求,也成为千问区别其他通用 Agent 的功能独特切入点。

打开网易新闻 查看精彩图片

这不仅发挥了阿里在电商上的传统优势,也让庞大的商品供给和相对成熟的推荐体系真正被用起来。用户只需一句话,就能完成从商品推荐到下单的完整流程。其背后,是阿里各业务接口的打通和协同调用,用起来足够顺,也足够省事。

但更令人惊喜的是对决策层面的关注,这也是模型深入理解真实需求的表现,如何调用工具做更好的决策,体现了阿里强大的整合能力。

比如,现场展示了要给老人购买一款家庭扫地机,并且家里还养了一只猫,预算在 2000-4000 左右。千问在综合产品的价格与能力之上,还进一步老人的便捷需求与对猫毛的清洁效果,在综合这些复杂的条件后,给出推荐产品与相关理由,这正是大模型方便人类决策的一个虚拟需求感知。

打开网易新闻 查看精彩图片

在另一个徒步推荐的方案中,千问不仅推荐出行路线,结合天气情况给出建议,还将徒步需要的产品直接发送到了千问界面上,确实让人看到 AI 未来融入世界的真实摸样。

打开网易新闻 查看精彩图片

不是只做简单的一件事,而是将好多事做好,形成闭环,阿里已经迈出第一步。

笔者能想到的弊端,可能就是如何避免大模型被商家刷的假好评和广告垃圾数据污染,根据错误数据给出错误推荐。

在一个全家人考虑去三亚出行的案例中,千问综合了路线、预算、老人与孩子的需求等,给出了路线选择,并给出三套酒店方案。

打开网易新闻 查看精彩图片

不过,酒店的均价都在两三千左右,不少人吐槽这恐怕没人住得起,方案不适用,不接地气,这或许是笔者认为的阿里迈出的是“半步”,还需要进一步的地方。

现场还有一个小惊喜是,千问演示现场定饭店的时候,有一段与老板确定需求的打电话环节,从包间大小,价格,有小朋友等需求进行多方拉扯沟通,直到最后,电话结尾说,“我是千问 AI 助手在与你沟通”,大家才恍然大悟,原来是千问的语音功能在完成订酒店的“最后一公里”。

这正是各种多模态打通后,AI 能做到的程度,留给人更多想象空间。

这种好用,同时体现在在对办公需求上,在更专业的场景上,需要更好的交付结果,要求也更难。

千问可以集成各种复杂工具,完成做表格、整理数据、处理报表、汇报 PPT 等各种具体业务。从如何处理资料到最后成品展现,从效果来看,确实还不错。

打开网易新闻 查看精彩图片

此次,阿里找来了专业人士来验收干活效果,千万财经博主小 Lin 说,亲自下场演示了用千问生成一份《2026 毕业生就业报告》,从信息汇总,消化资料,角度分析,文章演示到 PPT 的生成,千问干了一个完整的活。

不过,如果把千问当做个工作三年内的大学生,来干这些活,效果还是不错的,如果要求更高,可能就是把控 PPT 的内容重点质量,PPT 的设计是否美观。

打开网易新闻 查看精彩图片

而在教育领域,千问也做出一些精心设计,令人印象深刻的是在各种题目中,除了思路的讲解,还会生成一段动态视频进行图示演说,能随时对话沟通,给出思路和解法,并且多模态展示,这让千问更像一个人一样解决问题。

打开网易新闻 查看精彩图片

笔者也亲自进行了一个上手测评,一个是用千问点奶茶,还有一个是用千问询问如何落户问题,千问都给出了较为实用的操作结果。

打开网易新闻 查看精彩图片

总体来看,千问并没有试图一下子把所有事都做好,而是在尝试把复杂的事做得更完整、更贴近人的真实需求。它距离“完全可靠的 AI 助手”还有距离,但已经明显走出了聊天框,开始进入决策和执行的真实环节。而对干活质量的进一步打磨,恐怕正是阿里下一步要发力的方向。

在几家最受关注的 AI 巨头中,字节跳动选择从系统层切入,通过豆包手机助手借助操作系统能力,去调度第三方应用,与现实世界建立连接;阿里的路线则更为直接,依托自身已高度成熟的电商、支付、物流、出行等业务体系,将这些能力整体接入千问,形成一个以自有生态为核心的闭环。腾讯目前尚未对外展示完整方案,但从近期在 Agent 和多模态方向上的密集招聘来看,其下一步布局大概率仍将围绕微信这一超级入口展开。

打开网易新闻 查看精彩图片

表面上看,Agent 之争比拼的是模型能力,但更深层的竞争,实际上取决于谁能更稳定、更规模化地承接真实世界的复杂需求。

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

技术人的年度仪式感! 年度盘点与趋势洞察 启动!

《2025 年度盘点与趋势洞察》由 InfoQ 技术编辑组策划。覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ 传统行业等方向,通过长期跟踪、与业内专家深度访谈等方式,对重点领域进行关键技术进展、核心事件和产业趋势的洞察盘点。

力求以体系化视角帮助读者理解年度技术演化的底层逻辑、创新方向与落地价值,并为新一年决策提供参考。内容将在 InfoQ 媒体矩阵陆续放出,欢迎大家持续关注。

今日荐文

你也「在看」吗?