2026 一开年,智能体的发展立马进入狂奔状态。
本周二,Anthropic 发布 Cowork 掀起了打工人的革命。它不再像 Claude Code 一样专门面向程序员,而是把大模型与智能体能力推进到电脑桌面上,可以解决大部分人的工作问题。
同一时间,谷歌联合 Walmart 等零售商推出了一项专为智能体购物场景设计的开放标准 —— 通用商务协议(UCP)。此举旨在推动智能体购物全流程的标准化,实现从商品推荐、购买决策到支付结算的无缝衔接。
1 月 15 日上午,千问又前进了一大步,已经准备让智能体全面接管我们的日常生活了。
千问 App 上线了全新 AI Agent 能力「任务助理」,同时全面打通阿里生态,一次开启了 400 多项新功能,邀请测试与灰度上线已经同步开启,全都是免费可用的。
千问 C 端事业群总裁吴嘉
国内最强的 AI 模型,与最全的应用生态,现在合而为一了。
现在,你只需要对 AI 说「我要两杯奶茶」,千问就可自动找到相应的店铺,选好你的地址、选好商品、下好订单,你只需要点击最终的支付即可。
如果你想买点什么东西拿不定主意,也可以和千问「任务助理」商量一下,它不仅可以讨论出个符合需求的结果,而且可以直通商店的付款链接。
可以看到,千问能够接入的应用包括淘宝、闪购、飞猪、高德地图和支付宝。如果你有需要,千问还能帮你打电话。在发布会现场,千问就展示了 AI 帮人订餐,看起来餐厅老板没有认出与他交谈的是千问。
除了各种有意思的功能,我们也初步体验到了 AI 智能体带来的交互革命 —— 强大的千问模型,正在把阿里独有的生态优势全部并联起来。不论生活还是工作,以后通行的方法,或许都会被 AI 重新整理一遍。
一手实测
触角已经碰到了物理世界
刚过去的 2025 年被普遍视为智能体元年,智能体在人工智能领域的热度一直没有断过。从 Manus、ChatGPT Agent 到更多国产 Agent 大模型与应用,几乎每一次发布都会引起轰动。
智能体的出现,让大模型从拥有智能「大脑」进化出灵活的「手」和「脚」,对复杂任务的自动分析、拆解、执行能力与日俱增。有了智能体的参与,人们可以从繁冗的流程性工作中解放出来,大大节省了工作量与时间成本。
在全面接入一众阿里生态业务之后,千问 App 上的这个智能体新面孔能带来哪些不一样的东西呢?带着这个疑问,我们在拿到内测资格之后,马上对它来了一次摸底测验。
多品牌团购不在话下
在上文,我们已经见识到千问「任务助理」点奶茶的便利。接下来的实测中,我们给它上上难度,看能不能搞定多品牌、跨店铺的团购任务。
团购不同牌子的奶茶通常需要我们进入购物 App 并一一查找、浏览对应牌子的奶茶店,还要确认店中有没有自己想要的口味,这会浪费不少时间。在将类似的任务交给千问「任务助理」后,一切的麻烦都没有了。
我们输入指令「帮我点 3 杯霸王茶姬,5 杯瑞幸,8 杯茶百道」,它在确认你的收货地址之后会首先询问你的口味需求。
在确认你有无特殊的口味需求之后,它便开始马不停地自动跑完接下来的所有流程,包括分析用户点单需求、核对点单数量、以及搜索并获取购物平台(这里是淘宝闪购)商品信息。随着一系列内外部信息被它吸收消化,紧接着会进入到制定最佳点单方案的环节。
在制定点单方案时,它会根据距离的远近等因素自动为你匹配合适的商家,并初步完成满足你需求的商品筛选与推荐。
一套丝滑连招下来,它为我们推荐了三种差异化的方案,或想更快收到货、或是选择评分高销量高的门店、或想要订单中包含更多样的饮品种类。这些潜在的用户意图被它精准地捕捉并考虑进来,转化为对应的优先级推荐方案。
最后一步,凭自己的喜好下单付款即可。整个操作过程中,除了在有特殊口味需求时需要你的手动介入,其他时候全权交给千问「任务助理」就行了。
定制旅游计划一气呵成
前几天,「威海暴雪」的新闻登上了微博热搜,让这座滨海城市闯入了人们的视线。提起山东,大家可能更多地想到青岛。相比之下,威海的名气没有那么大。但从网上的口碑来看,威海以「小而美」著称。
带着对这座城市的好奇,我们让千问「任务助理」制定一份 1 月 16 日(这周五)北京出发的威海两日游计划。
在接收到任务之后,它便自动进入到了任务规划以及逐步的任务执行流程。首先会对我们的需求进行一个整体分析,将威海的景点、美食、住宿等因素统统考虑进来,并启动搜索子任务,即调用搜索工具查询相关的背景知识。
通过不间断地搜索、查询多类型网络来源(包括门户网站新闻、旅行社区热帖等)的威海旅游攻略,尽可能地确保信息准确可靠。
紧接着,根据筛选后的优质搜索结果,它为我们规划详细的两日游行程,这里全程对高德飞猪进行了调用。
最终在整合所有行程信息之后,它在高德地图上呈现出了两条交互式路线图。
完整的威海两日游计划出来之后,我们发现,不仅囊括了威海热门景点,还兼顾自然风光与历史文化,并综合考虑了预算成本与游玩体验。
在生成的行程计划中,你既可以一键跳转高德来导航去某处景点的路线并一键打车,也能跳转飞猪去订景区门票和酒店。
在日常购物、旅游规划之外,千问「任务助理」擅长的事情还有很多,比如政务场景,在接入支付宝政务服务之后,只需用户一句话就能快速完成政策解读、材料清单梳理等步骤,覆盖办签证、查社保等等场景,并直达办理入口,效率高得惊人。
简单的几个任务测下来,我们感受颇深的一点是:在交互方式上,以前我们是与大模型「对话」,现在是给智能体「派单」。只需要给出任务,然后等待结果即可。该说不说,这才是智能体真正的定义。
千问 AI 助手
有一套「拟人化」思考架构
千问不仅是能点外卖这么简单,千问「任务助理」已经完成了一套基于通用 Agent 体系的底层重构。
首先,千问 App 采用了一套全新的通用 Agent 体系。它基于 MCP 和 A2A 协议,在其中,主 Agent 作为指挥者,它基于千问最强模型拆解和规划任务;子 Agent 作为执行者,它们是多个具有反思能力的智能体,在其领域具有完全决策执行的权限,可以根据任务情况动态纠偏。
这套范式实现了高效的分层规划,在特定任务领域上也可以保证正确的决策,大幅提升了跨领域、长链路的复杂任务执行效率和准确率。
千问深度重构了 Agent 的原生能力栈。不同于目前流行的基于视觉识别(GUI)的 Agent 路线,千问选择了更加直接的协议打通,提升了 Agent 在执行任务时的精度和效率,在隐私安全上也更有保障。为了进一步提升效率,千问还专门为 AI 进行了工具栈的重构。
比如在搜索时,Agent 能够自主选择不同的搜索方式,或是进行并发搜索;操作浏览器的 Agent 经过了专门训练,结合阿里自研浏览器内核,具备毫秒级响应和极高的交互精度;在处理可视化、写小程序或复杂表格时,智能体会检索、对齐经过验证的成熟代码范式,确保产出结果具备「工程级」稳定性。
「任务助理」多层 Agent 的系统,深度集成了阿里自家生态的各种应用、工具,大量的应用会被拆解成原子化的指令级,确保了工具调用的准确。在跨场景任务上,系统能够正确地感知实时的位置、价格等时效信息,减少了大模型常见的幻觉问题。
千问的 Agent 系统还具备可以持续演进的能力。在完成任务之后,Agent 并不是就结束工作了,而是会像人一样进行「反思」并沉淀经验,让 Agent 可以持续进化。实践的经验会被转化为结构化经验库,作为先验知识在后续任务中动态加载。
这样,AI Agent 就可以逐渐具备人类的工作直觉。
最后,通过 AI Coding 的能力,千问现在可以在执行任务时发动 AI 生成代码能力现写工具。前面说到在大量任务上,Agent 可以实现精准的识别与操作。而在比较少见的任务上,千问的 Agent 可以启动 Agentic Learning 机制,自主编写、测试并封装新的原子工具。随着人们的使用,千问「任务助理」的能力会持续增强。
前天 Anthropic 发布的 Cowork,据说是十天之内用 AI 生成代码能力写出来的。看起来现在千问把类似的能力已经给你集成在智能体上了。千问表示,目前在数百个常用工具中,有超过一半是由 AI Coding 编程自主生成的。
智能体的 AI 革命
已经开始了
今年,AI 领域正在进入产品爆发的阶段。
仅在 1 月份,业界就出现了 Anthropic 的 Cowork,OpenAI 的 ChatGPT Health 等一系列新产品。各家科技公司正在快速兑现 OpenAI 总裁 Greg Brockman 对于智能体在企业、专业领域落地的预言。
刚刚千问的新发布,更是把智能体拉近到了我们身边:它能用快速精准的方式连接最常用的 App,让 Agent 进入到你生活的每一步。在国内,能做到覆盖如此全面的生活场景的公司,还真的只有阿里,其生态囊括了购物、出行、支付、办公等方方面面。
我们能够看出,目前这些 Agent 能力还显得比较简单 —— 正如第一代 iPhone 功能的简单并没有掩盖其划时代的意义一样,千问 APP 今日的推出,也许就像是智能体的 iPhone 时刻。从鼠标点击到手指触控,再到自然语言对话的交互方式升级,从这场发布开始打响了第一枪,人与机器的关系也进入到了第三次革命的关口。
当 AI 开始帮你整理发票、规划行程、甚至下单买咖啡时,它不再是云端那个高冷的「先知」,而变成了身边能干活的「助理」,这是 AI 从「言」到「行」的分水岭。
千问,会像淘宝开启移动互联网时代那样,开启一个全新的 AI 时代吗?我们拭目以待。
热门跟贴