大家好,我是跟紧时事的袋鼠帝。
就在刚刚,阿里的千问App发布了一次重大更新。
这次更新不同以往,不夸张的说,这可能是千问的「iPhone时刻」。
可能要不了多久,我们进入互联网的入口将不再是手机桌面上那一排排操作繁琐的App图标了
而是一个AI对话框。
说真的,我以前一直觉得字节的豆包有先发优势。
毕竟在C端应用这一块,字节的产品力确实强,千问App之前给我的感觉,更多是吃了后发的亏,功能上跟豆包等手机AI助手没有拉开本质的差距,大家都在卷聊天、卷长文本、卷Agent。
但是这次不一样,阿里终于想通了,不再跟别人卷陪聊,而是走了一条极其实务的路线:直接搬出了他们最恐怖的底牌「超级生态」。
当AI不再只是陪你从诗词歌赋聊到人生哲学,而是真正走进真实世界,全面打通了你的衣食住行,那是种什么体验?
这次千问App全面接入了淘宝、淘宝闪购、支付宝、飞猪、高德等多项阿里生态的应用,一口气上新了400多项功能。
同时还推出了全新的「任务助理」
简单来说,就是把那个只会动嘴皮子的AI,变成了一个长了手脚、能帮你真正办很多事儿的超级管家。
为了验证这次更新的含金量,我决定直接用我自己的真实生活场景来体验一下。
看看这个背靠「阿里全家桶」的AI,到底怎么样。
用千问帮我办事
新家第一杯奶茶,AI能不能送到门口?
熟悉我的朋友应该知道,我是个数字游民,不习惯在一个地方待太久,最近换地方了,刚刚搬到昆明的一个新住处。
我对这周边的环境是一点都不熟,连门牌号都还没记清楚。
于是,我决定用千问App帮我点新家的第一杯奶茶。
直接对着千问说:'帮我点一杯奶茶',它首先会为我们推荐附近的各种奶茶,不满意可以左滑(这个操作有点似曾相识 哈哈哈)
然后我给了一个更具体的要求,指定点某家带草莓的茶。接着有地址确认的交互。
下单之后,又重新用嘴选择了甜度,最终支付,完事!
靠,不用动手点来点去的感觉挺新奇,爽!
本来优惠力度是非常大的,但是快送到了才反应过来,tm这家奶茶店配送费居然要7.4¥。。。
打开闪购看了一下,附近就他家配送费高的离谱♂️,其他家都是一两元
这好像是我第一次让AI帮我点奶茶,这种感觉还挺奇妙的
话又说回来,如果是之前的AI,大概率会给我列出一堆奶茶店的介绍,或者给我几个外卖平台的链接让我自己去点。
但这次,千问的反应非常直接。
对话框里瞬间弹出了淘宝闪购的卡片,不仅精准定位了我现在的小区,甚至连口味规格都自动选好了。我只需要动动嘴皮子(是的,也不用打字,可以用语音)
最后确认一下金额,点击支付,整个过程可能不到10秒,最好的一点是它能自动把优惠券选上。
这里我要稍微展开讲一下:之前我也测试过AutoGLM,它是基于GUI(图形用户界面)操作手机的技术路线(通俗一点,就是AI模拟人的手指,帮你点击操作App)。
那次的体验怎么说呢,有点像看一个眼神不太好的机器人在操作手机(比较吃模型能力,现阶段还没有像人一样丝滑)。
它反应较慢,而我只要一杯,它给我加了两杯,关键是不会自动凑满减券,看得我那个急啊,恨不得把手机抢过来自己点。
更深层的问题是安全:那种模拟点击的方案,对于App来说,其实是一种「外挂」行为。可能会触发App风控,把这种模拟操作给墙掉(背后主要原因还是不甘心自己做了那么多年的App沦为别人的后台,归根结底还是未来流量入口的争夺)。
但千问这次走的是MCP和A2A协议的底层接⼝路线,能自动调用匹配的应用,并完成任务。
打个比方,GUI路线就像是你雇了一个不懂规矩的临时工,让他翻墙进厨房帮你拿吃的,不仅慢,还容易被保安赶出来。
千问就像是拿到了餐厅老板给的VIP后厨钥匙,直接走专用通道下单。
这就是阿里生态的恐怖之处:淘宝、饿了么(现在的闪购)本来就是阿里自家的,千问调用它们的数据和接口,那是名正言顺,既稳定又安全。
长途旅行规划,终于不"乱编"了
我特别喜欢自驾游,针对旅行规划这个场景,我给千问出了个难题:
'我想从昆明开启我的特斯拉床车自驾游,我希望去的地点有:抚仙湖,贵州的罗秧河,普者黑,自贡吃好吃的,高过河漂流(注意这个顺序,不是最终要去的路线顺序),最后我是要返回昆明。请你帮我规划一下线路,要求是最短、最省钱的线路,并计算每个行程的里程,电耗,还有高速费。我全程住在车上,请你帮我规划这次的行程,并计算出大致的花销。'
其实,我从去年3月份就开始让各大AI(包括Claude)接入高德MCP去跑这个规划任务了,但是呢,从来没有一个让我满意的结果,最明显的问题就是规划的路线,时间、距离这些根本不准。
而且这个Prompt里充满了陷阱。地点的顺序是乱的,跨越了云南、贵州、四川三个省,还得考虑过路费、周边游玩景点等等。
这次用了千问的「任务助理」功能(还在内测阶段,需要邀请码)。
它显示「正在调用高德地图」、「正在调用飞猪旅行」、并且疯狂搜索相关信息,最后写代码生成一个可视化界面。
20多分钟后,一份详细到让我头皮发麻的计划出来了。
首先,它自动把我的乱序地点进行了逻辑排序,规划出了一条不走回头路的环线:昆明→抚仙湖(澄江市)→普者黑(丘北县)→罗秧河(关岭县)→高过河(镇远县)→自贡→昆明。
最让我震惊的是它的数据准确度:它给出的每一段路程的公里数,耗时,跟我自己用高德地图查出来的几乎分毫不差。
可惜高速费、电车的电耗没有加进去。
但是它给我推荐了每个点周边的多个景点,还有美食,每个景点游玩的顺序也规划好了,甚至有导航、打车(可以直接跳转到高德),点击详情可以直接跳到飞猪买票,简直不要太方便!
这就是「自家孩子」的优势吗,这种数据的颗粒度、准确度、便捷度,是任何第三方插件都无法比拟的。
一句话办政务,爽!
如果说吃喝玩乐还只是生活琐事,那接下来的这个更新,才是真正解决了我们普通人最头疼的痛点:办证和办事。
大家可能或多或少都有过这种经历:想给刚出生的宝宝办个医保,或者是想把户口迁到杭州,第一反应就是去网上搜。
结果搜出来一堆网页,有的说是A政策,有的说是B政策,还得在不同的部门网站之间来回跳转,看得头晕眼花,最后还是不知道自己到底符不符合条件,材料要准备啥。
这次千问App深度接入了支付宝的政务服务,一口气上线了签证、户口、公积金等50项民生服务。
我是一个在深圳待了四年,却没去过香港的人,在X上看到可以去香港办港卡,我也心痒痒,但是我不知道怎么弄港澳通行证,我试着问了千问:
'怎么办港澳通行证?'
千问没有给我废话,而是直接像一个经验丰富的老办事员一样,简单说明后,直接给出了一个「点击办理」的入口。
点进去,就是支付宝的官方办事页面,跟着流程傻瓜式操作就行了,非常方便。
之前为了搞清楚一项业务,可能得点来点去找半天,或者在浏览器里开几十个标签页(年轻人还好一点,特别是家里老人,他们完全就搞不了了)。
现在,千问利用它的大模型理解能力,加上支付宝沉淀多年的政务服务接口,把这些复杂的流程全部折叠进了一句话里。
我又试着查了一下公积金:
'帮我查一下我的公积金缴存记录'
千问同样直接给出办理入口,还给了其他办理渠道。没有迷宫一样的菜单,没有各种弹窗广告,就是纯粹的「办事」。
其实我23年就开始畅想有一天能摈弃那些操作繁琐的App,各种操作、配置系统,我觉得这些完全能通过AI去操作。
我想起大学实习的某监控厂商,做售后技术工程师还要去学习他们的监控平台管理系统的操作(就是熟悉什么功能在哪里点点点),我当时就觉得这个事儿真是太tm无聊了,这学来干嘛?有P用
阿里终于把我心心念念好久的事儿做成了!
为什么只有阿里率先做成了这件事?
我们不仅要看热闹,还得看门道。
为什么市面上大模型厂商这么多,只有阿里能把「AI办事」这件事做到这个程度?
这里面有两个核心护城河:最强的开源全模态模型组合 + 最全的生态。
1. 拼模型,这是硬实力的较量
部分朋友可能还不知道,在开源模型这个领域,阿里的Qwen系列在国际上都是领先的。
在Huggingface的榜单上,Qwen经常霸榜,全球下载量超过7亿次。
这意味着什么?意味着千问的大脑足够聪明。
要让AI办事,理解能力非常重要:比如我刚才那个自驾游的指令,里面包含了地理位置的推理、乱序的逻辑重组、成本的计算。如果模型不够聪明,它根本听不懂你想干什么,更别提去调用工具了。
2. 拼生态,这是阿里的杀手锏
目前全球范围内,能把芯片、云计算、大模型、应用生态这四层全部打通的公司,只有两家:一家是谷歌,另一家就是阿里。
腾讯有流量,但在模型以及应用生态上都不如阿里;
字节有算法,但在底层基建以及应用上台上还有短板;
OpenAI模型最强,但它没有自家的地图、没有自己的电商、没有自己的支付体系,所以它不太能干线下的活,更没有强大的AI基础设施,极度依赖三方云服务商。
阿里把淘宝(购物)、闪购(外卖)、高德(出行)、飞猪(机酒旅)、支付宝(金融政务)这些国民级的应用,全部通过底层协议开放给了千问。
这就好比阿里的千问是含着金汤匙出生的,别的AI想点个外卖,得去求美团开放接口,或者用不稳定的模拟点击去蹭;千问想点外卖,直接给闪购内部打个电话就搞定了。
这种生态的壁垒,是别家想抄都抄不来的。
3. 商业价值
我们来思考一个问题:未来的互联网入口到底是什么?
在PC时代,入口是浏览器;在移动互联网时代,入口是各种手机App。
但是实际上各家巨头的App把我们的生活割裂了,你要旅游,先打开小红书做攻略,再打开高德看路线,再打开携程订酒店,最后打开支付宝付钱。你要在四五个App之间来回跳转几十次。
千问正在做的事情,是把这几十次点击,折叠进一个对话框里。
这就是「超级入口」。
当用户发现,只要跟千问说一句话,就能把事情办了,谁还会愿意去下载那几十个臃肿的App?
这就是AI时代的流量分发权,谁掌握了这个对话框,谁就掌握了未来的商业命脉。
这也是为什么各大厂都不愿意开放接口给外部AI的原因--谁愿意把自己发展了这么多年的命根子交给别人呢?
只有阿里,因为生态都是自己的,才有魄力、有实力做这种整合。
而且,这会形成一个可怕的数据飞轮。
我们用千问办事越多,产生的高质量行为数据(比如真实的购物决策、真实的出行路线)就越多。
这些数据反哺给模型,会让千问变得更懂你、更精准,这是只靠爬取互联网文本数据的通用大模型永远无法比拟的优势。
「最后」
看着千问App的这次更新,我隐约感觉我们正站在一个新时代的门槛上。
回顾科技史,每一次交互方式的革命,都会诞生新的巨头。
三十年前,鼠标的出现,让我们通过点击(Click)链接了信息,诞生了谷歌和百度。
十多年前,多点触控的出现,让我们通过触摸(Touch)链接了服务,诞生了一众互联网大厂。
今天,基于大模型的自然语言交互越发成熟,让我们通过对话(Communicate)链接了物理世界。
千问App的这次进化,有点像当年的第一代iPhone,它可能还不完美,甚至还有点稚嫩。
可能在处理极度复杂的任务时还会偶尔犯错,或者有些服务的覆盖面还不够广。
但方向已经对了。
要不了多久,我们可能真的不需要在手机里装满几百个App了。我们只需要一个足够懂我们的AI助手,它是我们的旅行规划师,是我们的生活管家,是我们的财务顾问。
而我们,可以将从琐事中解放出来的时间,去享受生活,去感受风,去看一场真正的日落。
这就是技术进步的意义,不是为了让我们更忙碌,而是为了让我们活得更像人。
我是袋鼠帝,一个在云南陪你一起经历AI变革的数字游民。
点击关注下方账号,你将感受到一个朋克的灵魂,且每篇文章都有惊喜。
能看到这里的都是凤毛麟角的存在!
如果觉得不错,随手点个赞、在看、转发三连吧~
如果想第一时间收到推送,也可以给我个星标⭐
谢谢你耐心看完我的文章~