今天,千问开了发布会,台上指令:「帮我点 40 杯霸王茶姬的伯牙绝弦」,然后千问调用开始选商家、生成订单、完成支付

打开网易新闻 查看精彩图片

以及,本文不聊千问的东西(虚晃一枪

只是顺着这个场景往下想,我看到的是一个更底层的问题:支付

现代商业有三条流:信息流、商品流、资金流(没想到吧,我还干过电商

在这里,信息流和资金流在线上,商品流在线下

过去两年 AI 的进展,本质上是在革新信息流。大模型生成内容,各种协议解决 Agent 和工具的交互,RAG 解决知识获取。这些都是信息层面的事

但如果我们希望 AI 真正改变更多事情,让 Agent 从「能聊天」变成「能办事」,资金流的革命是绑不开的

打开网易新闻 查看精彩图片

为什么支付是关键杠杆

Agent 能帮你查资料、写代码、做 PPT、分析数据。这些能力已经很强了,但有个共同特点:不涉及花钱

一旦任务变成「帮我买东西」「帮我订机票」「帮我点外卖」,复杂度立刻上了一个台阶

传统支付系统是给人设计的。整个流程假设有一个人类用户全程在场:你打开 App,你选商品,你点支付,你验证身份,你确认交易。每一步都是你自己操作,出了问题你自己负责

打开网易新闻 查看精彩图片

Agent 的使用场景不一样

你可能说「帮我监控上海到北京的机票,低于 800 块自动下单」,然后去睡觉了。Agent 在凌晨三点发现有票,需要替你做决定、替你付钱

这时候一系列问题就浮出水面:

Agent 怎么证明这笔交易是你授权的?如果你明天醒来说「我没让它买这个」,谁来判定?

你的支付凭证存在哪里?Agent 能不能直接接触你的银行卡号、支付密码?如果能,安全怎么保证?如果不能,它怎么完成支付?

商家怎么知道对面这个 Agent 是真正代表用户的购物助手,还是一个恶意爬虫?传统风控模型是针对人类行为设计的,Agent 的行为模式完全不同

交易出了纠纷,责任怎么划分?是用户的责任、Agent 开发者的责任、还是平台的责任?

打开网易新闻 查看精彩图片

这些问题不解决,Agent 购物就只能停留在「帮你挑商品、比价格」的阶段。最后一步付款,还得把你叫回来

支付,是 Agent 商业闭环的最后一公里,这一公里不通,前面做得再好也打了折扣

全球 AI 支付的格局

过去一年,几家头部 AI 公司都在这个方向上有动作

OpenAI 走得最快

去年 9 月底推出 ChatGPT Instant Checkout,能在对话界面里直接完成购买。技术上和 Stripe 深度绑定,用的是一种叫 SPT(Shared Payment Token)的机制,把用户的支付信息加密成一个令牌,只对特定金额和特定商户有效

打开网易新闻 查看精彩图片

首发合作方是 Etsy,后来 Shopify 的 100 多万商户接入,再后来是 Walmart、Target、Instacart。PayPal 也谈好了,今年计划把数千万商户目录接进来

同一天还发了一份 ACP 协议(Agentic Commerce Protocol),和 Stripe 联合搞的,Apache 2.0 开源,定义 AI Agent、商户、支付服务商之间的交互标准

Google 走的是开放联盟路线

今年 1 月 11 日在 NRF 大会上发布 Checkout in Gemini,和 Walmart 深度合作。用户连接账户后能获得个性化推荐,商品可以直接加到 Walmart 购物车,支持 3 小时内送达

打开网易新闻 查看精彩图片

协议层面有两个:UCP(Universal Commerce Protocol)解决商业交互,覆盖从发现、购买到售后的全流程;AP2(Agent Payments Protocol)解决支付授权,核心概念是 Mandate,一种数字签名的授权声明,精确定义 Agent 能执行什么操作

AP2 的参与方阵容很豪华,60 多家组织,包括 Visa、Mastercard、American Express、Adyen、Stripe、Coinbase。Google 的策略是不追求单一平台锁定,要当「基础设施提供者」

Anthropic 选择不直接下场

Claude 没有原生支付功能,也没有公开这方面的开发计划。MCP 协议(Model Context Protocol)专注于 Agent 和工具的交互标准,去年底已经捐给了 Linux Foundation

打开网易新闻 查看精彩图片

如果要让 Claude 具备支付能力,需要接 Stripe 的 MCP Server。但这只是「工具调用」,不是「交易闭环」。用户发起支付后,还是得跳转到支付链接去完成

三家的路径选择反映了不同的战略判断。OpenAI 要快速占领交易入口,Google 要构建开放生态,Anthropic 专注模型能力和安全,支付不是优先级

 不同的选择 中国的情况
打开网易新闻 查看精彩图片
不同的选择 中国的情况

国内 AI 支付的进展...主流赛道上,似乎目前只有支付宝在搞

去年 4 月发布了支付 MCP Server,是国内首个。去年 9 月外滩大会上正式推出「AI 付」,首个落地场景是瑞幸的 AI 点单助手

千问这次接入的支付能力,底层就是支付宝提供的

微信支付的 MCP 去年 7 月上线,目前还是体验版本,功能相对弱一些。京东有「AI 购」在内测,美团的「小美」去年 9 月公测,都在往这个方向走。但从协议层面的完整度来看,支付宝做得更系统

不过吧...虽然千问没说,但...我知道是这个: ACT 协议文档(Agentic Commerce Trust Protocols,智能体商业信任协议)

 https://aipay.alipay.com/act
打开网易新闻 查看精彩图片
https://aipay.alipay.com/act

写这篇文章的时候,为了防止出错,又读了一遍

ACT 协议的架构

ACT 把智能体商业的需求拆成四个域

委托授权域

解决的核心问题是:怎么把用户的自然语言指令,变成机器能理解、能执行、事后能追溯的东西

打开网易新闻 查看精彩图片

协议里定义了一套结构化表达,字段很细。意图基础信息、授权有效期、支付方式约束、品类约束、商户白名单和黑名单、单笔金额上限、日累计上限、周期累计上限、价格容限、超限时的处理策略(暂停并通知 / 自动取消 / 自动继续)、设备信息、地理位置、凭证签名,加起来 30 多个字段

举个例子,用户说「帮我买一台 4000 块左右的笔记本电脑,今天之内」。这句话会被解析成:品类是笔记本电脑,单笔金额上限 4500(留了容限),授权失效时间是今天 23:59:59,支付方式是支付宝,然后整体做数字签名

有了这个结构化表达,后续的意图澄清、凭证签发、一致性校验、纠纷追溯都有据可依

商业交互域

Agent 怎么和商家系统对话。包括商品元数据接口、意图上下文传递、多 Agent 协作等

打开网易新闻 查看精彩图片

这里重点说一下意图上下文传递。用户说「帮我给爸妈买台扫地机器人」,Agent 需要把这个意图传给电商平台。平台拿到之后,能推理出「防缠绕、高温杀菌」这些老年人关注的功能点,然后筛选出合适的商品

为了更有效的传递信息,协议里定义了结构化的表达格式,包括显式意图、隐式意图、约束条件、用户偏好等多个维度

支付服务域

核心设计思路是 不让 Agent 碰敏感信息

打开网易新闻 查看精彩图片

用户的支付账户会生成一个 Token。Agent 拿着这个 Token 去发起支付请求,但它不知道用户的真实账号。Token 本身可以限定使用范围:只能在特定商户用、只能特定 Agent 用、有金额上限、有时间窗口

文档里有句话我印象比较深:「整体支付流程与原有流程基本保持一致,主要是发起支付的角色从用户替换成智能体」

这个思路很务实。不是另起炉灶搞一套新东西,而是在现有支付体系上做最小改动。兼容性好,落地阻力小

信任服务域

这是 ACT 协议比较独特的一块

包括 Agent 身份管理(Know Your Agent)、交易风控、声誉评价、行为存证。解决的问题是:商家怎么区分「正常的购物 Agent」和「恶意爬虫」?出了纠纷怎么有据可查?

打开网易新闻 查看精彩图片

传统风控模型是针对人类行为设计的。人类的点击轨迹、浏览时长、下单频率有一定规律。Agent 的行为模式完全不同,可能瞬间查询几十个商品、几秒内完成下单,这在传统模型里会被判定为高风险

信任服务域要解决的就是这个问题:建立一套针对 Agent 的风控体系和身份认证机制

和海外协议的对比

把各家协议放一起看,不是谁全面领先的问题,是各有侧重

打开网易新闻 查看精彩图片

这里,还可以展开,几个观察:

协议完整度和落地速度是两回事

ACT 在纸面上覆盖最全,四个域都涉及,委托授权的字段定义也最细。但 OpenAI 的 Instant Checkout 去年 9 月就上线了,已经接了 Etsy、100 多万 Shopify 商户、Walmart、Target、Instacart,实际交易在发生

协议设计得再完整,不如先跑起来迭代。这方面 OpenAI 走得最快

生态开放性上,Google 更有优势

AP2 拉上了 Visa、Mastercard、American Express 这些传统支付网络巨头,还有 Adyen、Stripe、Worldpay 这些支付处理商。60 多家组织参与,阵容很豪华

打开网易新闻 查看精彩图片

这意味着 AP2 未来可能直接走银行卡通道,不依赖单一支付服务商。相比之下,OpenAI 的 ACP 则是和 Stripe 深度绑定

MCP 成了某种公共基础设施

Anthropic 没有做原生支付,但 MCP 协议被各家采纳:OpenAI 支持,Google 的协议设计了互操作,支付宝的 MCP Server 也上线了。去年底 MCP 捐给了 Linux Foundation,成了行业共治的开放标准

打开网易新闻 查看精彩图片

不下场做支付,反而在协议层获得了最广泛的认可。这是个有意思的策略选择

信任服务域、跨终端互操作是 ACT 独有的

「怎么识别恶意 Agent」「怎么给 Agent 建立信用评价」这些问题,海外协议基本没涉及。可能和市场环境有关,中国的羊毛党、爬虫问题更突出,对这块的需求更强

打开网易新闻 查看精彩图片

对于手机、眼镜、汽车、音箱上的支付体验怎么保持一致?不同终端的身份验证能力怎么协商?这块海外协议没怎么涉及。中国的 IoT 设备多样化程度更高,可能是这个设计出现的背景

为什么会有这些差异

简单来说:环境不同

支付基础设施不同

中国移动支付渗透率极高。支付宝和微信支付处理了绝大部分线上线下交易,已经是基础设施级别的存在。在这个基础上叠加 Agent 能力,改动相对小

美国的支付链条更长更分散。信用卡体系涉及发卡行、收单行、卡组织等多方。OpenAI 要和 Stripe 合作,Google 要拉上 Visa、Mastercard、Shopify。每多一个参与方,协调成本就多一层

打开网易新闻 查看精彩图片

生态结构不同

千问背后是阿里生态的系统级打通:淘宝的商品库、支付宝的支付能力、高德的位置服务、飞猪的票务系统。Agent 调用这些能力,链路短、摩擦小

海外是开放生态,各家独立运营。AI 公司需要和电商平台、支付网络、物流服务商分别对接。这也是为什么 Google 要搞 UCP 和 AP2 这样的开放协议,试图用标准来降低协调成本

监管环境不同

中国的支付监管相对集中,支付宝和微信支付已经有成熟的合规框架。Agent 支付可以在这个框架内演进

美国涉及联邦和各州的多层监管,金融服务的合规要求复杂。这可能也是 Anthropic 选择不直接做支付的原因之一

正因为这些原因,AI 支付领域,海外虽然做得早,但国内可能会落得快

两种场景

ACT v1.0 重点支持两种场景:即时确认和委托授权

用户即时确认支付

用户实时和 Agent 对话,Agent 推荐商品,用户在场确认,然后发起支付、验证身份、完成交易。整个过程用户全程参与

打开网易新闻 查看精彩图片

这个场景相对简单,和传统电商的差别主要是交互方式变了。风险可控

用户委托授权支付

用户预先表述意图,明确授权范围,生成意图授权凭证。Agent 拿着这个凭证,可以在用户不在场的时候自主执行交易

打开网易新闻 查看精彩图片

比如「帮我监控这趟火车票,有票就买」。用户睡着了,凌晨放票,Agent 检测到符合条件的票,自动下单、自动支付,第二天早上用户醒来收到通知

这个场景复杂得多。意图怎么精确表达?授权边界怎么界定?凭证怎么防伪?超出授权范围怎么处理?这些问题在协议里都有对应的设计

当然,蚂蚁数字支付 CTO 朱林在外滩大会上还提过一个「AI 支付三阶段」:第一阶段 Agent 能收付款,第二阶段支付体验沉浸化不中断流程,第三阶段根据用户意图自动完成支付

千问目前到了第二阶段,部分场景触及第三阶段

协议竞争的走向

目前的格局是:

  • • OpenAI 和 Stripe 绑定推 ACP

  • • Google 拉联盟推 UCP 和 AP2

  • • Anthropic 专注 MCP 做工具协议

  • • 支付宝在中国推 ACT

有意思的是,MCP 现在成了某种程度上的公共标准。OpenAI 宣布支持 MCP,Google 的协议也设计了和 MCP 的互操作,支付宝的 MCP Server 去年就上线了

协议层面有合作空间。各家都不想让协议碎片化导致生态割裂

竞争集中在应用层。谁能让用户习惯在自己的入口完成购物,谁就占住了这个位置。OpenAI 有 ChatGPT 的用户基础,Google 有搜索和 Android,支付宝有中国的支付入口

接下来看什么

这个领域还在早期,几个方向值得关注:

异步执行场景的成熟度
「监控价格自动下单」这类场景,用户不在场,风险更高,对意图表达和授权机制的要求也更高。这块的体验和风控还有很多工作要做

跨平台互操作
现在各家 Agent 基本只能在自家生态内完成交易。如果用户想让 Agent 同时比较淘宝、京东、拼多多的价格然后下单,目前做不到。这需要协议层面的打通

监管框架的演进
Agent 代替用户做支付决策,出了问题责任怎么认定?现有的消费者保护法规是假设人类用户在操作。这块需要新的规则

信任体系的建立
怎么给 Agent 建立身份认证和信用评价?怎么让商家区分好的 Agent 和坏的 Agent?这个问题不解决,商家对 Agent 流量的态度会很矛盾

收尾

千问发布会演示的那杯奶茶,背后是一整套基础设施在支撑

Agent 要从「能聊天」变成「能办事」,信息流的问题大模型解决了,商品流有电商和物流体系,资金流是最后要啃的硬骨头

全球几家头部公司都在这个方向上投入,路径选择不同,进度不同,但方向一致

中国的环境,有独特优势
支付基础设施成熟,超级 App 生态完整,协调成本低。支付宝的 ACT 协议在覆盖范围和细节颗粒度上做得比较系统。这是千问能做到「对话里直接买东西」的底层原因

至于最终会形成什么格局,现在判断太早。协议标准还在演进,各家产品还在迭代,监管框架还没成型

打开网易新闻 查看精彩图片

但有一点,是清楚的:
谁能让 Agent 顺畅地完成支付,谁就拿到了 AI 时代商业闭环的关键钥匙