9.9元买了什么

先说一个数字让你感受一下当下的规模差距。

2026年3月,国家数据局局长在国新办发布会上公布:全国AI日均Token调用量已达140万亿。两年前,2024年初,这个数字是1000亿(同一发布会披露的对照基数)。官方说法是"增长了1000多倍",按数字推算约1400倍(据公开数据测算)。

同一时间,江苏移动宣布:外部Token日销8亿。

8亿听起来很多。但8亿÷140万亿=0.00057%。

也就是说,江苏移动一个省的日销Token,占全国日均调用量不到万分之一。

打开网易新闻 查看精彩图片

图片由AI生成

但运营商说这是AI转型的成果。中国电信推出轻享版:9.9元/月,1000万Tokens。中国移动推出Coding Plan:40元/月1.8万次,或200元/月9万次。联通更简单:1元/天解锁GLM-5。

这三个套餐,用的是你买流量包时见过的同一种逻辑——买月租,送额度,超量另算。

套餐本身没什么问题。问题在套餐里装的是什么。

点火器是别人的

移动的Coding Plan,是专门给开发者用的AI编程套餐。按道理,移动自家的九天大模型应该在里面占个核心位置。

但Coding Plan目前支持的模型,是MiniMax系列。

九天大模型,缺席。

不是九天不够好,是根本就没放进去。移动的MoMA平台官方说法是"承载九天,整合超300款主流模型"——九天是门面,300款是货架。

电信轻享版的情况类似。发布稿里写的是"融合星辰大模型+DeepSeek V3.2、GLM5"——自研星辰和第三方模型并排列着,谁是主力一眼看得出来:DeepSeek V3.2在2025-2026年间几乎成了国内所有AI产品的默认底层。

联通就更直接,1元/天卖的是智谱的GLM-5调用权。

翻译一下就是:三大运营商在AI套餐里做的事,是把第三方模型打包进自家账单,加上自己的渠道和结算体系,换个名字往外卖。

这不是AI公司,这是分销商。

打开网易新闻 查看精彩图片

图片由AI生成

价差有多大?直接去查:DeepSeek-V4-Flash缓存命中价格是0.02元/百万Tokens(缓存命中场景),DeepSeek-V4-Pro限时优惠是0.025元/百万Tokens(缓存命中场景,限时至2026年5月31日)。电信9.9元/月1000万Tokens,折算下来是0.99元/百万Tokens。

差了40到50倍(据公开定价数据测算)。

你在电信买的Token,有可能就是DeepSeek的模型在跑,只是中间多了一层运营商的壳。

为什么会这样

从公开数据看,有三层结构性原因约束了这个商业路径。

第一层:财报压力下的"算力变现"路径。

中国移动2026年Q1净利润同比下降4.2%(据中国移动2026年Q1财报)。与此同时,2025年移动数据流量收入6097亿元,同比下降3.1%。流量收入这条腿已经在萎缩。

但中国移动2026年算力网络资本开支计划同比增长62.4%(据新华网),这笔钱砸进去了,需要找到变现出口。Token套餐是其中一个出口——把算力基础设施包装成消费产品,把IDC机房里的GPU利用率转化成财报上的"AI服务收入"。江苏移动"日销8亿Token"在统计意义上是一个业绩数字。

算力投资回报压力构成了这条路径的主要驱动力。

打开网易新闻 查看精彩图片

图片由AI生成

第二层:第三方模型供应商是真正的受益方。

MiniMax、DeepSeek、智谱,这些公司获得的不只是技术采购款,而是运营商的渠道触达。

中国移动有超过9亿用户,大多数人不会自己去注册DeepSeek账号、研究API定价、读计费文档。但如果移动在流量套餐旁边加一个"AI包9.9元",他们会顺手买的。运营商替第三方模型完成了最难的一步:从技术工具到普通用户的破圈。

代价是什么?对模型公司来说是定价权——集采价格被压低了。但换来的是规模和曝光,总体算账未必亏。

谁从中受益?模型公司用被压价的批发款换来了渠道,运营商用别人的模型填满了自己的AI收入项,两家都得到了各自想要的东西:规模换渠道,渠道卖规模。

第三层:普通用户被信息差锁住。

知道DeepSeek有API、知道定价是0.025元/百万Tokens、知道怎么申请账号和调用的用户,不会去买运营商的Token套餐——价差太明显了。

但大多数用户不在这个信息圈里。他们看到的是:运营商App里,流量套餐旁边,多了一个AI套餐,9.9元,这个价格和一杯奶茶差不多,买了也不心疼。

这个用户群体无法改变什么,因为他们的参照系就是运营商提供的那个。他们不知道同样的模型能更便宜、更直接地用。信息差本身就是壁垒,不需要任何额外的锁定手段。

历史重演

这件事在运营商身上不是第一次发生了。

2013年,微信替代了短信。那一年,移动短信收入开始断崖式下跌。运营商那时候也推过飞信,2007年就上线了,结果无人知。2015年前后推了RCS富通信服务,号称能替代短信和即时通讯,结果也是无人知。

每一次,运营商都完成了基础设施层的升级——更快的网速、更大的带宽、更强的覆盖——然后应用层的收益被微信、抖音、支付宝拿走了。

运营商变成了"哑管道"。这个词他们自己也知道,20年了,从来不喜欢被这样叫。

现在的Token套餐,是运营商试图在AI时代不再做哑管道的尝试。逻辑上合理。但看看套餐里装的是什么——不是自家模型,是别人家的模型——这次他们连应用层的正面进攻都没有,直接变成了别人应用层的分销渠道。

哑管道主动请缨帮别人卖货,管道还是那根管道。

国际上的对照更能说明问题。AT&T、Verizon、NTT这些海外主要电信运营商,目前均未见AI Token消费级零售产品。他们的选择是:专做基础设施,和云厂商合作,把算力卖给真正做AI应用的公司。这条路没有一夜爆红的故事,但也没有"用流量包逻辑卖AI"的尴尬。

打开网易新闻 查看精彩图片

图片由AI生成

1000万Token你真的用得完吗

算一笔账。

普通人和AI对话,一轮(一问一答)大概消耗500到2000个Token(作者据主流模型平均对话长度估算),取中间值1000个。1000万Token能支撑1万轮对话,平摊到30天,每天333轮。

你每天和AI聊333轮吗?

就算是重度用户,每天50轮已经算多的了。1000万Token够用200天。以9.9元/月买这个套餐,第一个月就用不完,第二个月开始全是浪费。

流量包的商业逻辑从来不是让你把流量用完——用不完的部分,才是利润来源。Token套餐沿用同一套算法。

你买的不是算力,你买的是"随时能用"的安心感。安心感值多少钱,因人而异。但你有没有算过,你每个月实际用掉的Token,折算成直接调用API的价格,是多少?

更直接的:如果你手机是骁龙8 Elite或者苹果M4,这两款芯片的NPU算力分别是80 TOPS和38 TOPS,已经能在本地跑Qwen3-1.7B和DeepSeek-Lite这些轻量模型——连接AI的成本是0,只要会装App就行。

如果你用的是骁龙8 Elite或者苹果M4的手机,你试过本地跑AI吗?在评论区说一下你现在主要在哪里用AI。

这门生意的天花板

泼一盆冷水:运营商不是不努力。

这几年,三家都在做算力基础设施,都在建数据中心,都在采购GPU,都在投资AI研发。移动的九天大模型是真实存在的,电信的星辰也不是纯粹的PPT。但模型研发和把模型卖给普通用户,是两件不同的事,中间隔着应用、产品、用户习惯和生态。

运营商擅长基础设施,不擅长应用层的用户经营。这不是态度问题,是组织基因问题。

用"流量包"命名AI产品本身就暴露了这个局限:Token和流量不是一回事。流量是管道里跑的水,Token是模型生成内容的计量单位,两者的定价逻辑、使用场景、用户行为都不一样。但套餐的名字、计费的方式、销售的渠道,全都沿用了流量时代的框架。

更大的威胁来自另一个方向:端侧AI。当骁龙8 Elite和苹果M4已经能在手机上本地推理轻量大模型,用户调用AI就不再需要经过任何网络——不需要云端,不需要运营商的数据中心,不需要Token套餐。这个方向的发展速度比Token套餐的推广快得多。

绕过管道,历史上发生过。下一次,不会不一样。

本文数据来源:国家数据局2026年3月24日国新办发布会(新华网)、通信世界(江苏移动Token日销数据)、、DeepSeek官方API定价文档、中国移动2026年Q1财报(每经网2026-04-20)、中国移动2026年算力网络资本开支计划(新华网)、工信部《2025年通信业统计公报》