Token消耗重心已变,降价是在重写分配地图
大模型降价不是要收割你,而是整个产业的算力账单正在被悄悄重写——以前花在生成上的钱,现在全砸进理解你的过程里了。你想想,当Agent替你跟世界交互,它读的文档、查的接口、调的工具,每一项都在疯狂吃进token,这种输入侧的消耗已经远远甩开输出,成了烧钱的无底洞。
顺着这条线你会发现,降价是把蛋糕做大的前奏。输入token消耗的幂律分布意味着头部场景会吸走绝大部分资源,而腰尾部应用才刚刚冒头——这让主动投资工具的职场人反而能卡住先发优势。说白了,现在每个行业都处在被AI重新装配的早期,谁先把自己的工作流拆解成可被调用的能力块,谁就能在token经济的分配表里拿下一块高地。
听完这期你会带走一个清晰的坐标:AI重构不是换工具,是换逻辑。当产业蛋糕还在膨胀,幂律的头部尚未固化,投资自己驾驭Agent的能力,就是在给未来的话语权充值。问题是,你看得见这张新的分配地图吗?
Agent时代Token消耗重心转向输入
你上一次用ChatGPT聊天,花了多少Token?你肯定没算过,因为OpenAI没给你账单。但到了Agent时代,账单突然变得吓人——不是因为输出多了,而是输入爆炸了。智朴的李子玄在节目里点破了这层窗户纸:2026年大家突然开始聊Token,绝不是巧合。之前的AI产品,不管是豆包还是DeepSeek,用户感知的是“聊了多少轮”,谁管你输出了多少字?直到OpenAI搞出API计价,人们才被迫用一个冷冰冰的单位丈量每一次交互。可这还没完,Agent一来,范式直接翻了个个儿。
以前用生成式AI,你敲十几个字的prompt,它给你吐一首诗,四五千Token砸在输出上,你看得见,觉得“流量差不多就这些”。现在呢?李子玄的原话一针见血:“进入agent时代,大量的token消耗其实不可见的,你装载一个skills,然后去做了一个检索,这检可能花了十几万、几十万token,这个都是非常的常见。”几十万Token是什么概念?如果纯输出,够生成半本中篇小说了。但在这里,它们被吞进检索、拆解、比对、数据库回溯那一长串你根本看不见的链条里,最后呈现在你眼前的,可能就三行字、一个选项。
试想一下,你只是让Agent帮你查“上个月华南区退货率异常的原因”。它先是把你的指令拆成七个搜索意图,调了四个内部知识库,又抓了上百条订单备注逐条做语义分析,中间反复交错着几家大厂的模型API——郝景芳在节目里就是这么搭工作台的。每一步都在狂吃Token,你看到的却只有一份干净利落的结论。这种输入端的消耗,甚至在很多任务里能占到九成以上。所以你才觉得“每天一查账单,哎,好像也没花很多钱”,那是因为Token单价降到让你几乎无感,可数量呢?早就是聊天机器人时代的千倍万倍了。李子玄自己每天就在零到一亿Token之间波动,零是纯开会,一亿是疯狂调Coding Plan搞开发。都第四年了,抢不到自家公司的Coding Plan还得自己想办法,这算不算AI原生的代价?
AI时代职场人应主动投资工具
都第四年了,还有人在等公司给配AI工具。
李子玄在华夏基金这期deeptalk里聊到一个细节——他要求团队里的技术成员自己去抢购质朴的coding plan,跟外面几十万人一起排队。每天早上一开售就显示售罄,他的同事也得盯着屏幕刷新。“你是一个ai原生时代的人,如果公司不赞助a模型怎么办?你要有办法有意愿去获得a模型。”这话扔出来的时候,弹幕飘过去好几条“扎心了”。
他是拿mac mini类比。2023年初龙虾刚刚火起来,多少人第一时间自掏腰包买设备做测试?没人等公司IT部门出采购通知。现在轮到AI,逻辑一模一样——你需要的不是审批,是一次凌晨三点的抢单。李子玄自己的token消耗曲线夸张到每天在0到一亿之间波动,开会见客户的日子归零,回到开发状态就疯狂调用。他说这不是为了开发而开发,是发现工作流里某个卡点,marketting流程里、product design环节里,突然意识到这个步骤可以优化,然后立刻打开codex动手。
但真正的分水岭不在这里。试想一个场景:你的部门有预算,模型有配额,你用得上手。另一个场景:预算砍了,模型涨价了,你怎么办?李子玄的答案是“你要去想办法”而不是停下来等着。这就把AI从业余使用推进了职业素养层面。郝景芳在同一期节目里刚好做了最好的反例——她用多个模型搭了一个工作台,编程用cloud code,对话用deepseek,多模态识别用千问,生图用集梦,几种token交叉消耗。每天查账单发现没多少钱,因为token单价在持续下降。她在没人报销的情况下自己投入,把一个传统机构该一个技术组干的活,一个人用agent搭完了。
所以你缺的真的是工具吗?还是缺一个凌晨三点抢sold out的决心?2026年日均token调用量已经突破140万亿,两年前这个数字是1000亿。需求在指数级翻倍,而坐等公司采购的人,会被自己卡在原地。
为何大模型降价反而扩大产业蛋糕
token消耗的天平完全反转了。Agent模式下,你给模型丢过去的上下文——几万字的产品文档、整串的对话历史、实时爬取的网页数据——才是吞噬Token的怪兽,模型最终吐出来的那几行操作指令反倒省得像根牙签。子玄说的那句“输出所占用token少,输入非常多”,点破了一个残酷的事实:AI原生应用里,Token早已不是“生成内容”的计量单位,它是“理解世界”的氧气。试想,一个自动化客服Agent,它要读完你过去三个月的所有聊天记录、调出你的订单库、扫一眼退货政策,最后可能只回你一句话:“亲,这边帮您退款哦。”这句话不值几个Token,可前面那一大套“阅读理解”烧掉的Token,够普通用户聊三天了。
那这么烧下去,谁烧得起?
郝景芳的回答听起来像个悖论。她每天用Claude Code搭平台,用DeepSeek做用户沟通,用即梦生图生视频,几个模型串成一个工作台流水线,吭哧吭哧地跑。问她账单贵不贵,她说:“每天一查询,哎,好像也没有很多。”这不是凡尔赛。这是整个AI产业正在剧烈上演的一幕:Token价格正以肉眼可见的速度往下砸。智谱的Coding Plan抢都抢不到,不是因为它贵得让人肉疼,恰恰是因为它太便宜了,便宜到开发者像饿狼一样扑上去,一秒就显示“售罄”。类似的剧情,你可以在硅谷找到翻版——Anthropic的API、OpenAI的GPT-4o,每一家都在降价。按照传统经济学剧本,降价应该意味着行业利润摊薄,蛋糕越切越小才对。可现实呢?郝景芳这类“一人公司”的开发者非但没跑,反而往里面砸的时间、精力、Token量翻了几番。
这就引出一个反直觉的提问:如果Token是AI世界的“能源”,那能源价格暴跌,不等于产业要过冬吗?
你把时间拉回到2024年初。中国日均Token调用量突破1400000亿,两年前这个数字只是1000亿。整整翻了14000倍。不是40%,不是400%,是五个零的增长。这意味着什么?意味着当你以为降价是在消耗利润时,郝景芳这样的创作者正从“偶尔用AI写首诗的体验者”,变成“每天靠AI搭一个工作台的生产者”。价格每砍一刀,就有新一批人带着新需求冲进来。景芳直接戳穿了这层窗户纸:“AI这个市场没有达到饱和……你这个价格怎么降都不怕。因为这个市场还有这个成千上万倍的增长空间,所以价格再多降一些才好呢!”你以为她在呼应供给侧的降价策略,她其实在讲需求侧的爆发逻辑。Token不是用来囤的,Token是被烧掉的——烧得越便宜,人们就越敢放手去烧,越放手去烧,那些原本蜷缩在成本阴影里的复杂应用——多智能体协作、实时多模态识别、全自动工作流——就一个个被烧活了。平台的总调用量随之往上狂飙,技术成本被天文数字般的调用次数一摊薄,利润反而从规模里长了出来。
这个逻辑,中国互联网早在十多年前就玩过一次了。2014年,移动流量资费一降,短视频、直播、手游应声而起,最终把运营商喂得盆满钵满的不是高价流量,而是全民刷手机的时长。Token时代的故事,连剧本都没换:天翼云、移动云、火山引擎、阿里云,几大云厂商几乎在同一周期启动了大模型降价潮,将推理成本打到了原来的几十分之一。结果呢?那些在2025年还担心Token账单的小创业者,到了2026年已经可以像郝景芳一样,云淡风轻地搭着多模型工作台,顺便盘算着要不要再买一台Mac mini跑本地模型了。子玄说得更直接,在AI原生时代,你不能指望公司给你报销所有Token,就像你不能指望公司给你买龙虾当夜宵一样。“这可能是AI原生时代的人,必须要有的一个投资。”自己主动寻找更有知识密度的Token,加入自己的工作流,这不叫消费,这叫生产资料的本钱。而生产资料只有便宜到几乎忽略不计的时候,一个产业的真正爆发才算按下了倒计时。
Token消耗为何呈幂律分布而非正态
移动互联网时代,我们习惯了一个词——用户时长。头条、抖音、微信,所有人的争夺都围绕着这玩意儿。你每天刷多久,我每天刷多久,拉个曲线一看,挺标准的正态分布:特别沉迷的和完全绝缘的都是少数,绝大多数人挤在中间那个鼓包里,一天三五个小时,不多不少。
可token的消耗是这么回事吗?你再想想。
主持人高翔在节目里抛出的这个对比挺狠的。他观察到一个现象:AI时代,人和人之间“用量”的差距,根本不是一个量级。有人一天零token,手机里的AI助手吃灰三个月;有人一天烧掉上亿token,拿coding plan当水喝,开发、设计、营销全链路都往agent里灌。这两个极端之间,根本不是从“轻度用户”到“重度用户”的平滑过渡,而是一道断崖。
李自玄在节目里随口提了一组他自己的数据:一天之内,token消耗量在“零到一亿之间波动”。零,是因为那天开了一整天线下会,嘴皮子磨破了但没碰一行代码;一亿,是因为他用Claude Code和Codex啃掉了一个积压两周的流程优化问题。你注意这个波动幅度,它不是一个“今天多用了一点、明天少用了一点”的均值回归,它是上亿倍的切换。
这就不是正态分布了。高翔给了个准确的数学命名:幂律分布。翻译成人话就是——少数人的消耗量占了总量的大头,那个长长的尾巴翘得高得离谱。正态分布看的是“平均人”,幂律分布看的是一小撮“极端值”。移动互联网的杀手锏是信息流,喂给你的内容越长,你的时长越稳定,越容易收敛到一个均值。可AI agent呢?它不喂你,是你去喂它。你扔进去的是需求、是上下文、是整个项目库里扒出来的几十万行祖传代码,吐出来的是重构方案。输入的token量跟用户的“生产能力”直接挂钩,而不是跟“消费意愿”挂钩。
郝景芳的案例更极端。她一个人用AI搭了整家公司的管理平台,从第一行代码就没找过活人程序员。她的工作台是个multi-agent流水线——A模型负责理解用户意图,B模型干活出方案,C模型跑图像识别,长上下文的东西丢给DeepSeek,生图生视频召唤集梦。这不是“使用AI”,这是在调度一支机器人军队。你说她一天的token消耗量能画进那条正态曲线的什么位置?画不进去,她是尾巴尖上那个让横轴都拉长的点。
“它确实是一个跟移动互联网完全不是一个量级的创新。”高翔在节目里下了这个判断,然后补了关键一句:“它这个分布的状态,可能更像是数学上讲的是一个密率分布,就是它的尾巴那个部分可能会非常高。”字节、腾讯当年抢的是“国民总时间”的大饼,每个人从24小时里抠出几十分钟,均匀地分给所有人。token呢?它是生产力本身,跟时长无关,跟能力直接正相关。一个能用代码重构业务流程的人,和一个只会用豆包写周报的人,他们之间压根不存在“逐步升级”的梯子。
李自玄的团队连模型token都不让公司赞助,自己抢coding plan去。他管这叫“AI原生时代的人必须有的技能”——不是等公司买单,是你要有办法有手段主动拿到知识密度最高的那个token配额。都第四年了,公司还不赞助模型?那就自己去抢啊!
AI重构所有行业仍处于早期阶段
AI重构所有行业才走到哪儿了?要是你以为客服机器人、文生图、自动翻译就算落地,那真是把这场变革看小了。李子玄在与郝景芳、主持人高翔的对谈里提了个判断:“现在只是一个开始,因为还没有非常深入的进入物理层...还有很大的一个想象空间在这里。”这句话戳中了一个被大多数人忽略的事实——2026年开年,中国日均token调用量已经冲破1400万亿,是两年前的1.4万倍,可这些token绝大多数在干什么?在跑代码,在生成文案,在调对话流。它们还没真正撞上你身边那堵墙。
什么叫进入物理层?试想你打开外卖App选餐,AI助手能帮你比价、记住你上周夸过哪家店的锅气足,但它能让那碗面更快送到你手上吗?不能。骑手在路口等了90秒红灯,后厨因为切配慢了4分钟,这些物理世界的摩擦,token流经不去。再看网约车,平台调度算法确实在匹配供需,可一旦早高峰某个路口发生剐蹭,方圆两公里的车全堵成一片深红色,算法除了重新计算ETA、发条“司机已到达,请耐心等待”的推送,还能做什么?它干预不了路面上任何一辆车的物理轨迹,没法让前方那台龟速行驶的环卫车往右变个道。
郝景芳在节目里说她用多个AI Agent搭建管理平台、处理多模态任务,一个人活成了一家公司。李子玄更绝,一天token消耗能从零飙到一亿,边开营销会边写代码优化流程。听上去AI已经无所不能了吧?可你再想想,他们做的事——写程序、生成图像、对话理解、数据回溯——本质上还是在信息层打转。就像你用Claude Code重构了一整天的后端架构,最后发现部署到服务器上卡了壳,原因不是代码逻辑不对,是机房的空调昨天夜里坏了,两台机器温度过高自动降频。这事儿,token调用量再大也解决不了。
物理层的缺失,才是当前AI重构行业的天花板。李子玄为什么说“想象空间巨大”?因为他看得清楚,AI现在还是个困在屏幕里的聪明鬼。它能替你写方案、画原型图、做市场分析,可一旦涉及调动真实世界的资源——让工厂产线自动调整排期、让冷链车根据实时路况重新规划配送序列、让医院里不同科室的检查设备协同起来为同一个病人抢时间——它就抓瞎了。不是技术上做不到单点突破,而是整个社会的物理基础设施还没准备好向AI敞开接口。你每天消耗的token里,有多少条指令是指向屏幕之外的世界?恐怕连万分之一都不到。
还有一个更隐蔽的层面。郝景芳说自己用工作台串联多个模型,阶段性成果存进数据库不断回溯,这其实是一个Agent协同的雏形。可当多个Agent要协同操控物理设备时,问题就不是“你帮我写段代码”这么简单了。一个Agent负责调控仓库温湿度,另一个Agent管理自动分拣线,第三个Agent对接物流调度——它们之间的信息延迟哪怕只有300毫秒,就可能造成一车生鲜报废。这就是为什么李子玄说重构还处在早期。信息层的智能再炫,物理层的协同能力几乎为零,这两者之间的鸿沟才是未来十年真正要填的东西。
你觉得现在token已经便宜到可以随便挥霍,一天几百万token烧着做开发也不心疼。可这些token创造的价值有多少能穿透屏幕落进现实?2014年移动互联网鼎盛时大家也觉得能挖掘的场景都挖完了,谁会想到后来冒出拼多多撬动整个供应链、抖音改变内容分发逻辑?AI现在连移动互联网当年那种对物理世界的渗透程度都还没达到,连一个真正闭环的“决策-执行-反馈”链条都跑不通。李子玄说的没错,这只是一个开始,远没到谈终局的时候。
热门跟贴