来源:市场资讯

(来源:藏金洞)

洞主江湖说:我说的可能都是错的,但值得你去探索和反思。

打开网易新闻 查看精彩图片

亲爱的藏金洞友们:

你以为AI在烧钱,其实它在发行新货币

硅谷现在有一种新的炫富方式。

以前炫融资:我融了几个亿。后来炫算力:我买了多少张GPU。现在更离谱:我今天烧了多少Token。

这股风潮有个新名字,叫 Token Maxing。

说白了,就是把AI用量拉到极限。员工一天烧多少Token,团队能同时调度多少个Agent,公司内部谁是AI超级用户,正在变成硅谷新的“工牌鄙视链”。

以前卷加班,后来卷代码,现在卷Token。

你没烧过几百万Token,都不好意思说自己AI Native。

但洞主觉得,这事不能只当成硅谷的新型凡尔赛来看。

因为Token背后,藏着AI时代真正的新战争:模型公司在抢定价权,云厂商在抢通道权,开发者在抢成本优势,中国模型在抢全球性价比市场。

如果说石油是工业时代的血液,电力是数字时代的底座,那么Token很可能就是AI时代的新货币。

01

打开网易新闻 查看精彩图片

Meta员工一个月烧掉60万亿Token,大厂为什么疯了?

今年4月,Meta被曝内部有一个AI使用排行榜。

这个榜单统计了超过8.5万名员工的AI使用情况,列出Token消耗量最高的前250名超级用户。

最近一个月,榜单总使用量突破 60万亿Token。

如果按高端模型API价格粗略换算,这是一笔极其夸张的成本。排名靠前的员工,一个人烧掉的Token价值可能就达到数百万美元。

这消息一出来,硅谷炸锅了。

支持派说:公司必须鼓励员工疯狂使用AI,不然就会被更AI Native的对手淘汰。

反对派说:烧Token不等于生产力,烧得越多,可能只是证明你越不会用AI。

这就像一个人天天去健身房打卡三小时,但大部分时间都在自拍。你确实去了健身房,但肌肉不一定长了。

AI也一样。

Token烧得多,不代表公司变聪明了。但完全不烧Token,基本说明这家公司还活在旧时代。

真正的问题不是要不要烧,而是:

你烧掉的Token,有没有变成代码、产品、决策、收入和利润?

02

打开网易新闻 查看精彩图片

AI正在改写软件行业的成本结构

过去软件行业最性感的地方是什么?

边际成本低。

一个SaaS产品开发出来以后,卖给100个用户和卖给100万个用户,底层成本差别没那么大。

所以传统软件是越卖越赚。

但AI不一样。

每一次对话、每一次总结、每一次代码生成、每一次Agent调用工具,背后都有真实账单。

用户不用,产品没价值。用户真用,成本又爆炸。

这就很尴尬。

过去软件公司的梦想是:用户越多,毛利越高。现在AI公司的噩梦是:用户越活跃,账单越吓人。

尤其到了Agent时代,一个任务不是问一句答一句。

它要拆任务、查资料、读文件、调工具、跑代码、修错误、再总结。

每一步都在烧Token。

所以AI创业公司拿到融资以后,第一件事可能不是招人,也不是租办公室,而是买API额度、买算力、买Token。

甚至有风投开始考虑:既然创业公司拿钱也是买Token,那我为什么不直接投Token额度?

看懂了吗?

Token已经不只是成本项了。它越来越像AI公司的弹药、燃料和现金流底座。

03

打开网易新闻 查看精彩图片

为什么越贵的模型,反而可能越便宜?

很多人以为Token成本就是单价乘数量。

没那么简单。

一次AI调用里,至少有三种Token:

  • 第一种,输入Token。也就是你发给模型的内容。

  • 第二种,缓存输入Token。如果上下文被系统缓存过,再次调用会便宜很多。

  • 第三种,输出Token。也就是模型生成回答时产生的内容。

一般来说,输出Token最贵。

因为模型生成答案需要一步步推理和计算,消耗更高。

这就产生一个很关键的商业逻辑:

AI真正贵的,不是你问了多少,而是模型答了多少、循环了多少、返工了多少。

便宜模型看起来单价低,但如果它一次做不对,就要反复重试。

强模型看起来贵,但如果它一次做对,反而总成本更低。

这就像请顾问。

便宜顾问一天1000块,陪你聊三个月,最后结论是“建议进一步研究”。贵顾问一天10万块,三小时指出问题死穴。

你说谁便宜?

所以AI时代的成本,不能只看“每百万Token多少钱”,而要看:

每一个有效结果到底花了多少钱。

这才是真账。

04

打开网易新闻 查看精彩图片

中国模型为什么突然香了?

当硅谷开始疯狂Token Maxing,全球开发者很快遇到一个问题:

美国顶级模型很好,但真的贵。

尤其是Agent工具普及后,Token消耗从几千、几万,直接跳到几十万、几百万、甚至上千万。

这时候,开发者自然开始找替代品。

于是中国模型开始在国际开发者市场里变香。

原因非常简单:

性价比高。

不是每个任务都需要最强模型。

很多任务并不需要AI像哲学家一样深沉,只需要它听话、稳定、便宜、跑得快。

比如格式转换、批量总结、信息抽取、客服问答、数据清洗、简单代码任务。

这些场景里,顶级模型当然能做,但用它就像拿法拉利送外卖。

不是不行,就是有点烧包。

中国模型的机会就在这里。

美国模型定义智能天花板。中国模型打穿价格地板。

一个卖最强大脑,一个卖极致性价比。

而在全球开发者生态里,性价比永远是最硬的通行证。

这背后不只是模型能力问题,还有工程能力、云厂商补贴、推理架构优化和基础设施效率。

说白了,中国模型正在用当年中国制造的方式切入全球AI市场:

不一定最贵,但足够好用;不一定最豪华,但极具杀伤力。

05

打开网易新闻 查看精彩图片

OpenRouter卖的不是接口,是AI时代的调度权

模型越来越多以后,开发者最头疼的问题变成了:

到底该用谁?

复杂任务用GPT。长文本任务用Claude。便宜任务用中国模型。代码任务用专门模型。某个模型挂了,还要自动切换备用模型。

这时候,OpenRouter这类平台就冒出来了。

它表面上做的是统一接口。

一个入口,接入多个模型。

但它真正值钱的不是接口,而是调度权。

谁便宜,用谁。谁快,用谁。谁稳定,用谁。谁效果好,用谁。谁出问题,马上换谁。

这很像AI时代的模型交易所。

OpenRouter不只是帮开发者省事,它还掌握了一个极其关键的数据:

全球开发者到底在用哪些模型?哪些模型增长最快?哪些任务正在爆发?哪些模型正在被替代?

这就是AI应用层的水流图。

谁掌握水流,谁就掌握未来的分发权。

06

打开网易新闻 查看精彩图片

Token套利:下一批赚钱的人,可能是最会省Token的人

只要模型之间有价差,就一定会有套利。

这就是 Token Arbitrage。

翻译成人话就是:

用便宜模型干大部分活,用贵模型处理关键判断,然后整体打包卖给用户。

用户看到的是一个AI产品。背后可能是十几个模型在分工协作。

简单问题,小模型回答。复杂问题,强模型处理。格式整理,便宜模型完成。关键决策,顶级模型兜底。模型失败,系统自动切换。

用户不关心你背后用了谁。

用户只关心结果好不好、速度快不快、价格能不能接受。

这里面就有利润空间。

同样一个任务,全程用顶级模型,成本可能是10美元。智能路由以后,成本可能降到1美元。用户愿意付5美元,中间就有4美元空间。

这不是简单倒卖API。

这是一套新的AI成本工程。

未来AI应用公司的核心能力,不只是会不会写Prompt,而是:

会不会调度Token。

模型是车。Token是油。路由系统是物流网络。

真正赚钱的,未必是最会造车的人,也可能是最会调度车队的人。

07

打开网易新闻 查看精彩图片

Token出海:中国可能出口一种“不出海关”的新商品

最值得重视的,是Token出海。

想象一个场景:

一个伦敦程序员调用中国模型API。请求从英国发出,传到中国数据中心。中国GPU开始计算,中国电表开始跳。几秒钟后,结果返回英国。账单完成跨境结算。

这个过程中,没有任何实物离开中国。

没有集装箱。没有海关。没有码头。没有报关单。

但中国的电力、算力、模型能力和工程效率,已经通过Token完成了一次出口。

这是一种全新的出口形态。

过去中国出口衬衫、玩具、家电。后来出口光伏、电动车、锂电池。未来,中国有没有可能出口Token?

本质上,Token就是电力、芯片、算法、数据中心和模型工程能力打包后的数字商品。

它不像传统商品那样装箱上船。它通过API交付,通过账单结算,通过全球开发者生态扩散。

这就是所谓的“电力出海”“算力出海”“智能出海”。

不是电真的离开了中国。而是电在中国被转化成Token,然后卖给了全世界。

这事如果做成,意义不亚于中国制造出海。

只不过当年出口的是“便宜好用的商品”,未来出口的是“便宜好用的智能”。

08

打开网易新闻 查看精彩图片

真正的战争,不是模型战争,而是基础设施战争

很多人以为Token价格战,拼的是模型。

不完全是。

模型只是前台。

后台真正拼的是电力、GPU、数据中心、网络、冷却系统和基础设施响应速度。

美国不是没有电,而是很多地方缺少能快速接入大型数据中心的电力基础设施。

变电站审批、高压电接入、土地协调、环保流程,每一项都可能拖慢AI基建。

中国的优势在于大规模基础设施组织能力。

西部有新能源,东部有需求,中间有特高压。云厂商、地方政府、数据中心、模型公司和供应链可以形成一套完整的协同体系。

所以Token价格战,表面看是模型API价格战,实际上是算力工业体系的战争。

谁能更快建数据中心,谁能更便宜拿电,谁能更高效调度GPU,谁就能拥有Token经济里的定价权。

AI拼到最后,还是一门重工业。

别被“智能”两个字骗了。它的底座,是电网、机房、芯片和冷却塔。

09

打开网易新闻 查看精彩图片

洞主有话说:Token不是技术单位,是AI时代的新账本

Token正在从一个技术单位,变成AI时代最重要的经济单位。

它连接了模型能力、算力资源、电力系统和商业收入。

过去石油是工业血液。未来Token可能是智能时代的工业血液。

因为Agent要工作,AI应用要运行,企业要自动化,代码要生成,内容要生产,决策要辅助,都离不开Token。

更关键的是,Token消耗正在从“人类主动发起”变成“机器自动运行”。

以前是人问一句,AI答一句。未来是Agent自己查资料、自己写代码、自己跑测试、自己改方案、自己交付结果。

人类一天只会问几十个问题。但一个Agent工作流,一天可以调用模型上万次。

所以Token需求不是线性增长,而可能是指数级增长。

这就是为什么黄仁勋说Token会成为大宗商品。

围绕Token,人类过去几千年发明过的商业模式,都会重新演一遍:

批发零售、平台抽佣、期货交易、智能路由、套餐计费、价格套利、基础设施租赁、跨境服务出口。

唯一不同的是,这一次速度更快。

以前石油要从地下挖出来,炼化、运输、储存、销售。现在Token从数据中心生成,几秒钟就能跨境交付。

所以AI时代最值钱的公司,未必只有最强模型公司。

还会有三类赢家:

  1. 能最低成本生产Token的基础设施公司。

  2. 能最高效率调度Token的平台公司。

  3. 能把Token转化为真实业务结果的应用公司。

说到底,AI时代不是看谁喊AGI最大声。

而是看谁能回答一个最朴素的问题:

我烧掉的每一个Token,到底换回了什么?

这才是Token经济学的底层账本。