硅谷Token焦虑蔓延：烧得越多越厉害，打工人被逼疯

魏家东

2026-04-20 12:31 ·北京 ·东狮品牌咨询（北京）有限公司CEO、《借势》作者

当AI成为科技行业的核心生产力，一场关于"Token"的疯狂竞赛正在硅谷上演。Meta内部员工自发搭建的"Claudeonomics"排行榜，让8.5万名员工卷入Token消耗大赛，单月烧掉60万亿Token，价值约9亿美元。从高管公开支持到员工争相攀比，"烧Token"俨然成为新的KPI和身份象征。然而，这场看似繁荣的算力狂欢背后，隐藏着巨大的资源浪费与效率困境。随着智能体（Agent）时代到来，Token消耗模式发生结构性变化，行业正从"越多越好"的粗放增长，转向"越准越好"的精耕细作，一场关于算力效率的革命正在悄然展开。

一、Meta的Token狂欢：当烧钱成为新KPI

在Meta公司内部，一场别开生面的竞赛正火热进行。员工自发在内网创建的"Claudeonomics"排行榜，实时追踪着全员的AIToken消耗情况。这个以Anthropic旗舰产品Claude命名的榜单，汇聚了8.5万名员工的数据，列出Token消耗量最高的前250名。

榜单设计得如同游戏竞技：排名靠前的员工可获得铜、银、金、铂金到翡翠的等级徽章，以及"模型鉴赏家""缓存巫师"等趣味头衔。而站在金字塔顶端的人，则被冠以"Session永生者""Token传奇"的称号，成为公司内的AI明星。

数据令人咋舌：过去30天，Meta员工累计消耗Token超60万亿。按AnthropicClaudeOpus4.6模型每百万Token15美元的价格估算，总成本约9亿美元。个人消耗榜首更是达到惊人的2810亿Token，价值数百万美元。

更值得关注的是，这种"Token最大化"文化已获得管理层背书。MetaCTOAndrewBosworth公开表示，顶尖工程师将相当于年薪的金额用于Token消耗，生产力可提升10倍，"这笔交易成果显而易见，应持续投入，没有上限"。英伟达CEO黄仁勋更是直言不讳："如果一名年收入50万美元的工程师每年在AIToken上花费少于25万美元，我会深感担忧"。

在硅谷，"烧Token"已成为新的职场炫耀资本和能力证明。员工们为提升排名，让AI代理长时间闲置运行、频繁发起无意义调用。这种"人工数据膨胀"行为，将Token消耗异化为单纯的数字游戏，而非真正的生产力提升。

二、Token≠生产力：被误读的效率指标

这场Token狂欢引发广泛质疑。彭博社记者JoeWeisenthal在X平台嘲讽："用Token总消耗量衡量生产力有何意义？这就像'后院炼钢炉'，一味追求数字而忽视质量"。

根本问题在于：Token消耗是投入指标，而非产出指标。就像用打印页数衡量员工生产力，消耗更多Token并不等同于取得更多成果。

智能体（Agent）的兴起让问题更加复杂。以OpenClaw为代表的新一代AI系统，不再是简单对话工具，而是能持续执行任务、主动调用工具、自行拆解目标的自动化系统。它像"不下班的执行单元"，任务启动后在后台长时间运转，反复推理、调用、修正。

这种转变彻底改变了成本结构：一次简单自动化流程，可能拆分成数十甚至上百次模型调用；一次"让AI自己完成"的指令，背后是长时间推理和连续Token流水。大量消耗来自模型内部推理，而非用户直接需求。

更严重的是，当前许多Agent系统效率低下，像经验不足的执行者，需要反复确认、多次修正。原本少数步骤可完成的任务，被拉长为高冗余流程。Token消耗增长，更多反映系统控制能力不足，而非智能水平提升。

行业长期存在"更强智能必须建立在更高算力消耗上"的假设。从GPT-3到GPT-4，通过更大模型、更长上下文、更复杂推理链换取能力提升。这种路径依赖延伸到Agent系统，演变为"用更多调用换更高成功率"的实践惯性，推动行业走向隐性算力竞赛。

三、效率革命：从"烧得多"到"用得准"

当Token竞赛逼近可持续边界，行业开始反思：真正的AI进步，不在于"用得多"，而在于"用得准"。Agent竞争正从"谁消耗更多资源"转向"谁更高效使用资源"。

1.模型与提示词优化：减少无效消耗

最简单高效的方式是优化交互方式。行业已总结出实用技巧：

精简提示词：将500字提示压缩到180字，Token消耗可降64%，质量基本不变

禁用冗余表达：要求AI"不要寒暄、不要解释、直接给答案"，减少输出浪费

对话管理：任务完成开启新对话，避免历史上下文累积导致成本上升

启用缓存：重复内容只付一次费，Anthropic缓存价格仅为正常1/10

2.智能路由：把算力花在刀刃上

不同任务需不同能力模型，"杀鸡用牛刀"是最大浪费。智能模型路由系统可自动分配：简单任务用低成本轻量级模型，复杂任务才调高性能模型。这种策略可降低成本50%以上。

3.架构革新：从根源提升效率

Anthropic提出革命性方案：将"模型直接调用工具"改为"模型编写代码调用工具"。通过MCP协议，把工具封装为代码文件，让AI生成代码执行任务。实测将典型任务Token消耗从15万降至2000，节省98.7%成本。

4.Token工厂：基础设施效率革命

无问芯穹CEO夏立雪提出"Token工厂"理念：与其扩张算力，不如把现有资源用到极致。通过技术打通不同芯片和算力集群，实现软硬件协同优化。

"Token工厂"不是简单堆砌服务器，而是从"为人设计"到"为AI设计"的底层重构。它像超级调度中心，将分散算力池化成统一资源，毫秒级分配给最合适任务，让GPU利用率从15%-30%提升至更高水平。

四、未来已来：高效AI时代的新图景

Token效率革命正重塑AI行业发展逻辑，带来三大深远变化：

1.成本曲线非线性优化

行业一直假设"更强模型必然更贵"，但效率优化打破此魔咒。高效训练的小模型，可能比参数更大但低效的大模型更强、更省。AI能力提升不再唯算力论。

2.算力瓶颈转向效率瓶颈

当GPU利用率仅15%-30%时，问题不在算力不足，而在利用不充分。通过系统优化，现有硬件可释放数倍潜力。行业竞争焦点从"谁有更多GPU"转向"谁能用好每一块GPU"。

3.AI民主化加速

只有成本降至足够低，AI才能从巨头专利变为全民可用工具。Token效率革命让AI从昂贵奢侈品变成普惠基础设施，每一分算力被珍视，每一次调用有价值。

五、从野蛮生长到精耕细作

Meta的Token狂欢是AI发展的必经阶段，反映行业从技术探索向规模化落地的转型阵痛。当"烧Token"成为KPI，我们必须清醒：真正的AI价值，不在于消耗多少资源，而在于创造多少成果。

未来属于那些能用更少Token完成更复杂任务的创新者。从"越多越好"到"越准越好"，从粗放扩张到精耕细作，这场效率革命不仅是成本控制，更是AI发展范式的根本转变。

当行业真正理解Token经济学的核心——效率为王，AI才能摆脱资源竞赛陷阱，走向可持续、普惠的未来。那时，Token不再是攀比数字，而是真正驱动创新、创造价值的核心燃料。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴