凌晨三点,你的代码代理还在跑。它用掉了你本月第三笔"算力津贴",而隔壁工位的同事刚因为token消耗量登顶内部榜单被CTO点名表扬。这不是科幻——这是2025年硅谷工程师的真实日常。
黄仁勋的"算力分红"提案
本周英伟达GTC大会上,皮衣CEO Jensen Huang扔下一颗炸弹:工程师应该拿到相当于底薪50%的AI token配额。按他的算法,顶尖人才每年可能烧掉25万美元的算力。
他把这个定位为"招聘工具",并预测会成为硅谷标配。
这个数字怎么来的?Huang没细说。但湾区VC Tomasz Tunguz在二月中已经算过一笔账:用Levels.fyi的数据,头部软件工程师年薪37.5万美元,加上10万token预算,总包冲到47.5万。每五块钱里,有一块是算力。
Tunguz管这叫"工程薪酬的第四个组成部分"——排在工资、股权、奖金之后。
为什么是这时候爆发?
token补偿的概念其实早有人在聊,但一月底OpenClaw的开源发布把讨论彻底点燃。
这个AI助手的设计逻辑很激进:持续运行、自动分解任务、在用户睡觉时派生子代理啃完待办清单。它属于"代理型AI"(agentic AI)浪潮的一部分——系统不再等你敲回车,而是自主接管一连串操作。
后果很直接:token消耗量呈指数级爆炸。
写篇文章可能用掉1万token,但工程师后台跑一群代理,一天能自动烧掉几百万——全程零输入,纯后台行为。传统"按用量计费"的模型在这里失效了,因为没人能预测自己的代理会多"勤奋"。
从福利到竞赛
《纽约时报》上周末的调查勾勒出一幅更具体的图景。Meta和OpenAI的工程师正在内部排行榜上比拼token消耗量,慷慨的算力预算正变成和免费午餐、牙医保险同级别的标准福利。
一位斯德哥尔摩的爱立信工程师告诉时报,他在Claude上的开销可能超过自己的工资——当然,公司买单。
这引出一个微妙的问题:当算力变成薪酬的一部分,它到底算"投资员工"还是"转嫁成本"?
Huang的叙事是前者——给你更多算力,让你更值钱。但Tunguz的数据暗示另一种解读:公司只是把原本要付的推理成本,包装成福利塞进总包。工程师感知到的"涨薪",可能只是成本结构的重新排列。
tokenmaxxing:新职场军备竞赛
时报创造的"tokenmaxxing"这个词正在硅谷流传。它描述的不只是消耗算力,而是系统性地优化代理配置、并行策略、模型选择,把每一分token压榨出最大产出。
这和当年的"leetcode刷题"或"系统 design 八股"本质相同:一种可被量化、排名、货币化的新技能。
但区别在于,leetcode是时间投入,tokenmaxxing直接烧钱。公司愿意烧多少,成了人才竞争的分水岭。
已经有工程师在谈判时主动询问token配额,把它和401k匹配比例、休假天数并列讨论。招聘启事开始标注"unlimited tokens"或"enterprise-grade compute budget"作为卖点。
谁在真正买单?
这里有个被忽略的转移支付。当公司承诺"无限token",它实际上是在和云厂商或模型提供商签批量协议,把边际成本压到零售价的十分之一甚至更低。
工程师感知到的"25万算力福利",公司实际支出可能只有2-3万。这种信息不对称让token补偿成为极具杠杆的招聘话术。
但风险同样真实。如果代理失控——进入无限循环、递归调用、或者干脆被 prompt 注入攻击——单账户的token消耗可能在几小时内突破六位数。谁为这个买单?HR手册还没写到这一章。
代理型AI重塑成本结构
更深层的变革在于,AI正在从"工具"变成"劳动力"。当代理能独立完成代码审查、测试用例生成、文档更新,工程师的角色向"代理管理者"迁移。
这种迁移的直接后果是成本核算的复杂化。传统软件开发的人力成本是线性的:一个工程师一个座位一份工资。代理经济里,成本变成脉冲式的——项目启动时代理集群扩张,维护期收缩,但基础设施始终待命。
token补偿试图把这种波动成本固定化、人格化。它让工程师对自己的"AI下属"有预算意识,同时也让公司有了更灵活的薪酬调节阀。
全球扩散的障碍
硅谷的玩法能复制到其他地方吗?短期内有几个硬约束。
首先是监管。欧盟AI法案对自动化决策的透明度要求,可能让代理型AI的部署成本陡增。token补偿在这种环境下很难算清账。
其次是基础设施。不是所有地区都能稳定获取Claude、GPT-4、Gemini的API。当算力本身成为地缘政治筹码,token薪酬的全球化会遭遇摩擦。
最后是文化。东亚科技公司的层级结构让"工程师自主决定算力消耗"这件事变得政治敏感。tokenmaxxing需要的实验精神和容错空间,与某些组织的KPI文化存在张力。
对个体工程师的启示
如果你在这个行业,现在该做什么?
第一,重新理解你的"总包"。下次谈offer时,把token配额换算成等值现金,比较不同公司的实际购买力。注意配额是"硬上限"还是"弹性申请",后者在实操中往往等于无限。
第二,投资token效率。学习如何给代理写更精确的指令、如何选择模型层级(GPT-4 vs Claude 3 Haiku)、如何设计缓存策略。这些技能正在成为新的技术护城河。
第三,追踪成本归因。确保你的token消耗能被正确关联到项目产出,而不是变成无法解释的开支。这在绩效评估和晋升答辩中会很重要。
对企业决策者的启示
如果你是CTO或HR负责人,考虑token补偿前需要回答几个问题:
你的代理使用是否有足够的可观测性?能否区分"高效自动化"和"配置错误导致的浪费"?
token配额是统一发放还是按项目申请?前者简单但可能滋生浪费,后者灵活但增加管理成本。
如何防止token补偿变成纯粹的数字游戏?需要配套产出度量,而不是比谁烧得多。
长期看,token成本会下降还是上升?Huang的赌注是上升(所以才要现在锁定人才),但开源模型和边缘计算的进展可能颠覆这个假设。
回到那个根本问题
AI token到底是新的签约奖金,还是做生意的必要成本?
从Huang的视角,它是前者——稀缺资源的战略分配,对顶尖人才的定向投资。从Tunguz的数据透视,它更像后者——推理成本不可避免,把它包装成福利只是会计技巧。
真相可能在两者之间。token补偿确实反映了AI原生工作方式的崛起,但它的"福利"属性很大程度上来自当前的市场摩擦:模型定价不透明、工程师缺乏成本意识、公司急于建立竞争优势。
随着这些摩擦被磨平,token可能会像当年的AWS积分一样——从炫耀性福利变成基础设施,从谈判筹码变成默认配置。
但在那之前,有一扇窗口期。会玩tokenmaxxing的工程师,将在这一轮重构中获得超额收益。
你的配额到账了吗?
热门跟贴