AI算力当工资发，硅谷在玩什么？

像素与芯片

2026-03-22 16:10 ·北京

凌晨三点，你的代码代理还在跑。它用掉了你本月第三笔"算力津贴"，而隔壁工位的同事刚因为token消耗量登顶内部榜单被CTO点名表扬。这不是科幻——这是2025年硅谷工程师的真实日常。

黄仁勋的"算力分红"提案

本周英伟达GTC大会上，皮衣CEO Jensen Huang扔下一颗炸弹：工程师应该拿到相当于底薪50%的AI token配额。按他的算法，顶尖人才每年可能烧掉25万美元的算力。

他把这个定位为"招聘工具"，并预测会成为硅谷标配。

这个数字怎么来的？Huang没细说。但湾区VC Tomasz Tunguz在二月中已经算过一笔账：用Levels.fyi的数据，头部软件工程师年薪37.5万美元，加上10万token预算，总包冲到47.5万。每五块钱里，有一块是算力。

Tunguz管这叫"工程薪酬的第四个组成部分"——排在工资、股权、奖金之后。

为什么是这时候爆发？

token补偿的概念其实早有人在聊，但一月底OpenClaw的开源发布把讨论彻底点燃。

这个AI助手的设计逻辑很激进：持续运行、自动分解任务、在用户睡觉时派生子代理啃完待办清单。它属于"代理型AI"（agentic AI）浪潮的一部分——系统不再等你敲回车，而是自主接管一连串操作。

后果很直接：token消耗量呈指数级爆炸。

写篇文章可能用掉1万token，但工程师后台跑一群代理，一天能自动烧掉几百万——全程零输入，纯后台行为。传统"按用量计费"的模型在这里失效了，因为没人能预测自己的代理会多"勤奋"。

从福利到竞赛

《纽约时报》上周末的调查勾勒出一幅更具体的图景。Meta和OpenAI的工程师正在内部排行榜上比拼token消耗量，慷慨的算力预算正变成和免费午餐、牙医保险同级别的标准福利。

一位斯德哥尔摩的爱立信工程师告诉时报，他在Claude上的开销可能超过自己的工资——当然，公司买单。

这引出一个微妙的问题：当算力变成薪酬的一部分，它到底算"投资员工"还是"转嫁成本"？

Huang的叙事是前者——给你更多算力，让你更值钱。但Tunguz的数据暗示另一种解读：公司只是把原本要付的推理成本，包装成福利塞进总包。工程师感知到的"涨薪"，可能只是成本结构的重新排列。

tokenmaxxing：新职场军备竞赛

时报创造的"tokenmaxxing"这个词正在硅谷流传。它描述的不只是消耗算力，而是系统性地优化代理配置、并行策略、模型选择，把每一分token压榨出最大产出。

这和当年的"leetcode刷题"或"系统 design 八股"本质相同：一种可被量化、排名、货币化的新技能。

但区别在于，leetcode是时间投入，tokenmaxxing直接烧钱。公司愿意烧多少，成了人才竞争的分水岭。

已经有工程师在谈判时主动询问token配额，把它和401k匹配比例、休假天数并列讨论。招聘启事开始标注"unlimited tokens"或"enterprise-grade compute budget"作为卖点。

谁在真正买单？

这里有个被忽略的转移支付。当公司承诺"无限token"，它实际上是在和云厂商或模型提供商签批量协议，把边际成本压到零售价的十分之一甚至更低。

工程师感知到的"25万算力福利"，公司实际支出可能只有2-3万。这种信息不对称让token补偿成为极具杠杆的招聘话术。

但风险同样真实。如果代理失控——进入无限循环、递归调用、或者干脆被 prompt 注入攻击——单账户的token消耗可能在几小时内突破六位数。谁为这个买单？HR手册还没写到这一章。

代理型AI重塑成本结构

更深层的变革在于，AI正在从"工具"变成"劳动力"。当代理能独立完成代码审查、测试用例生成、文档更新，工程师的角色向"代理管理者"迁移。

这种迁移的直接后果是成本核算的复杂化。传统软件开发的人力成本是线性的：一个工程师一个座位一份工资。代理经济里，成本变成脉冲式的——项目启动时代理集群扩张，维护期收缩，但基础设施始终待命。

token补偿试图把这种波动成本固定化、人格化。它让工程师对自己的"AI下属"有预算意识，同时也让公司有了更灵活的薪酬调节阀。

全球扩散的障碍

硅谷的玩法能复制到其他地方吗？短期内有几个硬约束。

首先是监管。欧盟AI法案对自动化决策的透明度要求，可能让代理型AI的部署成本陡增。token补偿在这种环境下很难算清账。

其次是基础设施。不是所有地区都能稳定获取Claude、GPT-4、Gemini的API。当算力本身成为地缘政治筹码，token薪酬的全球化会遭遇摩擦。

最后是文化。东亚科技公司的层级结构让"工程师自主决定算力消耗"这件事变得政治敏感。tokenmaxxing需要的实验精神和容错空间，与某些组织的KPI文化存在张力。

对个体工程师的启示

如果你在这个行业，现在该做什么？

第一，重新理解你的"总包"。下次谈offer时，把token配额换算成等值现金，比较不同公司的实际购买力。注意配额是"硬上限"还是"弹性申请"，后者在实操中往往等于无限。

第二，投资token效率。学习如何给代理写更精确的指令、如何选择模型层级（GPT-4 vs Claude 3 Haiku）、如何设计缓存策略。这些技能正在成为新的技术护城河。

第三，追踪成本归因。确保你的token消耗能被正确关联到项目产出，而不是变成无法解释的开支。这在绩效评估和晋升答辩中会很重要。

对企业决策者的启示

如果你是CTO或HR负责人，考虑token补偿前需要回答几个问题：

你的代理使用是否有足够的可观测性？能否区分"高效自动化"和"配置错误导致的浪费"？

token配额是统一发放还是按项目申请？前者简单但可能滋生浪费，后者灵活但增加管理成本。

如何防止token补偿变成纯粹的数字游戏？需要配套产出度量，而不是比谁烧得多。

长期看，token成本会下降还是上升？Huang的赌注是上升（所以才要现在锁定人才），但开源模型和边缘计算的进展可能颠覆这个假设。

回到那个根本问题

AI token到底是新的签约奖金，还是做生意的必要成本？

从Huang的视角，它是前者——稀缺资源的战略分配，对顶尖人才的定向投资。从Tunguz的数据透视，它更像后者——推理成本不可避免，把它包装成福利只是会计技巧。

真相可能在两者之间。token补偿确实反映了AI原生工作方式的崛起，但它的"福利"属性很大程度上来自当前的市场摩擦：模型定价不透明、工程师缺乏成本意识、公司急于建立竞争优势。

随着这些摩擦被磨平，token可能会像当年的AWS积分一样——从炫耀性福利变成基础设施，从谈判筹码变成默认配置。

但在那之前，有一扇窗口期。会玩tokenmaxxing的工程师，将在这一轮重构中获得超额收益。

你的配额到账了吗？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴