出品 | 网易智能
作者 | 小小
编辑 | 王凤枝
有人一周狂烧2100亿个Token,有人一个月为AI编程工具砸下15万美元。
如今,硅谷评价一个程序员牛不牛的标准,不再是代码质量、项目交付或团队贡献,而是疯狂比拼一个极其昂贵的技术指标,Token消耗量。
一位OpenAI的工程师在一周内通过公司的AI模型烧掉了2100亿个Token(相当于33个维基百科全部文本的总和),位居全公司第一。在另一家AI公司Anthropic,一名Claude Code用户在一个月内就产生了超过15万美元的账单。
这种看似荒诞的攀比并非员工自娱自乐,而是源于老板们的疯狂推崇。既然老板迷信AI能提效,疯狂烧钱自然就成了员工保住饭碗的“表演”。在一些科技公司,内部排行榜会实时公开每位员工消耗的Token数量;而在Meta和Shopify等巨头内部,管理层甚至直接将AI工具的使用情况与绩效评估强行挂钩。
业内将这种现象戏称为“Tokenmaxxing(Token最大化)”。
但这笔天价账单真的物有所值吗?企业花重金买回来的,究竟是能颠覆行业的超级代码,还是员工为了刷榜而让AI疯狂生成的电子垃圾?当烧钱本身成了勤奋的证明,这场所谓的生产力革命或许只是一场自欺欺人的泡沫。
01 Token:AI时代的硬通货
要理解这场竞赛的本质,首先需要弄清楚Token究竟是什么。
Token是AI系统处理信息的最小计量单位,大致相当于一个词片段。当用户向AI模型输入文本时,系统会将文字拆解为Token进行处理;当模型生成回答时,同样以Token为单位计算工作量。对于基于文本的AI应用而言,生成750个单词大约需要消耗1000个Token。
就在不久之前,即使是重度用户,一天消耗数千个Token已属极限。例如,一名学生借助AI完成一篇论文并经过几轮修改,大约用掉一万个Token(约合7500个单词)。要消耗数百万个Token,需要一个人坐在电脑前连续敲击键盘几个小时,而消耗数十亿个Token几乎是不可能的。
然而,随着所谓智能体编码工具的问世,筹码被加大了。这类工具与传统AI助手的本质区别在于自主性。这些系统可以不受监督地连续工作数小时,只需一个提示词,就能审查和编辑庞大的代码库,甚至编写出完整的软件程序。每个智能体可以生成成百上千个子智能体(subagents)来处理任务的不同部分,每一步操作都在生成数千个Token。一些AI系统(如流行的开源AI助手OpenClaw)甚至被设计为24/7全天候运行,在人类用户睡觉时疯狂消耗Token。
AI初创公司Mechanize的联合创始人埃格·埃尔迪尔(Ege Erdil)透露:“如果你有几个持续运行的智能体,一个全职智能体一周就能消耗7亿个Token。(我估计我自己每周的Token消耗量在10亿到100亿之间。)其实根本不需要费什么力气。”
当Token成为衡量AI工作量的通用标尺,它自然而然地演变为一种稀缺资源,甚至成为科技公司人才竞争的新筹码。英伟达CEO黄仁勋在今年GPU技术大会的主题演讲中明确提出,他计划在工程师年薪之外,额外提供相当于年薪一半的Token预算。“这现在成了硅谷的招聘手段之一:我的工作附带多少Token?”黄仁勋的这番话,将Token从技术概念推向了商业竞争的前台。
OpenAI旗下AI编码服务Codex的工程负责人蒂博·索蒂奥(Thibault Sottiaux)也观察到类似趋势。他表示,在求职面试中,越来越多的人开始询问他们能获得多少专属的推理计算资源。Token正在成为继薪酬、奖金、股权之后,科技人才争夺中的第四大组成部分。
02排行榜上的荣耀与焦虑
在一些科技公司,Token消耗量已不再只是一个技术指标,而是被赋予了强烈的社交属性。在Meta和OpenAI等AI公司,员工们会在内部排行榜上展开竞争,比拼的正是各自消耗的Token数量。排行榜成了新的业绩展示板。慷慨的Token预算正成为程序员的一项工作福利,就像牙科保险或免费午餐一样。
Shopify则是另一条路径的代表。该公司在一份声明中确认,Token使用只是衡量绩效的指标之一,同时也会考察AI如何改进和放大工作成果。该公司CEO托比·卢特克(Tobi Lütke)已将AI的使用设为一项基本期望,并直接与绩效评估挂钩,那些大量使用AI工具的员工会得到奖励,而使用较少或不使用的员工则会受到敲打。
这种氛围催生了一种新的职场焦虑。风险投资家尼昆吉·科塔里(Nikunj Kothari)在他发表于Substack的文章中将其称为“Token焦虑”。他观察到,科技圈的对话主题正在悄然改变,过去人们见面时常问“你在构建什么?”,如今变成了“你跑了多少个智能体?”
为了在排行榜上占据一席之地,一些员工开始采用极端策略。一些程序员掌握了AI多任务处理的艺术,同时打开多个窗口,一次性将几十个智能体释放到他们的项目中。
更有甚者,利用订阅套餐的漏洞,以远低于市场价的成本获取大量Token额度。一位初创公司创始人透露,他发现设计初创公司Figma开发的一款AI工具存在漏洞,通过每月20美元的账户,就能使用相当于价值7万美元的Claude Token。他利用这个漏洞同时构建了六个软件项目,直到该功能在最近几天开始执行AI额度限制。
这种现象在AI公司内部也引发了反思。一位匿名OpenAI员工表示这似乎不可持续。
然而,没有人愿意轻易停下脚步,因为谁也不愿成为那个在AI时代仍主要依靠手工编码的人。正如科技通讯作者格尔盖利·奥罗斯(Gergely Orosz)所言,在大型科技公司内部,无论产出质量如何,不以加速的步伐使用AI正成为一种职业风险。
这种文化在观察者眼中已经偏离了工程应有的轨道。有网友评论称,真正的工程追求效率,用最少的资源换取最优的结果。而当前这种攀比服务器账单的行为,不过是将烧钱误当作生产力,企业若为草率的实验无节制地买单,终究会为此付出代价。
03 Token消耗:衡量的是努力还是成果?
员工比着用,老板乐得买单,看似双赢。但这里隐藏着一个经典的管理学难题,Token消耗量大,就一定意味着产出高吗?
自动化平台制造商Zapier已经开始用一种新的仪表板追踪员工的Token使用情况。其首席AI转型官布兰登·萨穆特(Brandon Sammut)表示,如果发现某个员工的Token用量是同伴的五倍,他们会感到好奇,这个人是效率极低,还是真正的超级明星?答案取决于这些Token究竟换回了什么。
Vercel公司提供了一个正面案例。一位高级工程师让一组AI智能体在一周内基于一篇研究论文,构建了一套核心基础设施的新服务。如果交由人类工程师完成,这项任务需要数周甚至数月。这份工作的账单是1万美元左右。Vercel的CEO吉列尔莫·劳赫(Guillermo Rauch)认为这笔投入非常值得,他表示这有点像给人们一根喷射燃料的消防水带。他估计,花1万美元换回的一天工作量,可能为公司节省了数百万美元。
Kumo AI公司则从另一个角度看到了Token投入的价值。联合创始人赫马·拉加万(Hema Raghavan)透露,她手下优秀的工程师使用AI智能体,就像拥有了一支初级助手大军。有些工程师在周末滑雪时,他们的智能体仍在继续执行任务。更重要的是,拉加万发现,智能体有时能帮助编写出更优的代码,反而降低了公司的整体云成本。
然而,并非所有高消耗都能产生如此积极的回报。一些员工可能只是为了在排行榜上露脸,或者出于用了就是对的的简单逻辑,进行了大量低效、重复甚至无意义的计算。有网友评论指出,这好比只看销售人员拨打了多少通电话,却不关心他最终完成了多少成交。如果企业不区分努力与成果,激励机制就会导向表面忙碌而非实质贡献。
更有工程师分享了更精明的使用策略,将自然语言提示词提炼为关键变量,而非将完整段落原封不动地传递给模型。通过这种方式,Token使用量可以下降约99%,而效果仍能保留近九成。这位评论者直言:“Tokenmaxxing是在烧钱来假装有生产力,语义效率才是真正的解锁之道。”
《纽约时报》的凯文·鲁斯(Kevin Roose)在采访了多位重度用户后,提出了一个更为严峻的质疑,排行榜不衡量产出质量,这引发了一个显而易见的问题:这些Token最大化者中,有人产出了好东西吗?还是他们只是在原地打转,拼命产出无用的代码并浪费宝贵的处理能力,仅仅为了让自己看起来很忙?
04成本账单:谁来为“数字出勤主义”买单?
目前,Token的消耗成本大多由企业承担。但随着使用量的激增,这笔账迟早要被认真核算。
AI公司本身已经从这股浪潮中获益。Anthropic在今年前两个月内将其收入预测提高了一倍多,主要归功于智能体编码工具的迅猛增长。OpenAI的Codex工具,自年初以来每周活跃用户增加了两倍,以Token衡量的总体使用量增长了五倍。谷歌去年曾表示,其AI模型每月处理超过1.3千万亿个Token。
但对于使用这些工具的企业而言,Token成本的飙升是一个不容忽视的现实。有网友指出,目前市面上的AI订阅服务,如Claude每月200美元的套餐,其实际资源消耗远超定价,背后是AI公司的高额补贴。一旦AI公司需要实现盈利而提高价格,或者企业转向按使用量付费的API模式,Token成本可能上涨数倍甚至更多。届时,那些在排行榜上风光无限的Token大户,很可能迅速变成老板眼中的成本黑洞。
这种情况在云计算普及之初就曾上演。许多企业因上云成本失控而付出沉重代价,如资源闲置、配置过度、缺乏治理,最终导致账单远超预期。
如今,Token成本正在成为新的云成本问题。Exceeds AI创始人马克·赫尔(Mark Hull)称,他最近使用Claude Code开发了三种工作流工具,总计约30万行代码,Token成本约为2000美元。他决定让公司全体员工都使用这个平台,但48小时内成本就急剧飙升,迫使他不得不设置使用限制。
Vercel的CEO吉列尔莫·劳赫也承认,虽然目前Token消耗最多的员工也是表现最好的,但他并不否认未来会出现滥用行为。他直言员工可能把这些Token用在了副业项目上,比如自己的初创公司、兼职赚外快或者任何事情上,肯定会有很多滥用的情况。
有评论将这种现象称为数字出勤主义(digital presenteeism)在AI时代的翻版。过去,有人把外套挂在椅子上假装在公司,有人在居家办公时用物理鼠标抖动器(mouse jigglers)保持即时通讯工具在线,如今则用Token消耗量来证明自己的价值。只是这次,成本不再是免费的演技,而是真金白银。一旦企业开始严格核算投入产出比,这些表演就会变得格外刺眼。
FinOps专家凯文·普罗科佩茨(Kevin Prokopetz)指出,不加管理的AI工具采用会导致大量Token被烧掉,却对实际投资回报率毫无可见性。另一位评论者内特·帕特尔(Nate Patel)说得更为直白:“如果Token消耗不能与交付成果或节省的时间挂钩,那就只是在烧钱。”
05回归本源:究竟应该衡量什么
问题回到了管理学的原点。自彼得·德鲁克(Peter Drucker)首次系统论述知识工作者的生产力以来,如何有效衡量产出就一直困扰着各类组织。人们总是倾向于衡量最容易计算的指标,而非最有价值的指标。过去是代码行数、发送邮件数量、工作时长,如今轮到了Token消耗量。
有评论引用古德哈特定律来剖析这一现象,当一个指标本身成为目标时,它就不再是一个好指标。Token排行榜正是如此,它驱使员工去攀比消耗量,而非追求真正的成果。
芝加哥大学布斯商学院的研究员布莱恩·贾巴里安(Brian Jabarian)称,公司必须开始衡量Token使用情况,但目的不是为了比较谁用得多,而是为了看清投入产出。
他认为每个人都以为只要使用AI Token生产力就会提高,然后事情就结束了,但现实要复杂得多。如果一家公司通过AI招聘节省了前期成本,但后期需要耗费更多人力或Token去弥补错误,那么整体就是亏损的。当一家公司向50万名员工提供AI工具时,这些Token问题就变成了首要问题。
一些企业已经开始探索更精细化的管理方式。Zapier的萨穆特表示,他们会通过分析得出结论,判断某种使用模式是值得在同事中推广的金牌模式,还是需要通过指导来摆脱的反面模式。Exceeds AI的赫尔则建议,公司应围绕Token使用制定治理规则,例如对特定任务可以使用哪些模型设置限制,甚至可以借助AI本身来实现此类选择的自动化。
一位网友分享了他的评估标准,评价一个AI项目的价值,看的不是消耗了多少Token,而是每个Token创造了多少持久的价值。如果哪个管理者坚持以Token消费额为唯一考核标准,他会毫不犹豫地选择离开。
也许,我们需要的不是更多的Token,而是更聪明的使用方式。许多公司将最先进的顶级模型用于所有场景,而许多工作流程中,使用成本更低的模型就足够了。缺乏上下文缓存和糟糕的上下文管理,同样是企业浪费Token的重要原因。
还有人开始探索让AI更加节俭、更加自主,比如用更小规模的模型来完成特定任务。IBM的Granite 4系列模型,其3B和350M参数版本运行成本仅为大型模型的一小部分,甚至可以在树莓派等低功耗设备上运行。
另一位评论者则从技术架构的角度提出了更根本的思考。他认为,真正的突破在于用结构效率取代参数膨胀。用消耗数百亿Token的蛮力来解决确定性逻辑问题,就像开着喷气发动机去酒吧,这是一种巨大的、毫无道理的能源浪费。智能体AI的未来应该是节俭的、自主的、确定性的,将刚性逻辑卸载给高效的求解器,而不是在软件沙箱中无节制地生成数百个子智能体。
这些观点指向了同一个方向:Token本身不是目的,而是手段。衡量Token消耗,最终是为了衡量它换回了什么。
结语
当这股靠燃烧算力来“假装努力”的歪风刮遍硅谷,管理者们终将面临一个极其冰冷的商业现实:在这场疯狂的内卷游戏里,还没有真正的超级英雄。眼下唯一的绝对赢家,只有那些躲在幕后的算力供应商。
不可否认,今天这些疯狂消耗额度的“Token成瘾者”,或许在未来真能借此摸索出工具的潜能,进化成传说中的百倍效率工程师。但这同样可能只是一场昂贵的职场行为艺术。一旦企业重新审视“有效产出”的真正定义,这座用算力吹起的泡沫随时会轰然倒塌。
无论这场荒诞的戏剧最终走向何种结局,有一点是确定的:未来的世界注定需要更庞大的数据中心。而当大浪淘沙之后,真正能在竞赛中胜出的,绝不会是那些沉迷于排行榜数字的“刷榜机器”,而是那些懂得把每一个Token都转化为实际业务价值的组织和人。
不过,在畅想这场生产力革命的最终胜利之前,最好先祈祷公司的财务负责人看到下个月的账单时,还能保持情绪稳定。
热门跟贴