3月17日,2026年的英伟达GTC大会上,黄仁勋在两个小时的演讲,提到了超过了70次Token。如果你看最近的AI相关的文章,会发现“Token”这个词出现的频率也极高。不少人把黄仁勋的演讲,概括为“Token经济学”来传播。
我看到网上很多人都在讨论,要是把Token翻译成中文,该是什么?有人说叫“智元”,有人说叫“模元”,有人说叫“令牌”。直到前天(3月24日),国家数据局给起了个名字,叫“词元”。
不过,满屏的讨论似乎没能解答很多人的困惑。
这个Token到底是什么意思?它跟我有什么关系?
我理解,这种感觉,就像是千禧年时,很多人第一次听到“互联网”这个词那样。既兴奋,又迷茫。感觉很重要,但又说不出到底有什么用。
不过,我有一个半开玩笑的看法,反正Token是个AI时代前几乎没人提到的新概念,那“词元”这个翻译,格局可能小了。不如叫它“黄仁勋”。为什么这么说?
别急,听我用一个你绝对熟悉的场景,把这件事给你说明白。
01
Token,就像是电玩城的“游戏币”
电玩城,我们大概率都去过。
那里面,有投篮机,有赛车,有拳皇,各种游戏街机,老板给它们标上不同的价格。赛车火爆,想收5块一次。娃娃机机器多,薄利多销,想收2块一次。投篮机玩的人也不少,3块一次。
问题来了,怎么收费呢?如果每台机器都装一个投币口,只收现金,那得准备多少零钱?老板和玩家都觉得麻烦。
于是,电玩城的老板们想出了一个办法:
游戏币。
首先,设定一个最小计价单位,比如说1块钱换一个游戏币。接着,所有的游戏全都用这个最小单位的整数倍定价,比如投篮3个币,赛车5个币,抓娃娃2个币。
你看,问题解决。只要你一进门先在柜台换上50个、100个游戏币,就能全场畅玩。更重要的是,如果没花光,收好游戏币,下回接着来。
只要你理解了电玩城游戏币的逻辑,也就能看懂Token。
如果你去搜“Token”的翻译,你会发现,它的直译就是“代币”。
Token,就是AI世界里的“游戏币”,用来计量AI帮你干活到底花了多少“智力”的最小单位。
你让AI给你写诗、分析财报、写代码,这些任务其实就跟在电玩城玩游戏一样,都要付不同的钱,消耗不一样的Token。
好了,我们知道了Token是AI世界的“游戏币”。那么它能买什么呢?
02
Token,是“智力”定价的度量单位
买的是智力。
更具体地,Token就是一个给AI“智力”定价的度量单位。
什么意思?
过去,在工业时代,想搞建设就要先实现最基础的“三通”:通水、通电、通气。后来,到信息时代,多了个“通网”,变成了“四通”。到了AI时代,又多了一通:通智力。
这意味着,“五通”,正在成为未来商业发展的基础设施。
打好了基建,自然就要考虑开销支出。每一个基础资源,都有一个清晰、公认的计量单位。
水,按“吨”算。电,按“度”算。网,按“G(流量)”算。那么,“智力”该用什么计量呢?答案就是Token。
今天,用来计量“智力”的“Token”,可以看作是AI时代的“度量衡”。
所以,未来判断一家公司的营运,除了用电量、用水量、服务器数量。或许可以加上一个问题:
你们公司一个月消耗多少Token?
听到这,你可能会想,不对啊,我用的豆包、DeepSeek,从来不花钱啊。那我岂不是没有消耗Token,也用上了AI?
其实,这恰恰是很多人对AI应用在理解上的误区。
拥抱AI的最终目的,是用它改造业务,而很多人仅仅是用AI聊天。
如果你打开DeepSeek的官网,会看到两个硕大的按钮。左边,是最熟悉的窗口聊天,完全免费。右边,则是API接口,收费。那里是企业“通智力”的入口,也是DeepSeek赚钱的地方。
那么,这个“智力”到底卖多少钱?
现在一般按照100万Tokens来计价,我给它起了个名字,叫“一度智能”。目前的主流大模型公司,以输入价格为例。比如DeepSeek V2,一度智能只要1元人民币。豆包,0.8元。GPT-5.4,大约18元。Gemini 3.1 Pro,大约15元。
假如让AI分析一篇1万字的中文文章,大约要消耗8000 Tokens。DeepSeek要花0.8分钱,豆包0.6分钱,而ChatGPT大约要0.13元。差距大约有二十几倍。
你看,国内大模型的Token价格,远远低于国外的。但是,在具体的功能上,国外主流大模型也确实厉害。
所以,如果你的业务追求量大管饱,就用国内的。如果业务复杂追求性能,就用国外的。
当我们真正开始计算Token成本,AI就不再是只会对话的玩具,而是一个严肃的生产力工具。
想让企业“通智力”,就要把业务接上那个“API接口”。让每一次Token消耗,都为你创造价值。
比如,客服。接入AI大模型的客服系统,能实现24小时实时响应,智能应答。比如,设计。接入到公司内的设计软件,实现一键生成海报。
再比如,我们公司前阵子在内部上线一个“编审系统”。就用的是大模型Claude,专门帮主笔改稿。
一篇写好的初稿,直接粘贴丢进去。它能从标题到结尾,逐字逐句地给你分析。比如,认知差够不够,要不再封装几个概念。比如,情绪足不足,要不再加点愤怒或者兴奋。比如标题好不好,再给你10个不一样的参考。
很好用。但每条建议背后,都是Token,都是花出去的真金白银。
这种把AI放进具体业务的实践,才是AI时代真正要做好的功课。
在5月16日的年中大课上,我还会更详细、更具体地分享,我自己在“AI融入业务”这件事上的思考和经验。
03
Token,是“智力”到“方案”的媒介
既然Token把“智力”明码标价,那么它到底是怎么运转的?
黄仁勋在GTC上提到了一个概念:Token工厂。
工厂,意味着Token已经变成可以工业化、规模化、标准化生产出来的“工业产品”。
整个过程,可以被拆解为三层效率转换。从下至上,层层递进。
第一层转换,从煤到电。
传统发电厂的核心任务,就是把煤这样的能源,转化为电力。它们要研究的,是怎么让煤更高效率地燃烧,发更多的电。
第二层转换,从电力到智力。
OpenAI、Claude这些大模型公司,就像是“二代发电厂”。只不过,烧的是“电”,产出的是Token。它们的竞争,是如何用更少的电,产生更多、质量更高的Token。这就是黄仁勋提到过的“Token生产效率”的竞争。
方法有很多。比如在算法层面优化模型结构。比如在系统层面用上更先进的推测解码技术。比如在硬件和软件协同层面降低能耗。当然,这些技术细节不一定要懂。但你要知道的是,今天生成Token的成本已经大幅下降。比如结合了MoE架构和英伟达Blackwell平台的优化,让生成Token的成本降低了20倍。
第三层转换,从智力到方案。
好了,现在Token已经从“二代发电厂”里源源不断地往外冒。接下去的主角,成了AI时代的创业者和企业家们。他们要解决的,是怎么用更少的Token消耗,做出更好的方案。
所以,这就像空调。你会发现,同样是制冷到18度,一级能效的就是比三级能效的更省电,更受消费者欢迎。
因此,未来的创业者和企业家们,都成了“空调厂商”。比的是谁能用最少的电烧最好的饭,用最好的电把电视点亮。
这就意味着,“大模型领域”的竞争,几乎已经结束了。未来的竞争,可能不再是纠结用谁家的“电”,而是你打算用多少“电”,干怎样的事。
于是,企业招聘条件也变了。黄仁勋在演讲里做了预测:
未来,Token配额会成为薪酬的一部分。
就像现在公司配电脑、配手机一样,以后还会给你配Token额度。比如,月薪2万,每个月2000万Token额度。有了Token,你的工作就越离不开AI。想要AI用得好,你就要不断提高写提示词的水平。提示词水平越高,Token的投入产出比就越高。
也许,Token也将跟对员工能力的评价挂钩。
怎么用Token?打算用多少Token?这些,或许将成为每个企业家和创业者,要日思夜想的问题。
最后的话
好了。当你理解了Token,就能看清AI世界的价值流动。
但有意思的是,作为“Token经济”的创造者、亲历者,我们人类自己,却常常在算一笔笔糊涂账。
举两个例子。
比如,我们在古巴的时候,看到很多人花130美金买一根雪茄,眼睛都不带眨一下。因为这根古巴雪茄太稀有,买回去很有面子。但是,你建议他花20美金订阅一个月的ChatGPT会员,他很可能犹豫半天,觉得“这钱没必要花”。
你看,这就是糊涂账。他宁愿为了感官享受而支付高价,却不愿意投资一个24小时待命、可能产出价值千金创意的AI。
再比如,很多老板喜欢动不动就拉一群人到会议室开会,但他从来都没有算过,光是开会要花掉多少成本。
我们简单算一笔账。假如有20个人开会,平均月薪1万元,那么按21个工作日,每天8小时算。这一小时会议的成本就是1200元。换算一下,如果一周开三次会,一个月的会议成本够20个人用ChatGPT整整3个月。
这也是糊涂账。他舍得花时间拉大家开会,却不舍得把真金白银换成ChatGPT、DeepSeek的Token。
想想看,要是大家都能算明白这笔账,那得省下多少时间成本、人力成本。可为什么那么多人都算不清?
我想,可能很多人还没有意识到,Token正在近乎全面地影响企业的成本结构。
未来,衡量一家企业的经营情况,要把Token成本,和用电量、人力成本放到一起看。从这个数字,看你的Token消耗、看你用AI产出了多少好用的解决方案。如果看不到这个数字,你就永远感受不到AI对业务的真实价值,更不会真正投入。
发现了吗?Token不仅仅是个新鲜的技术词汇,而是AI时代的“度量衡”。
过去,电的普及用了将近100年,才从工厂走进千家万户。可Token的渗透速度显然快得多,它不需要铺设物理管道,只需要一个API接口。交付方式的改变,让它迅速从一个生僻的术语,变成深入文明毛细血管的基本单位。
伟大的发明家定义单位,伟大的技术定义时代。
Token,很像工业时代的瓦特、电力时代的安培,有了些划时代的意义。既然瓦特、安培留在了灯泡、电路里,也许,我们可以干脆大胆些,把那个让Token成为AI时代最小单位的人的名字,留在我们的账单上。
开个玩笑,不然,我们把度量智力的单位,直接叫“黄仁勋”吧。
以后老板给员工发福利,就可以直接说:
“这个月表现不错,奖励你2000万黄仁勋,加油干!”
观点/ 刘润主笔/ 海盐编辑/ 歌平版面/ 黄 静
这是刘润公众号第2896篇原创文章。未经授权,禁止任何机构或个人抓取本文内容,用于训练AI大模型等用途
PS:
这段时间大家对Token的热烈讨论,折射出我们面对AI时的共同心态:兴奋、又有点焦虑,不知道究竟该干点什么。
我有个判断:在见证了这些年大模型能力的疯狂内卷后,我们都知道,2026,正式来到了AI技术的落地之年。许多积累多年的真问题,终于等来了解决它的新技术。创新的火焰,就这样被点燃。
这几个月,我看到了大量优秀的技术落地案例。实在等不到年底年度演讲和你分享。所以,5月16日,我将在上海影城1000人的大剧场。与你分享【刘润·年中大课】。今年的主题就是:
不做现场直播。也不做事后回放。就让我与你,独家分享。点击下方购票链接,就可以了解到更加详细的票务信息。
现在抢先购买,或是带着团队一起来,还可以享受到“早鸟价”。
5月16日,我们不见不散!
热门跟贴