周三下午,同事阿杰突然在工作群里甩来一张曲线图。图的纵轴是对数坐标,横轴是时间,一根陡到近乎垂直的线把所有人都吓一跳。图下方配着一行小字:“AI数据中心的规模,每7个月翻一番。”我第一反应是数据跑偏了——就算摩尔定律最激进的时候,芯片上晶体管数量翻倍也得18个月。阿杰立马补了一句:“Epoch AI今天早上刚发的报告,谷歌、微软、亚马逊的算力投资已经刹不住车了。” 我打开原文,发现这确实不是什么标题党,而是一张正在改写AI产业经济账本的路线图。
Epoch AI的发现本身只有一个核心结论:进入2024年后,人工智能数据中心的整体规模每7个月翻一倍。与之对比,一直到2023年底,这个周期还是12个月。从一年多翻倍缩到半年多就翻倍,曲线往上翘的那一下,恰好跟几家云巨头从“买卡试水”切换到“建基础设施”的节奏吻合。这里讲的规模,并不光指GPU或TPU的颗数,而是将芯片数量、互联带宽、供电能力打包在一起的综合算力容量。Epoch AI明确提到,这背后不是单纯的“堆更多芯片”,而是互连密度和电力基础设施的同时跃进。这波加速已经令整个行业的硬件经济跑在了摩尔定律的前面,或者说,跑出了另一条更陡的指数曲线。
增长的第一推力,来自明晃晃的资本承诺。谷歌从2026年6月开始,每年向SpaceX计算服务投入110亿美元。同一时间线上,谷歌还给英特尔下了封装订单,目标是在2028年之前打包完成300万颗TPU。微软这边,Azure正在搭建超过10万块H100等效GPU的超大规模集群,亚马逊的扩容动作同样咬得很紧。三家巨头的动作高度趋同——不再满足于租用现成的算力实例,而是直接向上游预订芯片、包下整厂封装产能、甚至咬着牙吞掉电力配套的基建成本。AI数据中心当前普遍跑到500兆瓦功耗以上,这个数字意味着,单一园区的电力容量已经超过许多中型制造基地。当集群功率以500兆瓦为单位起跳时,7个月的翻倍就不再是PPT上的估算,而是变电站和备用柴油发电机组堆出来的物理现实。
顺着这条翻倍曲线往下推,AI的经济账会出现一个很吓人的数字。Epoch AI指出,目前前沿模型单次训练的成本已经超过5亿美元。如果数据中心规模保持每7个月翻一番的势头,那么到2028年,单次训练开销可能碰到100亿美元的天花板。这不是单纯把5亿乘以2的若干次方,而是因为随着模型参数攀升,数据清洗、消融实验、超参搜索的算力消耗会在更大基座模型上出现乘数效应。伴随这些数字而来的,是整个产业竞争格局的重新划线:谷歌和微软这样拥有深厚资本池的既有巨头,可以消化掉这种级别的现金流燃烧,但对初创公司来说,入门券正在变成一座几乎翻不过去的高墙。值得留意的是,Epoch AI的分析暗示推理侧的需求有可能沿着相似的轨迹爬升。随着智能体系统和实时应用密集铺开,推理算力的消耗曲线很可能不再是训练成本的一个零头,而是会和训练形成互相追赶的双峰。
当然,面对“7个月翻一番”这种乍看有些反常识的结论,Hacker News上的社区讨论反而没有跳出来反驳。据相关消息,技术社区表现得相当平静,似乎默认了这条曲线合理存在。但需要警惕的是,Epoch AI的方法论主要基于企业的公开扩产计划和资本开支指引。如果实际装机后的利用率滞后于纸面宣布的产能,那么真实算力落地的翻番速度可能会比7个月要缓。换句话说,计划容量和实际吞吐量之间,隔着一个巨大的工程落地变量,从征地、架设高压线路到冷却系统调试,处处都可能打折扣。不过,即便把折扣算进去,三大云厂商实打实的投资承诺依然强烈暗示这个趋势并不是泡沫。仅谷歌一家,2026年起每年110亿美元砸进太空计算领域的年化支出,已经超过不少国家全年的科技研发预算。这样的资金强度,本身就构成了一种很难撤回的惯性。
后续验证信号会出现在2026年第三季度的财报电话会上。如果届时谷歌、微软、亚马逊三家合计的人工智能基础设施资本支出年化规模冲过1000亿美元,那么7个月的翻倍周期便得到硬财务数据的背书。反过来,观察英伟达或AMD的芯片订单变化,也是一个敏感的先行指针。如果连续两个季度出现GPU或TPU级大单放缓,那很可能意味着这轮奔涌的扩建潮出现了第一道裂缝。
所有迹象都指向同一个结论:人工智能的基础设施正在摆脱“配套”身份,变成一种独立扩张的产业主干。每7个月翻一番的规模增长,不仅让训练前沿模型的成本开始以百亿美元作单位,也让人们重新审视“算力还是一种弹性资源吗”这个根本问题。下一次你再看到云账单上算力开销意外翻倍,或许不用先怀疑自己的模型是不是又写错了哪里,而是可以无奈地拍张截图转发给同事,附一句:“不是我们的问题,是整个人工智能的底座又膨胀了一圈。”
热门跟贴