你刚在Q1定完年度技术预算,三家公司的财报电话会就把桌子掀了。特斯拉把2026年AI资本开支拉到250亿美元,Meta和谷歌分别锁定1150-1350亿、1750-1850亿美元区间。三家中位数加起来,3450亿美元——这还只是地板价。
这笔钱花在哪、多久到账、对你的技术栈意味着什么,是这篇要拆的事。
钱的三副面孔
同样的"资本开支"标签,落地节奏完全不同。作者把这笔钱按交付周期切成三层,对应你技术决策的三个时间窗口。
第一层是已经通电的机房里塞更多GPU。Q2-Q3到货的主要是英伟达Blackwell和Blackwell Ultra,六个月就能转成可用算力。这批货直接决定托管API的推理成本——作者判断,主流云厂商会在今年年底前把旗舰模型标价砍掉20%-40%,高频用户还能拿到提示缓存的阶梯折扣。
第二层是新数据中心土建。Meta在俄亥俄的1吉瓦站点、路易斯安那的5吉瓦规划,属于2027-2028年的产能。这批钱现在花出去,成本曲线效应要明年才传导到你的账单。但它会重塑技术选型:上下文窗口多长、嵌入维度多大、多久训一轮模型,这些架构决策的约束条件正在18个月尺度上被改写。
第三层最隐蔽也最可能超支:变电站、变压器、液冷、光纤。你的技术栈不关心具体买了哪个变压器,但"GPU支出"与"电力支出"的比例会暴露一个信号——这笔钱是在买真实的服务产能,还是在买期权。
三个可执行的技术判断
基于上述资金流向,作者给出了三个直接影响工程排期的建议。
第一,暂停"降本迁移"项目。如果你正计划从旗舰模型切到便宜版本以控制成本,三个月后再算一遍账。旗舰模型的降价速度大概率会跑赢迁移节省的开支,同时你还能保留质量。作者举了个具体场景:Q2 OKR里"把客服流水线从Opus迁到Sonnet"这类目标,值得等到下一轮价目表更新后再评估。
第二,把上下文窗口推到极致。基于8K窗口假设搭建的RAG流水线,正在浪费精度。原文此处截断,但信号明确:窗口竞赛还在加速,架构债越早还越便宜。
第三,(原文未完整呈现,此处保留信息缺口)
为什么这3450亿是地板价
三家合计之外,Futurum的追踪器把前五家超大规模厂商(加上微软、亚马逊、甲骨文)的2026年AI资本开支区间定在6600-6900亿美元。这意味着特斯拉+Meta+谷歌的3450亿,还不到全行业的一半。
但作者刻意把焦点收窄到这三家。因为它们的支出结构足够清晰,能拆解出可操作的信号——而全行业的聚合数字只会制造焦虑。
核心判断写在原文里:每token推理价格的压缩会在2026年加速,上下文窗口继续突破100万token,主流云厂商的微调吞吐速度快到让你可能从"每季度重训"变成"每月重训"。
这些不是预测,是资本开支的物理后果。钱已经花了,正在变成机柜、硅片和电力合同。你的技术栈要么利用这个窗口,要么承担滞后成本。
现在该做什么
打开你的Q2-Q3技术路线图,找到三类项目:模型降级替代、RAG架构优化、微调流水线频率。把前两类项目的评审节点后移60-90天,等新一轮价目表和上下文窗口基准测试。第三类项目——如果涉及自建训练集群——重新评估电力采购和液冷方案的可行性,因为供应链的瓶颈正在从芯片转向基础设施。
这笔钱不是你的,但它的副作用会流经你做的每一个技术决策。越早对齐资金流向,越少做反向操作。
热门跟贴