谷歌卡住Meta的AI算力脖子？供需缺口逼出裁员与自研|meta|知名企业|算力|谷歌|马克·扎克伯格

英国《金融时报》的一篇报道，揭开了云AI算力市场的一角：因为自己的算力池实在喂不饱Meta那夸张的胃口，谷歌不得不对这家社交媒体巨头下了限制令，卡住了对方使用Gemini模型的配额。这件事背后，其实是一幅非常经典的供需矛盾图——一边是下单时恨不得把货架搬空的超级大客户，另一边是产能已经拉满、但炉子只有那么大、订单积压还在翻倍增长的供应商。把这张图拆开看，能读出不少AI产业当下的真实水温。

先看需求端，Meta到底有多需要Gemini。据CNBC的说法，早到今年3月，Meta就意识到一件事：自己根本拿不到当初想买的那一整套Gemini容量。它需要的运算规模，与谷歌实际能交付的量之间，有一个让人头疼的缺口。这个缺口直接拖住了Meta内部一批AI项目的进度。其他谷歌云客户也感受到了吃紧，但没有谁像Meta那样暴露在风险里——因为它的采购体量过于庞大，一旦供给打个喷嚏，自家业务就会重感冒。简单讲，Gemini已经不只是Meta“用不用得上”的选项，而是嵌进核心业务的血液里了。

根据此前的报道，Gemini之所以成为Meta无法割舍的工具，根源在内容审核。标记有害帖子、搜寻并铲除诈骗内容，这类活儿Gemini干得比Meta自家那套Llama模型更出色。既然别人家工具更锋利，那就先用着，所以Gemini一度扛起了内容风控的半壁江山。但现在被限量供应，Meta也开始给自己多留一条路。报道中提到，公司更新的自有模型Muse Spark正在接手越来越多这类工作，目标就是一步步把核心AI能力搬回自己院子。

供给侧的紧张，可不止波及Meta一家。谷歌云在今年第一季度斩获了200亿美元的营收，这个数字已经够亮眼，可CEO桑达尔·皮查伊却点破了一个尴尬现实：算力短缺硬是拖住了原本能更强的业绩。最直观的证据是，这个部门的订单积压量，几乎冲到了前一季度的两倍。有单子接不住，机器转不过来，钱就在门外排着队等炉子空出来。这就像餐厅后厨只有三口锅，哪怕前厅满座、菜单卖爆，出菜速度也追不上食客拍桌子的频率。

这种算力锅不够大的窘迫，还体现在谷歌对普通Gemini用户的使用限制上。今年早些时候，有用户忍不住抱怨，怎么才敲了几条提示就撞上了配额天花板。谷歌随即改了一套计量规则：从过去单纯按提示条数算账，切换成按每次请求的复杂程度、调用了哪些工具、对话有多长来综合掂量用户消耗配额的速度。等于说，同样是用AI，你的问题越重、对话像裹脚布一样越拉越长，抽屉里的token额度就烧得越快。这背后传递出的信号再明显不过——连服务普通订阅者的那部分池子，也得拧紧水龙头了。

缺口摆在面前，Meta的选择是层层传导压力。内部通知要求员工，往后消耗AI token时得精打细算。这里的token，就是追踪AI用量并作为计费基础的最小单位。换言之，以前可能大手大脚地让模型多吐几段回复，现在就得想想每一次生成是不是非用不可。这种从“无限畅饮”到“按滴收费”的转变，正好折射出供给紧缩的余波，是怎么从合同条款的缝隙，一直渗透到每个工程师指尖的。

再把镜头拉远一点：这场供需拉锯战还催化了另一个层面的震动。与自带云业务的谷歌不同，Meta没有属于自己的云基座，而扎克伯格早已把AI锚定为公司最核心的投资方向。在这个大前提下，公司一边宣布裁撤约8000个岗位，同时又要把7000名员工调配到与AI直接挂钩的角色上去。一减一增之间，人的流向本身就成了企业战略重心的说明书。向外求算力受限，就向内调人才，这是眼下Meta能打出的清晰手牌。

所以回到那张供需矛盾图——纵轴是谷歌能给的，横轴是Meta想要的，曲线交点死活够不到。当外部模型供应被掐住嗓子，内部自研模型拼命长大，人力也跟着重新排兵布阵，这场算力短缺带来的涟漪，远远不止一张订单能不能交付那么简单。