英国《金融时报》的一篇报道,揭开了云AI算力市场的一角:因为自己的算力池实在喂不饱Meta那夸张的胃口,谷歌不得不对这家社交媒体巨头下了限制令,卡住了对方使用Gemini模型的配额。这件事背后,其实是一幅非常经典的供需矛盾图——一边是下单时恨不得把货架搬空的超级大客户,另一边是产能已经拉满、但炉子只有那么大、订单积压还在翻倍增长的供应商。把这张图拆开看,能读出不少AI产业当下的真实水温。

先看需求端,Meta到底有多需要Gemini。据CNBC的说法,早到今年3月,Meta就意识到一件事:自己根本拿不到当初想买的那一整套Gemini容量。它需要的运算规模,与谷歌实际能交付的量之间,有一个让人头疼的缺口。这个缺口直接拖住了Meta内部一批AI项目的进度。其他谷歌云客户也感受到了吃紧,但没有谁像Meta那样暴露在风险里——因为它的采购体量过于庞大,一旦供给打个喷嚏,自家业务就会重感冒。简单讲,Gemini已经不只是Meta“用不用得上”的选项,而是嵌进核心业务的血液里了。

打开网易新闻 查看精彩图片

根据此前的报道,Gemini之所以成为Meta无法割舍的工具,根源在内容审核。标记有害帖子、搜寻并铲除诈骗内容,这类活儿Gemini干得比Meta自家那套Llama模型更出色。既然别人家工具更锋利,那就先用着,所以Gemini一度扛起了内容风控的半壁江山。但现在被限量供应,Meta也开始给自己多留一条路。报道中提到,公司更新的自有模型Muse Spark正在接手越来越多这类工作,目标就是一步步把核心AI能力搬回自己院子。

供给侧的紧张,可不止波及Meta一家。谷歌云在今年第一季度斩获了200亿美元的营收,这个数字已经够亮眼,可CEO桑达尔·皮查伊却点破了一个尴尬现实:算力短缺硬是拖住了原本能更强的业绩。最直观的证据是,这个部门的订单积压量,几乎冲到了前一季度的两倍。有单子接不住,机器转不过来,钱就在门外排着队等炉子空出来。这就像餐厅后厨只有三口锅,哪怕前厅满座、菜单卖爆,出菜速度也追不上食客拍桌子的频率。

这种算力锅不够大的窘迫,还体现在谷歌对普通Gemini用户的使用限制上。今年早些时候,有用户忍不住抱怨,怎么才敲了几条提示就撞上了配额天花板。谷歌随即改了一套计量规则:从过去单纯按提示条数算账,切换成按每次请求的复杂程度、调用了哪些工具、对话有多长来综合掂量用户消耗配额的速度。等于说,同样是用AI,你的问题越重、对话像裹脚布一样越拉越长,抽屉里的token额度就烧得越快。这背后传递出的信号再明显不过——连服务普通订阅者的那部分池子,也得拧紧水龙头了。

缺口摆在面前,Meta的选择是层层传导压力。内部通知要求员工,往后消耗AI token时得精打细算。这里的token,就是追踪AI用量并作为计费基础的最小单位。换言之,以前可能大手大脚地让模型多吐几段回复,现在就得想想每一次生成是不是非用不可。这种从“无限畅饮”到“按滴收费”的转变,正好折射出供给紧缩的余波,是怎么从合同条款的缝隙,一直渗透到每个工程师指尖的。

再把镜头拉远一点:这场供需拉锯战还催化了另一个层面的震动。与自带云业务的谷歌不同,Meta没有属于自己的云基座,而扎克伯格早已把AI锚定为公司最核心的投资方向。在这个大前提下,公司一边宣布裁撤约8000个岗位,同时又要把7000名员工调配到与AI直接挂钩的角色上去。一减一增之间,人的流向本身就成了企业战略重心的说明书。向外求算力受限,就向内调人才,这是眼下Meta能打出的清晰手牌。

所以回到那张供需矛盾图——纵轴是谷歌能给的,横轴是Meta想要的,曲线交点死活够不到。当外部模型供应被掐住嗓子,内部自研模型拼命长大,人力也跟着重新排兵布阵,这场算力短缺带来的涟漪,远远不止一张订单能不能交付那么简单。