英伟达现在是科技圈最赚钱的公司,卖芯片赚得盆满钵满。但就在老黄数钱的时候,底下那几个超级客户其实早就坐不住了。
带头反抗的就是OpenAI。他们不打算继续乖乖掏钱买通用显卡,而是准备绕开英伟达,自己砸钱搞研发,做专属芯片。
为什么连大模型行业的领头羊,都要去碰这种吃力不讨好的重资产硬件?现在这水面下到底藏着多少利益博弈?这不仅关系到OpenAI的生死,更牵扯到整个算力行业未来的大洗牌。
要想搞懂这群巨头为什么要造反,先得理清一个事实:AI的算力需求,分为“训练”和“推理”两个阶段。
用英伟达的通用GPU去“训练”一个大模型,确实好用,没人打得过。可是,像ChatGPT这种已经成型的产品,每天应付全球网友的提问,这个过程叫“推理”。这个时候再用那种通用的大GPU去跑,就太费钱了。打个比方,这就好比你只是出门买个菜,却非得开一辆油耗惊人的重型大卡车,极其不划算。
根据业内的动态,OpenAI打算和博通合作,开发专门用来做推理任务的芯片,代号包含halpin、IO以及sereno。这两款芯片绝对不碰训练,就只干一件事:让ChatGPT跑得更快、更省钱。由于底层架构完全是为了自家的工作需求量身定做的,一旦投产,效率理论上会远超现在市面上所有的通用显卡。
想法很好,但真正落地的时候,OpenAI碰壁了。
造芯片是个无底洞。OpenAI自己没能力生产,只能拉着博通一起干。但现在的谈判卡在一个极其现实的问题上:钱。博通要求OpenAI必须共同出资,分担这高达180亿美元的交易费用。
这笔钱如果不掏,博通就没法去台积电那边下单。现在全球芯片代工的产能紧张得要命,没有真金白银砸下去,台积电根本不给你留位置。
但OpenAI这边咬死不松口,不答应博通的融资条件。双方现在就这么僵持着,直接导致整个项目的进度充满了不确定性。最大的恶果就是,代号halpin芯片的量产时间大概率要往后拖延,连带着下一代的sereno也会跟着遭殃。这对于迫切需要降本的OpenAI来说,实在是很被动。
就在OpenAI因为芯片项目焦头烂额的时候,它的头号死敌Anthropic却玩了一手极其漂亮的“两头下注”。
明面上,Anthropic抱紧了谷歌的大腿。他们跟谷歌签了一个巨额协议,承诺在未来5年的时间里,向谷歌支付大约2000亿美元,用来采购计算资源和芯片。
2000亿美元是个极其庞大的数字,这相当于谷歌目前未确认收入的40%。双方现在就是一根绳上的蚂蚱。Anthropic需要谷歌的算力来支撑自己可怕的增长速度——这帮人的收入从去年底的90亿美元,疯狂飙升到现在超过300亿美元,云服务使用量在一年内暴涨了80倍。而谷歌,也急需Anthropic这种超级大客户来填满自己的云服务产能。
这看起来是个非常稳固的合作。但在商业战场里,没人会把命全交给别人。
暗地里,Anthropic早就开始给自己找后路了。他们正在跟一家叫Frank to(有消息称实际为Fractal)的芯片初创公司频繁接触。
这家公司做的是推理芯片,而且用的是一套跟现在市场上所有人都不一样的内存架构。按照这套架构跑下来,大型语言模型的运行成本会变得极其便宜,速度也更快。
更有戏剧性的是,这家公司技术路线的奠基人,正是当年谷歌芯片项目的联合创始人。Anthropic去找他们,显然是对这种非英伟达的技术方案眼馋已久。
新芯片最快也得今年下半年投产,真正用上要到明年,所以它解不了Anthropic现在的近渴。但这绝对是一份“长效保险”。万一未来英伟达的显卡暴涨,或者货源被掐断,Anthropic就能直接切换备用路线,不至于当场停摆。
大家对算力的争夺,现在已经到了一种近乎疯狂的地步,甚至不惜付出巨大的社会代价。马斯克旗下的xAI就是个最典型的例子。
他们在孟菲斯建了一个极其庞大的AI数据中心,因为没用外包全部自己动手,建设速度极快。他们对外号称每兆瓦的建设成本只要270万美元,远低于行业平均的1230万美元。
但这所谓的低成本,其实是在账面上动手脚,并且牺牲了底线换来的。调查显示,他们竟然用那种只能在偏远地区临时用的移动燃气发电机,直接摆在城市边缘给数据中心供电。噪音和空气污染严重扰民,连当地的田纳西河谷管理局都介入了调查。更过分的是,大约400名建筑工人被强行塞进同一栋房子里居住,连呼吸都成了问题。
疯狂建算力中心的下场是什么?xAI虽然基础设施建得快,但他们的聊天机器人产品Grok和底层模型却遭遇了严重滑铁卢,用户量大跌,创始团队全部离职。
马斯克甚至公开表示公司需要重启。手里空拿着一大堆数据中心算力却没产品用,这就给了Anthropic趁虚而入低价接盘的机会。而这也坑惨了原本跟xAI有合作的Cursor公司,导致他们面临没有地方运行代码的尴尬局面。
把这些事情全串起来看,现在AI行业的核心驱动力已经变了。以前大家比谁的代码写得好,现在大家比的是谁能抢到更多的资源、更多的芯片。
当前的芯片竞争,早就不是单打独斗了。CPU、GPU、ASIC加上特殊的内存架构,大家都在全面角力。连老大哥英伟达都开始自己出CPU,想把整个技术链路全打通。
短期来看,英伟达的位子依然稳固。但到了2027年、2028年,随着初创公司的芯片成熟,整个市场绝对会迎来一次彻底的大洗牌。现在的算力市场格局非常脆弱,所有人都高度依赖谷歌、亚马逊、微软这几家云服务商以及英伟达。只要一环断裂,大家全都得遭殃。
这也引出了一个最致命的终极隐患:等到这两年大家把算力囤够了,未来各家模型的能力差异越来越小的时候,拼的绝对就是谁手里有更便宜的算力。
到那时候,拥有压倒性体量的谷歌、微软、亚马逊这些云服务巨头,将会掌控一切。而像OpenAI、Anthropic这种原本不可一世的独立实验室,如果手里没捏着自己的芯片和底座,最后会不会彻底变成这些云巨头的附庸和打工仔?这场关于算力和芯片的底层厮杀,还远未结束。
热门跟贴