就在行业还扎堆在数百兆瓦级算力里互相内卷时,马斯克已经反手砸下180亿美元,在田纳西州墨菲斯郊区搞出了全球第一个GW级AI算力集群——巨兽2。

这波操作不光把全球算力基建的天花板直接掀了,还让不少人心里犯嘀咕:西方这是又要领跑AI时代了?

打开网易新闻 查看精彩图片

咱们中国在算力领域布局这么久,这头突然冒出来的算力巨兽,到底会带来多大冲击?咱们又该怎么接招?

打开网易新闻 查看精彩图片

算力巨兽有多猛?重新定义AI基建的量级

巨兽2的落地,与其说是建了个数据中心,不如说马斯克直接造了一座只为AI大模型服务的算力城池。

作为全球头一个GW级AI数据中心,它的算力规模远超现在行业主流的数百兆瓦级,就算是谷歌、OpenAI这些巨头,面对这样的体量,估计也得慌一下。

打开网易新闻 查看精彩图片

毕竟在AI能力一天一个样的当下,手里握有的算力储备,基本就决定了自家模型能进化多快。

核心硬件这块,巨兽2装了大概55万块英伟达顶级GPU,主力还是GB2和GB系列,集群互联用的也是英伟达全套解决方案,就是为了尽量减少兼容损耗。

打开网易新闻 查看精彩图片

目前来看,这也是公开信息里最大的单体GPU集群,未来还打算往百万级规模扩,没能一步到位搞到百万级,倒不是马斯克没钱——对他来说,钱大概率真就是个数字——主要还是英伟达GPU产能跟不上,卡了脖子。

打开网易新闻 查看精彩图片

耗电量更能看出这头巨兽的凶悍,现在它的耗电量已经达到1GW,预计4月份就能涨到1.5GW,最终目标是冲到2GW。

这概念可能有点抽象,咱们具象化一下:典型商用核反应堆的单元容量,大多在0.9到1.6GW之间,一座核电站通常配1到4个单元,总容量也就2到4GW。

打开网易新闻 查看精彩图片

说白了,巨兽2要是满负荷运转,差不多得单独占一座核电站的供电量,马斯克的落地速度也很让人佩服,2025年3月刚拿下场地,几个月时间就正式运营了。

这种效率,让他在超大规模算力基建这条路上暂时占了先发优势,也为后续模型训练抢下了不少时间。

打开网易新闻 查看精彩图片

而这头巨兽存在的核心意义,就是支撑XAI团队训练下一代GROK5大模型,这模型参数量超6万亿,也是目前公开领域里规模最大的大模型。

打开网易新闻 查看精彩图片

底层逻辑藏玄机:算力、供电与芯片的取舍

肯定有人会疑惑,特斯拉不是重启了兜柱3项目,主打自研AI芯片吗?马斯克为啥不让巨兽2用自家芯片?这背后不是单纯偏爱哪款硬件,而是多方面权衡后的结果。

兜柱3架构下的AI5和AI6芯片还在研发中,短期内没法稳定提供算力,而且这个项目本来就定位于太空算力基建,是长远布局,和巨兽2急需算力支撑的需求根本不匹配。

打开网易新闻 查看精彩图片

两者分属不同主体,兜柱3是特斯拉的项目,巨兽2则归XAI管,XAI的核心目标是快速迭代大模型,对算力硬件的成熟度、兼容性要求极高。

现阶段来看,英伟达GPU还是全球唯一能撑得起这种超大规模模型快速训练的硬件,XAI自然不会为了等自研芯片,放慢大模型迭代的节奏,不过未来在推理层面,两者说不定还有合作的可能。

打开网易新闻 查看精彩图片

供电难题的解决方式,更能看出马斯克这套生态联动的思路有多绝,单靠接入当地电网,只能满足几十到几百兆瓦的电力,根本撑不起巨兽2运转,还可能影响周边居民用电。

所以马斯克双管齐下,一方面协调当地电力公司开辟专属发电容量,另一方面直接在现场摆了几十台燃气轮机,靠烧天然气补电力缺口,再搭配特斯拉Meggapec储能系统平衡用电峰值、接入储能设备持续储电。

打开网易新闻 查看精彩图片

这套组合方案,既避免了过度依赖公共电网,又保证了算力供应稳定,但说实话,燃气轮机发电终究不是长久之计,咱们中国的超临界二氧化碳发电技术,或许能给出更优解。

这项技术已经实现商用突破,全球首台商用机组超碳一号,占地面积只有传统机组的一半,发电效率却提升了85%以上,还能适配工业余热回收、储能等多种场景。

要是能用到这种超大规模数据中心上,既能降低能耗,又能提升效率,说不定还能成为咱们的技术突破口。

打开网易新闻 查看精彩图片

起点论靠谱吗?算力堆砌的边界在哪

马斯克直言2026年是AI大模型的起点之年,言外之意就是,这一年AI会迎来增长临界点,慢慢展现出自主性。

在他看来,算力是当前AI发展唯一的技术瓶颈,只要堆够了算力和数据,就能催生出足够智能的大模型,妥妥的算力原教旨主义者,而巨兽2,就是他这套理念最直接的落地产物。

打开网易新闻 查看精彩图片

看好超大规模算力的不止马斯克,OpenAI、Meta、微软都有超大规模数据中心的建设规划,只是落地时间都要到2027年之后,马斯克这波算是先拔头筹了。

目前行业里还普遍认“算力即正义”这个理,大模型参数量和智能性大致能成正比,只是架构和效率优化,慢慢成了头部企业拉开差距的关键。

打开网易新闻 查看精彩图片

但算力堆砌也不是没有尽头,边际递减效应已经开始显现了,从几百亿参数迭代到几万亿参数时,大模型能力提升幅度通常能有10%到20%。

可一旦突破几万亿这个门槛,提升幅度就骤降到2%到5%,有些任务甚至出现了性能饱和的情况。

前OpenAI研究员就说过,单纯靠扩参数、堆数据,顶多算是工程上的胜利,算不上科学突破,解决不了模型逻辑断裂、事实幻觉这些根本问题。

打开网易新闻 查看精彩图片

这么看来,马斯克这套暴力堆算力的路子,大概率会在10到100万亿参数区间遇到回报临界点。

人脑突触数量大概是100万亿,现在GROK5才6万亿参数,和人脑比还有不小差距,或许100万亿参数会是个重要节点。

但这也不是绝对的,毕竟大模型和脑突触的类比只是简化说法,人脑的时空动态性、实时可塑性,都是当前大模型没法比的,单纯追参数量,未必能实现真正的智能突破。

打开网易新闻 查看精彩图片

中国该如何应对?从技术突围到生态构建

不可否认,巨兽2的建成,让西方在超大规模算力基建上暂时领先,但这并不意味着咱们中国就陷入了被动。

在算力硬件和能源技术领域,咱们早有积累,不少差异化优势,足以形成有效应对。

打开网易新闻 查看精彩图片

就说AI芯片,天数智芯发布的彤央系列边端产品,在多个场景实测中,性能都超过了英伟达同类产品,还完善了云+边+端全场景布局,虽说暂时没触及GW级算力需求,但也为自研芯片迭代打下了扎实基础。

能源技术上,咱们的超临界二氧化碳发电技术更是处于全球领先地位,超碳一号商用机组的成功运行,给超大规模数据中心提供了更高效、更紧凑的供电方案。

打开网易新闻 查看精彩图片

这种技术不仅能回收工业余热,还能和熔盐储能结合,要是能应用到数据中心上,说不定能破解电力制约的难题,打造出咱们自己的绿色算力优势。

另外,咱们中国的AI产业,已经从盲目追规模,转向了优化效能,既然大模型参数量增长的边际效益在递减,行业焦点自然就落到了提升智能密度上——在有限参数量里,靠优化架构、创新算法,挖出模型的潜在能力。

打开网易新闻 查看精彩图片

马斯克这头算力巨兽,更像是给行业敲了个警钟,提醒咱们算力竞争有多激烈,而不是建立了一道不可逾越的壁垒。

AI发展的终极方向,从来都不是单一维度的规模比拼,而是硬件、算法、能源、生态的综合较量。

打开网易新闻 查看精彩图片

咱们既有自主技术储备,又有庞大的应用场景做支撑,只要稳住节奏、精准发力,未必不能在下一代AI竞争中实现弯道超车。

毕竟算力赛道的比拼是场马拉松,不是百米冲刺,一时的领先,根本决定不了最终的胜负。