马斯克亲手打造了一台“电老虎”。
近日,他正式宣布xAI的超级计算机Colossus 2上线,这是全球首个迈入吉瓦级门槛的AI训练集群。
一吉瓦是什么概念?其功耗足以同时点亮75万户家庭的照明,甚至超过了旧金山全市用电高峰期的总负荷。而目前这还只是起步版本。马斯克表示,该集群将于四月升级至1.5吉瓦,并最终冲击2吉瓦的更高版本——这一功耗水平已接近一座大型核电站的输出能力。
该训练集群为何如此耗电?原因在于其内部集成了约55.5万块高性能GPU。相较之下,Meta和微软所拥有的百万块显卡分散在全球数十个数据中心,而马斯克却将这数十万块GPU全部集中部署于孟菲斯一处地理位置,从而实现了极高的算力密度。
为确保这一超算集群稳定运行,马斯克采取了两项关键技术措施:
第一是部署了特斯拉自研的Megapack超大储能电池系统。形似集装箱的巨型储能装置可在电网负荷低谷期充电储能,并在用电高峰期向超算供电,有效弥补了当地电网供电能力的不足;
第二是采用了高度复杂的弯管端闭环冷板式液冷架构,使冷却液如同血液一般在数万个机柜间持续循环,高效解决散热问题——否则,这些GPU极有可能因过热而无法正常工作。
更令竞争对手感到绝望的是该超算集群的建设速度。通常而言,建设如此规模的超算需耗时15至18个月,而Colossus 2从零开始到建成仅用了122天。当其他公司尚在加州因环保评估等问题陷入冗长争论之时,Colossus 2已然通电运行。这也意味着马斯克距离训练出全球最强的AI模型——Grok 5更近了一步。
XAI在此轮全球AI竞赛中率先获得了关键的算力筹码,使得2026年的竞争格局愈发白热化。OpenAI的“星际之门”计划、Meta的“普罗米修斯”计划预计均将在今年逐步投入运营。谷歌与亚马逊亦未袖手旁观,正大规模购置土地、兴建基础设施。国内的华为、阿里云等主流企业也在AI芯片研发与算力基础设施建设方面投入重金。
或许我们应当征询地球的意见。据估算,Colossus 2理论上每年耗电量可达87.6亿度,相当于一个小型国家的全年用电量。
一边是推动人工智能持续突破所必需的核心算力,另一边则是巨大的能源消耗。假如这正是AI走向强大的代价,你认为值得吗?
热门跟贴