埃隆·马斯克的Colossus AI基础设施,据说是世界上最强大的AI计算集群之一,刚刚达到满负荷运行。这个庞大的计算系统旨在突破人工智能的界限,现在由20万个GPU组成,全部运行在特斯拉Megapack电池上。这是马斯克进军人工智能领域的一个重要里程碑。

随着现场变电站上线并连接到主电网,位于田纳西州孟菲斯的Colossus AI基础设施的第一阶段现已完成。据称,这台超级计算机现在以150兆瓦的功率在电网中运行。额外的150兆瓦Megapack电池系统将作为备用电源,确保在停电或电力需求增加期间继续运行。
Colossus AI是马斯克AI公司xAI的旗舰产品。这台超级计算机在以惊人的速度建造后,于去年7月首次启用了10万个英伟达(Nvidia) GPU。整个项目在122天内完成,而硬件安装到调试阶段只花了19天。该项目的速度给Nvidia首席执行官黄仁勋留下了深刻印象,他指出,这种规模的项目通常需要四年左右的时间,部署速度非常快。
黄仁勋说:“据我所知,世界上只有一个人能做到这一点。”“埃隆对工程、建筑、大型系统和资源调配的理解是独一无二的;这简直令人难以置信。”

然而,这种速度是有代价的,因为该设施最初缺乏与电网的直接连接。为了保持运营,该工厂依赖天然气涡轮发电机供电,这引发了人们对排放和可持续性的担忧。
早期报告显示,有14台涡轮机正在供电,每台发电2.5兆瓦,但居民的观察表明,周边地区的涡轮机数量可能已超过35台。这是允许限额的两倍多。这种对临时电源的依赖引发了关于该设施长期能源计划的讨论,尤其是在xAI寻求进一步扩大运营规模的情况下。
在基础设施中添加更多的GPU意味着AI集群现在可以更多地依赖电网电力,而不是燃气发电机。这将有助于提高效率并解决环境问题。据报道,xAI计划在夏末前拆除一半的临时发电机。另一半临时发电机将不得不留下来满足第二阶段的电力需求。

马斯克计划在今年年底前将Colossus AI的容量翻一番。另外还将增加150兆瓦,使总容量达到300兆瓦。这相当于为30万户家庭供电。毫不奇怪,这种巨大的电力需求引发了人们对田纳西河流域管理局(TVA)是否有足够能力支持它的担忧。
xAI已公开表示计划将其Colossus超级计算机扩展到100多万个GPU。对于当地经济,Colossus AI承诺经济发展和基础设施投资。然而,人们仍然担心居民的电能质量会受到干扰,以及该项目对环境的影响。
基层组织孟菲斯社区反污染组织(MCAP)主任KeShaun Pearson说:“你不会获得技术创新的绰号,如果有人进来利用你的自然资源、水,利用漏洞污染空气。”“这种趋势是危险的,因为它使我们的城市更容易被利用。”

为100万个GPU供电的道路始于马斯克于2023年7月创立xAI。明确的目标是“了解宇宙的真实本质”。更实际地说,马斯克希望在自己的指导下建立一个人工智能实验室,不受微软、谷歌或其他主要科技公司的影响。
该公司是对OpenAI(现在有微软作为亲密合作伙伴)和谷歌DeepMind日益增长的主导地位的回应。xAI还与马斯克的其他企业进行了整合,包括SpaceX和特斯拉。随着Colossus现在满负荷运行,xAI有能力在马斯克更广泛的生态系统中加速人工智能的开发和部署。
热门跟贴