在TPC26大会的演讲中,莱布尼茨超级计算中心(LRZ)董事会主席、慕尼黑大学(LMU Munich)计算机科学教授Dieter Kranzlmüller阐述了他对Blue Swan AI超级工厂的愿景,以及该项目可能对欧洲AI未来扮演的角色。
欧洲对AI超级工厂的兴趣,源于一种判断:现有的AI基础设施将无法支撑未来科学与工业领域的AI工作负载。
Kranzlmüller认同欧洲需要更多AI算力、AI超级工厂值得推进,但他提出了一个更深层的问题:欧洲是否应该只是建造尽可能大的GPU集群?是否存在一条更具可持续性的路径?
"我一直在质疑、却无法回答的是:可持续性怎么办?如果我们现在投入5000亿美元,是不是意味着五年后还要再投入同样的金额,因为必须淘汰掉所有旧GPU?这个问题确实存在。而我相信,我们真正需要的并不是那样的模式。"
Kranzlmüller的担忧源于当前全球正在规划和实施的AI基础设施项目规模。他提到美国的星际之门(Project Stargate),该项目关联了近5000亿美元的资本,数据中心耗电达数百兆瓦。这是一个巨大的规模。但它可持续吗?
Kranzlmüller承认扩大AI算力的重要性,但他质疑单纯建造更大规模的设施是否就是答案。他认为,欧洲应充分利用数十年来运营高性能计算(HPC)系统的经验。能效、散热技术和长期利用率必须与原始算力一并考量。
"我不认为这是可选的,"他在谈及可持续性时说。"我认为它必须是优先事项。"
Kranzlmüller认为,仅凭硬件本身不会创造价值。但当硬件与工具、服务和领域专业知识等外围生态系统结合时,其效用将远超独立的GPU部署。
该提案的一个关键差异点在于对科学研究的重视,而非仅聚焦产业。目前,欧盟委员会设想的超级工厂由私营部门资本驱动。然而,Kranzlmüller认为科研机构应发挥更大作用。
"无论我们投入什么,当今全球唯一能够充分利用欧洲所有这些GPU的群体就是科学家。我们有能力将这些设施规模化应用。我在AI领域有足够多的朋友告诉我:只要你给我10万块GPU,我就能把它们用起来。"
对Kranzlmüller而言,这正是Blue Swan区别于当前欧洲众多超级工厂提案的地方。该项目的核心理念是:科学界不应仅仅是基础设施的使用者,研究人员应从一开始就参与塑造它。
如果欧洲要在AI基础设施上投资数十亿,必须有人来使用它。Kranzlmüller指出,科学家是少数已经在这些系统所设想的规模上开展工作的群体之一。
从第一天就将科研机构纳入其中,使超级工厂在产业界逐步提升自身AI雄心的过程中保持高效运转。
Kranzlmüller将AI视为欧洲在HPC优势基础上继续发展的机遇,而非从零开始。超算社区数十年来一直在攻克功耗、散热、效率和系统利用率等问题。他认为,这些经验对AI与传统HPC同样适用。
对AI算力的需求只会持续增长,Kranzlmüller承认这一点。他并非建议欧洲少建AI系统,而是主张欧洲应建造更智能的系统。
热门跟贴