一份例行粪便菌采样,揪出了一个藏在AI数据中心冷却管道里的棘手细菌。这不是哪家初创公司的实验室事故,而是发生在怀俄明州夏延市、涉及Meta承包商的大规模水处理停摆事件。夏延市公共事业局已经暂停接收所有数据中心级工业废水,直接原因和很多人以为的“冷却塔蒸发消耗”毫无关系——问题出在一个几乎所有新建AI数据中心都绕不开的施工步骤:灌水冲洗。
这个步骤在行业里叫fill-and-flush,是闭式循环冷却系统投入运行前的标准动作。施工队先把水管充满水,用这股水流冲刷管道内壁,把焊接碎屑、金属粉末、防锈涂层残渣一股脑冲走,然后排掉这第一波脏水。承包商Goat Systems LLC正是把这个冲洗水直接排入了夏延市的卫生下水道,而这些水带着一种叫Cupriavidus gilardii的耐金属细菌,一路流进了城市再生水处理厂。
在处理厂那一头,后果远不止“多了一道消毒工序”。这种细菌具备金属耐受能力,能扛住常规处理流程,它搅乱了两座水再生厂的运行,逼着整套系统下线好几个月,专门做清理。Frank Strong,公共事业局工程与水资源部门经理,告诉《怀俄明论坛鹰报》,实验室人员在二月份的例行粪便菌监测里突然检出了这个不速之客。他的原话是:“这不是我们常规会测的东西。”一把就点出了问题的核心——这个风险原本不在城市污水管理的监控清单里。
而细菌到底是从哪儿来的,至今没人能给出确切答案。Strong说冲洗所用的自来水就是从公共事业局买的,水质本身没有问题。菌株的源头有可能是管道材料、施工过程中的外界土壤,或者冷却组件预装时就携带了。公共事业局没有等溯源结果,而是在3月24日直接撤销了Goat Systems的冲洗排水许可,紧接着把这个禁令扩大到了所有接入城市服务的在建数据中心。不是针对某一栋楼,而是整个品类被暂停排放。
很多人会觉得奇怪,数据中心冷却不是一直宣传近零水耗吗?微软和英伟达这两年都在力推密封式液体回路,替代传统的蒸发冷却塔。微软的表述是,这种系统在建设期一次性加满水,之后就让同一股水在封闭管道里循环,几乎不再消耗水。英伟达的Rubin平台干脆用上了混合冷却液——75%的水加25%的丙二醇。看起来,水都用在了闭环里,城市供水应该很安全。但恰恰是那个“一次性加满”的前置工序,在密封之前,会产生一股必须要排出去的冲洗水。正是这股水,成了这次停摆事件的主角。
公共事业局的担心也远不止这一种细菌。Strong在随后的说明中进一步指出,闭式回路系统本身的运行介质就可能带着丙二醇、缓蚀剂、杀菌剂这类化学品,而这些东西根本不是城市污水处理厂设计的处理对象。夏延市的做法是把再生水直接喷灌到公园、高尔夫球场和城市绿地,一旦含化学品的水进入灌溉系统,影响就不再是水厂内部完事了。公共事业局尤其担心这种金属耐受菌在喷灌过程中形成气溶胶,变成呼吸道的隐患。Cupriavidus gilardii本身不是法规里列管的污染物,但它的出现已经实打实地触发了夏延市城市法规和联邦预处理条例中的两条判定——pass-through(污染物穿过处理设施未被有效去除)和interference(对处理工艺造成干扰)。换句话说,不用管它是不是“违法物质”,光凭它让处理系统瘫痪几个月这一条,就足够把排水资格叫停。
站在数据中心产业链的角度看,这个小概率生物学事件等于给闭式冷却的洁净形象划了个口子。过去行业讨论冷却水排放,焦点基本是水温、矿物质浓缩和化学添加剂,菌群管理往往只在开式冷却塔下才会被惦记。然而一个建筑工地的冲洗水,携带了一种常规监测根本不会测的菌种,直接导致了整个城市的再生水系统停摆数月。这种“一次排放就瘫痪”的脆弱性,对正在大量复制数据中心模板的各个美国城镇来说,不亚于看到了一份没有写进手册的风险清单。
承包商Goat Systems已经停止了排放,开始把冲洗废水用卡车拉到厂外处理。Meta方面给出的回应是,正在支持自己的总承包商Fortis,而且独立检测没有发现这种细菌的痕迹。但独立检测和城市发现的二月份检出之间恐怕存在取样时间差——这种细菌在完成最初破坏之后,很可能已经不在管道水样里了,而水处理厂的淤积物和滤料才是它真正扎根的地方。有细菌不等于水里现在还能测出,这在环境采样里很常见。所以Meta的“没找到”,并不能对冲掉水厂已经被迫停运几个月的现实。
这个事件有一个非常容易被忽视的细节:购买自来水进行冲洗,再把冲洗水排进下水道,在数据中心施工中完全是标准流程,不会有人觉得需要特殊许可。而问题恰恰出在了“标准”二字上——没有人认为自来水里会养出耐金属菌,市政的预处理法规也没有把建设期的冲洗水当作典型工业废水来对待。直到两个水厂的处理能力被打穿,系统被迫离线清理,大家才意识到,原来这种所谓“闭式零排放”的冷却方案,在施工环节其实留下了一个规范真空。
那些标榜“填一次水用一辈子”的密封液体冷却系统,经过这次事件后,恐怕要考虑把施工期的水质风险直接写进设计文件了。否则,当越来越多的城市在水资源紧张下被迫接受数据中心落户,任何一个类似的冲洗水事故,都可能直接变成地方政府叫停整个园区建设的理由。
热门跟贴