烟雾散尽后,服务器机架烧成了扭曲的金属骨架。天花板塌陷,碎渣铺了满地,电缆像融化后的糖浆挂在残骸上。这是印度电视台当天从STT全球数据中心印度设施内部拍到的画面。6月初的一个清晨,这座由新加坡ST Telemedia和印度塔塔通信合资运营的德里机房起火,经过数小时扑救后留下的现场,已经看不出任何机房的完整轮廓。
路透社获取的一封内部信件揭开了灾后第15天的状况。塔塔通信旗下子公司Novamesh在6月15日发给客户Matrix Cellular的邮件里用了两个词:“extensive damage”——严重损坏。邮件直言,尽管团队一直在努力恢复数据,但受损程度过于严峻,受影响的数据和系统面临重大恢复挑战。这封此前未被报道的信件,透露出现场损失远超外界预期。
Matrix Cellular的遭遇让这场火灾的后果变得具体。这家为国际旅行者提供全球SIM卡服务的印度公司告诉路透社,他们在塔塔数据中心内存放了超过20年的运营和业务数据,现在可能全部丢失。CEO Gaurav Khanna的语气里带着明显的不安:“已经20天了,他们还没有恢复备份。如果真有备份,现在早就该恢复了。”两句话指向一个冰冷的推论——灾备机制没有按计划启动,或者说,备份本身也烧没了。
火灾原因至今未明。德里消防部门给出的信息只有一个短语:锂电池单元起火。锂电火灾的麻烦在于它不需要外部氧气就能持续燃烧,传统灭火手段往往无效,温度可以在几秒内飙升至上千摄氏度。对于堆满服务器的机房而言,这意味着从第一簇火苗到整排机柜报废,可能只需要几分钟。
谷歌云也在同一时间出现了问题。6月9日,谷歌在其服务状态页面上发布公告,称“第三方数据中心设施发生火灾,需要对网络设备进行紧急断电”。公告里没有点名塔塔,但一位直接知情的消息人士透露,谷歌云在印度的间歇性网络中断正与此相关。截至6月23日最后一次更新,谷歌依然没有给出完全恢复的时间表,只能提醒客户:“在设施完全恢复前,你们可能会遇到延迟问题。”没有变通方案,没有临时补齐路径,只有等待。
塔塔通信和ST Telemedia对路透社的置评请求保持沉默。Matrix Cellular的CEO反复追问的备份问题,谷歌云含糊其辞的恢复进展,沉默本身成了一种回应。灾难恢复的黄金窗口正在关闭——机房里的硬盘、主板、供电模块被高温和浓烟双重摧残后,数据恢复的概率随时间指数级下降。20天,已经远远超出了常规灾备切换应有的小时级甚至分钟级标准。
热门跟贴