近期,某出版发行行业的客户遭遇停电,导致戴尔 PowerEdge R710 服务器 RAID 5 阵列中的两个希捷 SAS 硬盘无法读取。其中一个硬盘完全无法读取,而另一个硬盘性能不稳定。
起初,该发行商致电戴尔售后技术支持。戴尔的支持团队建议其使用热备盘重建阵列,但很快发现由于第二个硬盘不稳定,该方法无效。客户在此服务器上托管了 6 个重要的业务相关的 SQL 数据库。有一个数据库自动备份系统,但位于同一个服务器阵列上(采用 PERC H710P 控制器)。情况看上去不太乐观。
客户随后联系到了鸿萌。收到客户的设备后,鸿萌立即对其进行了初步检测与评估,随后,告知客户,预测结果看起来非常有希望。随即,鸿萌工程师团队迅速开始了恢复工作。
鸿萌工程师进一步仔细检查了该设备,发现出现故障的希捷硬盘是一款很陈旧的型号,并且这块硬盘它很久以前就从 PERC H710P RAID 阵列中掉线,无法进行读取。因此,PERC RAID 一直处于临界状态,直到第二个硬盘也从 PowerEdge 服务器阵列中掉线。
对第二块不稳定硬盘创建镜像后,鸿萌对所有数据库都进行了提取,并进行了一致性检查。随后,鸿萌将数据保存到一块新硬盘中,交付给客户。数据通过了客户的最终验证。从设备到达鸿萌,再到将恢复的数据返回给客户,整个过程耗时5天。
鸿萌在此建议,对存储设备应进行例行巡检,以预防因设备超出使用寿命造成的物理故障所导致的数据安全问题。并且,应避免使备份目的地与源数据位于相同的设备中。
任何数据安全问题,请联系我们。
热门跟贴