一台使用NTFS文件系统的服务器;7块硬盘组成了一组raid5磁盘阵列。

打开网易新闻 查看精彩图片

服务器故障检测:

raid5磁盘阵列磁盘故障离线导致服务器瘫痪。掉线磁盘只添加新的硬盘,并没有将掉线的3块磁盘从阵列中拔掉。

服务器数据恢复过程:

1、对所有硬盘镜像备份后,分析服务器raid结构。故障服务器中的硬盘每512字节多加了一个8字节的校验,也就是说每扇区520字节。

2、完成磁盘转换后开始分析RAID的结构。由于多了3块离线盘(故障离线后没有拔出),需要比较每块磁盘。因为其中会有两块磁盘前面的一部分相同,这两块前面部分相同的磁盘中有一个是旧盘,旧盘数据量没有新盘多,可以排除旧盘。

3、由于故障服务器使用的是NTFS文件系统,使用MFT就可以找到RAID结构。搞清楚RAID结构后发现这不是一个普通的RAID5,而是一个双循环,无法通过常规手段重组RAID。

4、通过其他方法重组RAID后发现数据不是新的。推测可能是RAID5掉线第一块硬盘时没有及时发现,没有及时添加新的硬盘做rebuild,服务器运行一段时间后又有一块硬盘掉线了,造成整个RAID不可用。

5、假设某个磁盘掉线,踢掉该磁盘后重组RAID,不用生成全部的数据,只生成前面几个G的数据,通过查看这个索引表的位图信息是否正确就可以判断此RAID是否正确。如果索引表的位图信息正确,生成此RAID数据即可完成RAID的重组。

6、数据验证完整可用,数据恢复完成。