IBM服务器6块硬盘2块亮黄灯RAID5数据恢复
【型号】:希捷ST3146356SS
【故障现象】:
客户描述学校机房的一台共享服务器登陆异常,数据无法访问。值班人员去机房查看,发现盘柜当中有两块硬盘指示灯为黄色,并伴随有不间断的蜂鸣警告声,
查看raid配置信息,0号与3号硬盘处于Off line状态,重启服务器故障依旧。由于两者相距较远,而且经过沟通了解事情比较紧急,所以工程师驱车火速赶往现场。
【维修过程】:
工程师对离线的两块硬盘优先进行了检测,其中0号有剧烈的异响声,3号能识别,但有无法读取的坏扇区,剩余的硬盘均无硬件故障。
由于0号盘损坏严重,根据以往的经验,工程师采取缺0号硬盘分析底层数据的组合方式,将磁盘阵列的结构首先分析出来,并进行虚拟的重组。重组后,最关键的一步就是验证数据是否“新鲜”了,尝试提取一个最近时间点的数据进行验证,数据完好,说明组合方式正确,工程师心里的大石头也放下了,情况尚属比较幸运,如果0号盘是后掉线的,那么这个数据就不是一晚上就能挽救回来的了。
最终,数据恢复结束,经客户验证数据恢复成功率在98%以上。
结尾:
第一:缺盘的组合分析及数据完整性的判定
因为存在一块以上的硬件故障盘,并且有一块磁头损坏,不可能在短时间内修复,只能采取缺盘的方式去重组数据,且没有可选择性。这就要求必须确认这样的组合是否得到的是用户完整的数据。
第二:镜像
因为另外一块故障盘有坏扇区,重组完是没有办法直接拷贝数据的,遇到无法读取的扇区位置会造成循环冗余导致程序中断,必须先进行镜像。如果没有时间要求的情况下,镜像过程是一个非常简单的工作,但在特殊情况下,需要我们对每块硬盘的底层数据分布有一个大概的判断,对连续坏道点的扇区位置有一个基本的了解,从而更快更有效的完成镜像的工作。
对客户建议:
磁盘阵列出现问题以后,切记不要盲目做一些“尝试恢复”的操作,由于阵列数据来讲一般要比个人数据更为重要,在出现问题以后,维护人员往往心里着急,会做一些尝试恢复的操作,或者通过电话咨询厂商,在电话指导下做一些操作。这里并非质疑他们的专业性,而是说在没看到现场的情况下,根据叙述而做出的一些指导并不一定非常的准确,数据的安全是第一位的,我们不能因此而冒一丁点风险。如果在不确定是否做了一些危害数据操作的情况下,可以选择直接断掉服务器电源的方式。
RAID5数据恢复相关帖:
学到熟练维修 需要多少钱?
培训科目
- 学校整体环境展示2022-10-18
- 选择迅维专业手机维修培训的十大理由2022-10-17
- 手机培训教室展示2022-10-16
- 学员实操维修台2022-10-15
- 笔记本维修培训教室展示2022-10-14
- 迅维培训软实力2022-10-13
- 迅维培训大量实操材料2018-07-06
- 迅维培训工具设施2018-07-06