服務器數據恢復環境:
某品牌2850服務器中有一組由6塊SCSI硬盤組建的raid5磁盤陣列,linux操作系統+ext3文件系統。
服務器故障:
服務器運行過程中突然癱瘓。服務器管理員檢查陣列后發現raid5陣列中有兩塊硬盤離線,將其中一塊硬盤進行強制上線操作,但是服務器操作系統啟動異常。這時,管理員意識到問題的嚴重性,馬上將服務器關機,聯系到我們數據恢復中心尋求幫助。
raid5陣列兩塊硬盤離線的故障情況十分常見,由于raid5磁盤陣列支持一塊硬盤離線時的冗余保護,如果出現多塊硬盤離線的情況,服務器便處于癱瘓狀態,且離線硬盤不會自動上線。由于目前市面上主流品牌的raid控制器的磁盤監控策略比較嚴格,陣列中硬盤掉線很多是由電源波動、控制器bug等隨機原因所導致,所以掉線盤很有可能沒有比較嚴重的物理故障。但是硬盤掉線后的強制上線操作風險性是很大的,一旦上線出錯就會導致控制器對數據造成一些不可逆的損壞。進入操作系統后因為文件系統不一致進行自動修復,導致服務器中所有硬盤數據不一致,數據恢復難度很大。
服務器數據恢復過程:
1、將故障服務器中所有磁盤編號后取出,以只讀方式進行扇區級全盤鏡像,鏡像過程中發現多塊硬盤存在壞道但沒有下線,應該是raid還沒有識別到這些硬盤上的壞道。鏡像完成后將所有磁盤按照編號還原到原服務器中,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
2、基于鏡像文件分析故障服務器中的raid結構信息,利用獲取到的raid結構信息虛擬重構raid并驗證raid結構的正確性。北亞企安數據恢復工程師人工修正被破壞結構,將修正后的數據導出到一臺存儲上臨時存放。
3、使用完好的硬盤在服務器上搭建新的raid5磁盤陣列,將恢復出的數據遷移到新搭建的raid中。經過檢驗,恢復出來的數據一切正常,本次數據恢復工作結束。
Tips:
一旦出現raid5磁盤陣列中多塊硬盤離線導致服務器癱瘓的情況,切記不要盲目進行強制上線操作。首先要做的就是將源硬盤全部鏡像,可以在WINDOWS環境下執行如下操作:
1、可用相同或大于源盤容量的硬盤作為目標盤,將源盤全部扇區方式CLONE到目標盤。將所有盤做同樣操作。
2、可將每塊源盤完全以扇區方式輸出文件到某大容量存儲空間(如大容量硬盤、NAS、SAN、DAS等)。
審核編輯 黃宇
-
服務器
+關注
關注
13文章
9685瀏覽量
87274 -
數據恢復
+關注
關注
10文章
635瀏覽量
18010 -
磁盤
+關注
關注
1文章
388瀏覽量
25652 -
RAID5
+關注
關注
0文章
130瀏覽量
12970
發布評論請先 登錄
服務器數據恢復—raid5陣列多塊硬盤離線導致EMC存儲不可用的數據恢復案例
服務器數據恢復—華為OceanStor存儲中RAID5陣列數據恢復案例

評論