服務器數據恢復環境:
兩組分別由4塊SAS接口硬盤組建的raid5陣列,兩組raid5陣列劃分LUN并由LVM管理,格式化為EXT3文件系統。
服務器故障:
RAID5陣列中一塊硬盤未知原因離線,熱備盤自動激活上線替換離線硬盤。在熱備盤上線過程中,raid5陣列中又有一塊硬盤離線。熱備盤同步失敗,該raid陣列崩潰,LVM結構變得不完整,文件系統無法正常使用。
將故障RAID5陣列中的兩塊離線硬盤標記后取出進行檢測,發現先離線硬盤無法識別,初步推斷該盤存在硬件故障,需要開盤修復,另一塊硬盤可以正常識別。
服務器數據恢復過程:
1、將故障raid中其他沒有離線的硬盤標記后取出。硬件工程師對這些硬盤進行檢測后沒有發現有硬盤存在明顯硬件故障,都可以正常讀取。以只讀方式將完好的硬盤進行扇區級全盤鏡像。鏡像完成后將所有磁盤按照原樣還原到原服務器中,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。硬件工程師在無塵工作間對故障硬盤進行開盤修復操作。開盤后發現該硬盤盤片磨損嚴重,無法修復,只能對陣列進行缺盤處理。
為了安全起見,對另一組raid陣列的全部成員盤進行只讀全盤鏡像。
北亞企安數據恢復—RAID5數據恢復
北亞企安數據恢復—RAID5數據恢復
2、基于鏡像文件分析硬盤底層數據。解析EXT3文件系統結構,分析兩組raid5陣列的盤序、條帶大小、校驗方向等配置信息。根據上述分析出來的信息重組兩組raid5陣列。由于有一塊硬盤無法修復,所以在重組故障raid時只能做缺盤處理。
北亞企安數據恢復—RAID5數據恢復
北亞企安數據恢復—RAID5數據恢復
3、兩組raid5陣列重組完成后分析底層數據,找到LVM結構信息并分析LVM結構。將兩組raid中作為PV(LVM物理卷)的LUN導出,然后將兩個PV重組,重新生成LVM邏輯卷。
北亞企安數據恢復—RAID5數據恢復
北亞企安數據恢復—RAID5數據恢復
4、LVM重組完成之后,使用北亞企安自主開發的工具解析LV(邏輯卷)中的EXT3文件系統,恢復并導出其中的全部數據。
北亞企安數據恢復—RAID5數據恢復
5、在恢復出來的數據中挑選部分壓縮文件進行校驗,發現部分文件損壞。對比解析結果和恢復結果,發現部分文件損壞且無法恢復。經過分析,初步判斷文件損壞與兩組raid中部分硬盤存在壞道有關。
兩組raid中部分硬盤壞道情況:
Raid 1:2# 67 bad source sectors encountered.
4# 13 bad source sectors encountered.
Raid 2:2# 37 bad source sectors encountered.
6、由于故障硬盤損壞嚴重,無法修復,且部分硬盤存在壞道,導致raid結構存在缺陷,部分文件損壞。經過用戶方驗證,大部份文件恢復出來了,只有小部分文件丟失或者損壞,用戶方認可數據恢復結果。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
9659瀏覽量
87161 -
數據恢復
+關注
關注
10文章
632瀏覽量
17978
發布評論請先 登錄
評論