服務器數據恢復環境:
某品牌ProLiant DL380系列服務器,服務器中有一組由6塊SAS硬盤組建的RAID5陣列,WINDOWS SERVER操作系統,作為企業內部文件服務器使用。
服務器故障:
機房供電幾次意外中斷,服務器出現故障前最后一次異常斷電重啟后RAID報錯,提示無法找到存儲設備,進入RAID管理模塊做任何操作都死機,重啟服務器后問題依舊,用戶聯系北亞企安數據恢復中心尋求幫助。
服務器意外斷電導致RAID故障(包括RAID管理信息丟失和RAID硬件損壞)的情況并不少見。RAID創建完成后,RAID管理模塊信息一般不會再發生改變,但RAID管理模塊信息是可修改的信息,磁盤陣列意外斷電也經常會導致RAID管理信息被篡改或者丟失。多次斷電甚至有可能導致RAID卡元器件損壞,從而導致服務器失去對多塊物理硬盤進行RAID管理的中間層模塊。本案例中的故障表現如在RAID模塊的任何操作都導致死機的現象就極有可能是RAID卡硬件損壞引起的(后經服務器廠家售后人員驗證確實如此),如果是這種情況,通過常規方法已無法獲取RAID5陣列中6塊硬盤的數據,只能通過專業的數據恢復技術手段來恢復服務器的數據。
服務器數據恢復過程:
1、將故障服務器中所有磁盤編號后取出,由硬件工程師對6塊SAS硬盤進行物理故障檢測,檢測結果是這6塊硬盤讀取狀態良好,無明顯的物理故障。
2、以只讀方式將所有磁盤進行扇區級全盤鏡像,鏡像完成后按照編號將所有磁盤還原到故障服務器中,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
3、基于鏡像文件對原RAID5陣列的結構進行分析,獲取盤序、數據塊大小、校驗方式等重組raid5陣列所需要的信息,根據獲取到的信息重組RAID5陣列。
4、重組完成后對所RAID5陣列中的數據進行邏輯校驗,在確保重組RAID所使用的參數正確無誤后,針對用戶所需要恢復的重要數據進行驗證。
5、經過驗證,用戶確認恢復出來的數據完整有效,認可數據恢復結果。協助用戶方將所有數據遷移至用戶準備好的生產環境中。本次數據恢復工作完成。
服務器數據安全Tips:
1、盡最大可能保證機房供電穩定,減少供電異常對服務器及存儲造成的破壞。
2、為重要的服務器及存儲配備UPS,在意外斷電的情況下能保證核心業務能繼續維持一段時間的運行,為應急方案實施贏得時間。
3、定期對服務時間長的服務器進行安全狀況檢查,并對整體運行狀態進行評估以決定是否進行硬件及系統的升級。
4、提前制定突發數據災難的應急處理方案,降低數據災難造成的損失。
審核編輯 黃宇
-
硬盤
+關注
關注
3文章
1335瀏覽量
58138 -
服務器
+關注
關注
12文章
9681瀏覽量
87261 -
RAID
+關注
關注
0文章
280瀏覽量
35754 -
數據恢復
+關注
關注
10文章
635瀏覽量
18001
發布評論請先 登錄
服務器數據恢復—raid6陣列硬盤故障導致上層分區丟失的數據恢復案例
服務器數據恢復—異常斷電導致linux系統無法啟動的數據恢復案例
虛擬機數據恢復—異常斷電導致XenServer虛擬機不可用的數據恢復案例

服務器數據恢復—不當操作導致raid5陣列數據無法恢復的案例
服務器數據恢復—搬遷導致服務器無法識別raid的數據恢復案例
服務器數據恢復—異常斷電導致虛擬機配置文件丟失的數據恢復案例

評論