服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
服務(wù)器+10個(gè)磁盤柜,每個(gè)磁盤柜24塊磁盤;
9個(gè)磁盤柜的磁盤用來存儲(chǔ)數(shù)據(jù),另外1個(gè)磁盤柜用來存儲(chǔ)元數(shù)據(jù);
存儲(chǔ)元數(shù)據(jù)的24塊磁盤的組成結(jié)構(gòu):9組RAID1磁盤陣列+1組4盤位的RAID10磁盤陣列+4個(gè)全局熱備盤;
存儲(chǔ)數(shù)據(jù)的9×24=216塊磁盤的組成結(jié)構(gòu):36組6盤RAID5陣列;36組RAID5磁盤陣列分為2個(gè)存儲(chǔ)系統(tǒng)。
服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境架構(gòu):
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
注:Meta_LUN(元數(shù)據(jù)卷) Data_LUN(用戶數(shù)據(jù)卷)
服務(wù)器故障:
存儲(chǔ)數(shù)據(jù)的其中一個(gè)存儲(chǔ)系統(tǒng)中一組RAID5陣列由于2塊磁盤先后故障離線,該RAID5陣列失效,導(dǎo)致整個(gè)存儲(chǔ)系統(tǒng)崩潰,無法使用。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障RAID5陣列中的6塊成員盤編號(hào)標(biāo)記,從磁盤柜中取出并接入到北亞企安數(shù)據(jù)備份服務(wù)器上,以只讀方式對(duì)所有硬盤進(jìn)行全盤鏡像備份,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免服務(wù)器數(shù)據(jù)恢復(fù)過程中誤操作對(duì)原始數(shù)據(jù)造成二次破壞。
備份過程:
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
在備份過程中發(fā)現(xiàn)故障RAID5陣列中的1塊離線硬盤存在大量的壞道,無法繼續(xù)備份。由硬件工程師對(duì)該故障盤開盤&更換固件并進(jìn)行修復(fù),經(jīng)過處理后硬盤可以繼續(xù)備份,但壞道仍然存在。
部分鏡像文件:
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
2、基于鏡像文件對(duì)故障RAID5陣列進(jìn)行分析,獲取RAID相關(guān)信息,利用這些信息虛擬重組RAID5陣列,將RAID中的LUN恢復(fù)成鏡像文件。經(jīng)過分析發(fā)現(xiàn)后離線硬盤損壞較為嚴(yán)重,存在大量壞道。
登錄存儲(chǔ)設(shè)備的管理界面,獲取到StorNext文件系統(tǒng)中和卷相關(guān)的一些基本信息。
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
3、分析StorNext文件系統(tǒng)中的Meta卷和Data卷,發(fā)現(xiàn)該StorNext文件系統(tǒng)包含2個(gè)Data卷,每一個(gè)完整的Data卷都是由多組RAID中的LUN組成。通過分析這些LUN北亞企安數(shù)據(jù)恢復(fù)工程師研究出LUN之間組合的算法規(guī)律,虛擬重組出完整的Data卷。
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
4、分析Meta卷中的節(jié)點(diǎn)信息,目錄項(xiàng)信息以及Meta卷和Data之間的對(duì)應(yīng)關(guān)系。針對(duì)一個(gè)Meta卷管理多個(gè)Data卷的情況,北亞企安數(shù)據(jù)恢復(fù)工程師研究出Meta卷到Data卷的索引算法。
文件節(jié)點(diǎn):
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
目錄塊:
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
5、通過上面通過分析研究獲取到的全部信息,北亞企安數(shù)據(jù)恢復(fù)工程師編寫程序掃描Meta卷中的節(jié)點(diǎn)信息和目錄項(xiàng)信息,解析目錄項(xiàng)和節(jié)點(diǎn)并獲取完整的StorNext文件系統(tǒng)目錄結(jié)構(gòu)。解析每一個(gè)節(jié)點(diǎn)中的指針信息,并將這些信息記錄在數(shù)據(jù)庫中。
文件信息:
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
6、北亞企安數(shù)據(jù)恢復(fù)工程師編寫文件提取程序讀取數(shù)據(jù)庫,結(jié)合解析出的信息以及兩個(gè)Data卷之間的聚合算法提取數(shù)據(jù)。
數(shù)據(jù)驗(yàn)證:
隨機(jī)抽樣檢測恢復(fù)出來的數(shù)據(jù),沒有發(fā)現(xiàn)。將數(shù)據(jù)移交給用戶親自驗(yàn)證,經(jīng)過驗(yàn)證用戶確認(rèn)恢復(fù)數(shù)據(jù)完整可用。雖然故障硬盤存在大量壞道,所幸核心數(shù)據(jù)沒有破壞,本次數(shù)據(jù)恢復(fù)工作完成。
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9681瀏覽量
87266 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
635瀏覽量
18003 -
磁盤
+關(guān)注
關(guān)注
1文章
388瀏覽量
25645
發(fā)布評(píng)論請(qǐng)先 登錄
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列多塊硬盤離線導(dǎo)致EMC存儲(chǔ)不可用的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列兩塊硬盤離線崩潰,數(shù)據(jù)如何起死回生?

服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列熱備盤同步數(shù)據(jù)失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲(chǔ)中RAID5陣列數(shù)據(jù)恢復(fù)案例

RAID5數(shù)據(jù)恢復(fù)—如何重組RAID5陣列?

服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列硬盤離線但熱備盤未激活的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤上線同步失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤未全部成功啟用的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—硬盤離線導(dǎo)致Raid5陣列熱備盤上線失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤同步失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)中raid5陣列多塊硬盤離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列硬盤壞道導(dǎo)致raid崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5熱備盤同步過程中硬盤離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列硬盤離線且熱備盤未激活的數(shù)據(jù)恢復(fù)案例

評(píng)論