服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境:
一臺(tái)EMC存儲(chǔ)中有一組raid5磁盤(pán)陣列,劃分1個(gè)lun供小型機(jī)使用,上層采用ZFS文件系統(tǒng)。
服務(wù)器存儲(chǔ)故障:
一臺(tái)有一組raid5磁盤(pán)陣列的存儲(chǔ)在運(yùn)行過(guò)程中突然崩潰。管理員檢查發(fā)現(xiàn)存儲(chǔ)中的raid5陣列有兩塊硬盤(pán)離線,該陣列中的兩塊熱備盤(pán)只有一塊熱備盤(pán)激活成功,raid5陣列癱瘓,存儲(chǔ)不可用。
服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)過(guò)程:
1、將故障raid中所有磁盤(pán)編號(hào)后取出。硬件工程師首先對(duì)raid中兩塊離線硬盤(pán)進(jìn)行物理檢測(cè),硬盤(pán)無(wú)物理故障,無(wú)壞道。其他硬盤(pán)經(jīng)過(guò)檢測(cè)也沒(méi)有發(fā)現(xiàn)物理故障和壞道。
以只讀方式將所有磁盤(pán)進(jìn)行扇區(qū)級(jí)的全盤(pán)鏡像,鏡像完成后將所有磁盤(pán)按照編號(hào)還原到原存儲(chǔ)中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤(pán)數(shù)據(jù)造成二次破壞。
將備份數(shù)據(jù)的520字節(jié)扇區(qū)轉(zhuǎn)換為512字節(jié)扇區(qū),以方便操作。
2、基于鏡像文件分析所有硬盤(pán)的底層數(shù)據(jù),獲取原RAID5陣列的相關(guān)信息,并找到最先掉線的那塊硬盤(pán)。根據(jù)這些信息重組原RAID。
3、通過(guò)重組的raid分析lun的分配情況和數(shù)據(jù)塊,使用北亞企安自主開(kāi)發(fā)軟件提取lun數(shù)據(jù),然后對(duì)提取出來(lái)的lun進(jìn)行文件系統(tǒng)解析操作。正常情況下解析完成即可恢復(fù)數(shù)據(jù),但解析文件系統(tǒng)報(bào)錯(cuò)。
4、服務(wù)器數(shù)據(jù)恢復(fù)工程師檢查文件發(fā)現(xiàn)ZFS文件系統(tǒng)的部分元文件損壞導(dǎo)致了文件系統(tǒng)無(wú)法解析。需要對(duì)損壞的ZFS文件系統(tǒng)元文件進(jìn)行修復(fù)后才能正常解析ZFS文件系統(tǒng)。
5、經(jīng)過(guò)分析發(fā)現(xiàn),ZFS文件系統(tǒng)正在進(jìn)行IO操作的時(shí)候存儲(chǔ)癱瘓,導(dǎo)致部分元文件沒(méi)有更新以及部分元文件損壞。人工修復(fù)這些損壞的元文件,直到ZFS文件系統(tǒng)能夠正常解析。
6、對(duì)修復(fù)好的ZFS文件系統(tǒng)做解析,解析所有文件節(jié)點(diǎn)及目錄結(jié)構(gòu)。解析完成后導(dǎo)出raid陣列所有數(shù)據(jù)。
7、經(jīng)過(guò)用戶方的仔細(xì)檢測(cè),確認(rèn)恢復(fù)出來(lái)的數(shù)據(jù)完整可用。本次數(shù)據(jù)恢復(fù)工作完成。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9123瀏覽量
85324 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
568瀏覽量
17432 -
RAID5
+關(guān)注
關(guān)注
0文章
113瀏覽量
12720
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論