RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列中多塊磁盤掉線導(dǎo)致EVA存儲(chǔ)不可用的數(shù)據(jù)恢復(fù)案例

Frombyte ? 來(lái)源:Frombyte ? 作者:Frombyte ? 2024-05-24 11:34 ? 次閱讀

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
1臺(tái)某品牌EVA4400控制器+3臺(tái)EVA4400擴(kuò)展柜+28塊FC硬盤。

服務(wù)器故障:
由于兩塊磁盤掉線導(dǎo)致存儲(chǔ)中某些LUN不可用,某些LUN丟失,導(dǎo)致存儲(chǔ)崩潰。

服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、由于EVA4400存儲(chǔ)故障是某些磁盤掉線導(dǎo)致的,因此收到故障存儲(chǔ)中的所有磁盤后,硬件工程師先對(duì)所有磁盤做物理故障檢測(cè),檢測(cè)完成后發(fā)現(xiàn)所有磁盤均不存在明顯物理故障。使用壞道檢測(cè)工具檢測(cè)也沒(méi)有發(fā)現(xiàn)壞道。
磁盤壞道檢測(cè)日志截圖:

wKgZomZQCnmAe8rbAABfPW4rQ-U591.png北亞企安數(shù)據(jù)恢復(fù)——EVA存儲(chǔ)數(shù)據(jù)恢復(fù)



將所有磁盤以只讀方式進(jìn)行扇區(qū)級(jí)全盤鏡像,鏡像完成后將所有磁盤還給用戶方。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成二次破壞。
備份完部分?jǐn)?shù)據(jù)截圖:

wKgZomZQCo2AQys9AABM-kmoSp8925.png北亞企安數(shù)據(jù)恢復(fù)——EVA存儲(chǔ)數(shù)據(jù)恢復(fù)



由于沒(méi)有檢測(cè)到磁盤存在物理故障或者壞道,可以初步判斷磁盤掉線是由于某些磁盤讀寫不穩(wěn)定導(dǎo)致的。EVA控制器檢查磁盤策略比較嚴(yán)格,EVA控制器通常將性能不穩(wěn)定的磁盤識(shí)別為壞盤并踢出磁盤組。一旦某個(gè)LUN的同一個(gè)條帶中掉線的盤到達(dá)極限,這個(gè)LUN將不可用。如果EVA存儲(chǔ)中所有LUN都包含這些掉線的盤,所有LUN都會(huì)受影響。所以兩塊盤掉線導(dǎo)致整個(gè)EVA存儲(chǔ)的LUN都不可用的情況是有可能發(fā)生的。故障EVA存儲(chǔ)目前的情況就是8個(gè)LUN正常,7個(gè)LUN損壞,6個(gè)LUN丟失。需要恢復(fù)所有LUN的數(shù)據(jù)。
2、基于鏡像文件分析所有硬盤的底層數(shù)據(jù)。EVA存儲(chǔ)中的LUN都是以RAID條目的形式存儲(chǔ)數(shù)據(jù)的,EVA存儲(chǔ)將每個(gè)磁盤的不同塊組成一個(gè)RAID條目。RAID條目的類型有很多種,首先需要分析出組成LUN的RAID條目類型以及這個(gè)RAID條目是由哪些盤的哪些塊組成。這些信息都存放在LUN_MAP中,每個(gè)LUN都有一份LUN_MAP。EVA將LUN_MAP分別存放在不同的磁盤中,使用一個(gè)索引來(lái)指定其位置,因此在每個(gè)磁盤中找這個(gè)指向LUN_MAP的索引就可以找到現(xiàn)存LUN的信息了。
3、雖然磁盤中記錄了指向LUN_MAP的索引,但是它只記錄現(xiàn)存的LUN,丟失的LUN是不會(huì)記錄索引的。EVA存儲(chǔ)中刪除一個(gè)LUN只會(huì)清除這個(gè)LUN的索引,而不會(huì)清除這個(gè)LUN的LUN_MAP。掃描所有磁盤找到所有符合LUN_MAP的數(shù)據(jù)塊,然后排除掉現(xiàn)有的LUN_MAP,剩下的LUN_MAP也不一定全是刪除的,也有一些是以前舊的。只能將所有LUN_MAP的數(shù)據(jù)都恢復(fù)出來(lái),人工核對(duì)哪些LUN是刪除的。
4、這些由于性能不穩(wěn)定而掉線的磁盤中存放的是一些舊的數(shù)據(jù),在生成數(shù)據(jù)的時(shí)候需要將這些磁盤都排除掉。如何判斷哪些磁盤是掉線的呢?由于本案例中LUN基本上都是RAID5陣列,只需要將一個(gè)LUN的RAID條目通過(guò)RAID5的校驗(yàn)算法算出校驗(yàn)值,再和原有的校驗(yàn)值做比較就可以判斷這個(gè)條目中是否有掉線盤。將一個(gè)LUN的所有LUN_MAP都校驗(yàn)一遍就可以知道這個(gè)LUN中的哪些RAID條目中有掉線盤。而這些RAID條目中都存在的那個(gè)盤就一定是掉線盤。排除掉線盤,然后根據(jù)LUN_MAP恢復(fù)所有LUN的數(shù)據(jù)。
5、北亞企安數(shù)據(jù)恢復(fù)工程師編寫掃描LUN_MAP的程序掃描全部LUN_MAP,結(jié)合人工分析獲取到準(zhǔn)確的LUN_MAP。編寫檢測(cè)RAID條目的程序檢測(cè)所有LUN中掉線的磁盤,結(jié)合人工分析排除掉線的磁盤。編寫LUN數(shù)據(jù)恢復(fù)程序結(jié)合LUN_MAP恢復(fù)所有LUN數(shù)據(jù)。人工核對(duì)每個(gè)LUN,確認(rèn)是否和用戶方描述的一致。部分LUN的數(shù)據(jù)截圖:

wKgaomZQCpSAdIWPAAA2QUtueSU626.png北亞企安數(shù)據(jù)恢復(fù)——EVA存儲(chǔ)數(shù)據(jù)恢復(fù)



6、根據(jù)用戶方描述,所有LUN的數(shù)據(jù)可以分成兩大部份:Vmware虛擬機(jī)和HP-UX上的裸設(shè)備,裸設(shè)備里存放的是Oracle的dbf數(shù)據(jù)庫(kù)。由于恢復(fù)的是LUN,無(wú)法看到里面的文件,需要人工核對(duì)哪些LUN是存放Vmware的數(shù)據(jù),哪些是HP-UX的裸設(shè)備。然后將LUN掛載到不同的驗(yàn)證環(huán)境中驗(yàn)證恢復(fù)的數(shù)據(jù)是否完整。
7、Vmware虛擬機(jī)和裸設(shè)備中oracle數(shù)據(jù)庫(kù)的驗(yàn)證這里就不贅述了。
8、將所有恢復(fù)出來(lái)的數(shù)據(jù)移交到用戶方準(zhǔn)備好的環(huán)境中,經(jīng)過(guò)驗(yàn)證,用戶方確認(rèn)恢復(fù)出來(lái)的數(shù)據(jù)完整有效,認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果。本次數(shù)據(jù)恢復(fù)工作完成。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9123

    瀏覽量

    85324
  • 數(shù)據(jù)恢復(fù)

    關(guān)注

    10

    文章

    568

    瀏覽量

    17432
  • 磁盤
    +關(guān)注

    關(guān)注

    1

    文章

    375

    瀏覽量

    25201
  • RAID5
    +關(guān)注

    關(guān)注

    0

    文章

    113

    瀏覽量

    12720
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列崩潰導(dǎo)致上層lun無(wú)法正常使用的數(shù)據(jù)恢復(fù)案例

    管理,重要數(shù)據(jù)為Oracle數(shù)據(jù)庫(kù)及OA服務(wù)端。 服務(wù)器存儲(chǔ)故障: RAID5
    的頭像 發(fā)表于 11-25 14:04 ?120次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b>崩潰<b class='flag-5'>導(dǎo)致</b>上層lun無(wú)法正常使用的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲(chǔ)RAID5陣列數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 華為品牌型號(hào)為OceanStor S2600T的存儲(chǔ)設(shè)備,存儲(chǔ)上有一
    的頭像 發(fā)表于 11-14 10:53 ?183次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—華為OceanStor<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>中</b><b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)EVA存儲(chǔ)磁盤磁盤掉線數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)EVA某型號(hào)控制+EVA
    的頭像 發(fā)表于 11-06 13:46 ?142次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>EVA</b><b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>磁盤</b>組<b class='flag-5'>磁盤</b><b class='flag-5'>掉線</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—用5RAID5陣列的4盤重建RAID5陣列后如何恢復(fù)原始數(shù)據(jù)?

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)服務(wù)器掛接一臺(tái)存儲(chǔ),該存儲(chǔ)中有一組由
    的頭像 發(fā)表于 10-30 15:07 ?191次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—雙循環(huán)RAID5陣列崩潰,數(shù)據(jù)如何恢復(fù)?

    拔掉)。整個(gè)RAID5陣列存儲(chǔ)空間劃分了一個(gè)LUN。 服務(wù)器存儲(chǔ)故障: 硬盤出現(xiàn)故障導(dǎo)致
    的頭像 發(fā)表于 09-02 11:35 ?357次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列熱備盤同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 華為S5300存儲(chǔ)中有一組由16FC硬盤組建的
    的頭像 發(fā)表于 07-15 11:38 ?508次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b>熱備盤同步失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)raid5陣列硬盤離線的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)EMC存儲(chǔ)中有一組raid5
    的頭像 發(fā)表于 07-09 11:58 ?221次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列硬盤壞道導(dǎo)致raid崩潰的數(shù)據(jù)恢復(fù)案例

    raid5陣列有23成員盤)。存儲(chǔ)系統(tǒng)上層一共分了11個(gè)卷。 服務(wù)器存儲(chǔ)故障:
    的頭像 發(fā)表于 07-05 12:00 ?545次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)雙循環(huán)riad5陣列數(shù)據(jù)恢復(fù)案例

    ,并沒(méi)有將掉線的硬盤拔掉,所以存儲(chǔ)中有3掉線磁盤。 服務(wù)器
    的頭像 發(fā)表于 06-18 11:10 ?451次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—X3650服務(wù)器raid5磁盤陣列數(shù)據(jù)恢復(fù)案例

    一臺(tái)某品牌X3650M3服務(wù)器,服務(wù)器中有一組raid5磁盤陣列,上層采用zfs文件系統(tǒng)。 服務(wù)器未知原因崩潰,工作人員排查故障后發(fā)現(xiàn)
    的頭像 發(fā)表于 06-04 11:08 ?513次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5磁盤掉線導(dǎo)致崩潰的數(shù)據(jù)恢復(fù)案例

    某公司的一臺(tái)服務(wù)器raid5磁盤陣列有兩磁盤先后掉線
    的頭像 發(fā)表于 05-21 11:43 ?763次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>多</b><b class='flag-5'>塊</b><b class='flag-5'>磁盤</b><b class='flag-5'>掉線</b><b class='flag-5'>導(dǎo)致</b>崩潰的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)存儲(chǔ)raid5陣列磁盤離線導(dǎo)致lun不可用數(shù)據(jù)恢復(fù)案例

    使用,主要數(shù)據(jù)為oracle數(shù)據(jù)庫(kù)和OA服務(wù)端。 服務(wù)器存儲(chǔ)故障: 該MSA2000存儲(chǔ)
    的頭像 發(fā)表于 04-29 11:29 ?549次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>中</b><b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>多</b><b class='flag-5'>塊</b><b class='flag-5'>磁盤</b>離線<b class='flag-5'>導(dǎo)致</b>lun<b class='flag-5'>不可用</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    EVA數(shù)據(jù)恢復(fù)EVA存儲(chǔ)磁盤掉線導(dǎo)致LUN丟失的數(shù)據(jù)恢復(fù)案例

    EVA存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: EVA控制+三個(gè)擴(kuò)展柜+數(shù)十
    的頭像 發(fā)表于 04-19 13:28 ?368次閱讀
    <b class='flag-5'>EVA</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>EVA</b><b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>中</b><b class='flag-5'>磁盤</b><b class='flag-5'>掉線</b><b class='flag-5'>導(dǎo)致</b>LUN丟失的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—V7000存儲(chǔ)硬盤掉線導(dǎo)致存儲(chǔ)崩潰的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)V7000存儲(chǔ),該存儲(chǔ)上有一組由12硬盤組建的
    的頭像 發(fā)表于 04-08 11:15 ?431次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—V7000<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>多</b><b class='flag-5'>塊</b>硬盤<b class='flag-5'>掉線</b><b class='flag-5'>導(dǎo)致</b><b class='flag-5'>存儲(chǔ)</b>崩潰的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)EVA存儲(chǔ)數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 某品牌EVA某型號(hào)存儲(chǔ),底層是RAID5
    的頭像 發(fā)表于 01-23 13:53 ?437次閱讀
    RM新时代网站-首页