沈陽數(shù)據(jù)恢復
沈陽飛客瑞康咨詢熱線:13998384184
今天為大家介紹的是服務(wù)器數(shù)據(jù)恢復案例,服務(wù)器的故障是raid信息丟失了。下面簡單介紹一下本次數(shù)據(jù)恢復的服務(wù)器基礎(chǔ)信息:某品牌DL系列服務(wù)器,存儲是由6塊73GB SAS硬盤組成的RAID5磁盤陣列,服務(wù)器上層操作系統(tǒng)是WINDOWS,服務(wù)器內(nèi)主要存儲了企業(yè)的內(nèi)部文件,沒有數(shù)據(jù)庫文件,在服務(wù)器的主機(無UPS)發(fā)生故障前曾經(jīng)出現(xiàn)過幾次意外斷電的情況,由于重啟后并沒有出現(xiàn)異常,因此服務(wù)器一直在使用,直到有一次斷電重啟后RAID報錯,提示無法找到存儲設(shè)備,進入RAID管理模塊后操作死機,管理員多次嘗試重啟服務(wù)器后還是沒有辦法進入系統(tǒng),為了防止服務(wù)器內(nèi)數(shù)據(jù)丟失,管理員聯(lián)系到飛客瑞康進行服務(wù)器數(shù)據(jù)恢復。
【數(shù)據(jù)恢復故障分析】
通常服務(wù)器出現(xiàn)這種情況的數(shù)據(jù)丟失多因為服務(wù)器意外斷電導致RAID模塊損壞(包括RAID管理信息丟失和RAID模塊硬件損壞)。一般在RAID陣列創(chuàng)建完成后陣列的管理模塊信息就固定下來不會再發(fā)生改變,但是raid陣列的模塊信息依然屬于可修改部分,服務(wù)器意外斷電很容易造成這部分信息被篡改甚至丟失,多次斷電甚至有可能導致RAID卡上的元器件損壞,從而使主機失去對多塊物理硬盤進行RAID管理的中間層模塊。該案例中對RAID模塊的操作死機現(xiàn)象極有可能是由RAID卡硬件損壞引起的(后經(jīng)HP售后技術(shù)人員驗證得到證實),此時通過正常途徑已無法將獲取6塊硬盤中的數(shù)據(jù),只能依靠第三方提供數(shù)據(jù)恢復服務(wù)來解決。
1.服務(wù)器數(shù)據(jù)恢復第一步首先對客戶的服務(wù)器內(nèi)所有硬盤進行嚴格的物理檢測,用以排查硬盤是否有硬件故障。經(jīng)過檢查發(fā)現(xiàn)服務(wù)器內(nèi)的所有硬盤均可以正常讀取。
2.由于硬盤全部正常,因此不需要進行硬件修復,直接對服務(wù)器內(nèi)的硬盤進行鏡像備份即可。
3.鏡像完成后,服務(wù)器數(shù)據(jù)恢復工程師開始對這組raid進行結(jié)構(gòu)分析,主要是為了確定raid陣列的硬盤順序、數(shù)據(jù)塊的大小和陣列校驗方式等用于重新構(gòu)建raid陣列。
4.服務(wù)器數(shù)據(jù)恢復工程師利用分析出來的raid陣列信息重新虛擬重建一組raid陣列并進行邏輯校驗,確保重構(gòu)RAID所應(yīng)用的各參數(shù)正確無誤后,針對用戶最為關(guān)注的數(shù)據(jù)進行完全驗證;
5.最后,數(shù)據(jù)恢復工程師聯(lián)系客戶對恢復出來的數(shù)據(jù)進行驗證,經(jīng)過驗證后所有數(shù)據(jù)均已經(jīng)成功恢復,數(shù)據(jù)遷移成功后本次數(shù)據(jù)恢復圓滿結(jié)束。
【服務(wù)器數(shù)據(jù)恢復過程】
1.盡量保證機房電源供應(yīng)穩(wěn)定,以減少電源異常對主機及存儲的沖擊;
2.最好為重要的服務(wù)器及存儲配置UPS,可在機房意外斷電的情況下保證核心業(yè)務(wù)系統(tǒng)能繼續(xù)維持一定時間的正常工作,從而為企業(yè)尋求應(yīng)急解決方案贏得寶貴的時間;
3.對于服務(wù)年限已久的服務(wù)器應(yīng)定期進行安全狀況檢查,并對其整體運行狀態(tài)進行評估以決定是否進行硬件及系統(tǒng)的全面升級,同時提前制定突發(fā)數(shù)據(jù)災(zāi)難的緊急處理方案,以降低數(shù)據(jù)災(zāi)難帶來的業(yè)務(wù)損失。
沈陽數(shù)據(jù)恢復
沈陽飛客瑞康遼寧省沈陽市和平區(qū)三好街艾特國際花園6號樓315室