在網絡大環境下,服務器是其中的重要組成部分,基本是我們平時所享受的服務大部分都是服務器管理并提供。服務器一旦出現問題,不僅僅影響千萬人正常使用服務,同時也對服務提供商造成無法估計的損失。
這次小編給大家分享一起由5塊SAS 600GB硬盤組成RAID5的IBM X3650服務器數據恢複的案例,通過案例我們來看看服務器的數據恢複過程。
在該案例裡面,其中4塊硬盤組成RAID5,另一塊硬盤作為熱備盤。服務器成員盤一開始先掉線一塊RAID變成降級狀态,熱備盤被啟用。在服務器數據同步的過程中,随後又有另一塊硬盤離線,造成了RAID損壞無法讀取數據。
根據情況,我們制定了以下方案:
一、先檢測硬盤情況,分析溯源故障原因
由于服務器是因為RAID陣列首先有一隻硬盤掉線了,掉線後系統啟用熱備盤,可在同步過程中,又因為有其他硬盤掉線,最終導緻服務器不可用。根據情況判斷,我們先對所有硬盤進行物理檢測。發現最先掉線的3号硬盤是由于磁頭損壞導緻的,後面掉線的1号和2号硬盤是壞道導緻。
二、備份數據
數據恢複最基本的是要确保數據的安全性以及可還原性,因此,在數據恢複前需要将所有硬盤數據進行一個鏡像備份,以避免因其他原因導緻數據無法再次恢複。
三、分析陣列信息
将備份好的鏡像挂載至隻讀環境,對所有鏡像進行陣列信息的分析,确定數據的時效性,完整性。通過分析得知,原陣列的XOR分塊的大小為128扇區,結構為0 1 2 3 ,3号為先離線的硬盤。
四、虛拟重建陣列并檢驗數據
分析完陣列信息,我們将鏡像挂載到虛拟環境上進行重組,恢複原來服務器掉線時的狀态,恢複重建目錄信息,檢查數據是否完整。
在檢查過程中發現一個最新修改日期的數據庫做DBCC 檢查時有2個一緻性錯誤。
再檢查鏡像出來的鏡像文件發現全部正常,應該是服務器在運行時數據庫有寫入造成的一緻性錯誤。這個問題不大,通過運行SQL Server 的dbcc 修複語句進行修複後,恢複正常。
整個服務器恢複過程到這裡大緻上完成,但最後遷回到原機器上的時候,我們發現原機器背闆也是有問題,通過與客戶溝通協商,最後我們根據客戶要求,将系統和數據遷移到另一台同型号的好機器上,到此完滿結束。
這麼多年來,憑借我們過硬的實力和良好的服務,得到了廣大客戶和同行的一緻肯定。我們很高興我們的付出能幫助到大家,我們會不斷地鞭策和提升自己,如有需要的小夥伴們,可以關注我們,聯系我們。我們下期再見。
,