服務器數據恢複環境:
由4塊SCSI盤組成RAID0 RAID1。
北亞數據恢複——RAID0 1數據恢複
服務器故障&分析:
根據用戶描述這是兩組raid1。RAID狀态顯示3快盤offline。如果如用戶所說的兩組盤都是做的raid1,現在應該有一組邏輯盤可以正常工作,但是事實并不是這樣。
服務器數據恢複過程:
1、把硬盤單獨接到SCSI适配器,進入系統後沒有發現異常,也沒有發現比較明顯的raid信息區域。比較之後發現1、3号盤及2、4号盤每組都有相同性,但後面有大量不一緻的數據。1号盤和2号盤有分區表,從每個分區表裡的描述可以判斷出原邏輯盤分區的總大小。
2、通過上面的檢測結果,服務器數據恢複工程師推測這2組raid莫非是兩組RAID0?但1、3号及2、4号均有部分完全相同的數據,這不符合2組RAID0的特征。
北亞數據恢複——RAID0 1數據恢複
3、假設這2組RAID是RAID1 0(即兩兩做RAID1,再做RAID0,這種安全級别高,因為方案是集成商做的,這種可能性最大)。兩組RAID1中先後有一塊硬盤離線(此後就相當于RAID0,再不能提供冗餘),然後又有一塊硬盤離線,系統崩潰。
4、假設這2組RAID是RAID0 1(即兩兩做RAID0,再做RAID1,這種方案并不好,推斷可能性不太大)。如果是這種情況,除了1、3組成的RAID,沒有任何錯誤,重組數據直接寫回RAID,系統正常可以啟動,文件訪問也正常。
5、但是在對第二種假設(RAID0 1)進行驗證的時候發現了問題:這都是兩年前的數據!難道是用戶做了RAID0 1,組成RAID1的其中一組RAID0中有一塊盤離線(應該為1或3),導緻整個RAID0離線(兩塊離線了)。之後一直以單RAID0的方式工作(這種工作方式竟然持續了兩年多)。直到剩下的一組RAID0中有一塊盤離線,RAID徹底崩潰。用戶使用的RAID卡為ADAPTEC的0通道RAID卡無法安全緩沖數據,最後離線時,因部分數據未寫入等原因導緻文件系統一緻性出現問題。
6、重新組織3号及5号盤,修正錯誤,數據恢複成功。
北亞數據恢複——RAID0 1數據恢複
,