




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、服務器raid信息丟失解決方案作者:郭國華,新炬網絡高級技術專家。在服務器硬件維修過程中,RAID信息的丟失造成用戶數據的全部丟失等各種情況都是災難性事故。我們要如何應對此類問題呢?一、硬盤涉及到硬盤,raid卡,硬盤背板,SAS線更換,都有可能導致raid信息丟失,致使數據丟失,造成重大損失,需嚴格按以下的步驟進行:(一)硬盤更換更換硬盤,可以在線更換,并且有raid信息,可以保證數據的恢復,風險性是最小的。硬盤上存儲服務器的全部數據,硬盤是一種機電設備,盤體由多個疊在一起的圓形盤片構成(盤片為金屬磁性材料,可在兩面存儲數據),并以圓心為軸旋轉(很象唱機播放唱片),讀寫頭通過機械臂與盤片相互
2、靠近,并將數據以位為單位存儲和讀取。當您讀取一個文件時,讀寫頭沿著旋轉的盤片表面前后移動,直到找到需要的數據。系統通過磁盤控制器將數據裝載到內存中。在存儲數據時,計算機再將數據以磁記錄的方式寫回到硬盤中,正是由于它是機電設備,故障率要高于設施中的其它設備。如更換不當就會引起系統崩潰,甚至導致信息丟失,造成不可挽回的損失更換風險:損壞新硬盤,損壞硬盤背板,丟失數據A. 離線更換:適用與非熱插拔或可以停機的硬盤更換,優點是風險小,缺點是需要停機,影響應用。1. 更換前備份數據,待數據全部備份完成且確認備份完整性后實施更換;2. 關機;3. 拔出損壞的硬盤;4. 插入新的硬盤(損壞硬盤的槽位);5.
3、 開機如果成功硬盤將會與其他盤自動同步數據;B. 在線更換:適用用熱插拔硬盤,優點,不影響服務器正常運行和用戶的應用,缺點,風險稍大。1. 更換前備份數據,待數據全部備份完成且確認備份完整性后實施更換;2. 拔出已損壞硬盤(拔到一半的位置,不要全拔出來。注意必須在9秒內拔盤。等待秒鐘拔出其余盤);3. 插入新硬盤,插入時先把硬盤插入一半待硬盤上的燈開始閃全部插入,9秒鐘內全部插入;4. 如果做了raid全部插入后硬盤會自動同步其他盤數據(raid 0除外)。硬盤更換失敗回退方案:1. 判斷失敗原因2. 如果新的硬盤有問題更換另外新的硬盤。3. 如果數據丟失,待硬盤更換完成,利用備份數據恢復數據
4、(二)硬盤背板更換更換背板:由于硬盤是一個機電設備,所以它的故障率要高于設施中的其它設備,為了保證系統能連續工作,在磁盤陣列和服務器中都設有一塊硬盤熱插拔背板,以便硬盤發生故障時能在不斷電的情況下更換硬盤即通常說的硬盤熱插拔,但在硬盤熱插拔時會給電路系統帶來很大的沖擊電流,如不采取相應措施就會引起系統崩潰,甚至導致信息丟失,造成不可挽回的損失。各大公司一般采用控制器或單片機加限流電路,可進行驅動器狀況監控并在熱插拔底板上顯示磁盤驅動器的狀態信息。這就允許客戶快速地確認并更換一個已經無效的或者可能有故障的磁盤驅動器。在更換了損壞的硬盤后,RAID的重建可自動進行,而無須再經手動操作RAID控制器
5、來完成。在硬盤的恢復過程中,不影響系統的服務。更換風險:丟失數據,損壞硬盤、主板。1. 更換前備份數據,待數據全部備份完成且確認備份完整性后實施更換;2. 關閉服務器,拔掉電源;3. 打開機箱,待服務器冷卻后佩戴防靜電手套拆除硬盤背板的連線。注意連接線位置,以便于正確安裝;4. 移去硬盤背板;5. 將硬盤背板從防靜電包中取出,放置背板,讓背板與機箱內的溝槽對齊,讓板上的連接器與系統板上的連接器對齊;6. 連接各種連線,注意不要插混;7. 裝配好機箱,加電,成功則正常啟動。硬盤背板更換失敗回退方案:1. 判斷失敗原因;2. 如果新硬盤背板損壞則更換新的背板;3. 如果因為更換不當引起主板,硬盤故
6、障,需要更換新部件后再加電測試;4. 如果數據丟失需要更換完成后利用備份數據恢復。(三)SAS線更換更換風險:丟失數據,掉盤陣,硬盤驅動器失敗。更換硬盤連接線:需停機進行更換,因為有丟失數據風險,更換前備份數據,待數據全部備份完成且確認備份完整性后實施更換。1. 關閉服務器,拔掉電源;2. 待服務器冷卻后,打開機箱;3. 找到需要更換的SAS線;4. 拆除壞SAS線,連接號新的SAS線;5. 裝好機箱,加電測試。回退方案:1. 判斷失敗原因是否與SAS線有關。2. 如果新SAS線依然有問題需要等調換SAS線后再次進行更換。3. 如果因為安裝不當引起其他部件損壞待新備件完成變更后,加電測試。4.
7、 如果引起數據丟失,則利用先前備份好的數據進行恢復。(四)Raid卡更換大多情況下raid信息都是寫在服務器硬盤里面,硬盤信息丟失,raid信息也會丟失,最好的方法是找專業公司來恢復數據。其中Hp近五年以內出的服務器陣列信息(包括smart、sas陣列卡)都是寫在硬盤上,無法備份raid信息。更換風險:丟失raid信息造成數據丟失1. 因為有丟失數據風險,更換前備份數據,待數據全部備份完成且確認備份完整性后實施更換。2. 關閉服務器3. 待服務器冷卻后,打開機箱。4. 拆除需要更換raid卡。5. 將新raid卡插入插槽中。6. 裝好機箱。7. 加電進入raid卡控制界面,將新raid卡原有的
8、信息清除。8. 退出界面,關閉服務器將硬盤按照原有順序接到原來接口。9. 然后從HDD拷貝raid信息過來即可,保存退出。Raid卡更換失敗回退方案:1, 如果已備份數據,則利用備份數據恢復;2, 如果沒有備份數據;3, 不要輕易嘗試Rebuild、同步等操作。不要頻繁開機,插拔硬盤,不可以強制上線試圖激活raid;4, 千萬不要初始化。 初始化是磁盤陣列全部清零,相當于硬盤的低級格式化;5, 謹慎重配磁盤陣列信息;6, 斷電后依次拔出硬盤并標記好序列號,找數據公司恢復數據。(五)恢復系統應用利用已恢復的數據恢復系統應用。如果出現數據丟失情況:可以對單盤做鏡像的方式(以為例)。1. 可以斷電后
9、依次拔出硬盤并標記號序列號。2. 將硬盤掛接到不含RAID功能的SAS適配器上。RAID損壞后,要想完整備份源數據,必須保證對所有硬盤的讀寫都是可回溯的。為此,只能使用不含RAID功能的SAS適配器進行連接后鏡像,這樣才能以單硬盤的方式進行訪問。3. 將硬盤與適配器連接好。4. 保證掛接服務器使用操作系統為WIN2003(其他系統也可以,本例以 WINDOWS為例)。5. 進入系統后,磁盤管理里會看到多個單獨的硬盤,此時切記不可初始化磁盤、分區或分配盤符給可能的磁盤分區(如果不確定是否可避免,建議不要進入磁盤管理)。6. 利用軟件WINHEX給單盤做鏡像。7. 可以使用WINHEX
10、用逆向還原回原硬盤。二、RAID如果RAID信息的丟失會造成用戶數據的全部丟失等各種情況的發生。為了避免類似的情況發生我們就需要從以下方面入手。1. Raid是什么?2. 造成Raid信息丟失是由哪些方面造成的?3. 維修過程中的注意事項有哪些?(一) Raid是什么?RAID是英文Redundant Array of Independent Disks的縮寫,翻譯成中文意思是“獨立磁盤冗余陣列”,有時也簡稱磁盤陣列(Disk Array)。簡單的說,RAID是一種把多塊獨立的硬盤(物理硬盤)按不同的方式組合起來形成一個硬盤組(邏輯硬盤),從而提供比單個硬盤更高的存儲性能和提供數據備份技術。組
11、成磁盤陣列的不同方式成為RAID級別(RAID Levels)。數據備份的功能是在用戶數據一旦發生損壞后,利用備份信息可以使損壞數據得以恢復,從而保障了用戶數據的安全性。在用戶看起來,組成的磁盤組就像是一個硬盤,用戶可以對它進行分區,格式化等等。總之,對磁盤陣列的操作與單個硬盤一模一樣。不同的是,磁盤陣列的存儲速度要比單個硬盤高很多,而且可以提供自動數據備份。RAID技術的兩大特點:一是速度、二是安全。RAID技術經過不斷的發展,現在已擁有了從 RAID 0 到 6 七種基本的RAID 級別。另外,還有一些基本RAID級別的組合形式,如RAID 10(RAID 0與RAID 1的組合),RAI
12、D 50(RAID 0與RAID 5的組合)等。不同RAID 級別代表著不同的存儲性能、數據安全性和存儲成本。但我們最為常用的是下面的幾種RAID形式。RAID級別的選擇有三個主要因素:可用性(數據冗余)、性能和成本。如果不要求可用性,選擇RAID0以獲得最佳性能。如果可用性和性能是重要的而成本不是一個主要因素,則根據硬盤數量選擇RAID 1。如果可用性、成本和性能都同樣重要,則根據一般的數據傳輸和硬盤的數量選擇RAID。(二) 常見Raid 故障及可恢復性分析1、軟件故障:a突然斷電造成RAID磁盤陣列卡信息的丟失的數據恢復。b重新配置RAID陣列信息,導致的數據丟失恢復。c如果磁盤順序出錯
13、,將會導致系統不能識別數據。d誤刪除、誤格式化、誤分區、誤克隆、文件解密、病毒損壞等數據恢復工作。2、硬件損壞:araid一般都會有幾塊硬盤,其中某一塊硬盤出現損壞,數據將無法讀取。(除raid0外,單塊硬盤壞都不會影響數據的安全性)braid出現壞道,導致數據丟失,這種恢復成功率比較大。(raid條帶出故障,包括配置不當或raid卡壞導致的raid條帶錯誤)c如果硬盤同時出現兩塊以上的損壞,恢復工作非常復雜,成功率比較低。常見raid故障可恢復性分析:1、磁盤物理故障。如:電路板壞、磁頭損壞、盤面壞、壞扇區、固件壞等。有些Raid級別提供容錯能力,磁盤出現物理故障之后還可以正常運行系統,但是
14、系統的整體性能將下降很多,而且數據處于危險狀態;2、RAID陣列卡出現故障。因為硬件RAID的信息存儲在RAID卡上面,所以當RAID磁盤陣列卡出現問題后,數據將會丟失。我們使用自己開發的軟件可以不依靠RAID卡信息恢復數據。現在大部分服務器都會在硬盤上保留一份raid的配置信息,這樣raid卡故障后,還可以從硬盤上的raid信息備份恢復raid配置,保障數據的安全;3、拔插硬盤將順序弄錯。如果磁盤順序出錯,將會導致系統不能識別數據,這種情況下用戶只要重新調整順序,大多可以解決問題;4、重新配置RAID陣列信息。這種情況大多是因為用戶不熟悉配置磁盤陣列卡,盲目進行操作所導致;5、突然斷電,突然
15、的斷電將會造成RAID磁盤陣列卡信息的丟失,嚴重的情況下可以導致硬盤物理損壞。(三) 如果出現raid卡、磁盤陣列等故障,請注意以下幾點:1. 在沒有保證數據100%安全下(如異地備份)不要對服務器進行任何操作,因為任何操作都有可能造成數據的丟失。如果在沒有異地備份數據而且數據非常重要的情況下建議找數據公司備份數據;2. 不要輕易嘗試Rebuild、同步等操作;3. 千萬不要初始化。 初始化是磁盤陣列全部清零,相當于硬盤的低級格式化;4. 謹慎重配磁盤陣列信息; 5. 如果某家公司需要你提供服務器或陣列卡進行數據恢復,他們做的事和硬件提供商一樣,也只是重新配置RAID陣列信息,如果配置參數、磁
16、盤順序和當初完全一致,數據有可能出來,相反數據就有可能徹底破壞,給客戶帶來巨大損失;6. 不要輕易讓服務器售后服務工程師操作,因為服務器廠商只負責硬件設備故障的更換。IBM,DELL,惠普等等廠商,他們的技術工程師上崗培訓里并不包括數據災難拯救項目。針對服務器陣列崩潰或壞盤,售后服務工程師會簡單地使用服務器自帶的功能,強行將硬盤上線或進行初始化、同步等操作,以試圖排除故障,很多數據二次破壞就是這么造成的,甚至部分服務器由于工程師的二次操作造成永久破壞而無法恢復。比喻硬盤亮黃燈后,大部分工程師會采取強行加載的方式來保持服務器繼續運行,按照我們的經驗,一般出現此類問題應該立即替換新盤,單純采用強行
17、上線的方式來保持陣列運行,是極其危險的,特別是在超過3個盤的大型陣列里;7. 仔細耐心檢查,記得在硬盤拔下來之前將硬盤編好號碼,以防止在插回去的時候插錯盤,類似于這樣的事情不在少數;8. 陣列出現了問題,可在開機的時候進入陣列卡,檢查一下硬盤的狀態,首先與服務器廠商聯系,但記住不要輕易讓工程師對服務器進行操作(除非對硬盤有備份的情況下)記下故障產生的過程,與廠商聯系的時候好應對提問,及時根據問答在電話中判斷故障的現像,如果您需要數據恢復服務,則最好將硬盤做成鏡像,然后將鏡像帶至數據恢復公司,這樣就相當于替您的服務器做了一個最底層的備份。對于一個有技術的公司而言,鏡像與源盤沒有任何區別,數據恢復
18、只需要鏡像,而不需要服務器。注意:鏡像并不是ghost文件。(四) 備份現有的ibm、 hp、 dell,哪些服務器、盤陣raid 信息是可以正常備份的,如何備份。大多情況下raid信息都是寫在服務器硬盤里面,硬盤信息丟失,raid信息也會丟失,最好的方法是找專業公司來恢復數據。其中Hp近五年以內出的服務器陣列信息(包括smart、sas陣列卡)都是寫在硬盤上,無法備份。注:陣列信息與硬盤的數據信息是兩個概念,在壞兩塊硬盤的情況下(做raid1的兩塊硬盤鏡像也壞了),即使恢復陣列信息,硬盤數據也會丟失。對于ibm低端的x系列服務器陣列卡的故障,如果需要更換陣列卡而又不破壞原本數據的話,需要注意
19、以下步驟:1、先拔下故障的陣列卡,將機器的各項微碼升級到最新,升級機器的微碼可以從IBM的官方網站下載最新的update express光盤來升級,具體步驟請參考IBM網站介紹2、裝上新的陣列卡,先不要接硬盤,如果陣列卡是和底板共用通道的話(比如6i 7k系列),可以將硬盤先拔出,此時注意不要搞錯硬盤依次的順序,否則對數據會有影響。在不接硬盤的情況下,將新的陣列卡的微碼升級到一個比較穩定的版本,如果知道故障陣列卡的微碼版本,建議升級到和原來陣列卡的微碼版本。清空陣列卡內的所有信息(這一步很重要)。3、接上硬盤,進入陣列卡的界面,將硬盤本身的信息導入陣列卡,重啟服務器。4、查看導入的硬盤的狀態,
20、是否為online或者hsp,如果是offline或者ddd的,需要用Server Raid光盤引導進入陣列管理界面,進行激活等操作,才能順利進入系統。5、將系統和陣列卡的微碼升級到一致,建議升級到一個比較高級的穩定版本。IBM X服務器備份和恢復RAID的陣列信息,當RAID卡的信息意外丟失(且用硬盤上的備份配置信息恢復又不起作用),導致整個系統不可用。當然,在配置好RAID后一定要用IPSSEND.EXE備份RAID信息到軟盤上。但是,通常情況下用IPSSEND.EXE命令行程序備份RAID信息較為復雜。本文將介紹一種簡單可行的方法-用ServerGuide光盤備份和恢復RAID卡的陣列信息。 ServerGuide6.0.2及其以上版本均可配置RAID 4系列卡,并且還可以備份/恢復RAID信息(調用光盤上的IPSSEND.EXE)。 解決方法: 1、用ServerGuide6.0.2引導服務器并配置好RAID。 2、在主菜單下按如下操作備份RAID信息。 1)Run setup programs & configure hardware-> 2)Custom-> 3)Create setup replication disk
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 激光技術工程師考試內容更新與動態試題及答案
- 計算機二級考試題庫建設探討試題及答案
- 聚焦2024年信息系統項目管理師考試管理誤區探討試題及答案
- 文化產業行業動態試題及答案指導
- 鑒別診斷的重要性在臨床中的體現試題及答案
- 藥品流通監管政策與實踐試題及答案
- 西醫臨床患者安全試題及答案
- 營養不良患者的護理策略與方法試題及答案
- 激光設備的故障類型及解決方法試題及答案
- 激光在社會發展中的貢獻試題及答案
- 2023年赤峰龍韻城市建設有限公司招聘筆試題庫及答案解析
- (人工智能導論)課件
- 專利申請培訓課件
- DPtechIPS2000系列入侵防御系統培訓膠片課件
- 競爭性談判二次報價單
- 危大工程巡視檢查記錄
- (房屋建筑部分)工程建設標準強制性條文2023年版
- 空氣自動監測站運維技術服務合同模版
- (完整)康復醫學考試題(含答案)
- 延期還款申請表
- 江蘇省地圖矢量PPT模板(可編輯)
評論
0/150
提交評論