OceanStor 18000系列存儲系統 日志分析_第1頁
OceanStor 18000系列存儲系統 日志分析_第2頁
OceanStor 18000系列存儲系統 日志分析_第3頁
OceanStor 18000系列存儲系統 日志分析_第4頁
OceanStor 18000系列存儲系統 日志分析_第5頁
已閱讀5頁,還剩24頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

修訂記錄課程編碼適用產品產品版本課程版本ISSUEXXXXXXXXXXXXXXXXX開發/優化者時間審核人開發類型(新開發/優化)周曉峰/9000185820131203新開發本頁不打印OceanStor18000系列存儲系統日志分析目標學完本課程后,您將能夠:

掌握如何收集日志及了解日志結構掌握如何使用工具(OceanStorToolKit)進行日志分析掌握如何對常見問題進行人工日志分析及處理方法目錄日志收集方法日志結構介紹日志分析工具介紹常見問題手工日志分析方法存儲設備運行出現故障,需要進行故障排查和定位時需要收集日志信息。日志收集方法分為兩類:當存儲設備工作正常時,可以通過DeviceManager/CLI或者OceanStorToolKit進行常規日志收集當存儲設備開工失敗,無法登錄系統時,需要通過其他方式進行日志收集(后面詳述)日志收集概述使用DeviceManager收集日志V100R001使用ISM登錄存儲系統選擇“設置”->“導出數據”->“系統日志”使用CLI收集日志常規日志收集1.使用SSH登錄存儲陣列CLI界面2.執行命令“exporteventevent_type=log…”,等待2-5分鐘。命令收集完成,界面顯示文件存放位置。使用OceanStorToolkit收集日志關于OceanStorToolkit工具的介紹請參見“OceanStorToolkit存儲配套管理工具介紹”課程。收集方法常規日志收集12使用OceanStorToolkit收集日志常規日志收集345信息收集過程顯示界面6如果存儲設備開工失敗,請使用以下方法收集日志:方法通過sftp工具,使用管理網口IP登錄控制器(用戶名/密碼與正常登錄時一樣),進入“/OSM/log/cur_debug”,下載該目錄下的所有文件。然后再登錄到另外一個控制器,下載同樣目錄下的所有文件。開工失敗日志收集(夏士鑫更新)目錄日志收集方法日志結構介紹日志分析工具介紹常見問題手工日志分析方法日志包格式為*.tar(壓縮包)日志包包含格式為*.tar.bz2的兩個控制器的日志壓縮包

控制器的日志壓縮包命名規則:控制器IP地址及是否主控標識(主控文件名含“MAIN”字樣)控制器日志文件結構日志包結構介紹【Config】其中包含一個config.txt文件

含陣列中當前的軟、硬件配置及各運行參數【Event】其中包含一個event.txt文件

含陣列中當前的告警、事件記錄【Messages】主要包含系統日志,小系統日志等【other】主要是各個軟件模塊的一些調試級別信息(及操作系統的少量信息)注意:原始壓縮包中Messages、other兩個目錄被壓縮在“msg_other.zip”文件中。主控制器日志包目錄日志收集方法日志結構介紹日志分析工具介紹常見問題手工日志分析方法原理介紹日志分析工具通過定制規則庫中的關鍵字或者關鍵ID,在日志包中進行搜索,滿足定制的條件,分析出問題并給出解決方案。定制規則庫介紹定制規則庫是根據現網出現的常見問題和版本存在的問題,提取定位問題所需的關鍵字或者關鍵ID并滿足某種關系,編寫成規則庫。可分析日志包類型DeviceManager收集的日志包OceanStorToolkit收集的日志包開工失敗收集的日志包可分析的問題(僅列舉部分,預期可分析規則為200個)內存不一致問題導致控制器無法正常啟動直流環境BYD生產的BBU電壓采樣算法有誤硬盤出現硬件錯誤硬盤慢盤日志分析工具介紹功能介紹日志分析工具介紹日志分析工具包下載后,解壓可直接運行start.exe程序進行使用。日志分析工具界面包括三部分:日志分析工具操作指導區,分析出的問題顯示區域和分析過程記錄區域。日志分析工具在V100R001C03SPC600及以上版本支持。運營商軟件下載企業網軟件下載***請定時關注網站更新操作指導日志分析工具介紹操作指導日志分析工具介紹操作指導日志分析工具介紹目錄日志收集方法日志結構介紹日志分析工具介紹常見問題手工日志分析方法以下介紹4類常見問題開工失敗硬盤故障硬盤隔離主機業務表現出性能慢人工處理常見問題的日志分析

及處理方法現象

DeviceManager上報“開工失敗”或“開工保險箱盤失敗”錯誤可能原因1.保險箱盤未插好2.保險箱記錄的控制框MAC地址和實際不一致3.控制框與硬盤框線纜級聯錯誤4.控制框溫度過高處理方法首先排查1和3號原因(也可通過查看日志進行確認),再進行日志分析。日志分析方法:通過前面所述的“開工失敗日志收集”方法收集日志。先分析主控制器日志包中的“/OSM/log/cur_debug/messages”文件,搜索關鍵字“SYS_TRACE”,找到報上電失敗的日志。如果日志中提示是slave上電失敗,則再分析備控制器的上述文件。在提示上電失敗日志附近(如前后100行),查找具體的失敗原因。下面對各種常見的原因進行逐一說明。開工失敗保險箱盤未插好日志表現在上電失敗日志內容部分,有類似提示“SYS_VAULT:CheckCofferdiskfailed”。表明保險箱盤未正常接入系統,或者保險箱槽位未插硬盤。解決方法重新排查連接和硬盤一般可以解決。注意事項OceanStor18000系列存儲系統會認為接到引擎0和1的0號槽位的接口卡0號端口的第一個框為保險箱盤所在的框,該框前四塊盤為保險箱盤。所以如果沒有框接入到該位置,或A、B控制器該位置的框不是同一個框,則設備必然上電失敗。開工失敗保險箱記錄的控制框MAC地址和實際不一致日志表現在日志中搜索“DEVfirstfailingreasonisthatctrlmacindbdifffrombaseboardonphase(waitreaddb).”。表明保險箱記錄的控制框MAC地址和實際不一致。解決方法清除保險箱DB(僅針對局點首次開工時)。執行命令cleardb,該命令的具體用法請參見對應產品型號的《受限命令參考》。《受限命令參考》手冊受限發布,如需使用需要向研發接口人申請。開工失敗控制框與硬盤框線纜級聯錯誤日志表現“framemacinvalid(newframenotwritemac,orframewasnotfastplugged)”。該錯誤主要原因是保險箱盤所在的框位置錯誤,主要場景是設備之前成功上過電,然后下電拆下重新連接,而框的連接順序與之前不同引起。解決方法一般修正連接順序后即可解決。----------------------------------------------------------------------------------------------------控制框溫度過高日志表現“Ctrlboardisfaulty(theentrancetemperatureistoohigh,orsomethingelseiswrong)”。該問題出現在上電時,由于環境溫度異常導致控制框溫度過高,導致開工失敗。解決方法排除環境溫度過高后重新上電可解決。開工失敗可能原因一般硬盤故障可能是介質錯誤,硬件錯誤等日志表現在日志中搜索關鍵字“Setdisk

to

bad”,在其前面可以看到具體錯誤原因,如有壞道記錄,或者SCSI打印出的具體原因。解決方法申請備件,更換對應硬盤。硬盤故障可能原因誤碼反復拔插硬盤硬盤電源接觸出現問題處理方法以下根據分類,分別給出兩種硬盤被隔離后的日志分析和解決方法。硬盤隔離日志表現查看SAS后端硬盤誤碼情況,在SES日志中搜索關鍵字errinc和disablediskphy日志中的phy:9phymon***disablediskphy表示Phy9被隔離,即9號槽位硬盤被隔離(phy0~phy23對應硬盤0~23)。解決方法1.拔插故障硬盤前,請收集硬盤的S.M.A.R.T信息并返回研發進行分析2.在允許的條件下,將隔離硬盤插入到其他槽位,判斷隔離現象是跟著硬盤走還是跟著槽位走。假如跟著硬盤走,申請硬盤備件進行更換。若跟著槽位走,觀察槽位內是否有異物。硬盤隔離(SAS硬盤)現象

主機業務表現出性能慢日志表現查看是否有端口故障和端口隔離的告警,沒有的話,查看A、B控日志,是否有如下打印:原因分析DiscardFrame表示存在丟幀,表示出現存儲出現丟幀的現象。解決方法如果出現如下打印的A、B控端口連接在同一個交換機上,且BadChar0表示交換機到存儲沒有產生誤碼,建議排查主機側到交換機的鏈路問題。主機業務表現出性能慢參考材料材料名稱內容簡介獲取鏈接誤碼導致FC框硬盤單鏈路故障案例介紹常見故障現象及處理方法。LinkExercise1、(判斷題)日志收集包括ToolKit

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論