北塔BTSO智慧運維平臺方案_第1頁
北塔BTSO智慧運維平臺方案_第2頁
北塔BTSO智慧運維平臺方案_第3頁
北塔BTSO智慧運維平臺方案_第4頁
北塔BTSO智慧運維平臺方案_第5頁
已閱讀5頁,還剩69頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

智慧運維平臺建設方案XX智慧運維平臺建設方案上海北塔軟件股份有限公司目錄TOC\o"1-5"\h\z\u目錄 21. 運維軟件的變革 71.1. 運維管理的三個轉變 71.2. 智慧運維給用戶的價值 81.2.1. 落實等級化管理 81.2.2. 落實管理經驗積累 101.2.3. 從數據挖掘實現隱患分析 101.2.4. 支持持續管理建設 121.3. 智能運維的特色功能 121.3.1. 智能拓撲 121.3.2. 智能采集 131.3.3. 智能基線 141.3.4. 智能策略 141.4. 項目效益分析 151.4.1. 管理效益 151.4.2. 實現綠色經濟模式 151.5. 北塔軟件公司介紹 161.5.1. 自主創新 171.5.2. 大量優質案例 171.5.3. 參與標準制訂 171.5.4. 服務能力 171.5.5. 核心競爭力 182. 整體技術方案介紹 192.1. 建設目標 192.1.1. 建設思路 192.1.2. 建設內容 192.2. 方案產品介紹 202.3. 方案詳細介紹 212.3.1. 產品平臺介紹 21. 運行摘要 22. 日常運維 24.1. 運維等級管理 24.2. 停機檢修管理 25.3. 軟件操作審計 252.3.2. 智能運維引擎 26. 運用等級概念實現差異化管理 26. 自主學習基線實現業務異常監控 27. 智能策略實現管理實例落地 272.3.3. 系統智能運維 28. 預置智維管理方案 29. 智維事件監控 29. 智維越界提醒策略 30. 客戶化分析策略定制 302.3.4. 故障管理 31. 告警管理 31.1. 便捷的規則設置 31.2. 高效的告警提醒機制 31.3. 清晰的告警查詢 32. 知識庫管理 332.3.5. 報表與分析 33. 性能趨勢分析 33. 基礎管理報表 34. 系統巡檢報表 34. 快速報表定制 362.3.6. 系統類管理 37. 主機管理 37. 設備性能分析 39. 數據庫管理 40.1. oracle-rac管理 43. 中間件管理 452.3.7. 網絡管理 47. 網絡拓撲管理 47.1. 拓撲生成 47.2. 拓撲圖展現 48.3. 個性化拓撲 48.4. 監控結果展現直觀 48.5. 界面美觀 48.6. 操作便捷 492.3.8. 存儲管理 50. 硬件狀態一覽 50. 容量使用分析 51. 高負載設備定位 52. 存儲線路管理 522.3.9. 虛擬化管理(后期擴展) 53. 呈現虛擬化對象健康性 53. 預防容量枯竭 54. 保障容量有效使用 55. 明細容量分配 55. 發現和解決性能瓶頸 56.1. 虛擬機性能分析 56.2. 智能運維策略 58. 判斷虛擬機可刪除 602.3.10. 專項運維 61. 設備性能管理 61. 線路性能管理 623. 售后服務 643.1. 服務宗旨 643.2. 服務內容 643.2.1. 產品升級服務 643.2.2. 標準支持服務 653.2.3. 現場巡檢服務 664. 附錄:《季度巡檢報告樣稿》 67服務介紹 67系統巡檢概要表 68用戶管理對象巡檢結果 69BTSO系統巡檢結果 715. 本次推薦配置列表 73運維軟件的變革運維管理的三個轉變近年來,國內IT應用系統建設經歷了基礎硬件環境建設、系統應用建設、數據大集中階段等多個階段。面對業務部門對信息支撐能力要求日益提高,信息部門管理工作也逐步從大建設、大發展階段進化到精細化管理階段,從過去強調網絡建設、應用建設和系統建設,逐步認識到增強管理能力的重要性。傳統的運維管理雖然具備一定的設備管理能力,但從實踐中有發現了很多弊端。這些弊端包括管理設備究竟該管那些關鍵指標(KPI)?確定KPI后運維管理給出的具體數值又代表什么含義?設備是正常的?故障的?還是只是需要注意下?最痛苦的是用戶會發現管設備節約的人力都投入到使用運維管理系統中,那么運維管理系統帶給用戶的價值在哪里呢?綜上所述,傳統運維管理軟件的弊端必然帶來新的變革,這種變革趨勢包含以下三個方向:人工運維向自動智能運維轉變傳統運維工作是以人工處理為主,通過各種專業的人對系統進行檢查的方式來發現系統中存在的問題。隨著系統復雜性和建設規模不斷增大,各種復雜設備對人的要求越來越高。初級的運維管理系統應運而生,這類系統是以“工具”的形式出現,即“我不知道該看什么指標,該管什么設備,反正我都可以管,具體怎么管用戶自己定”。系統投運后,大量的工作都需要用戶自己完成,轉變不外乎從登錄設備操作改變到登錄運維系統進行操作。這樣的運維管理系統一旦部署,用戶的工作量并沒有任何改變,對這類管理系統最大體會就是難用。因此,用戶也迫切希望建設具有自動管理能力,更像一個高水平的“管家”幫助用戶全方位的監控各類系統的運行狀況,及時給出異常提醒和操作建議。閥值管理向趨勢管理轉變閾值管理也是傳統運維管理系統的核心特征。通過設置設備運行的固定閾值,來界定設備處于正常和故障兩種狀態。然而事實上,閥值管理很難對實際的運維管理工作有指導意義。這是因為由于各類設備都承載了各種業務,由于每個用戶實際業務不同,即便完全相同的設備的運行指標也呈現出不同的負載變化。另外運維管理系統的核心價值體現是“防患于未然”,采用固定閾值的結果是走向兩個極端,要么設備故障了才告警,要么一堆告警而設備完全正常。這兩種極端會導致用戶被動處理各種故障或者對故障提醒麻木。這些都導致運維管理的核心價值沒有體現。因此真正的管理應遵循設備本身的實際運行狀態情況,“貼身”描繪出各個設備各個時間段的性能變化情況,并根據變化情況建立跟蹤曲線,通過跟蹤曲線可以真正建立趨勢管理視角,依據設備運行數據變化情況來做趨勢分析和預測,準確把握設備處于健康狀態、亞健康狀態和“生病”狀態。所以趨勢管理才是用戶真正需要的運維管理。通用平臺向全面開放的專屬平臺轉變雖然大多數用戶建設信息系統時采用的設備、技術都有相似性,但是系統的復雜性、耦合性、環境多樣性都導致每個用戶的運維管理重點與難點是存在較多的差異。這種差異既有實際環境中帶來的各種現實問題,也有不同發展階段不同運維要求帶來的實際問題。這些都要求運維管理系統提供全面、深入的管理能力同時還需要具備開放性,能夠根據用戶自身運維經驗提供“私人專屬”的定制運維策略能力,將用戶歷史的運維經驗,目前的管理重點都通過智能運維策略自動實現,真正實現即兼顧全面的綜合運維管理要求又能充分兼顧用戶個性化運維訴求。綜上所述,以大量KPI庫為核心,以閾值管理來區別設備正常或者故障,以通用標準為訴求點的舊運維管理系統已經越來越難以適應用戶管理要求。具備自動學習功能,可以完整學習各類設備日常運行狀況,根據基線數據自動運維,主動匯報設備異常,可以根據用戶真實管理要求進行定制策略智慧運維管理平臺將成為用戶選擇的主流。智慧運維給用戶的價值落實等級化管理管理上劃分優先級是被普遍認可的方式,優先級劃分能實現管理投入的合理分配,對于運維管理同樣適用,通過對資源按照所在業務重要度區分其對應的管理等級,比如關乎生產系統的資源劃分成一級,內部辦公系統相關資源劃分成二級設備;對于一級設備意味著更為密集的數據采集和更低的閾值,對于異常更為敏感,故障處理上要求更為嚴格,后期的管理數據統計需要單獨列項統計。常規運維軟件中僅僅是對于將管理對象簡單的劃分了不同等級,僅是為了界面上進行統計,沒有落實到具體運維過程中;真正落地的等級化管理必須要做到如下幾點:按照業務劃分管理資源實現對于不同等級資源不同的監控周期和預警閾值對于不同等級資源定義不同預警等級和處置方案對于不同等級資源進行不同角度的統計和報表分析能便捷的調整等級,并應用相應等級的管理規則智慧運維平臺以等級為核心進行管理區分,內置不同等級的管理解決方案,從下到上貫徹等級化,差異化管理模式。預置不同的指標采集方案和策略,落實差異化采集方式,按需采集提供技術基礎,同時為大節點管理提供理論可能;預置不同等級的不同風險閾值的設定,落實差異化管理和考核要求;為高級別設備自動生成統計報表,使用戶能方便的關注報表數據;支持方便的界面等級顯示方式,在不同界面均能方便的區分不同的等級,便于管理視野的日常落地。落實管理經驗積累從本世紀初,企業用戶開始重視IT環境的運維管理,10多年的運維歷程造就了一批運維人員的同時,長期的運維工作也促成企業用戶總結處理其具有自身業務特色的管理方法,這些方法包括大到流程的本地化,小到具體管理指標的定義;如何實現此類管理經驗的落實呢?智慧運維平臺提供處置知識管理,通過對用戶日常故障處置方法的收集,經驗積累,自動反饋到相同故障的處置過程中。通過系統提供的智能策略機制,將用戶對于某些異常分析的人工方式自動化,比如對于主機高負載原因的排查,一般的操作邏輯是確定主機負載超過風險閾值情況是偶發事件還是一直存在,然后分析每一次出現高負載的進程是否一致,通過人工智能找到具體的異常進程,關閉該進程或者卸載相關軟件,同時對于該進程的設定預警,達到事前預警;智慧運維平臺通過策略實現這一系列動作,包括對歷史記錄多點對比,對于進程的記錄,異常進程的智能判斷,乃至告警的建議;通過策略體制調用系統的各項零散功能,將用戶問題分析方式,快速自動化。從數據挖掘實現隱患分析傳統運維領域,更多的關注點在于即時狀態的監控,能對于異常的即時、準確通知;而隨著廠商技術的不斷提高,設備的告警越來越少,特別是一些新建機房,可能一個月也不能沒有幾個告警事件,難道運維就不再重要了嗎?恰恰相反,當設備故障減少后,正好為IT運維創造價值提供了客觀條件,IT運維需要將更多的時間和精力放在挖掘實例數據,發現業務隱患,提高業務運行效率。智慧運維平臺提供了強大的歷史記錄能力,可以實現45萬KPI的指標數據不壓縮存儲1年;同時提供詳盡靈活的數據分析工具,可以實現單設備1年、1季度、1月、1周整體趨勢分析,從歷史層面分析出業務運行規律,方便的發現業務運行異常;多指標相對分析,實現管理對象的縱向比較,找到影響具體的異常指標集。通過對歷史記錄分析,為管理方式改進提供基礎數據,貼合業務指標變化的規律,整合人力資源,實現關鍵時段重點關注的優先級理念;為用戶年度管理數據的統計提供可能,配合北塔快速報表開發能力,使符合用戶管理實踐的事后考核報為可能。智慧運維平臺貫徹時段管理的理念,提供了拓撲上整體的CPU趨勢分析,對近幾周的整體性能均值做比較,便于發現業務的偏離情況;使用歷史記錄作為檢測閾值,實現更為合理的業務使用情況監控;提供整體高低負載分析,實現整體回顧,合理評價。支持持續管理建設智慧運維平臺以平臺化架構設計,可以靈活定制用戶管理需求,實現用戶管理的可持續化建設;智慧運維平臺為用戶多種開發集成方式包含如下幾種技術實現:增加具有用戶獨有設備的管理,通過合作開發,智慧運維平臺可以集成用戶自行開發的采集方式,融入智慧運維平臺中進行統一的管理;整合具有本單位特色的管理指標集,實現下級單位的快速部署,和統一化管理;用戶管理經驗的策略化,實現用戶先進管理分析方式的自動化處理;報表定制,快速導入報表模板,實現客戶報表的快速實現和更新,使用戶報表的變更不再成為運維軟件的痛苦;使用戶的管理意志在軟件中得到持續體現。智能運維的特色功能智能拓撲系統采用北塔先進的、且得到近5000個現場驗證的發現算法,智能發現網絡設備和設備間的真實線路,準確而快速的完成拓撲的構建。網絡拓撲能清晰展現網絡的關系,自動布局;并能提供“圓形”“樹形”多種拓撲展現方式,便于用戶根據業務關系快速調整到用戶需要的展現方式,同時將管理對象的實時性能和告警信息通過圖標的不同狀態展現給用戶。智慧運維平臺拓撲管理不僅是,拓撲結構的展現方式,更是用戶監控的智能幫手;針對于業務承載的主機,系統同樣提供了系統拓撲,不僅提供全局狀態監控界面,同時也講拓撲圖作為全局分析工具,實現對于管理對象增長趨勢的全域分析,包含對全域設備的CPU業務應用情況的分析,整體智能分析業務上一段時間內使用的整體趨勢變化,以紅、黃、綠作為不同區段的顯示,使用戶能清晰辨識歷史增長異常。智能采集采集是運維管理的基礎,只有實現了采集穩定和準確,用戶才能管理,當采集的量和采集的正確性得不到保證,運維只能是理論而已。智慧運維平臺采用北塔自主研發的新一代智能采集平臺DGO,該平臺實現自主采集,自主容錯功能,獨立擴展功能,與設備相關的取值事項均有該平臺完成。均衡采集命令:該平臺通過智能控制,智能分配被管理對象的采集口令,忙閑配合,實現保證數據取值的前提下,對于設備的壓力最小;智能錯誤處置:平臺通過智能判斷,對于被管理對象取值異常進行智能判斷,避免由于網絡突發異常造成的采集出錯誤報和頻繁采集造成的設備壓力;DGO提供豐富的擴展接口,可方便的接入用戶自行開發的采集探針,實現用戶管理對象的便捷增加。智能基線傳統運維關于被管對象“警戒值”,而一旦超過警戒值意味著一定程度的“損失”已經發生,有沒有辦法在提前一點發現風險呢?答案有多種,通過業務基線的偏離判斷異常就是其中一種。智慧運維平臺能根據歷史記錄自動生成基線,并可按照業務變化規律,形成以日基線、周基線的數據對比,一旦實時數據大于基線比對點一定范圍,即生成智維事件,便于分析;當出現多次越界后,系統主動通知用戶,提示運維風險。基線方式的引入,降低了用戶對于“警戒值”的識別難度,使設置符合用戶業務實際的閾值成為簡單、可執行的事情;同時基線的方式,符合用戶周期性業務穩定的實際情況,真正落實用戶對于業務風險檢測。智能策略智慧運維平臺引入策略管理概念,架構上為策略提供各個功能的調用接口,方便的實現軟件各種處理邏輯的協同處置;方便實現用戶對于管理方法的落地。策略的分為觸發、分析、處置三個部分,通過全面的智能運維監控,實現對于各項關鍵節點的智維,包含單點、多點觸發;多單指標歷史記錄分析、多指標對比分析等方式,實現合理結論的分析,以提示、告警通知、自動報表的各項輸出方式給出用戶最終處置建議。系統預置多款智能策略,實現全面檢測、智能判斷、全面分析;包含對所有智維規則的普世策略,越界次數警示;包含對CPU負載過高的深入分析策略,可實現一站式,異常進程的分析識別。智慧運維平臺支持快速策略定制,便于用戶實現個性化管理需求,落實符合管理實踐的自動化分析。項目效益分析自動智慧運維平臺的上線將實現管理和經濟兩方面的效益:實現綠色經濟模式通過實施自動智慧運維平臺將會帶來非常大的收益和回報。我們來算一筆帳,我們在網絡中采用了自動智慧運維平臺后將產生什么樣的收益。自動智慧運維平臺可以實現對所有網絡、主機的安全和運維工作7*24小時不間斷自動監控,代替以往人工檢查的方法。按照200個管理對象預計,每個對象運行情況檢查大約需要10分鐘;全部檢查一遍需要約83.2工時。以每天系統運行情況檢查一遍,每工時/人按15元計算,每年可以節省人力成本約455520元。自動智慧運維平臺上線后,隨著運維管理水平的提高,整個信息系統故障的解決時間會縮短,并且由于管理水平的提高,信息系統非計劃停機時間也會減少,提高業務部門滿意度,提升行業形象,為用戶帶來短期和長期的經濟效益無法估量。自動智慧運維平臺將帶來如下的綠色經濟模式:系統可以減少運行維護人員的日常巡檢工作強度,可以合理安排人員。北塔的性能數據和事件處理辦法預計可以減少大量的運算服務器和存儲設備。系統對信息系統運行和安全隱患進行評估,減小了信息系統故障造成的信息中心系統中斷影響面,按評估結果進行故障排查。北塔軟件公司介紹上海北塔軟件股份有限公司(簡稱北塔軟件)是專業從事IT運維管理產品研發、銷售、咨詢和服務的高新技術軟件企業,致力于為中國用戶提供從網絡管理、IT基礎架構管理到業務服務管理的全面優質解決方案。通過優質的解決方案,北塔軟件不斷拓展各個行業用戶,累計取得全國超過5000家用戶的規模應用。這些規模應用讓北塔軟件的產品不斷改進,始終處于運維行業領先水平。2014年北塔軟件成功登陸國內新三板市場,為公司持續良性發展奠定堅實基礎。北塔軟件也深知服務對用戶的重要性,在全國所有省會城市都建立了專門的服務團隊,由此建立了全國最大的運維管理產品技術服務團隊,真誠為用戶提供更快捷、更周到的服務。管理效益自動智慧運維平臺的上線可帶來如下運維管理效應:透明化管理:通過對信息資源的透明化實現對信息資源的統一監控和智能管理,實現自動化的信息資源監控和管理能力。主動運維:即時的故障告警幫助管理人員即時了解安全和運行隱患,實現真正的事前管理,變被動為主動。全面降低誤操作可能:運維管理和安全手段都從手動的方式轉變為系統自動、安全、可以跟蹤的行為,手動的方式大量減少將極大降低誤操作的可能性,極大增加信息化設施的穩定性。提高效率:系統提供易用易操作的監控、處理、分析一體化關聯分析能力,快速幫助運維管理人員了解問題、分析問題、定位問題、輔助管理人員解決問題,提高處理問題的效率,為信息化的可靠運行保駕護航。綜合分析能力:總體把握資源,提高效益,能及時判斷信息資源各個環節對業務的影響,提高信息設施質量和降低運維管理人員工作強度,最終為提高信息中心的核心價值服務。自主創新北塔立足國內運維管理實際需要,獨立自主研發,堅定不移走自主創新之路,形成了完全符合國內用戶使用體驗的專業IT運維管理產品。產品完整覆蓋網絡、主機、數據庫、中間件、應用、業務、機房、虛擬化、存儲等各個IT設備領域。通過北塔專業的研發團隊,向用戶提供豐富的產品支撐和精細化的指標管理能力,完全滿足用戶對各種IT設備的管理要求。隨著北塔業務的不斷發展,北塔收獲了超過23個產品著作權證書,3個發明專利證書,承擔國家和地方科研項目,這些都是北塔強大的研發實力的體現。大量優質案例北塔軟件深知用戶的需求所在,秉承“為用戶創造價值”的服務宗旨,持續完善和貫徹符合國際標準的項目管理和質量管理體系。多年來,已在政府、電力、銀行、石油石化、教育、傳媒、企業等各行業開展實踐應用,協助用戶提升了IT運維管理水平,并以高品質、高性價比贏得了用戶的廣泛信任。目前,全國已有超過5000家的用戶使用北塔軟件系列IT運維管理產品。參與標準制訂2010年,北塔軟件加入ITSS(國家信息技術服務標準工作組)。作為副組長成員,肩負行業責任感,參與了研究并建立信息技術服務標準體系,制定信息技術服務領域的相關標準等方面工作,并積極投身于規范和引導信息技術服務業的發展歷程中。服務能力公司總部設于上海,現有員工超過300人,在上海、北京、廣州、成都、西安、沈陽設有六大營銷和服務中心,在全國三十幾個主要城市均設有分支機構和常駐人員,為用戶提供高效、快捷的本地化服務和支持。核心競爭力北塔軟件不斷加大研發、技術、服務和人才等方面的投入,強化以”研發、技術、創新“三大實力為主的核心競爭力,緊跟技術的發展與用戶的需求,不斷為廣大用戶提供高性價比的產品與服務,幫助用戶創造價值,持續站在國內同領域的巔峰位置。整體技術方案介紹建設目標建設思路結合國內外信息化管理平臺發展特點,針對信息化現狀和用戶實際需求,XXX局自動智慧運維平臺主要從以下兩個方面進行建設:建設全面的基礎設施管理本次管理平臺需要提供急需的基礎設施管理,這些管理內容包括網絡設備15臺、服務器15臺。在管理設備的基礎上還包括對操作系統管理。后期可擴展對數據庫、中間件管理、存儲、虛擬化、業務等管理,形成一個全面和精細的管理平臺。建設自動智慧運維管理平臺全面基礎管理之上,通過自動學習,跟蹤設備運行狀態,自動建立設備“健康檔案”。依據設備的運行狀態學習,建立全面的數據基線,基于自動運維理念,自動對設備的運行異常進行提醒。異常提醒的同時還同步給出操作建議。整個系統還能做到開放運維,可以將用戶的運維經驗通過智能策略的方式加入到運維管理平臺,更好滿足用戶“私人定制”系統的要求。建設內容具體建設內容如下:系統平臺,包括管理平臺、智能運維引擎和多用戶支持引擎。網絡管理,包括網絡設備管理、網絡拓撲管理、網絡性能管理、配置管理等內容。主機管理,包括服務器管理,操作系統管理,建設系統拓撲圖等內容。告警管理,包括建設設備運行基線、異常提示、處置經驗管理和智能巡檢等內容。方案產品介紹北塔BTSO(BetasoftSmartOperation&Maintenance,北塔智慧運維平臺)作為北塔軟件最新一代的運維管理軟件,秉承北塔多年管理經驗結合平臺化開發方式,在滿足用戶對于基本狀態和性能無人值守及實時展示的基本運維需求的同時,智能抓取關鍵性能數據,根據預置策略進行數據分析和聯動處置;同時提供強大的平臺能力和后臺開發能力,能將用戶個性化的分析方式和處置方式快速實現策略化,以期實現用戶管理效率的最大化提升。方案詳細介紹產品平臺介紹BTSO采用HTML5+JAVA平臺化設計,以DGO(DataGatherOcean)為數據采集平臺,基礎采集平臺構建功能平臺;以告警、報表、智能運維、license構成強大的功能平臺;具體資源的管理作為基于平臺的管理功能,具備以接口為中心的設計模式。系統提供強大的擴展能力,支持管理能力的自由擴展:采集平臺支持用戶個性化采集程序的快速兼容,實現管理指標的快速擴展;采集服務器支持無縫擴展,支持多個采集器同時部署;支持管理策略的快速擴展,實現用戶管理方式落地;支持用戶個性化報表的快速擴展,實現各種具備企業特征報表數據和展現方式。運行摘要對于一款監控軟件來說,其最大的價值是能替代運維人員(值班員)實現不間斷的監控,當系統成為用戶的必備管理工具時,每次進入系統有一個概要性的說明,成為軟件的必要。運維主管每日登陸一次即可綜合性的顯示了24小時內的系統運行變化趨勢,通過列出了運維人員重點關注內容;通過對本界面的閱讀,可快速掌握最近24小時的運維概況,實現運維工作的快速銜接。當前實時運維狀況,需要重點關注當前還處于告警狀態的資源最近需要的停機計劃虛擬化環境目前的整合密度,概要性反映虛擬資源利用的有效性最近24小時運維系統的設置變動,便于用戶了解“未在線”時段的事件重要的資源變動統計重要的監控方式變動統計已恢復的告警信息了解昨日關鍵指標波動最大的5個資源,便于本日重點分析主機CPU波動分析網絡設備CPU波動統計線路流量均值波動統計日常運維在運維過程中,運維系統在后臺進行規律性監測,但是由于業務上的定期整修、環境的變化,管理要求的提高均需要運維管理人員對于系統運維工作進行干預操作,為了更好的實現日常運維的各項管理,BTSO提供日常運維菜單,為用戶提供場景化工作入口,包括對現行監控方式的查看、對智維巡查過程的關注、調整監控計劃,審計運維配置修改過程。運維等級管理等級管理是實現差異化管理的一個具體手段,按照不同等級實現不同的監控方式是等級管理的具體落實;作為等級管理的主要頁面,全局顯示了所有等級的設備數量,以及不同等級的方式,包含智維規則、告警規則;同時設備的管理優先級不是固定不變的,本界面為用戶提供了快速等級切換的統一配置功能。停機檢修管理停機檢修是每個企業中不可避免的運維場景,檢修時段的監控是沒有意義,而且會導致相關誤告警;BTSO將停機作為基本運維場景,用戶可以按照在系統中制定停機計劃,比如網絡設備停機、主機停機,系統自動根據關聯關系對于相關聯的線路和承載軟件自動列入計劃。計劃執行前,系統可以以郵件、短信多種方式通知管理員做好相關保存備份工作。計劃執行時,系統自動屏蔽相關設備與軟件的告警項目;計劃結束后,系統自動啟用告警監控;相關統計中自動將停機內容進行去除,以設備正常進行計算。同時提供了admin賬號補填停機計劃的過程,此項過程為了保障由于臨時性停機過程,而出現的錯誤統計現象。軟件操作審計BTSO用于評價IT環境中的各個管理資源,為了體現公平合理,相關的評價規則的設置需要得到控制,所以提供了軟件操作審計,為管理者能清晰的查閱到對于資源設置變更、監控規則變更、報表規則變更的情況,強大的搜索系統,為用戶定位異常操作提供助力。智能運維引擎運用等級概念實現差異化管理運用等級概念實現差異化管理BTSO精選各類管理對象的關鍵狀態、性能指標,以不同管理等級為數據集,實現一個等級的資源一個管理方案,包含預置智維檢測指標、預置報表、預置策略檢測等;實現資源加入即可監控的簡單運維方式。BTSO也支持用戶根據業務系統的重要性,將管理上相同重要性的不同管理對象設置為同一等級,針對性新設、修訂管理指標監控集合,修訂監控密度、閾值,指定針對性處置策略,在不同等級間實施差異化管理;圖:智維引擎工作示意自主學習基線實現業務異常監控在日常運維管理中,業務管理的復雜性要遠高于設備管理的復雜性,它不是簡單的表現為好壞、通斷,而是更復雜為可用性問題,可用性判斷也是由一批關鍵指標構成的,但指標的正常與否,不能簡單地以固定閾值來對比,要結合真實業務情況的波動來判斷。BTSO提供智能基線監控方式,支持智能基線的自動學習,通過對正常狀態下指標的“歷史表現”,加以調整后作為基準線,與以后同樣時段的實時指標做對比,如果誤差在允許范圍內,那么判定為正常,否則為越界,越界次數越多,會導致系統的可用性嚴重下降,極端情況下導致系統不可正常使用;以此作為業務異常的監控;系統提供日、周兩種基線方式,周基線的形成是以前幾個穩定的周歷史數據為基礎,通過智能算法,將每日相同時間點的多個數據,歸并成一個基準數據,并以此為方式形成周基線。使用基線時,將實時數據和基線相同時間點進行比對,實現周一和周末的區別、上午8點和下午4點的業務區別。智能策略實現管理實例落地BTSO將圍繞運維數據產生且具有固定分析和處理邏輯的運維方法,歸類為智能策略需要處理的方法;通過策略的應用,可以進一步提高運維效率和運行成效。BTSO內置了眾多的智維策略,提供標準的管理實例落地,通過客戶化開發實現用戶處理經驗的快速落地;系統對于所有管理指標均可實現基礎分析方法,當發現異常后,及時了解該異常指標的管理意義和影響范圍,以及歷史情況,這樣將原本專業性過強的指標一下子拉進到可理解可運維的角度;系統對于主機類兩個重要問題“負載過高”“內存泄露”進行了專項分析,針對這兩個問題特征,聯合進程分析,進一步定位造成這兩個問題的具體業務進程,為用戶解決系統問題提供有數據、有結論的原因定位;系統對于數據存儲的核心性能問題“內核延遲”“設備延遲”做了專項分析,另外對于集群、宿主機、虛擬機、數據存儲的24個關鍵性能指標提供自動分析,當發現異常越界比例過高時,系統會主動以專題性分析報告的方式告知用戶,列出歷史分析數據,便于用戶更深入了解問題本質,同時給出了具體解決這個問題的方案,從而使用戶在第一時間能將影響范圍縮到最小;通用指標越界策略,如同上述數據庫指標一樣,通過對于歷史數據的分析回顧,智能分析出指標與歷史基準(具體風險閾值的差異),主動提示用戶異常風險,并同時告知該指標的意義以及異常的處理建議;該策略可覆蓋所有類型的指標,包括主機、網絡、數據庫等,用戶也可通過該策略關注業務相關的特殊指標,以完成策略的本地化應用;圖:異常情況分析與處理建議系統智能運維傳統系統監控的訪問方式為告警,但是面對設備日趨完善,管理對象超過閾值的告警越來越少,如何實現運維價值的最大化呢?這是擺在運維管理主管面前的最大課題。北塔公司結合用戶運維實際情況,發現運維價值最大化的方式有如下方面:通過事前隱患智能分析,主動排除,即時通知,將故障發生概率降到最低;對于部分故障實現自動化分析和處置,縮短故障處置周期,避免損失擴大化;落實每個運維主管的對于自身企業的個性化管理要求;BTSO適時推出了智能運維管理,為用戶落實如上3點訴求,提供管理功能。預置智維管理方案BTSO核心管理方式就是智能化管理,智能化的理論基礎是北塔十幾年的運維經驗和幾千家用戶的管理實踐,為把這些管理方案推送到用戶現場,BTSO提供了智能運維模板。智維模板按照管理等級,預置了不同管理對象的管理方案,方案包含如下技術點:內置監測方案,包含采集指標的多寡,具體指標的采集周期、監測閾值,便于對系統自行巡檢相關數據;提供了預置告警規則給用戶進行選擇,用戶可以根據業務管理實踐的不同啟用相應的告警管理規則;提供常見管理報表,并生成高級別對象的管理報表。通過上述智維模板,使軟件無需復雜配置,安裝就能對資源進行基礎運維。智維事件監控對于預置監控方案,BTSO不僅提供后臺自動檢測過程,也提供了前端巡查功能,使用戶能實時了解到后臺智維的實時動態;對于智維巡查結果,以事件方式存在,此類事件并不完整描述了故障或異常,所以BTSO推薦以統計角度進行評價,以越界比例作為觀測的切入點。同時系統提供詳盡智維分析工具,包含智維信息的統計、智維異常分布、歷史值檢查等,結合此類工具實現異常的關聯分析和確認。智維越界提醒策略BTSO預置多種預置策略,基礎策略是對于內置監控方案的提醒策略,對于智維越界事件,當系統發現內置檢測指標,越界事件超出安全頻率后,主動推送到頁面前端,通知管理員,系統發現了異常。提示內容中包含最近3日,發生異常的次數并且給出該指標的歷史曲線;同時給出該指標的詳細定義,清晰的列明,該指標是什么,異常后影響什么,一般的解決方案是什么。同時可對該指標進行快速設置告警,便于后期管理中,出現了相同問題后能通過短信、郵件通知離線用戶。客戶化分析策略定制BTSO的智能策略基于平臺化接口體系,作為軟件的核心,其可以調用BTSO軟件的各個方面,包含基礎數據的采集,合成指標的計算,各類對象的綜合分析,并可以實現通知、報表、下發等處置策略的調用。北塔軟件基于BTSO,通過合作開發的模式,可以實現用戶管理策略的自動化,使每個用戶能使用上“貼心”的運維軟件。故障管理對管理對象按照預置的風險閾值進行檢測,并實時通知到管理員處,是運維系統必備功能,也是傳統上運維軟件的核心價值所在;而在傳統上故障管理在應用上經常會遇到如下問題:設置告警的范圍選擇,用戶總是期望監控無死角,但是所有KPI的高頻監控必然導致管理設備的異常負載增加,這要求運維廠商能提供合理的告警范圍推薦;告警規則的自動設置,往往用戶對于告警的規則和檢測標準時一致的,如何實現相同標準的推廣,這要求運維軟件對于規則設置的易用性;告警的經驗如何總結和繼承,告警處理經驗能得到及時記錄,并能在下次出現同問題時,即時推送,便于有效提高故障處置效率。BTSO系統提供了靈活的告警設置、精確的告警檢測,多樣告警推送方式、簡單的告警經驗積累方式,實現用戶有效及時得到故障信息。告警管理便捷的規則設置告警永遠是運維中最基礎的功能,對于運維人員而言,總是期望告警不產生,那樣意味著系統正穩定運行;為了給用戶提供這個可靠的信息,BTSO提供便捷的告警設置實現大面積的監管設置;在設置界面為重點指標實現詳盡的指標說明,使用戶面對具體技術指標能更為合理的進行配置。系統提供多種預置告警規則支持以IP為方式,為未納入管理設備規則化的告警規則支持為某一個存在的對象為樣本,批量設置進程、硬盤的子對象的告警支持以IP網段方式和等級方式顯示告警的設置支持以多種通知方式,靈活的通知給不同的人員支持對告警通知內容恢復內容的自定義,滿足用戶對于業務化通知內容的實現高效的告警提醒機制BTSO為了讓用戶能快速識別告警信息,以不同顏色區分不同的告警等級,并在運行摘要和頁面框架中重點突出顯示。用戶每日登陸系統均可了解昨日告警的處理情況,目前發生且需要處理的告警數量,同時可以看到具體告警實時條目。以及本日的停機計劃,為一天的工作提供基礎信息。當長期打開頁面時,系統通過框架上的顏色區別顯示不同的等級告警,使值班人員能快速了解到具體的告警展現。同時系統提供短信、郵件的通知方式,為線下管理員提供最及時的告警信息。清晰的告警查詢為了使告警信息更為有效,系統提供靈活、清晰的告警歷史查詢界面,界面中列出了不僅列舉了歷史告警的各個字段,同時給出告警統計分析信息,為用戶以告警角度對現有對象的信息進行評價。系統提供告警時長、和累計次數為索引條件統計,為用戶提供這個維度出現告警最多的管理對象和具體異常點;提供重復告警統計,以及統計時段內最長、平均、累積的告警時長,為用戶提供告警規則有效性評估提供處置經驗的編輯功能,為用戶快速積累處置經驗提供管理入口,下一次相同問題出現時,提供處置參考;知識庫管理用戶在長期的運維過程中,一般均會有一些管理預案,但是如何實現管理經驗的長期積累呢?BTSO提供處置知識庫,通過對處置預案的積累,出現問題后能快速實現信息傳導,將處置預案真正落實到實際操作過程中。報表與分析監控數據是一般寶貴的財富,不僅僅能實現前期運維成績的考核統計,也可數據分析實現管理方法的改進,BTSO提供強大的報表數據處理能力,可根據用戶要求定制不同的個性化報表;同時提供靈活的數據分析工具,實現對于歷史數據的靈活分析能力;運維管理員可以在分析重大異常問題和階段性分析時進行數據分析。性能趨勢分析性能趨勢分析是基于BTSO強大的數據采集和存儲能力的基礎上,實現的數據分析工具,提供對于最多6個指標的同時對比分析,支持長達1年無壓縮數據的數據分析;實現從天到年的無縫數據擴展查看;對于每一個數據可以壓縮比例,實現數據幅度比較。基礎管理報表系統提供多張預置報表,包括管理上離不開的運行率和告警統計報表、性能統計報表;系統提供日、周、月、季報表統計周期;可對統計周期可以進行設置,可實現對于工作時段和值班時段的報表,并可按照用戶考核時段進行統計。同時用戶可實現不同管理域生成不同的報表,并可將報表授權給不同的人員進行查看。系統巡檢報表當管理對象被納入到BTSO系統后,系統自行啟用符合其管理預案的管理規則,涉及后臺采集,海量存儲、智能分析;系統按照管理要求實現不同頻度的設備數據采集,并且依據自主的業務基線以及業界規范基準值,進行定期巡檢;并將巡檢異常以實時狀態、越界統計、巡檢報表、智能策略方式進行反應;提供了前端巡查功能,使用戶能實時了解到后臺智維的實時動態;BTSO提供智維巡查界面,提供本日已巡查次數和本日越界的總體情況,對系統監控巡查的整體評價;提供巡查進度展示,并顯示以主機IP為主體的單次巡檢情況,了解到本次巡檢的異常,越界次數;點擊可了解到具體越界的具體指標內容;同時TOPN排行給出本日異常的出現最為頻繁的設備,便于用戶對該類設備進行重點維護。智能巡檢對于不符合內置檢測閾值的事件定義為越界事件,由于智維事件的閾值風險系數較低,所以不能從單個事件的產生去判斷這個對象的運維好壞;BTSO推薦以越界事件的出現規律比如一段時間內的越界比例、日越界增長的角度進行數據判斷。同時系統也提供了完善的分析統計系統;包通過等級、時間、指標、IP范圍查詢的越界比例TOPN分析、周越界比率增長TOPN、月越界比率增長TOPN;為了了解實時管理情況,根據不同業務類型整理成一張抽樣數據報表也是必要運維手段,系統提供日、周巡檢報表,可將影響業務健康度的各個關鍵指標,按照固定時間點得巡檢數據判斷、組成一張巡檢報表,系統會定期生成并主動發送運維人員;對于短期內出現越界過多的指標,系統會需要明確及時告知用戶,并且為用戶提供大量的問題處理分析數據和處置建議;當出現越界異常后,系統會提示具體該指標的管理意義和影響范圍,并且業界一般的處理方案;同時給出該指標最近72小時的運行情況,幫助用戶進一步定位分析定位;圖:異常情況分析定位快速報表定制用戶的管理考核要求每年的都會變化,固定的報表機制無法滿足用戶考核報表的要求,BTSO通過先進的報表引擎,可實現快速定制化報表開發;此項內容作為產品服務提供給客戶。報表引擎可以實現各類圖標和展現要求的定制,在界面風格和數據上滿足用戶要求。系統類管理主機管理主機管理以波浪圖方式顯示所有主機的全局信息,以圖形化方式顯示主機的常用管理參數。包含如下信息:詳細的主機基本管理參數單個系統的CPU、內存增長趨勢單個系統的業務流量變化趨勢單個系統存儲空間實時和變化情況同時可對統計范圍內的主機進行詳細的實時分析數據,便于用戶關聯分析出需要重點關注的主機:以實時CPU利用率的主機排行實時內存利用率的主機排行實時連續運行時間的主機排行各個操作系統的存儲空間已使用情況分析,給出使用率最高的20個設備最近30天以CPU為評價指標的高負載和低負載設備列表提供主機一體化顯示,按照不同的操作系統進行數據分類,系統提供基礎信息、運行信息、進程管理、事件與告警、硬件信息等各類管理信息:以關聯方式顯示主機上的承載數據庫、中間件、標準應用的實時狀態圖形化列出重點監控的硬件、日志、CPU性能、磁盤信息的實時信息對于CPU性能、網卡等重要參數的最近3天數據分析支持主機進程的實時展示分析對進程列表支持數據快照分析,支持列表數據定時導出;實現對進程的變化分析主機系統支持對于HP、Dell、IBM三個廠商的硬件狀態監控,支持對于溫度、風扇、磁盤、CPU、內存、電源等重要主機硬件的狀態監控;BTSO智能翻譯硬件各個狀態,將復雜的各個硬件運行狀態,轉化成運維監控的異常正常狀態;便于用戶快捷的設置硬件異常監控告警。設備性能分析對當前網絡設備的CPU和MEM負載進行排名查看,并可進一步查看指定設備的性能負載歷史記錄。可及時了解當前負載較高的網絡設備,在問題苗頭出現的時候,及時進行處置,保障網絡不間斷的平穩運行。數據庫管理數據庫專項管理支持對所有數據庫的統一分析和處理;BTSO支持Oracle(含OracleRAC)、SQLSever、DB2、MYSql、達夢等各版本的數據庫監控;數據庫管理操作系統管理為基礎,實現主機和數據庫協同管理。數據庫增加方式支持手工增加和批量導入模式;支持用戶以模板為基礎修改的資產清單的導入。支持對于管理信息的統計,包含授權點使用情況,各個數據庫狀態分布、各類型數據庫熟練統計、數據庫等級統計。支持對于各個數據庫實時運行狀態的實時統計,包含數據庫會話數、死鎖數實時排行。在數據庫技術層面主要對表空間大小和會話數、緩存信息、鎖信息進行重點監管;系統以圖形化方式顯示了各個關鍵指標,使管理者能快速了解數據庫狀態。同時鑒于數據庫與主機的不可分割性,系統強調關聯分析:主機列出數據的實時告警狀態,所在主機主要性能,主機上目前數據庫相關的進行列表實時情況。依托于所在主機的日志管理,支持對于數據庫應用日志的監控,比如oracle中alert_<instance>.log文件監控,可以獲取對ORA-27072等常見錯誤日志的實時監控。oracle-rac管理Oracle集群(rac)作為常見的oracle部署方式,結構復雜,管理能力要求高;BTSO通過圖形化展示方式,將rac的結構清晰展現給用戶,同時列出重點性能信息,幫助企業用戶能初步定為rac系統的關鍵異常狀態。BTSO支持oracle版本的集群體系,通過與部署主機、承載實例、控制軟件的分層管理實現清晰架構。通過整體方式顯示各個承載系統的性能,通過對各承載系統CPU、內存、物理IO情況的分析,清晰的展現出各個承載系統的負載均衡情況。支持對承載主機、實例、clusterware的一體化信息查看。對于clusterware應用軟件性能做了細致分析,如上圖,BTSO通過對GCS性能、融合寫比例、IO、實例會話四個方面,以對比方式監控不同的實例,從而幫助用戶判斷出節點負載是否均衡;為規劃調整提供對比數據。中間件管理中間件管理對通用定義中間件的管理,包含了應用服務器、消息中間件的的管理,BTSO2.0支持MQ、webologic、websphere的非集群管理;實現用戶對于中間件的基本狀態和承載業務的基本狀態監管。支持對于管理信息的統計,包含授權點使用情況,各個數據庫狀態分布、各類型數據庫熟練統計、數據庫等級統計。MQ管理:對于MQ管理系統中重點關注所在主機性能和通道、隊列信息。同時提供特別關注功能,記錄用戶業務相關的通道和隊列信息。websphere管理線程、事務信息、虛擬機信息,同時顯示實際承載業務的鏈接信息。weblogic管理重點關注中間件自身性能和承載業務鏈接應用的信息。BTSO支持最近24小時數據展現,使用戶更為清晰了解性能變化情況。網絡管理網絡拓撲管理拓撲生成BTSO可以自動根據北塔特有的拓撲生成算法,快速搜索整個網絡內的網絡設備,智能分析網絡拓撲結構,自動勾畫出整個網絡的真實物理拓撲圖,真實反映整個網絡的構成狀況。BTSO除拓撲生成之外,還支持拓撲添加功能,在保留原有拓撲圖的基礎上,搜索新的網絡設備,并自動添加到網絡拓撲圖上。拓撲算法快速、準確。內部采用北塔特有的拓撲算法,并融合了CDP算法、NDP等多種常用算法。確保能夠快速、準確的自動生成物理拓撲圖;支持跨廣域網分布式部署拓撲引擎。可將各引擎的拓撲搜索結果上傳到中心進行匯總,創建出一張完整的拓撲圖,實現統一展現。設備廠商支持廣泛,能夠支持100多廠家的1600多種型號設備,且能支持多廠商的設備組成的“混合”網絡。拓撲圖展現網絡拓撲圖可從全局的角度出發,幫助運維管理人員實時了解整個網絡當前的運行狀況,主動告訴用戶關注點應在哪里,網絡架構是否合理,有無網絡瓶頸,設備和流量有無異常等,動態告訴用戶可能的故障隱患,達到透明化、事前管理目的。個性化拓撲為了同時滿足不同用戶間的個性化需求,BTSO提供了靈活的拓撲圖復制功能,可為不同用戶提供單獨的展現頁面。用戶可以根據自己的偏好設置自己的個性化拓撲圖,且不同的用戶之間沒有任何影響。監控結果展現直觀可以通過紅、黃、綠等不同顏色表示網絡設備和線路負載壓力的評估狀況,并可以調整設備和線路的變色閾值;可以通過不同顏色的告警圖標,顯示各個網絡設備的告警觸發情況;可以為拓撲圖上的每臺設備、每條線路設置中文名稱,添加注釋,方便進行管理。界面美觀提供背景圖的更換設置功能,可自由選擇精美的圖片作為拓撲圖的背景;提供了靈活設備圖標的拖拽功能,可以自由設定圖標的擺放位置;提供設備圖標大小自適應功能,可以根據連接線路的數量自動調整設備圖標大小;提供拓撲圖的放大、縮小功能,可以將拓撲圖調整到合適的展現尺寸;提供大屏展現功能,可以在大屏投影的情況下提供友好的顯示效果;最突出的是網絡拓撲圖中連接線路的線型選擇方案異常豐富,主要包含:直線、直角折線、斜角折線、合并線等多種不同線型,并可在同一張拓撲圖中同時存在多種線型。操作便捷提供鷹眼功能,可以總攬全局,并快速的瀏覽、移動拓撲圖;提供便捷的縮略圖標、拓撲圖創建和維護功能;提供多種常用管理工具:服務端Ping、SNMP測試、Web管理等,可供用戶直接調用;提供快捷的設備實時信息查看功能,可以快速的查看指定設備的MAC表、ARP表、路由表、端口信息表等內容。存儲管理實現狀態問題即時告警,避免管理死角;從容量增長、性能趨勢多角度切入分析,為容量規劃提供數據支持,并結合數據分析實現增長異常、容量使用異常的及時通知統一管理平臺,實現存儲設備和系統使用者的關聯分析;硬件狀態一覽支持存儲設備(磁盤陣列、光纖交換機)的硬件設備狀態、性能管理,實現監控。容量使用分析提供各個存儲使用情況,從整個存儲設備,每個設備的每個磁盤池、到每個設備沒有使用的空閑lun信息進行一覽式查詢;通過這個表格,用戶可以定位到哪個lun可以對外提供服務,如果沒有則可以找到哪個rg可以再行分配空間;高負載設備定位通過歷史數據分析,定位負載最高的TOPn排名。存儲線路管理支持存儲線路的自動構建,實現傳輸線路的的狀態、性能管理;虛擬化管理對于vSphere服務器虛擬化環境,北塔的虛擬化管理主要幫助用戶解決以下六方面問題:如何了解虛擬化對象是否健康如何預防容量枯竭容量是否得到有效使用容量“去哪了”如何發現和解決性能瓶頸虛擬機是否可刪除呈現虛擬化對象健康性虛擬化拓撲圖以顏色變化展現管理對象以及虛擬機與虛擬網絡間的狀態和性能,紅色表示需要特別關注,可能會出現致命的風險;黃色表示需要進行關注,暫時沒有致命風險;綠色表示正常。對于集群、宿主機、數據存儲、虛擬機提供了更全面的信息查看,在虛擬化拓撲中,雙擊這些管理對象圖標,即可查看到一體化詳細信息。如下圖宿主機中能查看到硬件的狀態等信息。預防容量枯竭對于預防容量枯竭,既要能讓用戶了解到當前容量使用情況,同時也需要讓用戶了解到將來容量使用情況,使得當前和將來的容量風險都可控,這樣才能做到真正預防的效果。容量使用:系統根據當前的CPU、內存、數據存儲空間使用情況,預測可部署虛擬機數量,并用黃色或紅色提醒用戶哪些虛擬化環境只能創建少量或不能創建新的虛擬機。容量預防:系統分別呈現CPU、內存、數據存儲當前使用情況,預測可使用時間,預測將來1個月、2個月、3個月以及1年的使用大小。對于可使用時間,系統用黃色或紅色提醒用戶哪些虛擬化環境按照當前使用增長趨勢只能使用較短時間;對于將來1個月、2個月、3個月以及1年的使用大小,用戶可根據顯示的大小,進行投資評估等用途。保障容量有效使用為提高容量有效使用,BTSO虛擬化管理提供了專門“容量回收”功能。并分成四種場景統計可回收的虛擬機以及自動統計可回收的容量大小,這四種場景包括:未運行虛擬機回收、虛擬機快照回收、計劃下線到期回收、空閑虛擬機回收,用戶根據條件點擊“查詢”或直接打開頁面方式可查看到回收信息。明細容量分配在運維報表中,對于容量配置報表,可按照部門、業務系統等方式選擇需要統計的虛擬機。通過生成的報表,可查看到以上所設置“營銷系統”配置的CPU、內存、數據存儲總容量。發現和解決性能瓶頸系統根據使用場景提供了兩種分析功能:對于虛擬機性能問題,用戶很可能會感知到業務系統使用不暢,用戶需要根據時間范圍對虛擬機CPU、內存、虛擬磁盤、網絡的關鍵指標進行專項分析;對于集群、數據存儲、宿主機、虛擬機頻繁發生性能異常,用戶希望能自動檢測并主動告知,BTSO虛擬化管理通過智能運維策略很好地解決了此問題。虛擬機性能分析系統對于虛擬機CPU、內存、虛擬磁盤、網絡四大方面提供了專項分析,虛擬機的性能問題判斷,需要從配置以及關鍵指標兩方面進行綜合衡量,下面以虛擬機CPU性能分析為例進行說明。只需選擇需要分析的虛擬中心、集群或集群外宿主機、起始時間,點擊“開始分析”,則自動呈現分析結果。如下圖是對集群的容量和配置分析結果,指出了虛擬機間預留CPU問題以及解決方法,并通過黃色或紅色標識該集群下虛擬機哪些關鍵指標有異常。點擊“快捷功能—>虛擬機容量預留信息”,可查看到該集群下所有虛擬機的容量預留情況,根據查看到的信息,可對虛擬機預留做出調整。當需要對該集群下某一個虛擬機重點分析時,則選擇該虛擬機,并點擊“開始分析”。通過黃色或紅色顯示該虛擬機哪些關鍵指標有異常,并提供解決方法,同時點擊該虛擬機名稱,可查看到起始時間段內關鍵指標性能曲線圖。智能運維策略系統自帶智能運維功能組件,同時系統預置智能運維規則,通過這些規則可實現關鍵指標的異常檢測、歷史數據記錄,異常發生的信息會被記錄在案,智能策略會主動分析異常的頻度、次數情況,并主動提示用戶哪些關鍵指標異常頻發可能導致運行質量的下降,并給出相關解決方法。系統對于集群、數據存儲、宿主機、虛擬機關鍵指標采用智能運維策略自動檢測、自動分析,主動告知違反策略的管理對象以及提供相關解決方法。目前“指標越界處理”策略對集群、數據存儲、宿主機、虛擬機的24個關鍵性能指標自動監測,對于數據存儲的延遲情況專門提供“vSphere數據存儲內核延遲監測”和“vSphere數據存儲設備延遲監測”兩個策略自動監測。下面以“vSphere數據存儲設備延遲監測”策略加以說明。通過自動檢測與分析,該策略被觸發時,會出現通知頁面,內容包括:告知具體觸發設備延遲偏高的管理對象,以及帶來的危害。查看影響面的方法。性能變化曲線圖。解決此問題的方法。判斷虛擬機可刪除BTSO虛擬化管理提供兩種方式輔助用戶判斷虛擬機是否可刪除:第一種方式:圖形化呈現虛擬機的應用結構。通過虛擬化拓撲—>虛擬機右鍵—>查看應用結構,可直觀查看到該虛擬機運行的操作系統、數據庫、中間件和應用,如果正在運行數據庫、中間件或應用可詢問相關負責人后再進行刪除等操作。圖:虛擬機應用結構第二種方式:查看虛擬機計劃下線時間。通過虛擬化拓撲—>雙擊虛擬機圖標,則打開虛擬機的一體化詳細信息,可查看到該虛擬機的上下線時間,如果超出計劃下線時間,可詢問相關負責人后再進行刪除等操作。專項運維運維主管和值班員偏重于以拓撲圖、運行摘要為代表的全新性概述頁面,而具體負責問題解決分析的運維負責人,需要更深入的了解每個管理對象的信息,而每個管理對象具備不同的管理側重點,需要不同的管理方式,專項管理就是為了專職人員最快的查看和分析對象的管理菜單集。設備性能管理網絡設備的性能管理指的是優化網絡的活動,包括對網絡設備CPU、MEM等負載的監測、制定可接受的網絡性能閾值,與實際的網絡設備性能進行比較,發現偏離和性能異常,突出進行展現。通過網絡性能管理可以及時發現網絡堵塞情況,在問題苗頭出現的時候,及時進行處置,保障網絡不間斷的平穩運行,并可基于事實進行相關的容量規劃和有效地分配網絡資源。主要功能包括:支持對全網的網絡設備CPU、MEM的實時負載進行排名,當負載超過警戒值時,以顯著顏色進行標注,以引起管理員的注意,發現問題隱患。當發現某設備可能存在問題隱患時,還可以支持查看該設備的負載歷史記錄信息。查看該設備是長期處于高負載運行,還是突然出現異常,以協助管理人員判斷問題原因可能所在。線路性能管理在網絡建設完成之后,維護網絡線路,保障網絡傳輸線路的穩定與正常,是日常運維工作中重要的一個環節。BTSO可提供便捷的網絡線路維護管理功能,并可對網絡線路的負載進行細致分析。實現網絡線路流量、丟包率、錯包率等指標的實時監測,及時發現網絡堵塞情況,在問題苗頭出現的時候,及時進行處置,保障網絡不間斷的平穩運行,并可基于事實進行相關的容量規劃和有效地分配網絡資源。主要功能包括:支持對全網的網絡設備線路按照流量、帶寬占用比、丟包率、錯包率、廣播包等指標的實時負載進行排名。當發現某線路可能存在問題隱患時,還可以支持查看該線路的負載歷史記錄信息。查看該線路是長期處于高負載運行,還是突然出現異常,以協助管理人員判斷問題原因可能所在。售后服務服務宗旨上海北塔軟件股份有限公司(以下簡稱北塔軟件)致力于提供給客戶完整的IT運維管理解決方案,其中包括行業領先的產品和專業的合作伙伴。北塔軟件公司在上海、北京、廣州、成都、西安、沈陽設有支持服務中心,并可隨時為全國各主要城市配備支持服務人員。本次維保工作售后服務地址是:____________________________________________________本次維保工作指定工程師:_____________________聯系電話:_________________________本位維保工作質量監督人:____________________聯系電話:_________________________北塔軟件擁有大批資深的專業研發人員、系統技術顧問和網絡管理專家,建立了規模化的產品研發、咨詢、銷售和服務體系,基于先進的項目管理和知識管理模式,為客戶提供優質的產品和技術服務。北塔軟件售后支持服務可以幫助企、事業單位從其技術投資中獲得最大收益。在整個售后支持過程的每一步,北塔軟件都提供了多種服務。不論你需要的是產品相關的咨詢、支持還是其它,你都能從最精通北塔軟件產品的專家那里獲得這些服務。有關北塔軟件售后支持服務的其它信息,請訪問我們的網址:/support/,您也可直接聯系您當地的銷售代表或咨詢客戶服務熱線:400-820-7719服務內容產品升級服務產品升級服務可以使客戶獲得北塔同類產品最新版本和相關技術文檔,還包括訪問北塔軟件內部網站和其它相關服務在內的所有北塔軟件支持服務。產品升級服務可以帶給客戶以下的好處:穩定性:獲取并安裝北塔產品的最新版本有助于消除已知系統隱患,并提高您的IT運維系統的穩定性。最新技術:通過應用北塔產品的最新技術,您能提高現有系統功效和可用性。新特性:在升級期間,北塔軟件發布的產品的全部新特性和功能對客戶來講是立即可用的。投資回報:隨著您在業務規模、技術需求和用戶數量上的發展,您可以更快的提高投資回報率并減少因采購新版本產品的支出。北塔軟件的升級服務為客戶提供:產品版本升級產品缺陷修補、安全警告,以及關鍵補丁升級。主要技術的最新功能模塊發布,包括常規維護更新以及文檔更新。北塔軟件公司為服務期內用戶提供免費版本升級(不免實施費用),并定期面向全體用戶發布最新的產品補丁、安全警告,上述服務將通過Email、網站、論壇等方式對用戶給予及時的告知,并以多種形式發放。更詳細的信息請咨詢技術服務熱線:400-820-7719。標準支持服務服務的內容包括:直接響應客戶提出的關于軟件性能、功能或運行的詢問;直接響應客戶受支持軟件的問題或情況;診斷受支持軟件中出現的問題或發生的情況;解決受支持軟件中出現的問題或發生的情況。具體服務方式:電話支持:提供5*8小時服務響應,并對提供的服務請求在2小時內給出實質性的答復。技術支持電話:400-820-7719。熱線傳真:北塔軟件公司提供熱線傳真服務,用戶和隨時通過熱線傳真與專職技術支持工程師進行溝通,獲得便捷的技術支持服務,并承諾在24小時內給予響應及明確的答復。傳真Email支持:北塔軟件公司提供的技術支持信箱為support@,確保用戶可以隨時通過技術支持信箱與專職技術支持工程師進行溝通,獲得便捷的技術支持服務,并承諾在24小時內給予響應及明確的答復。遠程技術支持:為用戶提供實時的遠程技術支持,只要用戶的網管機能上互連網,用戶打開北塔的遠程協助工具,北塔軟件公司的技術人員就可以在屏幕上與用戶進行面對面的交流,隨時幫助用戶在遠程解決問題。網站自助服務支持:客戶可以隨時訪問北塔軟件的網站,獲得相應的支持服務,如文檔下載、自助注冊,以及補丁下載等。現場巡檢服務服務的內容包括:用戶現場產品運行情況巡檢工作;用戶現場產品管理對象運行分析總結工作;用戶產品使用培訓工作;用戶對產品意見搜集工作。具體服務方式:巡檢頻度:本次面向用戶采購的巡檢服務頻度是季度巡檢,本次服務周期內提供肆次現場巡檢服務。巡檢計劃:完成維保服務合同簽署后,提供巡檢計劃,約定每次現場服務周期;現場巡檢:北塔指定工程師將根據巡檢計劃,通過電話預約方式進行現場巡檢服務。現場巡檢服務的內容包括北塔產品運行情況巡檢、用戶設備運行分析與建議、用戶意見反饋和現場產品培訓。巡檢工作結束后,將出具一式兩份的《巡檢報告》。服務回訪:現場巡檢工作結束后,北塔區域技術經理、省總會根據《巡檢報告》反饋情況進行回訪工作,了解用戶使用情況和意見,核實現場巡檢工作質量。附錄:《季度巡檢報告樣稿》BTSO運維管理系統健康巡檢報告服務介紹巡檢服務是由北塔軟件提供的工程師定期上門服務,北塔工程師按規定的巡檢周期、巡檢內容對北塔運維管理系統進行檢查,以便隨時掌握系統運行情況,發現隱患、排除故障,保障系統健康、穩定運行,對巡檢過程中發現的問題及時處理,掌握用戶使用北塔運維管

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論