基于AI(人工智能)智能運維可視化平臺解決方案_第1頁
基于AI(人工智能)智能運維可視化平臺解決方案_第2頁
基于AI(人工智能)智能運維可視化平臺解決方案_第3頁
基于AI(人工智能)智能運維可視化平臺解決方案_第4頁
基于AI(人工智能)智能運維可視化平臺解決方案_第5頁
已閱讀5頁,還剩41頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于AI(人工智能)智能運維可視化平臺解決方案2020基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第1頁。面向不同人員的場景可視化示例基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第2頁。1.從人工到人工智能2.用人工智能點亮您的IT數據3.邁出AIOps的第一步目錄Contents基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第3頁。Part1從人工到人工智能基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第4頁。當前運維和業務團隊面臨的困境不是沒有數據,而是數據太多不是不想分析,而是無從下手基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第5頁。從人工到人工智能挖掘海量數據的業務價值統一大數據分布式處理技術智能算法與機器學習業務系統將要發生什么?主動響應的預防預測性管理降低系統低效對業務的影響多種分散獨立監控工具專業化專家型人才業務系統已經發生了什么?被動響應的故障恢復性管理人工運維AIOps基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第6頁。什么是AIOpsAIOps,即基于人工智能的IT運維(ArtificialIntelligenceforITOperations),是由Gartner定義的IT運維管理新類別。AIOps將服務管理、性能監測、自動化結合在一起,以實現持續洞察和改進的目標,并由大數據和機器學習技術進行支撐。機器學習大數據平臺AIOps商業價值監測(觀察)服務管理(交互)自動化(行動)持續察洞持續洞察持續洞察From

Gartner’s

Report基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第7頁。AIOps的四個核心能力AIOps對海量數據進行存儲通過智能算法在數據提取時和存儲后進行分析從不同的數據源中獲取數據對海量數據進行高效訪問基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第8頁。AIOps的技術棧可視化機器學習算法分析計算大數據數據源事件日志監控工單任務全量,海量,多樣性,復雜性IT數據集中統一管理,歷史數據存儲,實時數據存儲數據建模,模式識別,趨勢識別,故障隔離智能化選擇,異常檢測,異常定位,根因分析算法自我修改演進,新算法創建多維度,個性化,角色化,場景化展示數據清洗,去重,過濾,關聯,生成新數據基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第9頁。AIOps的核心價值故障發現故障規避故障止損故障修復異常檢測異常定位根因分析異常預測基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第10頁。AIOps將在5-10年內成為ITOM的主流技術From

Gartner’s

Report基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第11頁。Part2用人工智能點亮您的IT數據基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第12頁。OneAPM智能運維平臺解決方案服務器數據存儲數據網絡數據應用數據用戶體驗數據流量數據日志數據交易數據任意IT數據OneAPMAIOps大數據實時多維分析機器學習大規模事務處理海量數據實時接入服務分析深度挖掘場景可視化多維指標告警數據建模基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第13頁。OneAPM智能運維平臺的五個能力層次發現接入存儲整合梳理關聯智能分析多維展示從哪里來到哪里去IT數據基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第14頁。全棧IT數據發現與接入篇基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第15頁。全棧IT數據的采集范圍監控對象采集數據IT系統客戶端數據庫虛擬化中間件SaaS傳統架構業務層應用軟件層基礎設施層業務系統云架構硬件設備PaaSIaaS交易業務流程瀏覽器移動APP應用/微服務應用代碼數據庫服務中間件服務網絡流量包日志虛擬化網絡主機機房環境交易量交易金額交易成功率頁面加載時間瀏覽器類型用戶IP頁面加載錯誤率CDN質量應用響應時間應用吞吐量應用錯誤率單個服務響應時間單個服務吞吐量單個服務錯誤率交易錯誤率交易處理時間……APP頁面響應時間APP崩潰率APP網絡請求時間APP

H5頁面性能JVM內存利用率服務器時延SQL語句執行時間連接池數量緩沖區命中率告警……虛擬機數量主機數量CPU利用率內存利用率丟包率平均建鏈時間網絡流量磁盤可用容量電源處理器配置項……業務邏輯IT資產庫CMDB基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第16頁。全棧IT數據的采集方式日志采集模擬撥測SDK/API字節碼探針網絡流量采集基礎監控協議IT數據SNMP、IPMI、WMI、SMI-S、JMX、GlassFish、JDBC、SSH、Telnet等Java、.Net、PHP、Python、Ruby、Node.js、Andriod、iOS等Rsyslog、NXlog、Kafka、SDK、Restful

API等SFLOW、NETFLOW、IPFIX、SPAN、RSPAN、ERSPAN等StatsD、Web

Service、JSON等URL、Host、Port、HTTP、RTSP、RTMP等基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第17頁。IT數據采集方式的選擇采集方式適用場景基礎監控協議IaaS、PaaS層,服務器、網絡、存儲、操作系統、中間件、數據庫、應用進程,物聯網傳感器等網絡及協議可達的IT資源狀態和可用性指標數據采集網絡流量采集提取網絡包中攜帶的網絡性能、用戶體驗、應用性能、交易等數據日志采集收集系統、應用、業務等日志,進行事件、告警、交易等任意可標識信息的采集分析字節碼探針瀏覽器、移動APP用戶體驗數據采集,探針兼容的(Java、.Net、PHP等解釋型語言開發)應用系統的代碼性能數據采集,應用調用鏈路追蹤數據采集模擬撥測通過定時任務模擬用戶訪問和系統調用,主動探測應用服務的可用性指標采集SDK/API可根據數據采集(任意數據、任意格式)需要,在應用開發過程中調用SDK和接口采集數據基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第18頁。與已有ITOM工具的對接JDBC,SNMP

TRAP,Web

Service,……OneAPMAIOps基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第19頁。海量數據處理與存儲篇基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第20頁。海量IT數據處理的挑戰數據規模高并發總量大種類多樣格式各異毫秒級延時秒級處理響應邏輯復雜實效基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第21頁。海量IT數據處理平臺指標、交易、詳情指標、事件歷史大數據服務API網關搜索服務消息服務交易關聯/拼接服務/異常檢測服務等歷史數據處理實時數據處理數據采集器數據采集器數據采集器指標、事件、日志、交易、詳情、流量業務交易、指標、告警、詳情時間序列實時數據服務指標、事件、日志、交易、詳情、流量業務交易、指標、告警、詳情數據接入數據處理數據存儲AgentSNMPECHOIPMISDKFLOWLOG開發運維業務基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第22頁。海量IT數據處理平臺的能力OneAPMAIOps實時數據管理Streamingdatamanagement歷史數據管理Historicaldatamanagement指標數據管理Metricdataingestion

文本數據管理Documenttextingestion

日志數據管理Logdataingestion流量數據管理Wiredataingestion通過NLP(自然語言處理)技術,對人類可讀文檔進行解析從網絡上直接捕獲的數據包,兼容多種網絡協議任何軟硬件設備生成的日志數據,并為訪問分析建立索引對實時數據進行標準化和索引化,以時間尺度實時展示數據吸納海量多樣化歷史數據,并進行索引和持久存儲直接捕獲和使用數值型數據,例如時間序列數據基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第23頁。IT數據梳理與關聯篇基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第24頁。通過數據模型(Data

Module)梳理IT數據CPU利用率%數據庫服務錯誤數數據庫服務請求數數據庫平均響應時間數據庫死鎖率內存空閑率%存儲空閑率%數據庫連接池利用率%數據庫服務健康指數JDBCSNMP數據庫實例操作系統主機應用指標及閾值接口/協議依賴關系/拓撲數據模型Data

Module基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第25頁。開箱即用的數據模型和自定義擴展應用服務器關系型數據庫存儲操作系統Web服務器虛擬化應用性能管理用戶體驗管理開箱即用擴展自定義新增指標及閾值新增接口/協議修改依賴關系/拓撲自定義指標及閾值自定義接口/協議自定義依賴關系/拓撲數據模型Data

Module基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第26頁。深度挖掘多個指標對于服務質量的影響服務分析深度挖掘基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第27頁。如何從IT數據中獲得洞察?人工智能算法與分析篇基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第28頁。結合領域知識的人工智能算法人工智能算法聚類、決策樹、隨機森林、卷積神經網絡運維領域知識異常檢測、多維分析、根因分析、故障預測行業運維經驗金融、運營商、互聯網、政府、大型企業AIOps基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第29頁。OneAPM人工智能算法與分析平臺基礎數據層機器學習算法層RMDB事件指標日志工單作業監控MQNoSQLTSDBHDFSMPPDBARIMA卡爾曼時序數據分解Holt-Winters奇異譜變換(SST)DiDDBSCANPearson關聯分析J-MeasureTwo-sample

testAprioriFP-Growth分類聚類決策樹邏輯回歸DNNCNNLSTM/RNNNLPAIOps算法層指標分布預測指標聚類KPI聯動分析KPI事件關聯日志事件序列提取日志事件模板提取技術能力層數據源異常標記單指標異常檢測多指標異常檢測關聯分析故障拓撲圖故障樹根因分析調用鏈告警壓縮單故障止損灰度版本止損配置優化成本分析容量規劃資源調度發現問題定位問題解決問題其他應用層自適應異常檢測多維異常問題定位故障根因分析異常預測基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第30頁。什么是KPI異常檢測KPI(KeyPerformanceIndicator):用于反映服務的健康程度。如:服務請求數、拒絕數、響應時間、流、訂單等如:服務CPU、內存、絡、磁盤等KPI異常行為:潛在的風險、故障、bugs、攻擊......KPI異常檢測:用于識別KPI時序曲線上的異常行為。及早發現風險,防止其發展為故障及時發現故障,進行止損、診斷和修復運維的重要基礎基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第31頁。OneAPM自適應KPI異常檢測的特點普適性檢測算法動態基帶算法,適用更多不同特點曲線基于遷移算法學習,自動適配場景變化依據反饋,對算法和參數進行優選,減少人工干預對比14種常用檢測算法,準確度排名第一算法自我容錯場景動態適配異常精準檢測基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第32頁。OneAPM自適應KPI異常檢測結果展示某大型互聯網公司的KPI檢測效果基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第33頁。什么是多維分析關鍵指標屬性1屬性2……屬性n交易時間、失敗率、閃退率、銷售額、訂單數、PV、轉化率、用戶數、用戶增速、留存率、投訴率......運營商、省份、城市、移動設備類型、軟件版本號、移動端模塊、瀏覽器版本、無線網絡參數、服務器端模塊、后臺負載、用戶年齡、用戶性別......發現業務“關鍵指標KPI”瓶頸,為正確決策提供依據。例:“響應時間”在什么條件下會慢?基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第34頁。OneAPM多維異常問題分析的特點自動識別瓶頸條件基于決策樹分析,從大量多維度數據中,自動確定影響屬性基于歷史數據的AB測試,在歷史數據中對比實驗組和對照組的性能差別,預測可能的優化方案效果預測優化效果便捷的可視化系統,人員可對過程和結果進行核對,排除可能的干擾數據,重新分析,得到正確結果過程和結果可視化基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第35頁。OneAPM多維異常問題分析結果展示基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第36頁。如何從IT數據中獲得洞察?多維數據場景展示篇基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第37頁。面向場景的多維數據分析和可視化場景化和可視化封裝什么人什么時間什么問題如何處理基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第38頁。面向不同場景的多維儀表盤基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第39頁。面向不同場景的多維指標告警基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第40頁。面向不同人員的場景可視化示例基于AI(人工智能)智能運維可視化平臺解決方案全文共46頁,當前為第41頁。OneAPM智能運維平臺解決方案的特點10億+條事件分析,單服務器處理時間小于10秒快85%數據存儲壓縮比,每秒處理十萬條記錄,僅需一臺4核普通配置虛擬機低多指標聯動分析,針對不同人員的場景可視化展現炫全棧、全量數據采集,覆蓋所有IT數據全無需外部專用數據庫,數據存儲沒有時間限制無TCO,行業中最低總體擁有成本廉10分鐘輔助根因分析,提升排障效率準自研大數據分布式計算框架、機器學習算法智All

IT

Data,One

Anal

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論