IT運維服務整體方案_第1頁
IT運維服務整體方案_第2頁
IT運維服務整體方案_第3頁
IT運維服務整體方案_第4頁
IT運維服務整體方案_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

IT運維服務整體方案本文重要內容:IT運維服務內容IT運維服務流程IT運維服務管理制度規范IT運維應急服務響應方法一、服務內容服務目的運行維護服務涉及,信息系統有關的主機設備、操作系統、數據庫和存儲設備及其它信息系統的運行維護與安全防備服務,確保顧客現有的信息系統的正常運行,減少整體管理成本,提高網絡信息系統的整體服務水平。同時根據日常維護的數據和統計,提供顧客信息系統的整體建設規劃和建議,更加好的為顧客的信息化發展提供有力的保障。顧客信息系統的構成重要可分為兩類:硬件設備和軟件系統。硬件設備涉及網絡設備、安全設備、主機設備、存儲設備等;軟件設備可分為操作系統軟件、典型應用軟件(如:數據庫軟件、中間件軟件等)、業務應用軟件等。通過運行維護服務的有效管理來提高顧客信息系統的服務效率,協調各業務應用系統的內部運作,改善網絡信息系統部門與業務部門的溝通,提高服務質量。結合顧客現有的環境、組織構造、IT資源和管理流程的特點,從流程、人員和技術三方面來規劃顧客的網絡信息系統的構造。將顧客的運行目的、業務需求與IT服務的相協調一致。信息系統服務的目的是,對顧客現有的信息系統基礎資源進行監控和管理,及時掌握網絡信息系統資源現狀和配備信息,反映信息系統資源的可用性狀況和健康狀況,創立一種可知可控的IT環境,從而確保顧客信息系統的各類業務應用系統的可靠、高效、持續、安全運行。服務項目范疇覆蓋的信息系統資源下列方面的核心狀態及參數指標:運行狀態、故障狀況配備信息可用性狀況及健康狀況性能指標統計運維數椐、提供信息系統管理和工作報告、歸納總結并提供顧客想理解的數椐報告信息資產統計服務此項服務為基本服務,包含在運行維護服務中,協助我們對顧客現有的信息資產狀況進行理解,更加好的提供系統的運行維護服務。服務內容涉及:硬件設備型號、數量、版本等信息統計統計軟件產品型號、版本和補丁等信息統計統計網絡構造、網絡路由、網絡IP地址統計統計綜合布線系統構造圖的繪制其它附屬設備的統計統計硬件設備清單統計網絡、安全系統運維服務從網絡的連通性、網絡的性能、網絡的監控管理三個方面實現對網絡系統的運維管理。網絡、安全系統基本服務內容:序號服務模塊內容描述提供方1現場備件安裝配合顧客進行,按備件達成現場時間工程師達成現場2現場軟件升級首先分析軟件升級的必要性和風險,配合顧客進行軟件升級3現場故障診療按服務級別:7×24小時5×8小時4電話遠程技術支持7×24小時5問題管理系統對碰到的問題進行匯總和公布網絡核心交換機巡視典型作業計劃書硬件運行狀態電源運行狀態□正常□異常電扇運行狀態□正常□異常模塊運行狀態□正常□異常系統運行狀態檢查VLAN狀態□正常□異常配備狀態□正常□異常OSPF狀態□正常□異常日志檢查日志狀態□正常□異常其它檢查內容□正常□異常□正常□異常□正常□異常(1)顧客現場技術人員值守根據顧客的需求提供長久的顧客現場技術人員值守服務,確保網絡的實時連通和可用,保障接入交換機、匯聚交換機和核心交換機的正常運轉。現場值守的技術人員每天統計網絡交換機的端口與否能夠正常使用,網絡的轉發和路由與否正常進行,交換機的性能檢測,進行整體網絡性能評定,針對網絡的運用率進行優化并提出網絡擴容和優化的建議。現場值守人員還進行安全設備的日常運行狀態的監控,對多個安全設備的日志檢查,對重點事件進行統計,對安全事件的產生因素進行判斷和解決,及時發現問題,防患于未然。同時能夠對設備的運行數據進行統計,形成報表進行統計分析,便于進行網絡系統的分析和故障的提前預知。具體統計的數據涉及:配備數據性能數據故障數據(2)現場巡檢服務現場巡檢服務是對客戶的設備及網絡進行全方面檢查的服務項目,通過該服務可使客戶獲得設備運行的第一手資料,最大可能地發現存在的隱患,保障設備穩定運行。同時,將有針對性地提出預警及解決建議,使客戶能夠提早防止,最大程度減少運行風險。巡檢涉及的內容以下:編號巡檢內容1硬件運行狀態檢查項目單板狀態檢查電源模塊狀態檢查電扇狀態檢查整機批示燈狀態檢查機框防塵網檢查機房溫度、濕度檢查設備地線檢查2軟件運行狀況檢查項目設備運行狀況檢查網絡報文分析設備對接運行狀況檢查路由運行狀況檢查3網絡整體運行狀況調查網絡運行問題調查網絡變更狀況調查網絡歷史故障調查(3)網絡運行分析與管理服務網絡運行分析與管理服務是指工程師通過對網絡運行狀況、網絡問題進行周期性檢查、分析后,為客戶提出指導性建議的一種綜合性高級服務,其內容涉及:服務內容服務優點向客戶提供網絡專家電話號碼。確保重大問題第一連線至網絡專家。網絡專家組每七天與客戶進行不少于2小時的電話技術交流以最小成本確保及時解答客戶關心的技術問題,并就某一領域技術問題展開深層次溝通。每月向客戶提交CASE匯總分析報告,并可擴展到每年17次(月度、季度、年度)使客戶理解網絡歷史故障狀況以及故障防止建議,最大程度減少網絡故障隱患,更高效的進行網絡管理。(4)重要時刻專人值守服務確保重要時刻設備穩定運行對客戶成功尤為核心,因此,可對客戶提供重要時刻的專人現場值守支持,涉及政府客戶的重大會議期間、金融客戶的年終止算日、運行商客戶的生產網重大割接或其它任何客戶認為可能對其業務運行產生重大影響的時刻。如需專人值守,客戶需最少提前3周與授權服務商客戶服務經理聯系。對每位合約客戶,授權服務商均需按事先合同商定提供專人值守服務。客戶如需超出合同商定范疇的更多值守支持,需額外支付對應人力和差旅費用。主機、存儲系統運維服務主機、存儲系統的運維服務涉及:主機、存儲設備的日常監控,設備的運行狀態監控,故障解決,操作系統維護,補丁升級等內容。主機存儲系統基本服務內容:序號服務模塊內容描述提供方1現場備件安裝配合顧客進行。按備件達成現場時間工程師達成現場2補丁服務消除軟件漏洞給系統帶來的安全隱患,并對安裝補丁所引發的系統連鎖反映進行合理的平衡。3升級服務對系統進行軟件或硬件的升級,以改善、完善現有系統或消除現有系統的漏洞。4現場故障診療按服務級別:7×24小時5×8小時5電話遠程技術支持7×24小時6問題管理系統對碰到的問題進行匯總和公布7系統優化對客戶系統的括主機、存儲設備、操作系統、提供優化服務。現場值守人員可進行監控管理的內容涉及:CPU性能管理;內存使用狀況管理;硬盤運用狀況管理;系統進程管理;主機性能管理;實時監控主機電源、電扇的使用狀況及主機機箱內部溫度;監控主機硬盤運行狀態;監控主機網卡、陣列卡等硬件狀態;監控主機HA運行狀況;主機系統文獻系統管理;監控存儲交換機設備狀態、端口狀態、傳輸速度;監控備份服務進程、備份狀況(起止時間、與否成功、出錯告警);監控統計磁盤陣列、磁帶庫等存儲硬件故障提示和告警,并及時解決故障問題;對存儲的性能(如高速緩存、光纖通道等)進行監控。小型機系統巡檢典型作業計劃書硬件運行狀態電源批示燈▅正常□異常面板批示燈▅正常□異常內置磁帶機▅正常□異常CPU狀態▅正常□異常內存狀態▅正常□異常磁盤狀態▅正常□異常網卡狀態▅正常□異常HBA卡運行狀態▅正常□異常系統檢查系統日志▅正常□異常Mail▅正常□異常文獻系統,涉及磁盤卷剩余空間▅正常□異常硬件檢測▅正常□異常交換分區▅正常□異常固件版本▅正常□異常補丁包版本▅正常□異常系統鏡像▅正常□異常存儲磁盤▅正常□異常存儲驅動▅正常□異常進程狀態▅正常□異常系統性能檢查CPU運用率▅正常□異常內存運用率▅正常□異常磁盤I/O性能▅正常□異常數據庫運行狀態數據庫安裝目錄▅正常□異常數據庫進程狀態▅正常□異常集群檢查集群進程狀態▅正常□異常集群日志▅正常□異常存儲檢查存儲設備故障燈狀態▅正常□異常SAN交換機端口狀態▅正常□異常存儲交換機環境狀態▅正常□異常系統故障報告▅正常□異常數據庫系統運維服務數據庫運行維護服務是涉及主動數據庫性能管理,數據庫的主動性能管理對系統運維非常重要。通過主動式性能管理可理解數據庫的日常運行狀態,識別數據庫的性能問題發生在什么地方,有針對性地進行性能優化。同時,親密注意數據庫系統的變化,主動地防止可能發生的問題。數據庫運行維護服務還涉及快速發現、診療和解決性能問題,在出現問題時,及時找出性能瓶頸,解決數據庫性能問題,維護高效的應用系統。數據庫運行維護服務,重要工作是使用技術手段來達成管理的目的,以系統最后的運行維護為目的,提高顧客的工作效率。具體數據庫運行維護監控的基本服務內容涉及:序號服務模塊內容描述提供方1Oracle數據庫7*24電話支持服務每七天7天,每天24小時支持中心電話,電子郵件答詢,以滿足業務發展的需要。Oracle產品技術專家直接同客戶對話,協助解決客戶提出的疑難問題。根據問題的嚴重程度,將優先解決客戶認為是核心而緊急的任務。對客戶提出的普通性問題進行技術咨詢、指導。定時的客戶管理報告,避免問題再度發生。2Oracle數據庫產品現場服務響應數據庫宕機數據壞塊影響業務不能進行的產品問題軟件產品的更新及維護。3Oracle數據庫產品系統健康檢查對系統的配備及運作框架提出建議,以協助您得到一種更堅強可靠的運作環境減少系統潛在的風險,涉及數據丟失、安全漏洞、系統崩潰、性能減少及資源緊張檢查并分析系統日志及跟蹤文獻,發現并排除數據庫系統錯誤隱患檢查數據庫系統與否需要應用最新的補丁集檢查數據庫空間的使用狀況協助進行數據庫空間的規劃管理檢查數據庫備份的完整性監控數據庫性能確認系統的資源需求明確您系統的能力及局限性優化OracleServer的體現通過改善系統環境的穩定性來減少潛在的系統宕機時間4Oracle數據庫產品性能調優分析顧客的應用類型和顧客行為評價并修改ORACLE數據庫的參數設立評價并調節ORACLE數據庫的數據分布評價應用對硬件和系統的使用狀況,并提出建議運用先進的性能調節工具實施數據庫的性能調節培訓顧客有關性能調節的概念提供顧客完整的性能調節報告和解決辦法中間件運維服務中間件管理是指對BEAWeblogic、MQ等中間件的日常維護管理和監控工作,提高對中間件平臺事件的分析解決能力,確保中間件平臺持續穩定運行。中間件監控指標涉及配備信息管理、故障監控、性能監控。執行線程:監控WebLogic配備執行線程的空閑數量。JVM內存:JVM內存曲線正常,能夠及時的進行內存空間回收。JDBC連接池:連接池的初始容量和最大容量應當設立為相等,并且最少等于執行線程的數量,以避免在運行過程中創立數據庫連接所帶來的性能消耗。檢查WEBLOG日志文獻與否有異常報錯如果有WEBLOG集群配備,需要檢查集群的配備與否正常。二、運維服務流程建議顧客采用的服務方式為兩種:一種為技術人員現場值守,另一種是定時巡檢結合故障現場服務。技術人員現場值守運行維護服務的基本操作流程以下圖所示:定時巡檢結合故障現場運行維護服務的基本操作流程以下圖所示:三、服務管理制度規范服務時間(1)接受服務請求和咨詢:在5*8小時工作時間內設立由專人職守的熱線電話,接聽內部的服務請求,并統計服務臺事件解決成果。(2)在非工作時間設立有專人7*24小時接聽的移動電話熱線,用于解決內部的技術問題以及接聽7*24小時機房監控人員的機房突發狀況報告。(3)服務響應時間:故障級別響應時間故障解決時間I級:屬于緊急問題;其具體現象為:系統崩潰造成業務停止、數據丟失。30分鐘,2小時內提交故障解決方案12小時以內II級:屬于嚴重問題;其具體現象為:出現部分部件失效、系統性能下降但能正常運行,不影響正常業務運作。30分鐘,2小時內提交故障解決方案24小時以內III級:屬于較嚴重問題;其具體現象為:出現系統報錯或警告,但業務系統能繼續運行且性能不受影響。30分鐘,2小時內提交故障解決方案48小時以內IV級:屬于普通問題;其具體現象為:系統技術功效、安裝或配備咨詢,或其它顯然不影響業務的預約服務。30分鐘,2小時內提交故障解決方案5天內技術支持人員在解決故障時,會最大程度保護好數據,做好故障恢復的文檔,力求恢復到故障點前的業務狀態。對于“系統癱瘓,業務系統不能運轉”的故障級別,如果不能于12小時內解決故障,將在16小時內提出應急方案,確保業務系統的運行。故障解決后24小時內,提交故障解決報告。闡明故障種類、故障因素、故障解決中使用的辦法及故障損失等狀況。行為規范(1)恪守顧客的各項規章制度,嚴格按照顧客對應的規章制度辦事。(2)與顧客運行維護體系其它部門和環節協同工作,親密配合,共同開展技術支持工作。(3)出現疑難技術、業務問題和重大緊急狀況時,及時向負責人報告。(4)現場技術支持時要精神飽滿,穿著得體,談吐文明,舉止莊重。接聽電話時要文明禮貌,語言清晰明了,語調和藹。(5)恪守保密原則。對被支持單位的網絡、主機、系統軟件、應用軟件等的密碼、核心參數、業務數據等負有保密責任,不得隨意復制和傳輸。現場服務支持規范運維服務人員要做到耐心、細心、熱心的服務。工作要做到事事有統計、事事有反饋、重大問題及時報告。嚴格恪守工作作息時間,嚴格按照服務工作流程操作。(1)現場支持工程師應著裝整潔、言行禮貌大方,技術專業,操作純熟、嚴謹、規范;現場支持時必須恪守顧客單位的有關規章制度。(2)現場支持工程師在進行現場支持工作時必須在確保數據和系統安全的前提下開展工作。(3)現場支持時出現臨時無法解決的故障或其它新的故障時,應告知顧客并及時上報負責人,尋找其它解決途徑。(4)故障解決后,現場支持工程師要具體統計問題的發生時間、地點、提出人和問題描述,并形成書面文檔,必要時應向顧客介紹故障出現的因素及防止辦法和解決技巧。問題統計規范根據使用人員提出問題的類別,將問題分為咨詢類問題和系統缺點類問題二類:咨詢類問題是指通過服務熱線或現場解疑等方式能夠當場解決顧客提出的問題,含有問題解答直接、快速和實時的特點,該問題到現場支持人員處即可中斷,對于該類問題的統計可使用咨詢類問題統計模版進行統計。系統缺點類問題是指使用人員提出的問題涉及到系統對應環節確實認修改,需要通過逐級提交、診療、確認、解決和回復等環節,解決解決需要項目組的分析確認,問題有解決方案后,將解決方案反饋給顧客。具體提交流程以下:(1)問題提交。應用信息系統的顧客發現屬于系統缺點類的問題時,填寫系統缺點類問題提交單,提交服務支持中心。(2)問題分析。服務中心接到顧客提交的問題單,要組織對應人員對問題單中描述的問題進行分析研判,擬定問題的類型(技術問題、業務問題或者操作問題)。屬于技術問題,提交服務中心技術人員對存在的問題提出具體的解決意見和建議;屬于業務問題,提交服務中心業務人員進行解決;屬于操作問題,可安排有關人員對問題提出人進行解釋,并將系統缺點類問題提交單轉為系統咨詢類問題提交單。(3)問題確認、解決。服務中心的技術人員和業務人員收到系統缺點類問題提交單后,對提交的問題進行歸類匯總和分析、確認。能夠解決的,明確問題解決的具體解決建議和方法,經主管領導簽字同意后,交實施人員進行解決方案的實施。服務人員確認與否解決,并將解決辦法附在系統缺點類問題提交單上反饋給問題提出人員。(4)問題上報。服務人員收到經業務或技術人員確認的系統缺點類問題提交單后,上報服務中心。(5)問題回復。服務中心根據提交問題的進行分析,制訂解決方案并進行實施的解決,同時做好變更統計。將解決方案匯總后及時向問題提交單位或問題交辦單位作出回復,并將分析過程和問題產生因素一并提交。四、應急服務響應方法針對項目制訂了詳盡的設計、應急解決預案,整個流程嚴謹而有序。但是,在服務維護過程中,意外狀況將難以完全避免。下面,我們將對項目實施的突發風險進行具體分析,并且針對各類突發事件,設計了對應的防止與解決方法,同時提供了完整的應急解決流程。應急基本流程維護服務應急解決流程防止方法針對上門服務過程中可能碰到的多個各樣的風險,針對某些可能出現的狀況,制訂了一系列防止解決方法,舉例以下:應用軟件無法啟動軟件可執行文獻上門人員提前準備好各類需維護軟件安裝程序將應用軟件數據文獻備份后,重新安裝軟件打開過程中或運行中異常錯誤關閉上門人員準備好安裝程序,操作系統優化和修補軟件,查殺病毒軟件判斷出錯因素,備份數據,采用有關修復方法操作系統使用者本機操作系統異常或系統資源占用嚴重準備好系統檢查程序及修補程序,以及查殺病毒軟件告知使用者錯誤因素可能類型,提出解決方案,經使用者承認后采用對應方法B/S構造系統,IE瀏覽器異常或無法下載控件準備流氓軟件清理程序、修復瀏覽器軟件、查殺病毒軟件檢查IE瀏覽器選項設立,分析因素進行修復網絡或服務器B/S構造系統網絡流量異常或服務器登錄異常判斷服務器與否異常,否則準備殺毒軟件檢查網絡流量,流量異常小則報修網絡服務商,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論