運維保障服務方案_第1頁
運維保障服務方案_第2頁
運維保障服務方案_第3頁
運維保障服務方案_第4頁
運維保障服務方案_第5頁
已閱讀5頁,還剩49頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

運維保障服務方案XXX科技有限公司2023年XX月XX日

目錄一概述 3二運維管理內容 4三運維服務內容 8四運維管理制度 144.1工作匯報制度 164.2機房巡檢制度 174.3人員管理制度 174.4設備管理制度 184.5人員進出制度 194.6設備進出場制度 204.7安全制度 204.8保密制度 20五應急響應方案 215.1目的 215.2應急小組組織結構 215.3組織機構職責 215.4事件定級 225.5應急預案流程 23六服務保障體系 366.1巡檢管理 396.2安全管理 406.3知識管理 466.4質量管理 466.5服務報告 47七技術支持與售后服務措施 487.1技術服務熱線 487.2現場支持 487.3一站式售后服務 497.4系統巡檢與故障預防服務 497.5突發事件管理與應急處理方案 51概述云計算是基于可配置的計算和應用的共享資源池提供快捷、動態訪問的計算模式。服務具有多種特性:資源充分共享,快速部署和回收資源,按需分配,按使用量和服務級別計費、自助式服務。云平臺具有多方面的優勢,包括:? 真正支持跨平臺、多廠商、異構環境的云平臺;? 對物理資源和虛擬資源提供一致、統一的管理解決方案;? 支持所有物理設備,同時支持多種虛擬基礎架構;? 提供端到端多層次自動化部署技術,最大限度地提高效率與自動化程度;? 實現完整的生命周期控制;? 建設符合ITILv3標準的服務目錄和流程;? 支持精確的資源自動發現;? 從業務角度管理云環境;? 選用經過實踐驗證的成熟產品。云平臺以結構化的方式部署云計算基礎架構,使用已被證明有效的解決方案和技術,涉及云計算的各個環節,確保能夠正確覆蓋云基礎架構的所有關鍵要素,同時也允許服務對象定制其結構以滿足某些業務的特殊需求。平臺整合了高效運維、自動化服務交付模式,并將其與云計算的動態特性相互集成,代表著業界的最佳實踐。運維管理內容政務云平臺運營管理涵蓋的內容主要包括:流程管理、資源管理、自動化和標準化管理,功能描述詳見下表:流程管理用戶自助服務根據用戶的權限,可以提交資源使用申請,并能夠在申請服務器配置和服務時間根據用戶的權限,可以提交修改資源配置申請根據用戶的權限,可以提交資源使用延期申請。根據用戶的權限,可以提交軟件安裝申請。審批管理根據用戶的申請,管理員可以批準或拒絕用戶的申請。資源也可以有預審批屬性,即由系統自動審批,不需要人工干預。郵件通知在自動化操作完畢后,自動給申請人以及相關人員發郵件通知。服務目錄系統支持基于ITILv3的服務目錄,對系統可提供的服務進行標準化管理。可根據用戶角色為用戶列出服務列表,同時提供服務目錄的增、刪、改功能。資源管理生命周期管理對資源的申請、部署、監控、調整和回收的整個生命周期進行全方位的管理資源自動回收預約時間到期后系統會觸發資源自動回收流程資源回收前可通知用戶,用戶可提交延期申請,否則,到期時系統會把資源釋放,返回資源池虛擬化管理標準功能支持各種虛擬化技術,實現對x86PC服務器的虛擬化管理。資源池管理資源池中的資源可支持物理機、虛擬機、存儲、網絡、數據庫、中間件、應用等可自動地標識資源池中的資源的數量、關鍵屬性、可用狀態每次資源在部署或回收之后要動態更新資源池狀態可將CPU、內存、存儲等劃分為資源池,實現資源的集中管理。配置管理具備單一的配置信息數據庫,存放各種配置信息可向資源池中添加資源定義,變更資源所在資源池可定制和篩選查看內容可查看虛擬化資源的配置信息,包括虛擬機CPU、內存、磁盤情況及IP地址等資源分析可按資源池統計資源的使用情況。可按部門統計資源的使用情況。可按項目統計資源的使用情況。可按使用時間統計資源的使用情況。自動化和標準化管理系統介質庫集中存放操作系統安裝介質集中存放操作系統鏡像介質,例如:windows\Linux補丁介質庫集中存放補丁介質(操作系統補丁)軟件介質庫集中存放軟件介質(應用軟件,例如:Oracle、WebSphere、IIS等)腳本庫集中管理腳本操作自動化流程庫集中管理自動化處理流程與流程管理的集成自動化部署過程與流程管理無縫集成。各種流程中設計系統配置或變更的動作將觸發自動化過程自動完成,無需人工干預與配置管理的集成自動化部署過程會自動對配置數據庫進行更新,保證配置信息與物理系統實際狀態一致資源調度系統具有通用的調度引擎,和各種主流的軟硬件有內置的接口,可以根據用戶的申請自動地下達指令給相應的軟硬件資源,實現自動化資源調度虛擬機自動化部署用戶在申請虛擬機的請求被批準后,系統會自動從資源池中分配資源,創建虛擬機自動化部署過程可完成虛擬機創建、存儲劃分、系統鏡像部署、IP地址分配、軟件安裝等一系列步驟提供虛擬機的安裝和基線審核的自動化操作流程的增、刪、改功能提供虛擬機安裝自動化操作流程執行過程中,安裝參數輸入\選擇、臨時性手工操作和安裝信息反饋輸出等功能軟件自動化部署用戶在申請和使用資源時,可以動態的自動化部署軟件。在軟件或補丁安裝的過程中,如果出現問題,系統可以自動回滾到安裝前的狀態。提供軟件的安裝和基線審核的自動化操作流程的增、刪、改功能提供軟件安裝自動化操作流程執行過程中,安裝參數輸入\選擇、臨時性手工操作和安裝信息反饋輸出等功能提供軟件安裝的審核基線(包括:系統,數據庫、應用的配置,關聯信息)虛擬服務器管理用戶可以對虛擬服務器進行備份、恢復、刪除、啟動、停止、重啟等操作。運維服務內容駐場服務支持我公司為云計算大數據平臺提供專業的技術維護人員駐場,對入駐的硬件設備和基礎軟件提供7*24小時服務。基礎設施運維服務平臺基礎設施運維服務是對平臺基礎設施進行監視、日常維護和維修保障。服務涉及的基礎設施包括網絡系統、主機系統、存儲/備份系統、終端系統、安全系統、機房動力及環境等。服務內容主要包括:7*24小時日常維護類服務:我公司駐場技術人員對機房基礎設施進行7*24小時日常維護。包括但不限于以下內容:清理并保持機房衛生環境,保持室內衛生整潔、有序;測量并保持機房溫度、濕度符合設備運行環境要求;定期檢查機房用電負載,檢查UPS負載情況,及時排除用電隱患,保證機房內設備取電用電安全;巡檢機房空調設備運行情況,記錄溫度、濕度等信息,能夠及時聯系廠商對設備進行維護保養;巡檢機房內服務器及存儲設備物理運行狀況,對可見、可穩的設備物理故障第一時間通知用戶并配合用戶及廠商進行后續處理。巡檢機房內網絡設備及其他設備物理運行狀況,對可見、可穩的設備物理故障第一時間通知用戶并配合用戶及廠商進行后續處理;定期對機房內設備進行盤點,對設備硬件信息、運行情況等進行統計整理。監控類服務:我公司駐場工作人員提供7*24小時對政務云平臺及信息平臺網絡進行監控。包括但不限于以下服務:對政務云平臺物理設備及虛擬機運行情況進行監控,第一時間發現物理主機及虛機的告警、宕機等情況并迅速處理;對政務云平臺虛機CPU、內存、磁盤、網絡利用情況進行監控,對發現的資源緊張情況及時反映給用戶,建議用戶擴容獲采取其他方案,避免影響業務處理性能;定期對政務云平臺所有虛機資源利用情況進行整理及統計,研究并發現其中的規律,規避可能出現的資源受限問題,并提出合理規劃建議;對信息平臺網絡設備重要點進出流量進行監控,統計分析網絡帶寬利用率、網絡流量的發展趨勢、異常流量,以此評估網絡資源利用及消耗趨勢,做出合理化建議;對信息平臺網絡性能進行監控,包括對網絡丟包率、延遲、路由進行監控,對網絡性能進行評估,及時進行網絡性能瓶頸進行預警,并提出合理化建議。維修保障類服務:我公司駐場工作人員對機房設備維修提供7*24小時保障。對于我公司負責維保的設備,出現故障后保證第一時間告知用戶,并迅速組織技術人員對故障設備進行檢修,如需進行備件更換的,優先處理。保證對用戶的業務運行影響降到最低。并在維護結束后,向用戶提交詳細維護過程記錄,如有必要,提出合理化建議。對于用戶自行維護或者第三方公司進行維護的設備故障,我駐場工作人員保證全程配合,為用戶及第三方公司技術人員提供必要的方便,例如提供工具、跳線等。直至設備維護結束。如用戶需要,可在維護完成后,提供用戶設備維護記錄。云中心安全管理安全管理服務對信息化環境涉及的網絡、應用系統、終端、內容信息的安全進行管理,包括安全評估、安全保護、安全監控、安全響應及安全預警等服務。定期對云平臺的受管服務器設備及網絡設備進行漏洞掃描、補丁升級等、安全設備防攻擊、防病毒庫進行升級等,整理并撰寫安全報告,記錄發生的安全問題,對發現的安全隱患及時進行修補,對可能的安全問題進行預警,并提出安全規劃建議。網絡安全接入服務網絡接入服務提供網絡規劃和接入,包括互聯網接入服務、內網接入服務等。對于互聯網和內網接入,提供合理規劃,規避地址沖突問題。網絡接入提供安全過濾及建議,保障網絡接入安全可靠,避免網絡攻擊對用戶引用造成影響。內容信息服務內容信息服務對內容信息進行采集、發布、巡檢、統計、編輯、信息挖掘以及匯報,為內容信息的獲取和進一步處理提供支持。綜合管理服務綜合管理服務包括咨詢與培訓服務、技術支持服務、優化服務等。其他增值服務網絡系統性能分析和優化服務我司的技術專家定期現場協助分析網絡系統性能和優化網絡系統的運行。可對政務云中心的物理、網絡環境進行全面、詳細的分析,指出超出政務云中心系統規格的條件,并提出相關建議,以便減少由于物理和環境等因素所導致的停機時間。無推諉服務運維服務在運行過程中出現任何問題而致使系統發生不正常情況時,無論是何方原因,我公司工程師全力協助解決并排查故障,使系統盡快恢復正常政務云中心作為高優先級用戶,享有優先獲得我公司服務的權力。新技術及業務咨詢服務信息技術的發展日新月異,我們的各行業、各領域技術專家會幫助政務云中心決定哪些新的技術會幫助業務系統提高應用的水平。業務咨詢服務幫助政務云中心從業務發展的角度來規劃業務系統,通過聚焦于用戶的業務和基礎架構、管理、結構、以及對運營的管理,向政務云中心提供相關的信息化策略和架構的規劃等咨詢服務。巡檢服務與巡檢報告定期對整體系統進行安全巡檢,包含機房巡檢服務、監控巡檢服務。巡檢頻率小于45分鐘1次,配套設施及各部門應用設備應每月至少巡檢優化1次,并提供調優建議、故障解決等服務,定期巡檢是為了及早發現系統隱患、排除潛在故障以保證用戶方信息系統的正常運行和性能穩定,我金牌維保服務包含定期巡視和檢查服務。針對政務云中心運維服務項目的巡檢服務將包括每月一次的定期巡檢。我們的巡檢工程師會為政務云中心建立完整的巡檢服務檔案,并提供定期的預防性維護服務,從而提高設備的連續可使用率,提高系統的穩定性。巡檢內容包括但不限于以下內容:機房環境檢查、硬件設備情況檢查、軟件運行情況檢查、數據線路狀態檢查、服務器配置管理和日志分析、應用系統狀態分析、系統性能分析和優化建議,網絡安全建議等。巡檢完畢提供巡檢報告,每年度提供年終服務總結報告。巡檢服務檔案的內容主要有:用戶的基本信息技術服務小組人員表及聯系電話用戶的軟硬件配置表及數據通信網絡配置圖預防性維護計劃表各系統的維修歷史記錄表修正性軟件的安裝記錄巡檢工程師針對系統的設備配置情況,與用戶系統管理人員共同研究制定年度的預防性維護服務的內容和時間表,并做到定期到現場對維保設備進行預防性維護,防患于未然。巡檢期間預防性設備維護的主要方法有:檢查系統狀態并做好記錄,包括系統各部分詳細的出錯記錄,可以據此盡早采取措施,排除故障隱患。利用遠程診斷系統,通過ISP網絡,把用戶的系統聯入,實現問題的24小時自動報告與跟蹤等。工程師即可根據結果進行及時檢測和維修。進行設備測試檢查,找出隱患,盡早排除。進行設備的清潔保養。及時向用戶主管人員匯報設備狀態的第一手信息。我們的服務人員定期與政務云中心的主管人員會面,總結以往的服務情況和設備的使用狀況,并給予將來的工作計劃建議。我們所提供的巡檢服務可以提供一定的故障預防保障,除此之外,我們建議政務云中心應當特別注意在系統正常運轉時的異常檢測。常用的預防措施有:建立系統基線、線路備份、主機備份、電源備份、異常事件診斷、日志審閱等。很好的使用這些預防措施可以有效預防發生故障,降低故障損失,我們也將配合用戶做好日常維護管理手冊的制作。運維管理制度1、運維服務體系架構:服務宗旨、“信”字為先;快速響應、高效服務;致力于每個細節都超出用戶的期望;不畏變革,大膽創新,做競爭對手做不到的。2、組織管理模式層確定和規范運維管理體系運行的管理方式和與之相配套的人員崗位職責安排、機構設置,將信息化服務相關的全部活動進行統一決策與規劃,形成集中統一的運維管理機制,實現對用戶的端到端服務。在集中統一的運維管理模式下,按照運維管理任務科學設置或調整組織機構,劃分任務、角色、崗位,合理配置運維管理資源,達到人、工具、流程的有機融合。3、制度規范層分別從管理與操作方面建立運維管理過程中各個參與要素(人、流程、工具)的行為準則與工作程序,從運維管理體系總體運行、流程執行和崗位職責3個層次建立考核評價體系,確定運維費用的組成與計算方式,規范運維費用的來源保障,實現運維管理的量化管理。具體內容包括管理制度的制定、管理流程的設計、評價考核體系的執行、運維費用的管理等。4、技術支撐層建立面向業務用戶的信息化服務請求響應窗口和面向技術支持人員的體系運行管理窗口,建立負責運維管理流程運行的流程管理平臺和負責信息化基礎設施和業務應用系統運行監控的集中監控管理平臺,根據不同類型基礎設施和業務應用系統的管理職能,建立技術管理子系統,建立知識庫、配置庫、報表及日常操作等共享支持子系統和為業務管理提供服務的業務運維管理子系統。5、體系建設內容運維管理體系要真正發揮效益,避免“為技術而技術”,需要融合人、流程、技術。根據信息化的發展要求,配套的管理措施應包括組織模式、管理制度、管理流程、績效考核、運維費用、技術支撐等內容。工作匯報制度為保障運維質量和更有效完成運維工作,駐場運維人員每周總結本周工作內容:機房內是否有設備變化、是否遇到故障處理,是否有遺留問題還沒有處理完成。對發生的重要情況進行討論并制定策略,其次對下步工作進行排序,提出計劃。對本周工作提交書面周報發送給客戶及我相關領導。我駐場運維人員每月末對本月工作進行總結,對本月發生的機房變動、故障處理、重大事件進行匯總,對云服務項目平臺資源利用情況進行分析統計,形成規范報告文檔,然后向客戶及我相關領導進行匯報,并接受領導意見及下個月工作指示,不斷改善工作質量及服務質量。機房巡檢制度每隔1小時對數據中心機房進行一次細致巡檢,檢測機房內設備有無可見可聞的故障告警;7X24小時實時監控數據中心各項指標參數信息,一旦發現異常,迅速處理。巡檢時,保持各機房環境衛生,若發現地板有污漬、水漬、垃圾等物,第一時間進行清理;巡檢時發現問題,及時聯系相關負責人,并登記記錄,匯報客戶領導;實時通過運維監控平臺查看云服務項目平臺服務器是否報警每次機房巡檢時查看云服務項目平臺服務器的硬件狀態是否正常每隔3小時登錄運維平臺查看所有設備是否正常每天查看管理控制臺系統日志是否正常每天查看安全設備日志有無報錯每天查看運維平臺是否有報錯或者警告顯示每天查看運維平臺的權限屬性是否正常每周對網絡設備備份檢查每周查看物理服務器備份檢查運維人員嚴格按照平臺巡檢制度檢查各個項目運維人員嚴格遵守保密協議對于有報警的設備及服務器要立刻通知相關負責人解決。人員管理制度駐數據中心運維人員必須注意個人衛生,儀表、穿著要整齊、談吐文雅、舉止大方。運維人員個人用品要各歸其位,不能隨意亂放。運維人員離開工作工作區域前,應保證工作區域內保存的重要文件、資料、設備、數據處于安全保護狀態。如鎖定工作電腦、并將桌面重要資料和數據妥善保存等等。運維工作人員未經客戶領導批準,禁止將機房相關的鑰匙、密碼等物品和信息外借或透露給其它人員,同時有責任對保安信息保密。對于遺失鑰匙、泄露保安信息的情況要即時上報,并積極主動采取措施保證機房安全。進入機房人員必須注意環境衛生,禁止在機房內吃食物、抽煙、隨地吐痰;對于意外或工作過程中弄污機房地板和其它物品的,必須及時采取措施清理干凈,保持機房無塵潔凈環境。所有機房內的施工,在施工結束后,施工人員要將施工過程中產生的垃圾等清掃干凈、物品擺放整齊。禁止施工人員在無人看管下在機房中使用高溫、熾熱、產生火花的用電設備。不允許任何人在服務器、網絡設備等核心設備上進行與工作范圍無關的任何操作。設備管理制度每周督促檢查電源供電設備。建立完整的設備維修檔案,每周要調閱各類機器記錄進行分析比較,捕捉故障苗頭,及時采取措施。加強現場觀察,捕捉異常現象。從正常運行時的噪聲,設備上指示燈的狀態,以及設備發熱程度等方面捕捉可能故障的預發現象。做好故障情報工作,審定各種可能發生的故障的處理方案。認真作好日常的例行性維護和測試。建立預防性維護的有關制度。例如:機房各類人員的技術崗位責任制度,系統和設備的運行情況記錄制度,系統故障及異常情況的登記報告制度,設備維修過程的記錄及文檔整理、歸檔制度,零備件,易損件的保管及請領、匯報制度等。當設備在運行中發生故障時,必須報告相關領導,認真記錄故障現象,保護故障現場,請維修人員檢查。人員進出制度進入數據中心機房的人員必須登記,入駐數據中心單位人員必須持證進入,其他無證人員進入機房須有入駐單位工作人員持證帶領登記。進入數據中心機房人員必須穿戴鞋套;進入數據中心機房人員必須保持機房環境干凈衛生,不得亂扔雜物。進入數據中心機房人員只允許攜帶必須物品,其他物品放入機房門口儲物柜儲存,進入機房人員不得將食品、飲料以及易燃、易爆物品帶入機房進入數據中心機房在辦理登記手續時領取儲物柜鑰匙,在離開機房辦理手續時將鑰匙歸還。進入數據中心機房人員完成工作后,出機房時需要進行登記,記錄離開時間并歸還借用物品。對違反上述規定者,值班人員有權拒絕其進入機房;對造成損失的,應追究其相關責任。設備進出場制度設備入駐或搬出數據中心機房,必須出示加蓋責任單位公章的證明文件,并出示客戶審核通過的證明文件。設備入場前,應在機房外去除設備包裝,然后將設備搬入機房上架安裝。設備進出場,必須經駐場運維人員登記,記錄相關信息。設備進場或出場后,相關設備安裝人員必須及時清理設備產生的雜物,例如紙箱、泡沫、廢紙等物品,保證機房整潔衛生。安全制度機房內禁止明火作業,如有不得不在機房進行的明火作業,施工單位必須獲得客戶的同意,并出具相關證明。不得擅動各單位托管到數據中心機房的設備,除非獲得責任單位許可;機房內不得擅自私拉電線,嚴禁使用非機房使用的大功率設備;嚴禁擅自移動消防物品排放位置;嚴禁占用消防通道;嚴禁任何人攜帶易燃、易爆物品進入機房;保密制度所有數據中心駐場運維員工需要簽訂保密協議。任何駐場運維人員不得將掌握的客戶設備信息未經客戶許可泄露給其他人知道。駐場運維人員任何時候不得私自打開機房內客戶設備。駐場運維人員任何時候不得私自拷貝、更改、刪除客戶服務器數據。非工作需要,駐場運維人員不得掌握非工作范圍內設備的口令。辦公電腦中若有涉密信息,人員離開時必須鎖定屏幕或者關閉主機,主機必須設置強口令。應急響應方案目的為了確保中心發生突發事件后,運維人員能夠有條不紊的處理應急事件,特制定云計算中心相關應急預案。應急小組組織結構應急響應的組織機構由管理、業務、技術和行政后勤等人員組成,一般可設為:應急領導小組包含:專家團隊、應急日常運行小組、外部機構應急小組。其中應急日常運行小組包括系統工程師、網絡工程師、安全工程師、數據庫工程師、云平臺工程師等。組織機構職責應急響應領導小組是運維應急響應工作的組織領導機構,組長由政府主管部門以及我相關主管負責人擔任,主要職責如下:審核并批準恢復策略;審核并批準應急響應計劃;批準應急響應計劃的執行;應急處理時,協調一切可以協調的資源。應急響應日常運行小組主要職責如下:應急響應的需求分析,確定應急策略和等級;編制應急響應計劃文檔,維護和管理應急響應計劃文檔;組織并參與應急響應計劃的測試、演練和培訓。運維突發事件發生時的損失控制和損害評估;運維事件發生后信息系統和業務功能的恢復;運維事件發生后的外部協作。專家團隊由我針對信息化設施及應用系統機房的平臺、基礎環境、網絡安全等方面的資深技術專家組成,在信息化設施及應用系統機房緊急、重要故障在有效時間內無法得到解決,可由現場人員向應急領導小組領導申請專家支持,如何支持以及其他相關要素由應急領導小組進行協調。關于應急故障具體的處理流程詳見工作流程中的應急故障處理流程。事件定級運維事件可劃分為三級:緊急事件(Ⅲ級)、重要事件(Ⅱ級)和一般事件(Ⅰ級),級別劃分的主要參考要素為:信息系統的重要程度信息系統的重要程度主要考慮信息系統所承載的業務對組織的重要性,以及業務對信息系統的依賴程度,可據此劃分為特別重要信息系統、重要信息系統和一般信息系統。系統損失系統損失是指由于運維事件對信息系統的軟硬件、功能及數據的破壞,導致系統業務中斷,從而給組織造成的損失,其大小主要考慮恢復系統正常運行和消除事件負面影響所需付出的代價。社會影響社會影響是指運維事件對社會所造成影響的范圍和程度,其大小主要考慮國家安全、社會秩序、經濟建設和公眾利益等方面的影響。應急預案流程針對機房可以預見的一些應急故障,輸出如下關于電力、空調、消防以及系統網絡應急流程。應急故障處理流程網絡應急預案網絡中斷時,及時判斷網絡中斷范圍,局部中斷檢查匯聚層設備,全面中斷時,檢查核心交換、路由、安全設備。網絡中斷時,及時通知聯通公司網絡維護工程師,告知其故障范圍和現象,由聯通公司網絡維護工程師進行故障排除。故障解決后,輸出《機房故障報告》以及針對此類故障后期的預防、改進措施。服務器被攻擊預案接到服務器被攻擊的信息后,立即判斷受攻擊服務器的位置和網絡連接走線情況,并采取拔除網線方式切斷攻擊。及時通知入駐單位負責人對服務器進行檢查,保留日志等記錄分析攻擊來源和安全漏洞,找出安全漏洞并采取修補措施,確認服務器狀態安全后恢復網絡連接。故障解決后,輸出《機房故障報告》以及針對此類故障后期的預防、改進措施。電力應急預案機房機房采用雙路市電供電,一般情況下,不會出現全部電力中斷的情況;但仍必須提前做好應急預案應對極端情況,在出現問題時忙而不亂,沉著、有序的執行預定步驟,將風險和影響控制到最低。市電線路例行停電接到停電通知后,上報應急小組并做好應急準備,提前降低機房溫度。密切關注電力恢復情況、機房溫度情況。對停電情況進行記錄,并將過程進行總結匯報機房應急小組。市電線路出現故障將該情況立即報告機房應急小組。短時間停電情況下,增加機房巡檢次數,密切關注供電情況。準備多個物理溫度計,放置于機房各個監測點。如果發現某點溫度過高(一般服務器工作溫度不應超過40°C),立即聯系該點負責的管理員,經應急小組授權后關閉部分設備,關閉設備順序應優先關閉公眾影響小的設備,后關公眾影響大的設備。對于局部溫度過高區域采用大功率工業風扇散熱。故障排除后將故障過程總結匯報機房應急小組。UPS電源故障將電源故障情況報告機房應急小組。并對UPS盡快檢修,解決故障。在故障處理期間,增加巡檢次數,密切關注機房設備狀態。故障排除后將故障過程形成總結匯報機房應急小組。

空調應急預案

機房內某臺空調出現故障,立即進行處理。啟動機房內的備用空調。解決故障并記錄。故障解除后對機房內所有空調做一次檢測,檢查有無隱患。如果機房內所有空調均無法使用,考慮是否市電供電線路故障,應急預案參考《電力故障應急預案》。消防應急預案當消防控制盤有聲音報警時,應及時疏散機房和值班室工作人員。如果火勢較小,在佩戴專業呼吸面罩后使用手提式滅火器滅火,并通知其他人協助滅火。如果火勢較大,在佩戴專業呼吸面罩后操作消防控制盤滅火。火勢撲滅后應檢查機房內有無煙、火情況。火災處理后聯系各入駐單位,及時搶救重要數據;并對事故情況進行總結,分析事故原因形成報告匯報機房應急小組。網絡及系統應急預案應急預案級別預警級別警報內容預警級別介紹一級預警網絡流量升高主機性能降低數據備份出現異常異地備份出現異常工作站出現病毒監控軟件出現故障一級預警表示系統出現故障,但不影響運維系統的正常運行二級預警網絡中斷或網絡設備異常主機、存儲和帶庫出現故障數據庫相關故障黑客入侵或病毒大面積發作二級預警表示系統出現故障,影響運維系統的正常運轉,但運維工程師可以在短時間內進行故障排除三級預警網絡防火墻宕機無法正常使用。主機、存儲、帶庫宕機并無法啟動數據庫或數據倉庫無法正常使用收到不可抗力或自然災害的破壞三級預警表示系統出現故障,影響運維系統的正常運轉,運維工程師不能在短時間內進行故障排除或無法排除。應急預案處理流程運維過程中出現重要故障或緊急情況時,按一下規定流程進行處理及匯報。在遇到故障時,及時匯報上級領導并采取措施及時解決,具體匯報流程如下:一級預警處理運維過程中,如果遇到已經預警,按一下流程進行處理:當通過監控或得知系統出現故障時,首先在最短的時間查看故障點狀態,并分析故障原因。運維工程師在排查出故障后,立即著手解決。在故障排除后,對所發生故障的設備進行事后跟蹤。在故障排除后,運維工程師應對故障原因及解決辦法進行詳細說明并總結上報機房應急小組。二級預警處理當通過監控或得知系統出現故障時,首先在最短的時間內查看故障點狀態,并分析故障原因。立即報告給運營經理,運營經理應通過電話或當面把故障報告相關部門領導。運維工程師在排查故障后,如能夠立即解決,則立刻解決故障,如需要設備廠商的技術人員到現場,應立即聯系技術廠商的技術工程師,請求立刻到現場進行故障排除。在故障排除后,運維工程師應對故障原因及解決辦法進行詳細說明并總結上報機房應急小組。三級預警處理當通過監控或得知系統出現故障時,首先在最短時間查看故障點狀態,并分析故障原因。立刻報告給運營經理,運營經理應通過電話或當面把故障報告給相關領導部門.運維工程師在排查出故障后,如能立刻解決,在立刻解決故障。如需要設備廠商的技術人員到現場,應立刻聯系技術廠商工程師請求立刻到現場進行故障排除。如果因硬件設備出現故障而無法修復,需要更換時,應報運維中心主管人員,主管人員辦理硬件更換事宜。在故障排除后,運維工程師應對故障原因及解決辦法進行詳細說明并總結上報機房應急小組。服務保障體系(一)服務臺故障申告和技術支持工作流程1、工作流程1) 一線客服工程師或值班工程師接到用戶來電,記錄來電人信息和故障描述;2) 一線客服工程師核實來電人的客戶信息,初步判斷故障范圍和原因;3) 一線客服工程師生成故障記錄,處理和解決一般的問題和故障;4) 如一線客服工程師無法解決故障,生成工單并在流程管理系統中轉交二線技術支持工程師處理;5) 二線技術工程師處理完畢后,填寫工單并將處理結果和工單反饋至一線客服,一線客服回訪用戶處理情況,根據回訪結果關閉工作流程。如回訪后用戶問題未得到解決,則重新生成新的工單,工作流程繼續;6) 7*24小時值班工程師發現監控報警后,可以電話通知一線客服工程師2、流程圖服務臺-故障處理流程3、記錄故障解決報告(二)服務臺業務咨詢及變更工作流程1、工作流程一線客服工程師記錄用戶變更需求,核實用戶身份;一線客服工程師負責對變更業務或咨詢業務進行相應的解釋工作;一線客服工程師判斷變更需求,將不涉及到收費的變更請求生成工單,轉交二線技術支持工程師處理變更,二線工程師完成變更后將變更結果反饋至一線客服,一線客服通知用戶變更結果,待用戶確定無誤后關閉流程并更新用戶信息;一線客服工程師判斷變更需求,將涉及收費的變更通知客戶產品經理,產品經理確認商務問題后發起派工單;二線工程師完成變更后通知一線客服和產品經理,一線客服通知用戶變更結果,待用戶確定無誤后關閉流程并更新用戶信息,告知產品經理。2、工作流程圖服務臺-咨詢及變更流程3、記錄服務派工單、客戶檔案信息巡檢管理1) 機房實行巡檢制度,定期對機房進行常規物理巡檢,檢查服務器及網絡設備運行狀態和機房環境狀況。2) 巡檢時間,巡檢頻率小于45分鐘1次,配套設施及各部門應用設備應每月至少巡檢優化1次,并提供調優建議、故障解決等服務。3) 巡檢內容包括但不限于網絡設備、服務器硬件設備的工作狀態;機房環境溫度、濕度等。4) 巡檢過程:a) 應檢查監控室內網絡監控、機房環境監控等屏幕上是否有報警,檢查消防設施是否正常;b) 應檢查機柜門是否鎖閉、檢查機房內是否有異響異味、清潔及布線;c) 應檢查機房內服務器及網絡設備電源指示燈、運行狀態指示燈是否正常,有無異常警告;d) 應檢查空調機房、通信機房、電池室、鋼瓶間;e) 應檢查機房監控系統及其記錄是否正常;5) 如果遇到異常情況需及時上報,服務器、網絡設備等異常盡快通知設備責任人;6) 下班前應檢查門、窗、燈是否關閉,機房、機柜等是否鎖好;7) 巡檢后應及時填寫日常巡檢記錄。安全管理云平臺硬件安全使用制度機房人員必須熟知機房內設備的基本安全操作和規則。應指定機房人員,對機房的出入、服務器的開機或關機、維護等工作進行管理;應定期檢查、整理硬件物理連接線路,定期檢查硬件運作狀態(如設備指示燈、儀表),從而及時了解硬件運作狀態。禁止隨意搬動設備、隨意在設備上進行安裝、拆卸硬件、或隨意更改設備連線、禁止隨意進行硬件復位。禁止在正式運行的系統上進行試驗性質的配置操作,需要對系統進行配置,應在其它可進行試驗的機器上調試通過并確認可行后,才能對系統進行準確的配置。對會影響到全局的硬件設備的更改、調試等操作應預先發布通知,并且應有充分的時間、方案、人員準備,才能進行硬件設備的更改。對重大設備配置的更改,必須首先形成方案文件,經過討論確認可行后,由具備資格的技術人員進行更改和調整,并應做好詳細的更改和操作記錄。對設備的更改、升級、配置等操作之前,應對更改、升級、配置所帶來的負面后果做好充分的準備,必要時需要先準備好后備配件和應急措施。不允許任何人在服務器、網絡設備等核心設備上進行與工作范圍無關的任何操作。未經機房管理人員允許,更不允許他人操作機房內部的設備,對于核心服務器和網絡設備的調整配置,更需要小組人員的共同同意后才能進行。云平臺軟件安全使用制度1) 必須定期檢查軟件的運行狀況,進行數據和軟件日志備份。2) 禁止在正式運行的服務器上進行試驗性質的軟件調試,禁止在服務器隨意安裝軟件。需要對服務器進行配置,必須在其它可進行試驗的機器上調試通過并確認可行后,才能對服務器進行準確的配置。3) 對會影響到全局的軟件更改、調試等操作應先發布通知,并且應有充分的時間、方案、人員準備,才能進行軟件配置的更改。4) 對重大軟件配置的更改,應先形成方案文件,經過討論確認可行后,由具備資格的技術人員進行更改,并應做好詳細的更改和操作記錄。對軟件的更改、升級、配置等操作之前,應對更改、升級、配置所帶來的負面后果做好充分的準備,必要時需要先備份原有軟件系統和落實好應急措施。5) 不允許任何人員在服務器等核心設備上進行與工作范圍無關的軟件調試和操作。未經機房管理人員允許,不允許帶領、指示他人進入機房、對網絡及軟件環境進行更改和操作。云平臺資料安全制度資料、文檔、數據等必須有效組織、整理和歸檔備案。工作人員不得在辦公區接待來訪人員。禁止任何人員將機房內的資料、文檔、數據、配置參數等信息擅自以任何形式提供給其它無關人員或向外隨意傳播。對于牽涉到網絡安全、數據安全的重要信息、密碼、資料、文檔等等必須妥善存放并做好備份。工作人員離開座位應確保終端計算機退出登錄狀態和桌面上沒有包含敏感信息的紙檔文件。機房內重要文件及打印有企業數據的紙張銷毀,應使用碎紙機粉碎處理,不得隨意丟棄;載有各種數據的計算機存儲介質(磁盤、光盤、U盤)要專用專管,嚴禁隨意放置。存儲介質應確保放置安全、可靠的位置,并指定專人管理,存儲介質中數據應保證同時存在多個數據備份。并根據特殊需要,實行異地存儲,存儲地的環境要求和管理方法應與本地相同。存儲介質在物理傳輸過程中,應指定專門人員進行介質包裝,并對介質出入做出詳細記錄。存儲介質的歸檔和查詢等應進行登記記錄;存儲介質專職人員應定期根據存檔介質的目錄清單進行盤點;重要介質中的數據和軟件應采取加密存儲,并根據所承載數據和軟件的重要程度對介質進行分類和標識管理。存儲介質若需帶出工作場所,應首先對存儲介質進行內容加密,并進行存儲介質若需送出送出維修或銷毀,首先要確保已經清除介質中的敏感數據存儲介質在銷毀前確保數據已經安全可靠的備份完畢。存儲介質在確認存在無法修復的物理損壞后,應及時進行物理銷毀。對保密性較高的存儲介質須進行銷毀審批,未經批準不得自行銷毀;工作人員調離辦公室應立即交還該辦公室鑰匙。云平臺資產保護制度應編制并保存與信息系統相關的資產清單,包括資產責任部門、重要程度和所處位置等內容,規定信息系統資產管理的責任人員或責任部門,并規范資產管理和使用的行為;應根據資產的重要程度對資產進行標識管理,根據資產的價值區分責任人員和責任部門;應對資產信息分類與標識方法作出規定,并對信息的使用、傳輸和存儲等進行規范化管理。機房工作人員應有義務安全和小心使用機房的任何設備、儀器等物品,在使用完畢后,應將物品歸還并存放于原處,不應隨意擺放。對于使用過程中損壞、遺失的物品應匯報登記,并對責任人追究相關責任。未經機房管理人員同意,不允許向他人外借或提供機房設備和物品。云平臺保安制度1) 出入機房應注意鎖好門窗。對于有客人進出機房,機房相關的工作人員應負責該客人的安全防范工作。最后離開機房的人員必須自覺檢查和關閉所有機房門窗、鎖定防盜裝置。應主動拒絕陌生人進出機房。2) 工作人員離開工作區域前,應保證工作區域內保存的重要文件、資料、設備、數據處于安全保護狀態。如鎖定工作電腦、并將桌面重要資料和數據妥善保存等等。3) 外來人員出入應登記。4) 外來人員進入必須有相關的工作人員負責其行為安全。5) 未經機房管理人員批準,禁止將機房相關的鑰匙、密碼等物品和信息外借或透露給其它人員,同時有責任對保安信息保密。對于遺失鑰匙、泄露保安信息的情況要即時上報,并積極主動采取措施保證機房安全。6) 機房人員對機房保安制度上的漏洞和不完善的地方有責任及時提出改善建議。7) 禁止帶領與機房工作無關的人員進出機房。8) 不允許與機房工作無關的人員直接或間接操縱機房任何設備。9) 出現機房盜竊、破門、火警、水浸、110報警等嚴重事件時,機房工作人員有義務以最快的速度到達現場,協助處理相關的事件。云平臺安全保密制度1) 遵守國家、省、市相關法律法規,嚴格執行國家計算機信息網絡安全保密規定。2) 機房維護和管理人員應熟悉并嚴格執行安全保密規定。3) 工作人員須簽署保密協議,遵守保密條款,履行保密義務。4) 工作人員未經授權不得打開機房內用戶設備,不得拷貝、更改、刪除用戶服務器數據,不得將用戶信息泄露給其他單位或個人。5) 外來人員和非本職工作人員,未經批準不得進入機房,不得上機操作,確保機房的安全保密。6) 不得泄漏云計算中心的機密信息,數據以及文件等。7) 未經授權,任何人不得接觸和使用云計算中心或其他用戶的設備。8) 核心業務資料等均屬保密,不得任意抄錄、復制及帶出機房,也不得轉于工作無關人員9) 核心業務系統的各級帳號、密碼要定期修改,并以某種介質形式密封保存于安全可靠處10) 個人計算機密碼要定期修改,長度至少為8位,必須字母、數字及其他符合混用11) 對離開本崗位的人員,應及時禁用其全部相關帳號12) 如果系統管理員變更,要及時修改超級用戶密碼13) 系統管理員應定期檢查系統帳號的變更情況14) 未經許可,任何人員不得擅自翻看、抄錄、復制、下載各類機密資料及圖紙、設計文件、技術檔案、內部資料、技術文檔等(包括電子文檔),嚴禁將上述資料帶出云計算中心。知識管理為保證知識管理的正常運作,特別是在前期需要達到所有管理員工能把日常性的知識文檔統一在知識管理平臺中進行管理的這樣一個目標,提高知識管理和工作運作效率,為云計算中心知識的沉淀、共享、應用、創新的動態循環。通過制度,可以達到為云計算中心在知識管理的過程中,形成知識的積累、知識的共享、知識的利用、知識的創新一個循環的知識管理狀態,并逐步形成一個知識共享文化的環境;同時對與知識管理密切相關的自我學習意識的建立、及培訓工作中的內部自我培訓的建議、以及日常會議中的記錄形成等方面。并以可行的激勵方式使全體員工逐步形成內部知識共享文化氛圍的形成,從而提高內部信息交流的效率和質量。通過本制度的執行能使云計算中心在以后的知識管理推進實施階段逐步加深。質量管理為保障云計算中心安全穩定運行和規范服務,保障服務質量水平,降低服務質量風險,使質量管理系統化、規范化,特制定本制度。服務報告本文檔適用于云計算中心運維管理中心的內部IT服務管理報告,以及向客戶提交的相關報告。角色職責工作任務服務報告經理管理IT服務管理體系的所有報告,為內部管理與外部監督提供決策和參考的依據。匯總和分析IT服務管理體系的所有報告,為服務級別管理流程提供參考;若報告出現重大異常情況,提前服務管理體系負責人審批。客戶/內部管理層閱覽報告;審批報告中出現的重大異常情況。評價IT服務管理活動;審批報告中出現的重大異常情況。技術支持與售后服務措施為了讓用戶獲得我公司提供的優質服務,解決系統運行中出現的問題。我公司將在保修期內向用戶提供旨在提高用戶的系統可用性的持續支持服務。通過技術支持與服務,我公司希望以預防的手段,避免系統故障發生,且將故障率降到最低,以減少不必要的損失;通過保證用戶系統高度的可用率,保護用戶的利益。我公司提供服務,技術支持和售后服務的程序、內容及措施等情況如下:技術服務熱線我公司將為用戶提供7×24小時的400熱線電話(中文),如果用戶在設備使用中遇到問題,無論是軟件、硬件,都可以通過熱線電話得到支持與幫助。請用戶仔細記錄故障現象,然后通過服務熱線與我公司聯系,我公司的技術服務專家在盡可能短的時間內協助和指導用戶制定解決問題的方案,及時提出解決問題的建議和操作方法,然后由用戶反饋給我公司解決方案是否有效,我公司會依據反饋信息決定進一步的支持措施。現場支持在接到用戶設備故障通知后,在通過電話不能解決

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論