某基礎設施維護方案計劃_第1頁
某基礎設施維護方案計劃_第2頁
某基礎設施維護方案計劃_第3頁
某基礎設施維護方案計劃_第4頁
某基礎設施維護方案計劃_第5頁
免費預覽已結束,剩余13頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

/*/*根底設施維護方案一、概述并且可以延長設備的使用壽命。毫的高度敏感性。二、總則為根底設施的連續性和信息安全性,制定有效的運行維護策略來保證效勞交付的質量,兼顧運行維護過程〔準時和標準〕和運行維護結果〔可用和安全,實現“事前防范,風險前移;事中掌握,快速響應;事后改進,持續評估”的持續改進原則。可用性SLA和備份標準,以滿足需方對可用性的要求;進展合理的人員崗位設置和職責定義,保證專人專崗并設置人員備份;配備具有相應力量的人員和必要的工具人員力量具體要求;選擇適用的運行維護技術,以保證效勞的可用性;應的運行維護工具,以保證效勞水平。運行維護工具等級;安全性運行維護效勞中的物理安全、網絡安全、系統安全、應用安全和數據安全。包括:全保密協議等;保效勞人員了解并遵守數據中心安全、保密相關規定;評估,供給相應的安全建議,并對效勞對象進展適當的監控和保護;發生;建立有效的安全通報機制,以準時通報安全大事相關狀況和相應防范處理措施等。準時性實行適當的手段確保供給滿足SLA時間指標要求的運行維護效勞。包括:匹配;的準時響應;建立有效的效勞資源調度機制及與效勞相關方的協同機制,配置必要的備品備件,以供給準時的效勞保障;特別時間段〔如法定節假日或重大大事等持;建立有效機制,周期性對大事級別定義進展更,以確保定義準確有效。標準性包括:建立有效的效勞治理流程文件,以保證效勞過程實施標準性;建立或遵循需方的數據中心相關治理制度,如出入場治理制度、安保掌握制度等;對于例行操作效勞,應制定具體、可操作的技術手冊,以降低操作風險;對于非例行操作效勞〔響應支持、優化改善、調研評估的實施方案,并進展風險評估及分析,實行相應的風險躲避措施和回退手段;務記錄。三、效勞對象與交付說明效勞對象及內容〔具體設備范圍因合同;定期升級配套軟件的版本;幫助選購人制訂安全策略,定期檢查、排解風險,保障設備及網絡環境安全;針對重要設備,實時監控運行狀況,準時覺察故障、排解故障;針對周期性巡檢覺察的安全隱患進展防范和處理;供給配件修理、更換效勞系統重部署及調試:機上架幫助及系統移位幫助。幫助選購人,標準硬件治理維護標準化工作。交付內容效勞交付內容包括調研評估、例行操作、響應支持和優化改善四類,其中:運行環境進展現狀調研、系統分析和評估并提出相應的建議和效勞方案;和常規作業;和進展趨勢等進展記錄、分析和告警;條件和運行狀況進展檢查和趨勢分析,覺察其脆弱性,以便消退或改進;常規作業:對數據中心效勞對象進展的日常維護,包括定期保養、配置備份、數據備份、恢復、定期重啟等活動,以保證效勞對象的穩定運行。應;失,觸發將效勞對象恢復到正常狀態的效勞活動。大事驅動響應的處理過程首先爭取在最短的時間內恢復效勞或啟用備份資源,維持效勞的持續供給,并應對大事做出分析、明確誘發大事的緣由和影響的范圍,實行有效的防控措施,削減類似大事的再次發生。大事驅動響應的觸發條件包括外部大事、系統大事和安全大事三種;的SLA/SOW做出推斷,對效勞的實施進展影響評估,制定具體的實施方案和回退措施,并在條件允許的狀況下執行實施方案和回退方案的測試。變更型響應效勞實施完成后,應進展總結,確認已到達預期的目標。此類響應可能涉及效勞等級變更、效勞范圍變更、技術資源變更、效勞供給方式變更等;由于政府部門發出行政指令或需方提出要求時,應當啟動應急處理程序。優化改善效勞:包括適應性改進、增加性改進和預防性改進三種類型;的改造;據中心的安全性、可用性和牢靠性;風險,滿足將來牢靠運行的需求。四、運行維護交付內容效勞對象效勞對象包括空調系統〔周密空調系統、風系統、電力系統〔供配電系統、UPS系統、發電機系統、安防系統〔防雷接地系統、消防系統、視頻監控系統和門禁系統、網絡系統及設備、PC調研評估根底設施調研評估效勞內容包含但不限于:空調系統〔周密空調系統、風系統關心制冷單元配置建議等;電力系統〔UPS系統、發電機系統房回路調整分析調整建議、機房擴容建議等;發電機負荷分析及調整建議等;UPS運行分析及擴容建議,超過設計使用壽命的電池更換建議、整流直流電容、逆變溝通電容等;安防系統〔防雷接地系統、消防系統、視頻監控系統和門禁系統分析及改進建議、消防系統現狀分析和改進建議〔依據當地消防治理部門治理要求、視頻監控系統的分析和改進建議、門禁系統的分析和改進建議等;綜合布線系統等:光纖、銅纜容量、使用效率分析;應用環境及性能分析;數量、路由改進或擴容建議;級別提升建議等。PUE〔、電力系統優化〔回路優化、使用節能型設備等、實施容量治理〔對機柜的電力容量、制冷容量及空間容量進展統籌治理,以充分利用資源〕等。網絡及網絡設備調研評估〔整體或局部網絡實際負荷與承載力量分析〔整體或局部網絡預期負荷與承載力量分析與建議〔整體或局部〕網絡架構分析與建議〔整體或局部〕網絡路由策略分析與建議〔整體或局部〕網絡安全策略分析與建議〔整體或局部網絡配置調優分析與建議等。分析;效勞器性能分析及調整建議。例行操作根底設施的例行操作效勞包括:監控、預防性檢查、常規作業。監控對根底設施的監控內容參見表1,包括但不限于:效勞對象監控內容空調系統〔周密空環境溫度、環境濕度、出風溫度、回風溫度,告警狀況等效勞對象監控內容空調系統〔周密空環境溫度、環境濕度、出風溫度、回風溫度,告警狀況等調系統、風系統〕電力系統〔供配電 供配電系統:電流、電壓、功率因數、有功功率、無功功率、諧波系統、UPS系統、UPS系統、發等電機系統〕發電機:啟停狀況、電流、電壓、負載率、掌握系統供電狀況等UPS:輸入電流電壓、輸出電流電壓、頻率、負載率、溫度、報警情況、電池充電/放電電壓等電源使用效率:PUE值〔通過監控軟件監測或計算得出〕防雷接地系統:浪涌保護器、避雷器狀態等安防系統〔防雷接消防系統:消防掌握系統狀態、氣體滅火鋼瓶壓力、滅火器有效期地系統、消防系統、檢查視頻監控系統和門視頻監控系統:告警狀況、監控錄像等禁系統〕門禁系統:門禁狀態、告警狀況網絡設備的安康狀況、整體運行狀態、各項硬件資源開銷狀況鏈路安康狀況如端到端時延變化、鏈路端口工作穩定性、鏈路負載百分比、部署路由策略狀況下端到端選路變化、路由條目變化網絡及網絡設備治理權限用戶的行為審計設備軟件配置變動審計設備日志審計安全大事審計效勞器整體運行狀態效勞器電源工作狀態效勞器CPU效勞器效勞器內存工作狀態效勞器硬盤工作狀態效勞器網絡端口工作狀態預防性檢查2,包括但不限于:效勞對象性能檢查內容脆弱性檢查內容效勞對象性能檢查內容脆弱性檢查內容高壓壓力、低壓壓力〔風冷系統,冷凍檢查、室外風機運轉狀況、系統周密空調水壓力、溫度,冷卻水壓力、溫度〔水冷系統,風機運行狀況,灰塵狀況等檢查等風機運行狀況、風速,預處理系統工作風系統狀態,上下水狀況等過濾網檢查、風壓差檢查配電系統接地電阻、零序電流、器件發熱狀況等導線、器件發熱狀況,防浪涌器件狀況等發電機轉速、發熱狀況等油位,吸氣、排煙通道等系統器件發熱狀況、電池狀況〔外觀、非免器件、導線發熱狀況,電池UPS、檢查通風放電時間、通風狀況等狀況〔風扇、入氣口、出氣口〕等防雷接地系統接地電阻測試查啟動瓶、管道開關、氣體壓消防系統鋼瓶壓力、有效期、探頭污染等力等視頻監控系〔不同照度狀況下系統統盤〔磁帶〕容量、云臺運行等角問題等門禁系統與消防系統和視門禁系統效勞器、掌握器、讀卡器、門磁等工作〔如狀態果有此功能警檢查線纜兩端應貼有識別標簽,綜合布線系統 光纖、銅纜鏈路測試,性能測試等 標志要與實際拓撲圖完全全都設備機身、板卡或模塊的工作狀況 是否需要升級系統微碼網絡及網絡設備

CPU內存使用峰值狀況主要端口的利用率

設備鏈路的冗余度要求安全大事周期性整理分析設備生命周期評估鏈路的安康狀態,包括IP鏈路的安康狀態,包括IP包傳輸時延、備件可用性周期性檢查檢查其它的關鍵指標項,例如各類關鍵表項、會話連接數等效勞器資源安排是否超過預定閥值效勞器的資源安排狀況和策略效勞器關鍵部件是否滿足CPU運行冗余度要求內存使用峰值狀況效勞器關鍵部件的微碼版效勞器文件系統空間使用狀況本是否需要升級效勞器關鍵部件鏈路的冗網絡流量狀況等余度要求與存儲的鏈路性能測試效勞器硬盤是否RAID保護效勞器文件空間使用是否到達預定閥值常規作業根底設施的常規作業包括根底類操作、測試類操作和數據類操作,其中:根底類操作:按效勞治理手冊的有關規定,執行設備的日常運行、維護和保養;數據類操作:按事先規定的程序,對根底設施運行日志、記錄等數據進展操作。3,包括但不限于:效勞對象根底類操作測試類操作效勞對象根底類操作測試類操作數據類操作啟停機、清洗更換濾運行日志備份,報空調系 漏水報警測試、周期性主周密空調 網、清洗更換加濕系 警記錄備份、去除統 備切換/應急演練等統、清潔冷凝器等 等效勞對象根底類操作測試類操作數據類操作啟停機、清洗更換濾運行記錄備份〔如風系統網等消防聯動測試果有〕配電系統除塵、合閘、分閘等互投測試等運行記錄備份空載測試、帶載測試、切運行日志備份,報發電機電力系更換三濾、清潔等換演練等警記錄備份、去除統等運行日志備份,報UPS旁路、清潔等周期性主備切換/應急演警記錄備份、去除練等等防雷接地接地端子、匯流排緊運行記錄備份〔如系統固,浪涌、防雷保護接地電阻測試果有〕器復原等報警記錄備份、清消防系統探頭清洗等啟動測試、探頭測試等除安防系器件靈敏度、畫面清楚度出入記錄導出、備視頻監控統系統視頻監控頭清潔,云臺保養〔不同照度狀況下份,監控圖像記錄備份、去除,報警運行等記錄備份、去除等門禁系統與消防系統和視頻監控系統的聯動檢查測運行日志備份,報門禁系統門禁授權等〔假設有此功能警記錄備份、去除測試等綜合布線系統線路跳接等鏈路測試、性能測試布線系統拓撲圖數據更設備操作系統軟件備份及存檔網絡及網絡設備

系統微碼升級設備軟件配置備份及存檔監控系統日志備份及存檔效勞對象效勞對象根底類操作測試類操作數據類操作監控系統日志數據分析與報告生成網絡配置變更文件的審核網絡配置變更的操作網絡配置變更的記錄系統微碼升級配置文件備份效勞器過期日志和文件系統空間清理效勞器硬盤RAID〔如有RAID〕更換掌握器電池〔如有RAID掌握器〕響應支持大事驅動響應響應效勞,包括但不限于:機系統包括故障排查、啟動發電機、油料補充等;UPS系統包括故障排查、旁路系統、關閉非重要輸出等;安防系統:防雷接地系統包括浪涌保護器復原、更換,接地電阻降阻等;消防系統包括故障排查、系統啟動、報警聯動、疏散警示等;視頻監控系統包括故障排查、監控頭或硬盤更換、檢查告警、數據恢復等;門禁系統包括故障排查、手動開啟或關閉門禁系統、檢查告警或監控記錄等;綜合布線系統:線纜更換等。網絡及網絡設備大事驅動響應故障定位;停頓、啟動進程;中斷、連通網絡連接;關閉、啟動端口;網絡備件更換;更改、恢復配置。效勞器大事驅動響應效勞器重啟;更換故障部件,包括主板、電源、CPU、內存、硬盤等;效勞器關鍵部件微碼升級;效勞器硬盤RAID配置修復。效勞懇求響應依據應用系統運行需要或需方空調系統:調整溫度、濕度參數等,調整風量等;電力系統:配電系統包括增減回路、增減供電類型〔110V〕等;分支回路相位調整等;發電機為指定負載供電等;UPS增加錄像機容量等;門禁系統包括增加、刪減、變更門禁權限等;綜合布線系統:鏈路跳接、跳線更換,布線擴容等。網絡及網絡設備效勞懇求響應增加、降低網絡接入的數量或速度;更改網絡設備配置;啟動、關閉端口或效勞;更換、更或升級設備硬件或軟件。效勞器效勞懇求響應效勞器設備搬遷;效勞器設備停機演練;效勞器設備清潔維護等。優化改善適應性改進依據應用系統特點和運行需求,對根底設施進展調整,包括但不限于:空調系統:調整溫濕度參數等、調整機組位置、增減風風量等;方式等;系統的變化;綜合布線系統:調整綜合布線系統,以適應應用系統的變化。網絡及網絡設備適應性改進路由策略調整;設備或鏈路負載調整;安全策略調整;監控對象掩蓋范圍調整;局部交換優化;局部冗余優化。效勞器適應性改進效勞器硬盤RAID配置調整;效勞器網絡、光纖鏈路冗余調整;效勞器電源供電接入冗余調整。增加性改進施進展調整、擴容或升級,包括但不限于:空調系統:增減周密空調機組、增減APU單元,增加風機組、預處理裝置等;ATSUPS增加電池數量等;安防系統:防雷接地系統包括增加冗余引下線、接地裝置,降低接地電阻阻值等;報警聯動、增加終端數量、增加存儲容量等;綜合布線系統:線路擴容、更換高性能布線等。網絡及網絡設備增加性改進硬件容量變化,如網絡設備硬件、軟件升級、帶寬升級等;整體網絡架構變動;網絡架構容量變化,如網絡子系統的增減等;系統功能變化,如增功能區、增安全系統、增審計系統等;路由協議應用及部署調整;整體安全策略收緊;交換優化;冗余優化。效勞器增加性改進為本效勞器從存儲系統上安排更大空間;效勞器CPU效勞器內存容量增加;效勞器磁盤空間擴容;效勞器網卡和HBA接口卡增加等。預防性改進點,有針對性地進展改進性作業,包括但不限于:空調系統:調整機組位置,調整出回風方式等;加高標號油料等;防性改進〔依據當地消防治理部門治理要求防系統和視頻監控系統的聯動;綜合布線系統:弱電線纜與強電線纜的物理隔離,鼠患排查等。網絡及網絡設備增加性改進路由收斂速度、加快二層網絡生成樹收斂速度等;安全優化,例如密碼加密,TELNET掌握等;提高軟件配置命令可讀性。效勞器預防性改進檢查效勞器硬盤RAID配置,準時修復或更換故障硬盤;增加效勞器網卡、光纖卡以及鏈路冗余狀況;增加效勞器電源供電模塊冗余。五、效勞治理制度標準效勞時間接收效勞懇求和詢問:5*8效勞臺大事處理結果。7*24小時接聽的移動熱線,用于解決內部的技術問7*24小時機房監控人員的機房突發狀況匯報。(3)效勞響應時間:故障級別響應時間故障解決時間備注I級:屬于緊急問題;其具表達象為:系統302具體時間因崩潰導致業務停頓、數據喪失。提交故障處理方案12工程而定II屬于嚴峻問題;其具表達象為:消滅具體時間因30224工程而定不影響正常業務運作。提交故障處理方案III級:屬于較嚴峻問題;其具表達象為:302具體時間因消滅系統報錯或警告,但業務系統能連續運提交故障處理方案48工程而定行且性能不受影響。IV屬于一般問題;其具表達象為:系統302具體時間因技術功能、安裝或配置詢問,或其他明顯不提交故障處理方案5工程而定影響業務的預約效勞。到故障點前的業務狀態。對于“系統癱瘓,業務系統不能運轉”的故障級別,假設不能于12小時內解決故障,將在合同小時內提出應急方案,確保業務系統的運行。故障解決后24等狀況。行為標準遵守用戶的各項規章制度,嚴格依據用戶相應的規章制度辦事。工作。消滅疑難技術、業務問題和重大緊急狀況時,準時向負責人報告。文明禮貌,語言清楚明白,語氣和藹。遵守保密原則。對被支持單位的網絡、主機、系統軟件、應用軟件等的密碼、核心參數、業務數據等負有保密責任,不得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論