2024基于冷板式液冷的智能監控技術報告-76正式版_第1頁
2024基于冷板式液冷的智能監控技術報告-76正式版_第2頁
2024基于冷板式液冷的智能監控技術報告-76正式版_第3頁
2024基于冷板式液冷的智能監控技術報告-76正式版_第4頁
2024基于冷板式液冷的智能監控技術報告-76正式版_第5頁
已閱讀5頁,還剩71頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

[編號ODCC-2024-06003]基于冷板式液冷的智能

監控技術報告開放數據中心委員會209發布基于冷板式液冷的智能監控技術報告版權聲明單位共同享有著作權。轉載、摘編或利用其它方式使用ODCC成果中的文字或者觀點的,應注明來源:“開放數據中心委員會ODCC”。和翻譯出版等侵權行為,ODCC及有關單位將追究其法律責任,感謝各單位的配合與支持。I基于冷板式液冷的智能監控技術報告編寫組項目經理:楊舉普洛斯數據中心工作組長:晁懷頗阿里云計算有限公司貢獻專家:應澤良普洛斯數據中心白雪鋒普洛斯數據中心金超強普洛斯數據中心盧棟普洛斯數據中心劉雨翔普洛斯數據中心張良鋒普洛斯數據中心葉忠校普洛斯數據中心袁上普洛斯數據中心劉思纓普洛斯數據中心楊丹丹普洛斯數據中心段麗普洛斯數據中心鄒其顯普洛斯數據中心郁慶峰普洛斯數據中心韓冬普洛斯數據中心孫磊鋒普洛斯數據中心周亮普洛斯數據中心張德成普洛斯數據中心吳澤里普洛斯數據中心金玉龍北京三快在線科技有限公司II基于冷板式液冷的智能監控技術報告溫曉軍中聯云港數據科技股份有限公司葉偉現中聯云港數據科技股份有限公司孫志芳中聯云港數據科技股份有限公司李學文中聯云港數據科技股份有限公司閆培云中聯云港數據科技股份有限公司高揚中聯云港數據科技股份有限公司徐欣曙光數據基礎設施創新技術(北京)股份有限公司黃元峰曙光數據基礎設施創新技術(北京)股份有限公司張鑫曙光數據基礎設施創新技術(北京)股份有限公司崔旭靜北京奕信通科技有限公司李曉峰北京奕信通科技有限公司王超維諦技術有限公司胡海政維諦技術有限公司郭小飛遠地(廣州)數字科技有限公司陳新崇遠地(廣州)數字科技有限公司羅云健上海艾克森股份有限公司陳華廣東申菱環境系統股份有限公司李文龍廣東申菱環境系統股份有限公司林藝成科華數據股份有限公司陳祥輝科華數據股份有限公司王彬科華數據股份有限公司黃新科華數據股份有限公司劉大闖深圳市中電電力技術股份有限公司江錦衛深圳市中電電力技術股份有限公司陳昱昱智效能(上海)科技技術發展有限責任公司周慧文杭州華電華源環境工程有限公司余強突破電氣(天津)有限公司朱凱熙國網浙江省電力有限公司海鹽縣供電公司楊冰中國信息通信研究院III基于冷板式液冷的智能監控技術報告前言逐步上升到如今的高功率密度的機柜能夠容納更多高性能的CPU、GPU、大容量內存和術,以保障IT設備的穩定和高效運行。據中心IT設備的先進散熱方法。其基本原理是通過將液體直接或間式液冷是通過液冷板將熱量從IT設備傳導出去,具有高效的散熱能低、材料相容性好、易于維護等優點,是當前液冷技術中的主流。品在系統設計方面仍然參差不齊,各廠商和集成商也往往各自為戰。為了應對這些挑戰,我們期望通過聯合業內專家的智慧和力量,制定出更加完善、健全的冷板式液冷監控方案。IV基于冷板式液冷的智能監控技術報告為行業提供參考,推動冷板式液冷技術的更廣泛應用和規范化發展,為構建高效、可持續發展的數據中心基礎設施做出貢獻。系編寫組。感謝您的理解與支持!V基于冷板式液冷的智能監控技術報告目錄版權聲明I編寫組II前言............................................................................................................................IV一、術語、定義和縮略詞......................................................................1二、冷板式液冷的典型項目架構..........................................................4(一)冷板式液冷的設備構成..........................................................................4(二)冷板式液冷的項目結構..........................................................................5三、冷板式液冷的監控架構..................................................................7四、冷板式液冷的自控系統..................................................................9(一)自控系統功能要求..................................................................................9(二)CDU自控系統..........................................................................................91.主要部件以及監控需求102.傳感器部署113.主要控制邏輯154.告警點175.自控系統功能196.自控系統對外通信21(三)室外冷源自控系統..............................................................................231.室外冷源方案.....................................................................................232.室外冷源主要部件以及監控要求.....................................................253.室外冷源傳感器部署.........................................................................274.室外冷源主要控制邏輯.....................................................................29VI基于冷板式液冷的智能監控技術報告5.室外冷源告警點.................................................................................316.室外冷源自控系統功能.....................................................................33五、冷板式液冷的群控系統................................................................34(一)群控應用場景........................................................................................34(二)群控系統的實現....................................................................................35(三)群控應用方案示例................................................................................38六、冷板式液冷的運維監控系統........................................................40(一)DCIM系統的監控范圍..........................................................................41(二)DCIM數據采集、處理和存儲..............................................................42(三)冷板式液冷的監控視圖........................................................................431.空間設備布局圖.................................................................................432.液冷系統圖.........................................................................................443.液冷設備運行圖.................................................................................46(四)冷板式液冷的容量和能效分析功能....................................................471.容量管理.............................................................................................472.能效管理.............................................................................................49七、冷板式液冷的智能監控功能........................................................50(一)基于動態基線的設備故障預警............................................................50(二)冷板式液冷項目的數據治理................................................................52(三)冷板式液冷系統的物理機理建模........................................................53(四)基于大模型的故障智能診斷................................................................54(五)引入服務器監控數據............................................................................55八、標準點位建議.............................................................................58VII基于冷板式液冷的智能監控技術報告(一)CDU標準點位建議................................................................................58(二)室外冷源標準點位建議........................................................................62VIII基于冷板式液冷的智能監控技術報告基于冷板式液冷的智能監控技術報告一、術語、定義和縮略詞術語和定義BA系統(BuildingAutomationSystem):樓宇自動化系統,這運營效率和節能效果。DCIM系統(DataCenterInfrastructureManagement):是一種冷卻、網絡連接以及物理空間等方面。流經冷板時吸收元器件產生的熱量,并通過液冷系統將熱量帶走。的操作參數,以確保設備在預定的目標范圍內高效、安全地運行。參數,以確保關鍵設備在最佳條件下運行。型空調系統、工業冷卻和數據中心。1基于冷板式液冷的智能監控技術報告液體或氣體。一次側(PrimarySide):通常是指實現冷媒從冷源(如冷機、冷卻塔或干冷器)流向冷量分配單元的路線和設備。二次側(SecondarySide):通常是指實現冷媒從冷量分配單元流向IT設備的路線和設備。縮略詞AIOps(ArtificialIntelligenceforITOperations):人工IT障檢測、根因分析、預測維護等,以提高系統的性能和可靠性。BMC(BaseboardManagementController):服務器的底板管理控CPU風扇轉速、電源狀態等。CDU(CoolantDistributionUnit):冷量分配單元,它是液冷方案的核心,負責冷源的利用與熱源的散熱調配。CLF(CoolingLoadFactor):冷卻負載因子,衡量冷卻系統負載情況的指標,通常表示為實際冷卻負載與冷卻系統設計容量的比值。PID(Proportional-Integral-DerivativeController):比例-積分-微分控制器,一種廣泛用于工業控制系統中的控制算法。PID分),生成控制信號以調整系統的控制變量從而達到目標值。PLC(ProgrammableLogicController):可編程邏輯控制器,一通過編程實現邏輯運算、入/輸出,控制各種類型的機械或過程。2基于冷板式液冷的智能監控技術報告PUE(PowerUsageEffectiveness):電能利用效率,表征數據中心能與所有電子信息設備消耗的總電能之比。SLA(ServiceLevelAgreement):是在供應商和客戶之間達成的一種正式協議,明確描述供應商需提供服務的細節及其預期水平。WUE(WaterUsageEffectiveness):表征數據中心水利用效率的參設備消耗的總電能之比。3基于冷板式液冷的智能監控技術報告二、冷板式液冷的典型項目架構(一)冷板式液冷的設備構成自然。典型的冷板式液冷設備結構如下圖所示:圖1冷板式液冷結構示意圖塔、閉式冷卻塔和干冷器等設備實現,一般可提供30℃以內的冷卻水。機械制冷系統包括風冷機組和水冷機組,可提供20℃以內的冷卻水。體回路是指從冷量分配單元到機架,通過循環管路和設備連接,4基于冷板式液冷的智能監控技術報告然后再通過循環管路返回冷量分配單元的設計。CDU控制等作用。來自二次側冷卻回路的熱量通過CDU的板式換熱器傳遞到一次側冷卻回路,最終排放到大氣中或被熱回收再利用。分液單元():將冷卻液分配到各個需要散熱設備的部單元,從而防止不同路徑的芯片散熱冷板出現欠流或者過流情況。(二)冷板式液冷的項目結構和多個CDU成組運行,并采用N+1冗余設計,以確保在單個設備故障時仍能穩定運行。圖2冷板式液冷項目示意圖在冷板式液冷項目中,冷板主要用于冷卻服務器的CPU、GPU,5基于冷板式液冷的智能監控技術報告有精密空調設備,而且在設計上通常采用5:5至2:8的空調風冷與冷體系統的散熱需求。行。6基于冷板式液冷的智能監控技術報告三、冷板式液冷的監控架構CDU重要的作用。套并行系統:統或PLC量、壓力等關鍵參數進行監測與調節。常使用的監控系統。圖3DCIM監控架構示意圖7基于冷板式液冷的智能監控技術報告時,也會根據項目需求設計不同的架構。效運營。在小型冷板式液冷項目中,例如單個包間級的冷板式液冷項目,機柜數量在幾個到幾十個的情況下,此類項目的運維目標相對簡單,外完成。8基于冷板式液冷的智能監控技術報告四、冷板式液冷的自控系統(一)自控系統功能要求冷板式液冷項目的設備自控系統,主要是指CDU和室外冷源的設備自控系統,主要包含以下功能:關鍵部件的運行狀態等。(PID)等控制功能精確調節設備運行狀態。PLC數據和系統狀態,并進行基本操作和參數調節。控制面板上會呈現聲光告警。送數據,同時也能接受遠程控制指令。下將就CDU自控系統和室外冷源控制系統提供一套監控系統的標準方案建議。(二)自控系統在冷板式液冷系統中,CDU使用熱交換器連接一次側和二次側的量的有效轉移和管理。9基于冷板式液冷的智能監控技術報告1.CDU主要部件以及監控需求圖4CDU透視圖表1CDU主要部件及監控要求10基于冷板式液冷的智能監控技術報告部件監控要求換熱器用途:一二次側液體熱交換的部件。監控要求:溫度監控、流量監控、壓差監控。循環泵控要求:運行狀態、轉速、流量監控、壓力監控。膨脹罐用途:吸收冷卻液體積變化,保持系統壓力穩定。監控要求:液位監控、壓力監控。冷卻液儲液用途:存儲冷卻液,為系統提供穩定的液源。罐監控要求:液位監控。閥門用途:控制冷卻液的流動路徑和流量。監控要求:位置監控、流量監控。過濾器用途:清除冷卻液中的雜質。監控要求:壓差監控。電源模塊用途:為CDU以及相關的傳感器、控制器和執行器等提供穩定的電力供應。監控。2.CDU傳感器部署為實現對以上CDU部件的監測,需要合理部署傳感器,以實現可靠。CDU傳感器部署的總體要求:11基于冷板式液冷的智能監控技術報告具有長時間工作穩定、準確的特性,避免漂移現象。作。兼容性:傳感器應與CDU的控制系統兼容,能夠無縫集成到現有系統中。CDU傳感器部署的建議如下:圖5CDU傳感器部署示意圖表2CDU傳感器部署建議傳感器部署要求一次側溫度用途:測量一次側供液和回液溫度。傳感器110.2°C°C至150C12基于冷板式液冷的智能監控技術報告之間;響應時間:1秒以內。一次側壓力用途:測量一次側供液和回液壓力。(壓力傳感器建議傳感器安裝在溫度傳感器的上游)數量:一次側入口,1個;一次側出口,1個。0.5%FS0-10bar(0-145psi);響應時間:1秒以內。一次側過濾用途:監控過濾器兩端的壓力差。器前后壓力數量:過濾器前,1個,過濾器后,1個。傳感器一次側流量用途:測量一次側液體流速。傳感器數量:一次側入口或出口,1個。的1.5至2倍;響應時間:1秒以內;低壓降:傳感器在最大流量下產生的壓力損失應小于(滿量程);通道直徑:確保通道直徑大于或等于液體管路的直徑,推薦值一般為≥4mm。二次側溫度用途:測量二次側供液和回液溫度。傳感器11二次側壓力用途:測量二次側關鍵位置的液體壓力。傳感器數量:二次側入口,1個;二次側出口,1個。二次側過濾用途:監控過濾器兩端的壓力差。器前后壓力數量:過濾器前,1個;過濾器后,1個。傳感器二次側流量用途:監測冷媒在二次側的流動速度。13基于冷板式液冷的智能監控技術報告傳感器數量:二次側入口或出口,1個。水質傳感器用途:監測液體的化學特性,當前以乙二醇、丙二醇為典型的換熱液體為例。數量:二次側管道,傳感器1個,電導率傳感器1個。傳感器0.10-14pH間:30秒以內。電導率傳感器測量精度:±1%讀數范圍內;測量范圍:0.1到20,000μ;響應時間:30秒以內。濁度傳感器0.01NTU或讀數的±5%0-4000NTU;響應時間:10秒以內。漏水監測用途:監控液體泄漏情況。至少1個,具體視管道復雜度而定。5ml10秒以內。液位傳感器用途:監控冷卻液的液位,防止液體過少或溢出。數量:儲液罐,至少1個。CDU,推薦浮球液位傳感器;在較大規模的CDU環境溫濕度用途:監測環境濕度,防止冷凝水對設備影響。傳感器數量:機房內、管道周邊。14基于冷板式液冷的智能監控技術報告°C3%RH內;測量范圍:溫度在-40°C到+120°C,相對濕度在0%到100%RH;響應時間:溫度在10秒以內,濕度在20秒以內。管道溫度傳用途:監測外部管道內的溫度。感器數量:若干。管道壓力度用途:監測外部管道內的壓力。傳感器數量:若干。3.CDU主要控制邏輯在CDU的自控系統中,通常是將二次側的供液溫度、壓差或流PLC安全的運行。表3CDU控制參數建議控制參數控制說明二次側供液適用場景溫度和性能。控制邏輯1、實時監測二次側冷媒的供液和回液溫度;2、通過控制系統設定二次側供液溫度目標,例如30°C,利用控制算法調節一次側閥開度;15基于冷板式液冷的智能監控技術報告3、如果供液溫度高于設定值,增加調節閥的開度,可可使溫度上升。二次側壓差適用場景冷卻的長期穩定運行環境等;一級側的壓差波動較大,需要二次側提供穩定壓差。控制邏輯1、實時監測CDU二次側出入口的壓力,計算壓差;2、在控制系統中設定壓差目標,如0.5bar,利用PID控制算法調整循環泵的速度或調節閥的開度;3、當壓差大于設定值,循環泵轉速降低,當循環泵頻率降至最低壓差值仍大于設定值時,增大二次側閥開度為0是為了保證循環泵處于最佳的運行狀態。二次側流量適用場景備或區域的冷卻需求,動態調整流量分配。控制邏輯1、實時監測各個冷板或者整個支路的實際流量;2、在控制系統中設定適宜的流量目標,如50L/min,利用PID控制算法調整循環泵的速度或各支路的調節閥開度;16基于冷板式液冷的智能監控技術報告3、如果實際流量低于設定值,通過加快循環泵的轉速度,可降低流量。場景、系統設計和運行需求,對壓差控制或流量控制進行二選一。當然各廠家也可以針對一些復雜場景,設置綜合控制策略:時采用壓差控制。先級。例如,以壓差為優先,流量作為輔助控制目標。階梯控制:分階段控制,通過主控從控實現多目標優化。例如,在一級側有較大調節余地時,先控制壓差,再調整流量。4.CDU告警點在冷板式液冷系統的CDU中,為確保系統在發生異常情況時能夠及時發現并采取相應的措施,將典型故障和告警類別作為告警點。CDU系統,確保系統在發生異常情況時能夠迅速響應和處理。17基于冷板式液冷的智能監控技術報告表4CDU告警點位設置建議告警分類告警點部件故障部件告警,是針對CDU系統中關鍵部件的性能和運行狀態進行監控,確保這些部件在正常工作范圍內。1、循環泵/補液泵故障告警:循環泵變頻器故障、通故障(設備運行命令給出后未接受到運行反饋)。2、閥門故障告警:閥門卡死或無法正常開啟/關閉。3、換熱器/過濾器堵塞告警:壓差異常(前后壓差值超出設定范圍)。4異常掉電。傳感器故障傳感器故障告警,是針對CDU系統中各類傳感器的工作狀態進行監控,確保數據采集的準確性和可靠性。1或者快速變化。2、傳感器故障/通信中斷:無法采集數據或數據錯誤。設備異常設備異常告警,是針對CDU系統整體運行的各項指標進行監控,確保系統在臨界狀態或異常情況下,能夠及時觸發告警并采取措施。1部管道關鍵節點(如不利點)的壓力不足。2、系統流量異常:一二次側流量超出預設范圍。3、系統溫度異常:冷媒溫度過高或過低。18基于冷板式液冷的智能監控技術報告4體泄漏或補液不足)。5、漏液告警:水浸開關漏液告警。5.CDU自控系統功能CDU控制系統的運行狀態。表5CDU自控系統功能建議交互功能功能要求狀態監測在界面主頁顯示當前系統的各項關鍵參數,如溫度、壓力、流量、液位等。以組態方式展示CDU器、閥門等的運行狀態。用不同顏色或圖標標識正常、異常和告警狀態。控制操作提供泵和其他關鍵設備的開/關控制按鈕。允許用戶改變溫度、壓力、流量等關鍵參數的設定值。告警管理彈出窗口或明顯標識顯示當前的故障和警告信息。記錄并展示歷史警報事件,方便回溯和分析。數據記錄以圖表形式顯示溫度、流量、壓力等參數的變化趨勢。允許導出歷史數據,用于更詳盡的分析。維護提醒顯示維護預警,如過濾器更換、系統檢查等提醒。權限控制需要用戶登錄,確保系統操作的安全性。系統管理配置系統基礎設定,如控制邏輯、系統參數等。19基于冷板式液冷的智能監控技術報告提供系統時間設定和同步功能;提供網絡配置界面,允許用戶設置系統的地址、子網掩碼、網關和DNS。操作日志支持日志導出和查詢,使管理和審計更方便。圖6CDU監控界面示例一圖7CDU監控界面示例二20基于冷板式液冷的智能監控技術報告6.CDU自控系統對外通信上層監控系統需要采集CDU的實時數據,如溫度、壓力、流量等,也需要遠程設置CDU的工作參數,如泵啟動/停止、溫度設定值外部設備和上層監控系統高效、可靠地通信的關鍵因素。在通信接口方面,RS-485口。在使用RS-485接口時,需要部署采集器,將CDU數據集中采集通過以太網傳輸到監控服務器,實現快速、穩定的數據傳輸。按目前的監控技術發展,在CDU對外通信的接口層面采用以太網接口是更為適用的方案。表6RS-485對比以太網通信接口RS-485以太網接口(網口)標準是一種用于多點以太網接口是用于有線局域LANIEEE(電子工業聯盟)制802.3標準定義,它是目前最廣泛使用的計算機網絡技術化和數據采集系統中。之一。抗擾能力高,適用于工業環境需要網絡防護設備傳輸距離長達1200米通常為100擴展傳輸速率9600至115200波特高,10Mbps至1Gbps成本較低較高多點通信支持32個設備需通過網絡設備實現多設備21基于冷板式液冷的智能監控技術報告通信配置難度配置復雜遠程訪問不支持支持,適合遠程監控和管理標準化全球標準,全面支持鏈路層)協議在通信協議格式方面,Modbus和SNMP是主流的兩種格式。在當今的監控技術發展趨勢下,建議CDU自控系統同時支持Modbus和SNMP不同的上層監控系統需求。表7Modbus對比SNMP協議特性ModbusSNMP基本原理Modbus協議是一種主/從SNMPMIB)/服務器(Client/Server)通過代理(Agent)和管理系架構的通信協議,允許一統(Manager)之間的通信,個主設備與多個從設備之實現對設備的狀態監控和控間進行數據交換。常用數制。SNMP使用UDP協議傳輸據格式是16位的寄存器和離散的輸入/較低的通信開銷。就是線圈)。開放性和開放的工業標準,易于實標準化現廣泛支持簡單易用協議結構簡單,易于開發復雜度高,涉及MIB文件,22基于冷板式液冷的智能監控技術報告和調試多種操作類型傳輸層支支持多種傳輸方式(基于通信,適合分布持)式網絡適用性適合局部工業網絡,成本適合大規模網絡管理和遠程效益高監控安全功能基本的安全功能,需要外SNMPv1/v2c安全性較弱,部保護SNMPv3較好數據類型支持的數據類型有限支持復雜數據結構和多個數據類型主動告警不具備主動告警功能支持機制,具備主動告警功能實現成本較低成本較高(三)室外冷源自控系統1.室外冷源方案用性,因此在設計和選型上有多種多樣的方案。表8常見的室外冷源方案室外冷源方案介紹方案23基于冷板式液冷的智能監控技術報告冷卻塔+循適用范圍環泵氣溫低,全年可用自然冷源,水資源豐富。制冷原理垢的維護。干冷器+循適用范圍環泵氣溫低,全年可用自然冷源,水資源匱乏。制冷原理能力。水冷機組+適用范圍冷卻塔+板氣溫高,需要機械制冷補冷,水資源豐富。換+循環泵制冷原理24基于冷板式液冷的智能監控技術報告高。風冷機組+適用范圍循環泵氣溫高,需要機械制冷補冷,水資源匱乏。制冷原理蒸發的循環過程,從而吸收和排放熱量。不依賴水源,適用于缺水地區。監控系統進行管理,因此在此不再詳述。方案也是冷板式液冷項目當中更為常見的。自控系統進行集中監控,因此以下將這一類的一次側設備自控系統,統稱為室外冷源自控系統,詳細闡述監控方案。2.室外冷源主要部件以及監控要求統、熱交換系統、補液系統和噴淋系統組成。25基于冷板式液冷的智能監控技術報告表9室外冷源主要部件及監控要求部件監控要求換熱器用途:負責將冷卻液中的熱量傳遞給周圍的空氣。監控要求:溫度監控、壓差監控。風機用途:加速空氣流動,加速散熱。監控要求:啟停狀態、轉速。循環泵用途:維持冷卻液的流動,提供所需的流量和壓力。監控要求:溫度監控、流量監控、壓力監控、啟停狀態、轉速。補液泵維持在設計的穩定范圍內。監控要求:啟停狀態、轉速。加藥裝置用途:維持冷卻液的水質。監測要求:值、電導率。噴淋泵用途:噴淋泵負責將水從儲水罐或直接從水源泵至噴嘴,提供所需的水壓,使水能夠均勻地噴灑到換熱器的表面。監測要求:啟停狀態、轉速。儲液罐儲液罐中補充冷卻液。監測要求:液位監控。閥門用途:控制冷卻液的流動路徑和流量。監測要求:位置監控、操作狀態監控、流量監控。26基于冷板式液冷的智能監控技術報告電源模塊提供穩定的電力供應。控。3.室外冷源傳感器部署部署相對簡單。圖8室外冷源傳感器部署示意圖表10室外冷源傳感器部署建議傳感器傳感器要求供回液溫度用途:測量側供液和回液溫度。傳感器數量:入口,至少1個;出口,至少1個。0.2°C-40C至150°C之間;響應時間:1秒以內。27基于冷板式液冷的智能監控技術報告供回液壓力用途:測量供液和回液壓力。傳感器數量:入口,1個;出口,1個。0-10(0-145);響應時間:1秒以內。流量傳感器用途:測量液體流速。數量:入口或出口,1個。測量精度:±2%讀數范圍內;測量范圍:預期最大流量的1.5至21器在最大流量下產生的壓力損失應小于1%FS(滿量程);通道直徑:確保通道直徑大于或等于液體管路的直徑,推薦值一般為≥4mm。水質傳感器用途:監測液體的化學特性。數量:一次側管道,傳感器1個,電導率傳感器1個。傳感器測量精度:±0.1pH以內;測量范圍:0-14pH;響應時間:30秒以內。電導率傳感器0.1μ到20,000μ;響應時間:30秒以內。液位傳感器用途:監控冷卻液儲液罐的液位,防止液體過少或溢出。數量:儲液罐內,至少1個。類型:在小型儲液罐,推薦浮球液位傳感器;在較大28基于冷板式液冷的智能監控技術報告規模儲液罐,推薦超聲波液位傳感器,或電容式液位傳感器。環境溫濕度用途:實時監測周圍空氣的溫度和濕度。傳感器數量:進氣口附近,1個。測量精度:溫度在±°C范圍內,相對濕度在±3%RH內;測量范圍:溫度在-40°C到+120°C,相對濕度在0%到100%RH;響應時間:溫度在10秒以內,濕度在20秒以內。管道溫度傳用途:監測外部管道內的溫度。感器數量:若干。管道壓力度用途:監測外部管道內的壓力。傳感器數量:若干。4.室外冷源主要控制邏輯在室外冷源的自動控制系統中,控制邏輯主要圍繞循環泵控制、液溫度設定和供回液壓差設定。表11室外冷源控制參數建議控制參數控制說明供液溫度適用場景環境溫度波動較大的場景,通過精準的溫度控制確保系統穩定運行。控制邏輯29基于冷板式液冷的智能監控技術報告、實時監測冷卻液的供液溫度;30°用控制算法,調節風機轉速或噴淋系統的噴霧量。速度;當供液溫度偏低時,降低風機轉速,或降低循環泵速度;步降低供液溫度。回液溫度適用場景負載裝置需要高效散熱的情況,例如高性能計算環境。控制邏輯、實時監測冷卻液的回液溫度;35°用控制算法,調節風扇的轉速或循環泵的速度。速度;度。供回液壓適用場景差系統負載動態變化較大,通過供回液壓差控制,實時調整泵速和閥門狀態,確保系統高效運行。控制邏輯、實時監測室外冷源出口和入口的壓力,計算壓差;2、在控制系統中設定適宜的壓差目標,如0.5bar,利30基于冷板式液冷的智能監控技術報告用控制算法調整循環泵的速度或調節閥的開度;整閥門開度增加流量,可增加壓差;閥門開度,可降低壓差。征,進行三選二控制,舍棄一個目標作為自由變量。5.室外冷源告警點實時傳輸至上層管理系統。表12室外冷源告警設置建議告警分類典型告警點部件故障1、風機/循環泵/噴淋泵/補液泵故障告警或水泵速度無法調節,從而影響冷卻效果。之間的通信中斷,應立即報警。31基于冷板式液冷的智能監控技術報告正常啟動,應觸發啟動故障告警。態異常或性能下降的情況。2、電源故障即報警。穩定運行,應設置相應的電壓異常告警。傳感器故障1、傳感器異常告警讀數異常,長期保持某一固定值或者快速變化2、傳感器故障/通信中斷無法采集數據或數據錯誤設備異常1、系統壓差異常測到干冷器的冷卻介質進出口壓力超出正常操作塞或泵功能異常導致。2、系統流量異常應自動告警,指示可能存在泵效率問題或管路泄漏。3、系統溫度異常溫度可能會導致介質凝固問題。4、系統液位異常32基于冷板式液冷的智能監控技術報告如果干冷器的儲液箱液位低于或高于正常水位線,可能是由于控制系統故障導致補液過多。5、水質異常告警濃度過高或過低,需調整水處理設施或更換循環水。值過高可能導致結垢問題。維持適宜的范圍對預防這些問題至關重要。6.室外冷源自控系統功能在系統交互層面,室外冷源自控系統與CDU自控系統的要求是一致的,請參考上方的“CDU自控系統功能”,不再贅述。33基于冷板式液冷的智能監控技術報告五、冷板式液冷的群控系統目,室外冷源和CDU可能采用N+1及以上冗余結構設計,這就需要使用群控系統來管理。(一)群控應用場景圖9冷板式液冷設備并機示意圖CDU控系統需要滿足的場景如下:并機組網:多臺CDU/室外冷源可以并聯運行,通過群控系統協性。熱備功能:在某個CDU/室外冷源出現故障時,熱備系統可以立即接管其工作,確保冷卻任務不中斷。34基于冷板式液冷的智能監控技術報告個CDU/室外冷源的運行狀態,優化能源使用,降低運行成本。主備配置:群控系統支持主備配置,可以指定主系統和備系統,輪詢機制:通過輪詢機制,群控系統可以均衡各個CDU/室外冷余和控制冗余,確保系統在各種故障情況下仍能穩定運行。換,將故障系統的任務轉移到正常運行的設備上。(二)群控系統的實現定、數據采集和指令下發以及適當的應急處置方案。控制主機的設定下的某臺室外冷源或CDU來承擔。群控主機不斷從CDU和室外冷源收集實時參數數據,如設備運群控主機連接,確保數據傳輸的實時性和可靠性。群控主機使用先進的控制算法(如機器學習和數據驅動優化模35基于冷板式液冷的智能監控技術報告穩定性。指令下達與執行確、高效,并具備良好的反饋機制以保證整個系統的穩定性。a、指令的生成與下達自動由系統推薦的最優設置。制指令以適應這些變化。指令下達:經過計算和驗證的控制指令被發送到特定設備,如CDU絡線路發送這些指令。b、設備的響應與執行狀態如改變流速或轉速等。設備控制應有足夠的精確性和反應速度,以準確響應控制指令。參數,確保操作在安全和預定的范圍內進行。、反饋與閉環控制信息。36基于冷板式液冷的智能監控技術報告閉環控制。d、用戶界面與監控:件日志。結果,供未來審計和性能評估使用。適當的應急處置方案是群控系統需要完善的各項應急處置措施:a、手動干預流程快速切換模式:確保操作人員可以迅速接入系統進行手動干預。復位或切換至備份系統的選項。保操作人員在緊急情況下可以快速準確地采取行動。b、啟動本地控制冷卻系統以保持在安全溫度范圍內。件下自行解決簡易的技術故障,減輕對于即時人工干預的依賴。37基于冷板式液冷的智能監控技術報告、控制參數范圍限制參數的安全范圍,增強系統適應性和抗干擾能力。警報,并在可能的情況下自行調整或等待人工確認。d、異常監測與反饋機制析執行錯誤或異常狀態的原因,提供可能的解決方案或修復建議。并自動隔離故障部分,防止錯誤擴散。(三)群控應用方案示例方案一:大型數據中心應用方案項目背景:某大型數據中心計劃采用冷板式液冷系統來冷卻其高密度的CDU性較高。需要群控系統完成以下操作:通過群控主機協調多個冷板和CDU的運行,避免了某些冷板過載而其他冷板閑置的情況;板的冷卻能力,而在低負載時段則降低冷卻能力,以節約能源;在某個CDU發生故障時,群控系統迅速切換到備用CDU,保證38基于冷板式液冷的智能監控技術報告冷卻效果不受影響。群控預期效果:提高冷卻效率,降低能耗;增強系統的可靠性和穩定性;實現智能化管理,減少人工干預。方案二:中型企業應用方案項目背景:每個冷板和CDU都配備獨立的控制單元,能夠根據預設的參數CDU會自動增加水泵流速,以提高冷卻效果。維人員可以通過遠程系統手動調整冷卻參數,確保設備正常運行。在夜間低負載時段,系統自動降低冷卻能力,減少能源消耗。群控預期效果:·滿足中型企業的數據中心冷卻需求;·降低運維成本,提高冷卻效率;·實現基礎的智能化管理。39基于冷板式液冷的智能監控技術報告六、冷板式液冷的運維監控系統CDUDCIM系統。動環監控系統主要負責對冷板式液冷設備以及周邊配套設備的數據采集和告警監控。DCIM系統,則往往是動環監控系統的再上一層監控系統,用于全面整合和管理數據中心的各個方面,包括電力、備數據分析功能,有助于資源優化和提高運營效率。DCIM系統之間的界限變得越來越模糊。在適當的場景下,它們可以DCIM系統的功能。以下將以DCIM維監控系統應當具備的監控功能。40基于冷板式液冷的智能監控技術報告(一)DCIM系統的監控范圍中直接相關的空調末端和配電末端設備,不做深入展開。表13DCIM監控范圍以及要求設備監控要求CDU用途:冷板式液冷系統的核心設備,負責一二次側的熱交換。室外冷源環境中。精密空調板式液冷服務器的內存、主板等周邊設備降溫。恒濕機要求。監控要求:采集測點數據,監控告警。溫濕度傳用途:實時監測數據中心內的溫度和濕度水平。感器監控要求:采集測點數據,監控告警。漏水繩用途:監測機房內的漏水情況,及時檢測到漏水發生。監控要求:采集測點數據,監控告警。41基于冷板式液冷的智能監控技術報告列頭柜用途:給機柜配電。監控要求:采集測點數據,監控告警。配電柜CDU電。監控要求:采集測點數據,監控告警。(二)DCIM數據采集、處理和存儲在DCIMDCIM的標準方案進行處理,以下是DCIM系統中的方案概要介紹。數據采集采集方式:DCIM系統應支持Modbus和SNMP等標準通信協議3秒對于CDU為每5秒一次。于設備廠家提供的其他點位,也可以作為非標點位進行管理。數據存儲存儲策略:對模擬量采用周期存儲,每1分鐘或每10秒一次;據存儲粒度,甚至進行全量存儲以便事后分析。存儲時長:歷史數據應至少保留5年,以支持長期的數據回溯。數據處理42基于冷板式液冷的智能監控技術報告實時計算:DCIM系統應具備實時處理數據的能力,進行求和、平均、差值等基礎運算。耗、溫度趨勢等,以支持決策制定。(三)冷板式液冷的監控視圖對于冷板式液冷項目,DCIM監控視圖在確保系統高效和穩定運控視圖的詳述:1.空間設備布局圖空間視圖快速判斷出可能的問題點。空間視圖的制作要求:使用組態類工具繪制空間視圖按2D2.5D或3D裝位置及管道布置。整體性。對于遠離液冷房間的冷源,單獨繪制室外冷源的空間視圖,同時在房間視圖中標注連接點和方向,以便快速定位。圖元要求核心設備如CDU43基于冷板式液冷的智能監控技術報告反映設備的實時狀態。人員注意。狀態。用戶可點擊設備圖元,彈出窗口或側邊欄展示設備的詳細數據。整體運行指標展示功率、CDU免遮擋核心設備或關鍵通道。用戶友好界面確保界面清晰簡潔,不顯得凌亂。到細節視圖。2.液冷系統圖CDU斷具有關鍵作用,確保冷卻系統能夠連續無間斷地運行。44基于冷板式液冷的智能監控技術報告圖10冷板式液冷系統圖液冷系統圖的制作要求:使用組態類工具繪制液冷系統圖將存在相關影響關系的多組冷板式液冷系統整合成一個整體的液冷系統圖。準確繪制出室外冷源、、環網管道的連接關系。標示出室外冷源的風機和循環泵的運行狀態;標示出CDU中的循環泵的運行狀態,確保圖元動態反映實際情況。用不同顏色區分各環網,以便于直觀了解流向和結構。示(如顏色變化、閃爍等)。使用組態類工具或H5網頁繪制液冷參數總覽視圖45基于冷板式液冷的智能監控技術報告的液冷系統監控系統。這里需要展示:液冷系統的關鍵參數,如溫度、壓力、流量等;發現異常和進行故障診斷。確認彈窗和權限驗證,確保每次遠程控制操作都記錄在案。3.液冷設備運行圖在DCIM統核心設備如CDU和室外冷源設備的直觀監控方案。這種運行圖不使設施管理人員能夠及時識別和解決任何潛在問題。為了確保運維人員可以輕松理解運行圖中的信息并迅速采取行作效率,尤其是在緊急情況下,能夠迅速和準確地做出響應。46基于冷板式液冷的智能監控技術報告圖11冷板式液冷設備運行圖對于大型項目,由于設備數量眾多,應采用模塊化的繪制方法,控。且可以在單一界面上實現快速的狀態檢查和問題診斷。(四)冷板式液冷的容量和能效分析功能DCIM系統應當為冷板式液冷項目提供容量管理和能效分析功能,維人員優化冷板式液冷性能。1.容量管理針對冷板式液冷項目,推薦的容量管理包含以下頁面:47基于冷板式液冷的智能監控技術報告總容量使用報表頁面運維人員快速了解資源利用情況。頁面內容:總負載、總制冷能力、冷量使用比例、冷量供需比。示冷量供需比的歷史數據趨勢。設備容量使用報表頁面詳細使用數據,幫助識別高負載設備和潛在容量瓶頸。值)。備的負載與最大負載對比。冷量分配報表頁面分配情況,優化冷卻資源配置。含冷板系統的冷量和精密空調的冷量對比)冷量在不同設備間的分配比例。容量趨勢和預測報表頁面48基于冷板式液冷的智能監控技術報告提前規劃和決策。頁面內容:歷史容量數據、趨勢分析、預測數據。可視化:用折線圖展示歷史容量使用情況和未來容量需求預測,用散點圖或回歸分析圖展示容量使用趨勢。2.能效管理針對冷板式液冷項目,推薦的能效管理包含以下頁面:綜合能效報表頁面功能描述:展示冷板液冷系統的綜合能效,包括PUE、CLF等指標及其歷史趨勢。頁面內容:關鍵能效指標(PUE、CLF的實時和歷史數據)、冷量供需比(空調冷量和CDU提供的冷量之和,與設備的功率進行比較)、風液供冷比(精密空調供冷與冷板供冷的比例)。示能耗分布情況。設備能耗詳細報表頁面高能耗設備。據(精密空調的風機轉速、送回風溫差,風機轉速,水泵轉速)。展示能耗趨勢。49基于冷板式液冷的智能監控技術報告七、冷板式液冷的智能監控功能(一)基于動態基線的設備故障預警雜。如果僅依賴傳統的閾值告警系統,往往會導致告警滯后。然而,動態基線是通過時間序列預測算法,對關鍵測點構建動態基線閾區間,從而判斷系統是否存在異常。例如,LSTM可以捕捉數據中的ARIMA則通過自回歸據超出預測的正常運行范圍時,系統將自動觸發報警。50基于冷板式液冷的智能監控技術報告圖12動態基線預警示意圖較簡單,不需要人工設置閾值,算法能夠結合長期和短期歷史數據,相比靜態閾值告警更靈敏,可以提前發現問題。CDU線預警,當測點值超出日常的波動區間后,即可觸發預警。51基于冷板式液冷的智能監控技術報告升場景快30秒至3分鐘發出預警信息,在液體溫升場景可以快2-5分鐘。識別短時間內的異常劇烈波動。(二)冷板式液冷項目的數據治理點校驗和跨設備的數據校驗。單測點的工作區間校驗在冷板式液冷系統中,每類設備測點都可以定義出其工作區間,為是異常或無效數據進行剔除,避免影響設備控制或設備告警功能。CDU100C設備內測點數據校驗CDU和分析,可以判斷測點數據是否合理。多設備數據的相互校驗52基于冷板式液冷的智能監控技術報告多設備相互驗證數據準確性。例如,室外冷源的供液溫度和CDU的物理機理模型,通過仿真數據對實際監控數據進行校驗。(三)冷板式液冷系統的物理機理建模冷板式液冷的物理機理建模是對其熱力學和流體力學行為進行系統動力學特性等。冷板式液冷的物理模型可以應用于自控系統和群控系統中,為PID略的制定,為液冷系統的全生命周期管理提供有力支持。液冷系統的建模主要通過以下步驟實現:布、優化冷卻效率等。度、粘度、比熱容等)、管道幾何尺寸、熱源位置和功率等。口流速、溫度,出口壓力等。數值求解:選擇合適的數值方法(如有限元法、有限差分法等)53基于冷板式液冷的智能監控技術報告(如、Fluent等)。型的精度和魯棒性。(四)基于大模型的故障智能診斷依賴負載,如何快速準確進行故障診斷,及時止損。化為半結構化/結構化語言形式,通過大模型的診斷和推理,有效減少中間信息處理的時間,提升運維處理人效。用不同的知識系統進行綜合判斷。共建語料,進行精調和上下文學習,提升診斷有效率。進行合理推理跟發現。圖13大模型故障智能診斷流程對故障的智能診斷階段:/54基于冷板式液冷的智能監控技術報告關性分析;故障學習:通過輸出的設備運行規律,相關性信息,抽數據庫和圖數據庫中;半結構化/找到與故障最接近的N根因信息;推理能力進行故障診斷。(五)引入服務器監控數據在冷板式液冷項目當中,部署傳感器在機柜層面面臨諸多挑戰,供液給服務器的溫度、壓力等關鍵參數變得更加復雜和困難。然而,通過服務器BMC,可以直接監測服務器的內部溫度和負載情況,實現間接的環境監控和動態調整。BMC是一種專為服務器和高性能計算系統設計的嵌入式微控制器。BMC通過專用的獨立網絡端口或共享網絡端口與外部通信。BMC能夠實時監測服務器的各種硬件狀態,包括溫度、風扇速度、電壓、功耗等。服務器數據的用途在冷板式液冷項目中,利用BMC采集到服務器數據后,對服務器溫度和負載進行分析,可以為冷板式液冷系統的控制提供幫助。55基于冷板式液冷的智能監控技術報告充足的冷卻能力,而在負載較低時節約能源,從而優化系統能效。斷。命。高冷卻系統的整體效率。冷卻或服務器運行問題,通過BMC提供的監測數據能夠實現快速故用性。無法直接獲取服務器數據時的替代方案由于BMC具備重啟服務器等敏感操作功能,服務器運營商在開放BMC數據時可能會有所顧慮,而不愿將這些服務器數據直接提供給冷板式液冷監控系統。為了應對服務器運營商不愿提供直接BMC數據的情況,冷板式56基于冷板式液冷的智能監控技術報告態,例如溫度和功率消耗等。統的運行參數,確保系統在高效散熱的同時保持穩定運行。總之,即使沒有直接獲取BMC數據,也能通過這種方法有效監控和優化液冷系統,提高其整體效率和可靠性。57基于冷板式液冷的智能監控技術報告八、標準點位建議為了實現對冷板式液冷系統的CDU進行有效的監控和管理,制計。本報告提供了一份結合典型的CDU部件和傳感器部署方案的標準點位設計示例。(一)標準點位建議測點分類測點名稱測點類型讀寫單位數值精度有效值范圍運行參數一次側入口溫度模擬量℃0.10~80一次側出口溫度模擬量℃0.10~80一次側入口壓力模擬量bar0.010~5一次側出口壓力模擬量bar0.010~5一次側板換入口壓模擬量bar0.010~5力一次側板換出口壓模擬量bar0.010~5力一次側過濾器入口模擬量bar0.010~5一次側過濾器出口模擬量bar0.010~5一次側閥開度模擬量%0.10~100一次側流量模擬量L/min0.1按需而定二次側入口溫度模擬量℃0.10~80二次側出口溫度模擬量℃0.10~80二次側入口壓力模擬量bar0.010~5二次側出口壓力模擬量bar0.010~558基于冷板式液冷的智能監控技術報告二次側泵入口壓力模擬量bar0.010~5二次側泵出口壓力模擬量bar0.010~5二次側過濾器入口模擬量bar0.010~5二次側過濾器出口模擬量bar0.010~5二次側閥開度模擬量%0.10~100二次側流量模擬量L/min0.1按需而定循環泵轉速模擬量%0.10~100水箱液位高度模擬量cm10~200電導率模擬量us/cm0.10~20000PH值模擬量0.010~7室內濕度模擬量%RH0.10~100室內溫度模擬量℃0.1-30~50室內露點溫度模擬量℃0.1-30~50管道溫度模擬量℃0.10~80管道壓力模擬量bar0.010~5運行狀態開關機狀態狀態量本地/遠程狀態量循環泵運行狀態狀態量循環泵手自動狀態狀態量補液泵運行狀態狀態量補液泵手自動狀態狀態量一次側閥手自動狀狀態量態二次側閥手自動狀狀態量態設備故障機組告警狀態狀態量儲液箱低液位狀態量儲液箱高液位狀態量漏液狀態狀態量59基于冷板式液冷的智能監控技術報告液一次側過濾器堵塞狀態量一次側板換堵塞告狀態量警二次側過濾器堵塞狀態量一次側入口溫度過狀態量高一次側入口溫度過狀態量低二次側出口溫度過狀態量高二次側出口溫度過狀態量低一次側入口壓力過狀態量高一次側入口壓力過狀態量低二次側泵入口壓力狀態量二次側泵入口壓力狀態量二次側進出口壓差狀態量二次側進出口壓差狀態量一次側流量不足狀態量二次側流量不足狀態量二次側泵出口壓力狀態量電源故障告警狀態量60基于冷板式液冷的智能監控技術報告變頻器故障狀態量一次側閥故障狀態量二次側閥故障狀態量傳感器一次側入口溫度傳狀態量感器故障一次側出口溫度傳狀態量感器故障一次側入口壓力傳狀態量感器故障一次側出口壓力傳狀態量感器故障一次側板換入口壓狀態量力傳感器故障一次側板換出口壓狀態量力傳感器故障一次側過濾器入口狀態量壓力傳感器故障一次側過濾器出口狀態量壓力傳感器故障一次側流量計傳感狀態量器故障二次側入口溫度傳狀態量感器故障二次側出口溫度傳狀態量感器故障二次側入口壓力傳狀態量感器故障二次側出口壓力傳狀態量感器故障二次側泵入口壓力狀態量傳感器故障二次側泵出口壓力狀態量61基于冷板式液冷的智能監控技術報告傳感器故障二次側流量計傳感狀態量器故障

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論