




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
智算中心作為信息基礎設施的重要組成部分,通過算力的生產、聚合、調度和釋放,能夠為快速增長的人工智能算力需求提供基礎支撐,在推進AI產業化、賦能產業AI化、助力治理智能化、促進產業集群化等方面具有顯著作用,是數字經濟時代促進科技創新、優化產業結構、提升國家競爭力的重要支撐。中國智算中心產業迎來重要發展機遇。工業和信息化部、中央網信辦、教育部、國家衛生健康委、中國人民銀行、國務院國資委等六部門聯合印發的《算力基礎設施高質量發展行動計劃》明確提出,到2025年,我國算力規模超過300EFLOPS,智能算力占比達到35%。在政策指引與市場需求的共同推動下,智算中心產業進入快速發展期,大批智算中心項長。未來,隨著人工智能、大數據等新興技術驅動下的應用場景日益豐富,AI硬件、算力服務、模型應用等產業鏈重要環節的商業模式不斷創新發展,智算中心產業生態將加速形成,并向供給優化、數實融合、綠色低碳、產業協同等方向演進。為深入剖析中國智算中心產業發展現狀,精準把握智算中心產業未來發展態勢,中國通信工業協會數據中心委員會集合智算中心產業專家資源和產業鏈力量,聯合發布《中國智算中心產業發展白皮書(2024)》。本白皮書立足于我國智算中心產業實際,展望未來,為共創智能計算新時代、建設數字中國貢獻力量。本白皮書全面梳理我國智算中心產業發展的現狀、趨勢、機遇與挑戰,系統剖析智算中心建設、運營面臨的新形勢、新要求,希望為智算中心產業相關管理機構、行業協會、產業從業者等提供參考。3中國通信工業協會數據中心委員會張家口市人民政府蕪湖市人民政府韶關市人民政府烏蘭察布市人民政府慶陽市人民政府大同市人民政府內蒙古和林格爾新區管理委員會中國長江三峽集團有限公司中科院建筑設計研究院有限公司中國建設銀行股份有限公司北京科智咨詢有限公司上海寶信數據中心有限公司秦淮數據集團北京數道智算科技有限公司北京世紀互聯寬帶數據中心有限公司科華數據股份有限公司科大訊飛股份有限公司河南昆侖技術有限公司潤澤科技發展有限公司博大數據服務(深圳)有限公司聯想(北京)有限公司北京中科合盈數據科技有限公司南方電網大數據服務有限公司聯通(廣東)產業互聯網有限公司杭州星臨科技有限責任公司廣東美的暖通設備有限公司四川省天府云數據科技有限責任公司北京泰豪智能工程有限公司濰柴重機股份有限公司中電系統建設工程有限公司恒華數字科技集團有限公司深圳市中電電力技術股份有限公司廣州市匯源通信建設監理有限公司中建三局第一建設安裝有限公司雙登集團股份有限公司蘭洋(寧波)科技有限公司廣州尚航信息科技股份有限公司華章數據技術有限公司中世順科技(北京)股份有限公司潤建股份有限公司浙江潔普智匯能源科技有限公司廣東申菱環境系統股份有限公司鵬博士電信傳媒集團股份有限公司盛達全球暢服(深圳)科技有限公司公誠管理咨詢有限公司金和平張福林張曉雪潘建初甄鑒張澤銳趙文博方虹珺周超輝孫東旺許志德鄧國峰王元月于景淇郭俊峰鞠昌斌任國斌楊彥超張學超唐巨光周洪聰周科翔蘭滿桔張勁松邵南軍侯興澤5一、智算中心產業發展背景及內涵 (一)智算中心產業發展背景 (二)智算中心產業內涵 二、全球智算產業步入快速發展新階段… (一)人工智能驅動智算規模擴張… (二)AI芯片技術迭代奠定智算基礎 (三)大模型加速人工智能與產業融合… 三、中國智算中心產業迎來黃金發展期 (一)新型基礎設施賦能數字經濟發展 (二)政策推動智算中心合理有序建設 (三)大模型應用深化行業數字化轉型 四、中國智算中心產業發展現狀 (一)智算中心市場規模持續擴大 (二)各類投資主體積極投建智算中心 (三)智算中心商業模式不斷演進… (四)產業發展持續踐行綠色低碳理念… 五、AI時代算力中心建設開啟新篇章 (一)人工智能發展對算力中心建設提出更高要求 (二)技術創新加速AI硬件國產替代 (三)高效網絡架構推動算網融合… (四)功率密度提升促進高效制冷實踐 (五)新型供配電系統重塑能源應用 六、智算中心運營服務向高效安全方向發展 (一)算力資源高效調度 (二)數據安全多重保障 (三)運維平臺智能可視 七、中國智算中心產業發展展望與倡議… (一)中國智算中心產業發展展望 (二)中國智算中心產業發展倡議… 附:中國智算中心典型項目案例 圖表1:中國智算中心產業鏈 圖表2:中國智算中心相關政策梳理 圖表3:2020-2028年中國智算中心市場規模及預測 圖表4:中國投運/在建/規劃智算中心項目區域分布 圖表5:中國智算中心項目主體分布(按項目數量)… 圖表6:中國智算中心項目主體分布(按算力規模)… 圖表7:智算中心建設主體類別及優劣勢 圖表8:智算中心商業模式類別 圖表9:智算中心總體架構 圖表10:AI芯片(GPU、FPGA、ASIC)主要特點 圖表11:主流高性能芯片特性對比 圖表12:InfiniBand和ROCE方案比較 圖表13:數據中心液冷技術方案對比 圖表14:中國高性能算力中心先進制冷方案應用案例 圖表15:算力資源調度與管理架構 人工智能作為引領未來的戰略性技術,逐步成為衡量國家國際競爭力的重要領域,高性能算力是人工智能發展的重要組成部分。從全球范圍看,各國紛紛制定人工智能相關的戰略和政策,推動高性能算力發展。如美國成立智算中心基礎設施特別工作組、歐盟出臺《歐洲高性能計算共同計劃》、日本發布《人工智能戰略2022》等。在當前復雜的國際競爭形勢下,發展人工智能產業,有利于在新一輪國際科技競爭中掌握主導權。我國高度重視人工智能發展,黨的十八大以來,不斷完善人工智能發展頂層設計。自2017年,國務院印發《新一代人工智能發展規劃》,明確堅持人工智能研發攻關、產品應用和產業培育"三位一體"推進,全面支撐科技、經濟、社會發展和國家安全,部署構筑我國人工智能發展的先發優勢,加快建設創新型國家和世界科技強國。到2024年,全國兩會政府工作報告強調人工智能在推動經濟社會發展中的重要作用,提出強化基礎研究、拓展應用領域、加強人才培養等,促進人工智能與實體經濟深度融合。國家在政策層面全方位推進人工智能產業發展。智算中心是人工智能發展的關鍵基礎設施,是帶動社會科技創新、經濟發展以及社會治理水平提升,賦能全產業鏈發展的重要力量。智算中心能夠為基礎研究和應用開發提供先進計算能力,同時加速5G、大數據等新一代信息技術的迭代發展;推動人工智能與各行業融合創新,推動制造、教育、金融、能源等9領域的數字化轉型,提升產業發展數字化智能化水平;促進人才培養和資源整合,加快地區人工智能產業集聚發展;助力智慧城市建設、公共安全保障和政務服務優化,提升社會治理水平。智算中心產業成為我國提升國際競爭力、建設創新型國家的重要支撐。自生成式人工智能問世以來,國內人工智能大模型快速發展。截至2024年11月,國家網信辦備案的生成式人工智能大模型已達到252個,通用大模型和垂類應用大模型訓練的智算算力需求迅速增加。目前,通用大模型和垂類應用大模型的已經逐步商用,開始賦能千行百業。未來,人工智能大模型與產業必將走向深度融合,產業智算算力需求將得到充分釋放。在人工智能快速發展的帶動下,智算中心產業投資迅速增加。截至2024年11月,全國已投運的智算中心項目近150個,在建及規劃建設的智算中心項目近400個。智算中心是基于人工智能計算架構,提供人工智能應用所需算力服務、數據服務和算法服務的算力基礎設施,融合高性能計算設備、高速網絡以及先進的軟件系統,為人工智能訓練和推理提供高效、穩定的計算環境。智算中心的主要功能包括:提供強大的計算能力:智算中心采用專門的AI算力硬件,如GPU、NPU、TPU等,以支持高效的AI計算任務。高效的數據處理:智算中心融合了高性能計算設備和高速網絡,能夠處理大規模的數據集和復雜的計算任務。支持多種AI應用:智算中心適用于計算機視覺、自然語言處理、機器學習狹義上,智算中心是通用算力中心的升級,在傳統機房的基礎上部署AI算力以提供服務。廣義地說,智算中心是提供人工智能應用所需算力服務、數據服務和算法服務的新型算力基礎設施,包含基礎層、平臺層和應用層。其中,基礎部分是支撐智算中心建設與應用的先進人工智能理論和計算架構;平臺部分圍繞智算中心算力生產、聚合、調度、釋放的作業邏輯展開;應用層提供算力生產供應、數據開放共享、智能生態建設和產業創新聚集。智算中心產業鏈涵蓋從AI芯片/服務器等設計制造、基礎設施建設,到智算服務提供,以及生成式大模型研發及基于大模型的行業應用。在上游環節,主要包括土建基礎設施和IT基礎架構的建設。土建基礎設施涵蓋土建施工、制冷系統、供配電系統和電信運營等,為智算中心提供穩定可靠的物理環境;IT基礎架構包括芯片設計制造、AI服務器、網絡設備、存儲設備和數據中心管理系統等,它們共同構成智算中心的計算、存儲和通信基礎。AI芯片作為智能算力的核心,技術壁壘高,在GPU、FPGA、TPU、NPU等細分領在中游環節,智算服務提供商、云服務供應商和IDC服務商等基于自身優勢,提供智算服務及運維解決方案。主流云服務供應商不僅自建大型智算中心,還加速布局AI大模型,以提供更高效、更智能的服務。IDC服務商也依托云網資源優勢參與智算建設,提供智算、超算、通算等多樣化的算力服務及一體化運維解決方案。部分云服務商與科技公司利用自身技術壁壘提供大模型及平臺服務,為下游用戶提供更加豐富、智能的算力服務。動駕駛、機器人、元宇宙、智慧醫療、文娛創作、智慧科研等相關產業發展。通過提供智能算力和算法,加速新技術的研發和商業化進程,推動產業創新進步。隨著各行業積極探索生成式人工智能應用創新點,大模型應用場景逐步拓展。在海外市場,大模型主要在傳媒、游戲、機器人、辦公等領域落地應用。國內市場大模型應用則主要聚焦于金融、醫療、傳媒、游戲、汽車等領域。全球智算產業步入快速發展新階段大模型參數量實現指數級增長,推理和訓練以海量數據為基礎,全球范圍內大模型應用推動數據量激增,數據類型和來源更加豐富。在數據量、大模型復雜算法以及應用場景的推動下,承載AI計算能力的智算中心進入快速擴張階段。國際科技巨頭微軟、谷歌、亞馬遜,國內互聯網企業阿里、騰訊、字節跳動,以及基礎電信運營商等,紛紛在全球多個區域建設智能計算中心以拓展AI云服務或滿足自身AI業務發展需求,其他各類主體也積極投資建設智算中心。2023年全球智能算力規模增速超過算力總規模增速,隨著技術的不斷進步和需求的持續擴大,智算中心建設加速推進,智能算力將繼續保持快速增長勢頭。高性能芯片技術快速迭代創新,為人工智能發展提供保障,進而帶動智算中心發展。Nvidia作為全球GPU算力芯片市場領導者,代表性產品V100、A100、H100技術指標處于領先水平,最新產品BlQckwellGPU采用先進的4納米工藝,提供高達20petaflops的FP4運算能力。其他科技巨頭如AMD、英特爾、微軟、亞馬遜和谷歌也在AI芯片領域展開競爭。同時,中國AI芯片國產化進程正加速發展,華為、寒武紀、海光信息、景嘉微以及阿里、百度等企業不僅在自研AI芯片技術上取得重要進展,還通過產品集成、行業解決方案及生態伙伴合作等方式推動國產AI芯片商業化應用,為智能算力發展提供堅實基礎。隨著人工智能技術的快速發展,以及人工智能與5G、物聯網、邊緣計算等技術的不斷融合,高性能芯片也將迎來技術創新的新高潮。生成式人工智能應用蓬勃發展。隨著AIGC技術不斷進步,大模型商業化應用場景從文生文、文生圖應用逐步擴展至音頻生成、視頻生成、多模態生成類,以及面向不同行業領域或用戶群體的工具類應用,如代碼生成、copilot、數字人、營銷工具、聊天助手等。通用大模型適用性廣,包括chatGPT、訊飛星火認業、基礎電信運營商、大型央國企等正加速推動垂類大模型研發落地。據測算,2024年全球生成式人工智能市場規模將達到400億美元,到2030年有望增長到1.5萬億美元,2022-2030年復合年增長率高達83%。未來AIGC將加速在更多場景商業化落地,如廣告、游戲、自媒體等內容創作領域以及金融、電迎來黃金發展期智算中心是基于最新人工智能理論,采用領先的人工智能計算架構,提供人工智能應用所需算力服務、數據服務和算法服務的新型算力基礎設施。智算中心以算力技術和算法模型為關鍵核心,算力技術以AI芯片、AI服務器、AI集群為載體,算法模型則以AI大模型為主要代表。智算中心在提供高效算力資源和服務的基礎上,聚焦區域產業創新發展。智算中心項目具有良好的社會經濟效益,對技術創新、產業發展的帶動作用明顯。根據國家信息中心數據,在智算中心實現80%應用水平的情況下,城市/地區在智算中心建設投入的增長量對創新產出的貢獻率約為14%17%;預計2020年至2030年我國人工智能核心產業規模的年均復合增長率達20.9%,帶動相關產業規模的年均復合增長率達25.9%政府高度重視智算中心建設,密集出臺相關政策。為推動智算中心有序發展,國家出臺多項政策統籌建設面向人工智能領域的算力和算法中心,打造智能算力、通用算法和開發平臺一體化的新型智能基礎設施。各地政府積極響應,紛紛發布相關政策加快智算中心產業發展。智算政策聚焦關鍵領域,如高端高效智能經濟、安全便捷智能社會建設等,著力打造人工智能重點應用場景,推動智算中心在關鍵領域的應用和普及,促進數字化轉型。2017年《新一代人工智能發展規劃》出臺,首次將智能計算中心提升到國家戰略層面,明確提出"建立人工智能超級計算中心"的戰略目標中心的發展奠定政策基礎。2020年,國家發改委將智能計算中心納入新型基礎設施建設范疇,激發各地智算中心投資熱情。在政策推動下,多地政府開始積極落地智能計算中心項目,智算中心進入快速擴張期。2022年"東數西算"工程實施以來,國家政策明確對全國算力資源進行統籌和智能調度,對智能計算中心發展的引導力度進一步加強。2024年9月,工信部等十一部門發布《關于推動新型信息基礎設施協調發展有關事項的通知》,強調逐步提升智能算力占比,東部發達地區先行先試、探索5G-A、人工智能等建設和應用新模式,西部地區在綜合成本優勢明顯地區合理布局重大算力設施,探索建設超大型人工智能訓練算力設施。圖表2:中國智算中心相關政策梳理2017.8國務院《新一代人工智能發展規劃》布局前沿基礎理論研究,建立新一代人工智能關鍵共性技術體系,統籌布局人工智能創新平臺,建立人工智能超級計算中心、大規模超級智能計算支撐環境2020.4國家發改委新聞施、融合基礎設施、創新基礎設施三個方面信息基礎設施包括以數據中心、智能計算中心為代表的算力基礎設施等。2021.1國務院《建設高標準市案》加大新型基礎設施投資力度,推動第五代移動通信、物聯網、工業互聯網等通信網絡基礎設施,人工智智能計算中心等算力基礎設施建設。2021.7工信部《新型數據中心發展三年行動計劃(2021-2023年)》加快提升算力算效水平。引導新型數據中心集約化高密化、智能化建設,穩步提高數據中心單體規模、單機架功率,加快高性能、智能計算中心部署,推動CPU、GPU等異構算力提升,逐步提高自主研發算力的部署比例,推進新型數據中心算力供應多元化,支撐各類智能應用。強化標準支撐引領。加快推進邊緣數據中心、智能計算中心等標準建設,支撐新技術新應用落地。2021.12全和信息化委員會《"十四五"國家信息化規劃》加強信息技術專利創新。圍繞大數據中心、智能計算中心等領域加強高價值專利培育。構建云網融合的新型算力設施。統籌建設面向區塊鏈和人工智能等的算力和算法中心。2021.12國務院《"十四五"數字經濟發展規劃》推動智能計算中心有序發展,打造智能算力、通用算法和開發平臺一體化的新型智能基礎設施,面向政務服務、智慧城市、智能制造、自動駕駛、語言智能等重點新興領域,提供體系化的人工智能服務。2022.1國務院《關于印發全國一體化政務大數據體系建設指南的通知》鼓勵各地區各部門推進數據基礎能力建設,積極構建數據安全存儲、數據存證、隱私計算等支撐體系,推動大數據挖掘分析、智能計算、數據安全與隱私保護等核心技術攻關。2022.8科技部、財《企業技術創新能力提升行動方案(2022-2023年)》推動國家超算中心,智能計算中心等面向企業提供低成本算力服務。2022.11國務院《關于數字經濟算力基礎設施達到世界領先水平。建成一批國家新一代人工智能公共算力開放創新平臺,以低成本算力服務支撐中小企業發展需求。2023.2國務院《數字中國建設整體布局規劃》系統優化算力基礎設施布局,促進東西部算力高效互補和協同聯動,引導通用數據中心、超算中心、智能計算中心、邊緣數據中心等合理梯次布局。2024.9工信部等十《關于推動新型信息基礎設施協調發展有關事項的通知》優化布局算力基礎設施,引導面向全國、區域提供服務的大型及超大型數據中心、智能計算中心、超算中心在樞紐節點部署。逐步提升智能算力占比。達地區先行先試、探索5G-A、人工智能等建設和應用新模式,西部地區在綜合成本優勢明顯地區合理布局重大算力設施,探索建設超大型人工智能訓練算力設施。信息來源:科智咨詢整理人工智能大模型在數量、類別、參數方面不斷發展,效率和能力不斷提升,為千行百業數字化轉型提供人工智能解決方案。截至2024年7月底,全國范圍內已有197個生成式人工智能服務完成備案,10億參數規模以上大模型數量已超100個。通用大模型任務處理能力不斷提升,文本理解和生成能力增強,圖像識別更加精準;行業大模型深耕專業場景,百度、騰訊、華為、京東、網易等企業已發布適用于特定領域的行業大模型,提高業務效率。在參數方面,大語言模型的參數規模已從億增長到千億,甚至達到萬億級別,模型的計算效率和性能也逐步提高,在推動經濟社會數字化轉型方面發揮重要作用。目前,人工智能大模型正在由開發階段步入行業應用階段,為金融、醫療、教育、制造、交通、能源等多個行業的數字化轉型提供了有力支撐。企業可利用大模型對數據進行深度挖掘,優化業務流程,提高運營效率。如制造業大模型可以用于生產線故障預測、生產計劃優化等,從而降低生產成本,提高生產效率。金融機構可利用大模型創新業務模式,制定金融產品開發策略,并為客戶提供分析和建議等。在教育、娛樂等領域,大模型可提供智能問答、個性化推薦等服務,滿足用戶需求。在需求推動下中國智算中心市場投資規模高速增長。2022年生成式人工智能大模型推向市場,在國內引起AIGC發展熱潮,大模型訓練對智能算力的需求迅速攀升。2023年起國內頭部互聯網企業及科技公司加速AIGC布局,政府也牽頭建設公共智能算力中心,賦能社會數字化轉型需求,全國智算中心投資火熱,智算中心市場規模大幅增長。2023年中國智算中心市場投資規模達879億,同比增長90%以上。預計2024年國產化芯片產能提升,智算算力供給瓶頸將逐漸緩解。未來,AI大模型應用場景不斷豐富,商用進程加快,智算中心市場增長動力逐漸由訓練切換至推理,市場進入平穩增長期,預計2028年中國智算中心市場投資規模有望達到2886億元。圖表3:2020-2028年中國智算中心市場規模及預測(億元)注:智算中心市場規模包含算力(AI服務器)、存儲+網絡設備、基礎設施(機房、風火水電等)、算法(軟件平臺、數據服務)領域的投資。截至2024年8月,中國智算中心項目超過300個,已公布算力規模超50萬PFlops從已投用、在建、規劃的智算中心項目來看,全國各省智算中心總計300余個,約三分之一智算中心項目規劃算力大于500PFlops,主要為政府或基礎電信運營商投建項目。2024年當年投運項目數量超過50個,60%以上為地方政府、國資平臺及電信運營商項目,總計新增算力規模約為2萬PFlops。在區域分布上,智算中心項目主要集中在東部地區。中國智算中心產業發展具有明顯區域特征,東部地區集聚大量高科技企業,"AI+行業"應用進程較快,為人工智能發展提供豐富的應用場景和數據資源,智算需求集中。同時,大模型訓練和推理通常涉及多卡構成的算力集群,集群節點之間網絡通信壓力大,出于算力高效性和維護便利性考慮,當前大量智算中心項目落地東部發達地區。截至2024年8月底,江蘇省智算中心項目數量最多,其次為廣東及山東省;京津冀、長三角及廣東省智算中心項目合計超過120個,占比超40%。圖表4:中國投運/在建/規劃智算中心項目區域分布(截至2024年8月)大模型與行業深入融合發展,AI推理需求將快速提升,帶動一線城市、區域經濟中心及周邊地區等智算中心部署。AI訓練需求對于網絡時延要求相對推理較低,在大規模部署階段將更加注重經濟性,將帶動基于AI訓練的智算中心項目落地成本更低的"東數西算"西部集群地區。同時,近兩年政策強調統籌算力資源布局,推動區域協同發展。2024年8月《工業和信息化部等十一部門關于推動新型信息基礎設施協調發展有關事項的通知》提出,東部發達地區先行先試、探索5G-A、人工智能等建設和應用新模式,中西部和東北地區加快千兆城市建設,實現5G、千兆光網均衡發展,西部地區在綜合成本優勢明顯地區合理布局重大算力設施,探索建設超大型人工智能訓練算力設施。長期來看,智算中心市場發展重心將逐漸向中西部經濟中心及東數西算集群地區轉移。根據智算中心項目數量統計,截至2024年8月,全國投運、在建及規劃的智算中心中,地方政府和基礎電信運營商主導建設的智算中心項目占比超過50%,互聯網及云廠商項目數量占比約為17.7%,地方政府及基礎電信運營商是智算中心主要參與方。各地方政府一方面響應國家戰略,優化算力資源配置,實現東西部算力資源的高效互補和協同聯動;另一方面,智算中心作為數字時代區域基礎設施的重要組成部分,能夠為區域技術創新、產業轉型升級和數字經濟發展提供重要支撐?;A電信運營商兼具網絡提供商與算力中心服務商雙重身份,"東數西算"工程啟動后,基礎電信運營加快建設智算中心,提供網絡及算力基礎設施支持。從業務發展層面看,電信運營商在傳統業務增長放緩的情況下加大在算力領域的布局,著力發展業務第二增長曲線。圖表5:中國智算中心項目主體分布(按項目數量,截至2024年8月)從智算中心算力規模來看,互聯網及云廠商在智算中心投資建設中占據重要地位??萍季揞^在人工智能計算中心的建設中扮演重要角色,許多大型科技公司如阿里巴巴和騰訊,都在人工智能計算中心投入大量的資源?;ヂ摼W及云廠商建設的智算中心規模較大,多為萬卡集群,智算中心具備大規模、可擴展性、綠色化等特征,滿足互聯網及云業務長遠發展需求。企業主體在智算中心建設中可以提供強大的資金、技術支持和市場應用,以及市場化的管理運營機制,相比于政府等國資平臺更注重效率和效益,有助于提高智算中心的運營效率和服務質量。截至2024年8月,全國投運、在建及規劃的智算中心中,互聯網及云廠商建設的智算中心規模占比超過30%,其次為基礎電信運營商,占比約為25.6%。圖表6:中國智算中心項目主體分布(按算力規模,截至2024年8月)不同主體的智算中心功能定位及布局訴求存在差異。政府主導建設的人工智能計算中心主要服務于地方人工智能大模型研發應用及相關領域數字化轉型,加速產業發展、城市治理、公共服務等各方面智能化進程,推動智慧醫療、智慧交通、金融科技、無人駕駛等各領域數智化水平?;A電信運營商投資建設的智算中心成為政府算力基礎設施的良好補充,承擔國家算力網絡建設任務的同時滿足自身算力需要及算力業務拓展需求。大型云廠商如騰訊云、阿里云、百度云等,具有完善的供應鏈資源、扎實的技術能力以及豐富的客戶資源,出于滿足集團AI發展需求及云業務拓展考慮,建設智算中心。此外,浪潮、協鑫等產業上游供應商,商湯等AI科創企業,理想、小鵬等下游應用企業等基于產圖表7:智算中心建設主體類別及優劣勢地方政府響應國家戰略,推動政策落地;促進區域產業發展優勢:政策、資金、產業園區客戶北京/上海/廣州/武漢/天津/重慶/長沙/南京/西安/成都/合肥等30多個城市劣勢:缺乏IT技術、供應鏈經驗、運營能力不足互聯網及云電信運營商滿足自身大模型訓練需求;拓展算力業務優勢:充足的資金、技術和客戶資源,豐富的軟件供應鏈資源,較成熟的云算力業務模式騰訊合肥智算中心/百度陽泉智算中心/阿里飛天云智能華東算力中心等;中國電信武清智算中心/中國聯通蕪湖智算中心/中國移動武漢智算中心等客戶形成競爭互斥第三方IDC尋求業務增長優勢:豐富的IDC機房資源,IDC一體化建設運營能力潤澤國際信息港A-11云博大數據深圳前海智算劣勢:缺乏IT供應鏈資源和算力服務器廠商/芯片渠道商縱向一體化優勢:AI芯片、服務器等硬件資源獲取能力協鑫智算(上海)中心浪潮新疆克拉瑪依智算劣勢:缺乏IDC供應鏈和機房建設運營能力AI企業、應用企業縱向一體化優勢:算法及相關軟件能力,客戶資源和應用場景積累商湯臨港AIDC理想汽車智算中心劣勢:缺乏AI芯片貨源、IDC資源跨界企業戰略轉型/發展新業務優勢:一般與芯片廠商、渠道商英博數科北京AI創新賦能中心威星智能貴安智算中心恒潤股份蕪湖智算中心劣勢:缺乏IDC資源和持續穩定現階段,智能算力在快速增長的同時存在供需匹配問題,部分智能算力資源利用率較低。規劃和實際需求之間存在差距,如算力架構設計不合理,或技術更新迭代后設備無法滿足新的計算要求,可能導致智算中心資源閑置。部分智算中心由于市場推廣不足或服務類型單一等,算力資源未能得到充分利用。智算需求具有場景多樣化、高度定制化特征,同時智算中心涵蓋從底層基礎設施到上層應用各個方面,衍生出多元化的智算中心服務體系。智算中心服務包括機房托管服務、算力租賃服務、AI平臺服務、模型定制服務及AI應用服務。圖表8:智算中心商業模式類別IQQS基礎設施機房托管服務在傳統數據中心機房托管基礎上,提供更高功耗、配電和網絡定制智算轉型的數據中心服務商、中立的智算中心服務商等頭部云商及AI公算力租賃服務以云服務形式租賃智能算力,按使用時間和規模收費云廠轉型的智算服務商、中立的智算中心服務商等IT公司、非連續需求的科研機構等PQQS平臺即服務AI平臺服務提供人工智能應用開發工頭部IT公司中小企業和開發者MQQS模型即服務模型定制服務模型定制、精調、部署等AI大模型全流程服務成熟的大模型供應商(具有AI大模型技術能力)中小垂直行業企業saQS軟件即服務AI應用服務直接應用于企業業務,提供人工智能分析、決策等服務具有AI能力的垂直行業頭部企業小型垂直行業企業機房托管服務與傳統數據中心服務模式類型相同,但需要面向智算的特點進行深度定制。例如,為了滿足AI訓練對高功耗、高密度計算的需求,智算中心的機房托管服務在功耗管理、配電系統、網絡架構等方面進行了優化升級。算力租賃服務是指通過云服務的形式,將算力以按需付費的方式提供給用戶,降低了算力使用的門檻和成本。這種服務模式不僅滿足了中小企業在研發、測試階段的算力需求,也為科研機構提供了靈活、高效的算力支持。AI平臺服務提供基于智算能力的PQQS(平臺即服務)服務,主要包括人工智能應用開發工具和平臺。這些工具和平臺通常包含了數據預處理、模型訓練、模型評估、模型部署等全生命周期的管理功能,幫助開發者快速構建、優化和部署AI應用。模型定制服務提供基于智算能力的MQQS(模型即服務)層服務,主要提供從模型定制、精調到部署的全方位服務,這種服務模式不僅提高了AI模型的準確性和效率,還為企業帶來了更大的商業價值。AI應用服務是基于智算能力的SQQS(軟件即服務)層服務,SQQS層直接應用于企業業務場景中,提供人工智能分析、決策等智能化服務,供應方通常為具有AI能力的垂直行業頭部企業,這類企業基于自身在特定領域的深厚積累和專機柜托管以及算力租賃服務是當前智算中心市場的主流商業模式。在產業發展初期,智算中心一般為算力用戶和傳統IDC客戶提供機柜托管服務。算力用戶的服務器由用戶自行解決,這類用戶多為云廠、AI企業、高?;蚩蒲袡C構,通常單次采購規模較小。占比35%左右,其它均為自用。在租賃的算力中,約80%被用于大型模型的訓練,約20%則用于小模型的訓練和推理任務。在區域分布上,60%的智算需求集中在北上廣深一線城市。智算算力租賃業務的興起一是由于短期內智算資源供給能力不足,特別是以GPU為代表的AI芯片的緊缺;二是自建智算中心投資規模大、運維能力要求較高,算力使用綜合成本高。大多數中小企業在發展AI模型和應用的過程中面臨算力瓶頸,算力租賃業務迎來發展機遇。從客戶群體來看,AI企業、行業應用企業、高??蒲袡C構、解決方案提供商發布的大模型數量多,但互聯網企業模型落地最快。AI企業以及高??蒲袡C構掌握AI算法技術,但極少擁有算力,通常以租賃算力為主;互聯網企業AI技術件廠商具有硬件終端解決方案和用戶數據,部分有智算設施。目前來看,AI企業和高??蒲袡C構是智算租賃市場的主要客戶群體,此外各行業頭部企業也可能成為重要的潛在客戶。算力租賃市場競爭較為激烈,存在上游芯片廠商、下游AI企業、地方政府、上市公司新進入者、云廠商五大力量。AI企業現階段集中力量開發大模型產品,市場給新進入者留下窗口期,芯片廠商、地方政智算領域,但相較之下,云廠商、AI企業擁有客戶、數據、MQQS業務,競爭力明顯強于地方政府與上市公司。隨著大模型競爭格局逐步明朗,云廠商將依托平臺、生態力量、規模效應全面拓展智算市場,小規模智算租企業將被收算力綠色化發展已成為我國數字經濟發展的重要課題。"雙碳"目標提出中心和5G等新型基礎設施綠色高質量發展實施方案》、《數據中心節能診斷服務指南(2023)》、《數據中心綠色低碳發展專項行動計劃》等進一步落實數據中心能效監管,對PUE等指標提出明確要求,推動產業綠色低碳發展。同時,東數西算工程的實施促進了西部地區的風能、太陽能等可再生能源的消納,通過優化算力基礎設施布局,提升算力中心綠色能源應用比例,實現能源的合理分配和利用。2023年度國家綠色數據中心名單重點新增智算中心領域,引導產業加快綠色智算中心建設。當前,我國智算中心逐步加強綠色節能技術應用,提升算力性能和能源利用效率。在綠色IT設備方面,通過部署整機柜服務器、冷板式液冷服務器等,降低服務器能源消耗。如深圳百旺信智算中心應用一體化芯片仿真設計整機柜服務器,實現單柜算力40PFlops,提升服務器使用效率,同時達到節能效果;中國電信京津冀智能算力中心冷板式液冷萬卡資源池全年PUE值為1.15,單位算力能耗為1.5KW/P。在綠色能源利用上,智算中心利用當地的綠電智算中心依托慶陽創新的"源網荷儲碳數"電力系統和新風自然冷卻技術,將PUE穩定控制在1.2以下。在智算中心運營上,采用高效間接蒸發離心式變頻水冷、封閉冷通道等先進制冷技術,實現智算中心散熱能耗降低50%以上。部分智算中心建立智能化管理平臺,實時監控機房運行狀態,精確控制制冷和供電系統,推動制冷耗電量下降8%15%,保障智算中心安全穩定與低碳運行。如中國電信安徽智算中心A1樓通過優化任務調度、負載均衡等技術,提高信息設備利用率。面對巨大耗電量,智算中心綠色化水平仍有較大提升空間。高性能服務器單位能耗遠高于傳統服務器,千億參數大模型訓練階段用電或超過百萬度。在政策指導下,智算中心產業繼續貫徹落實綠色低碳要求,統籌推進算力與電力融合發展,充分考慮與電力基礎設施的協同布局,加強能源需求側管理和供給側優化,夯實國家數字基礎設施,推動綠色算力發展。高度耦合是智算中心與傳統數據中心建設架構的根本區別。傳統數據中心在數據中心基礎設施、算力、網絡通信、存儲、軟件與平臺等環節可采用獨立采購建設的模式,各環節之間協同性較弱。智算中心主要業務場景要求高并行,單一訓練任務以整個算力集群為基礎,因此算力基礎層內部的設計和運行是高度耦合的,計算、存儲及網絡須緊密協同。在生產算力環節,IT規劃設計須綜合考慮算力用途、算力類型、算力規模,以架構的確定性應對各類異構算力需求,提升計算效率和靈活性。存儲與數據方面,存儲系統不僅要能夠處理PB級的數據量,還要在數據采集、清洗、訓練及推理的每個環節,都能提供高速、可靠的數據訪問。另外,通信網絡對智算集群的吞吐量和性能起關鍵作用,智算中心核心業務場景大模型訓練中的大規模參數對算力和顯存都提出了更高的要求,智算中心需要配套建設低時延、大帶寬、長期穩定性、大規模擴展性和可運維的高性能網絡。圖表9:智算中心總體架構信息來源:國家信息中心高密機柜對智算中心基礎設施整體布局規劃、供電、制冷、承重等帶來挑戰。高密部署導致IT機房面積占比大幅縮小,為支持多元算力的混合部署,應規劃好空間布局以容納不同冷卻技術和不同功率密度的算力設備。供電方面,高功率、大電流輸電損耗凸顯,對變壓器、母排、線纜等電力傳輸設備要求更高,可采用電力模塊替代變壓器、低壓配電、UPS、輸出配電等多個獨立的產品,或采用高壓直流方式提升輸配電效率。制冷方案選擇要綜合成本、PUE、可靠性等多方因素,風冷仍占據重要地位,液冷方案是未來主流方向。在承重方面,由于單機柜密度提升及制冷方案的變化,在設計智算中心時需要提高建筑承重負載,合理布局功能區域和設備,并考慮未來可能的擴展和設備更新。智算中心常見應用場景為訓練和推理,根據其對算力精度的需求的差異分為FP32、TF32、FP16、BF16、INT8等。進行智算中心算力規劃應根據具體的模型參數量,計算出訓練、推理場景對GPU顯存大小的需求;根據GPU單卡算力和卡間通信帶寬設計合理的并行方案,并用于芯片服務器的選型和集群網絡方案設計。AI芯片技術迭代速度快,遠超過基礎設施建設速度,智算中心算力規劃應充分考慮核心硬件設備技術更新,保持與時俱進,滿足實際應用需要。在滿足大規模計算集群的連接需求方面,智算中心網絡正迅速向十萬乃至數十萬卡互聯演進,參數面網絡的接入速率已從200GE提升至400GE乃至800GE。高性能網絡有利于保障集群智算節點間的通信效率,以滿足更高性能和更大規模的算力需求。低延時需求:RDMA技術通過繞過操作系統內核,讓一臺主機可以直接訪問另外一臺主機的內存,從而降低多機多卡間端到端通信時延。實現RDMA的方式有InfiniBand、ROCEv1、ROCEv2、iwARP四種,當前智算中心的RDMA技術主要采用的方案為InfiniBand和ROCEv2兩種。高帶寬需求:智算中心需要處理海量數據,網絡設備的吞吐能力、端口帶寬及密度需要全面提升,確保數據在訓練和推理過程中的快速傳輸。穩定性需求:大模型分布式訓練任務有可能需要數天或數周,網絡不穩定將會影響整個訓練任務的進度??蛇\維需求:在成百上千張GPU卡的智算集群中,網絡架構的復雜性、運維是否簡單穩定并且有足夠的工具來管理集群是需要重點考慮的維度。海量文件存儲系統需要具備幾方面的特點,一是要求彈性擴展,滿足存儲集群增加節點的需要,二是橫向擴展時合理的數據分布,三是擴縮容穩定性、易運維。在AI訓練過程中,高效的數據讀有利于提升整體訓練效率。大模型訓練的主要文件包括樣本文件、checkpoint文件、模型文件,整體數據量很大,對讀寫的要求也非常高。NPU/GPU直通存儲技術簡化CPU內存緩沖和復制過程,大幅縮短數據讀寫時間。在AI推理階段,面對高并發、長序列的推理場景,以KVCQche(鍵值緩存)為中心的多級緩存加速技術能夠優化數據訪問路徑,提升系統的整體性能和響應速度,從而更好地滿足大模型應用的需求。智能算力的核心是CPU、GPU、FPGA、ASIC等各類計算芯片。AI芯片內核數量多,擅長并行計算,滿足AI算法所需的大量并行處理能力,并顯著提升計算效率和靈活性。智算服務器CPU+GPU、CPU+FPGA、CPU+Asrc等異構形式,以充分發揮不同算力芯片在性能、成本和能耗上的優勢。圖表10:AI芯片(GPU、FPGA、ASIC)主要特點FPGAASIC定義圖形處理器,用于圖形渲染、并行計算、AI訓練和推理現場可編程門陣列,可編程邏輯解決方案,適用于快速原型設計和特定應用專用集成電路,為特定應用定制設計的芯片相對較高,尤其是高性能GPU耗優化能耗并行處理能力采用數量眾多的計算單元和超長流水線,具備高并行結構,通過多核并行計算支撐大算力需求具有高度實時性和靈活行和任務并行計算專為特定任務設計,高度并行化。靈活性和可拓展性靈活性較高,可通過軟件編程實現不同功能;可拓展性好,可通過多GPU擴展計算能力靈活性很高,可現場編程改變硬件邏輯;可拓展性好,可通過外部接口和其他系統組件連接靈活性低,制造完成后功能固定;可拓展性差可定制性通用性強,可通過軟件更新實現一定程度的定制;已有成熟產品線半定制化,可編程靈活度全定制化,完全根據特定應制造周期。成本取決于性能需求中等,取決于FPGA的規模和復雜度應用場景游戲、深度學習、數據加密貨幣挖礦、高性能計算、特定算法加速等NVIDIA、AMDxilinx、IntelGoogle、華為、寒武紀信息來源:科智咨詢整理在高端芯片限制不斷收緊的背景下,國產化芯片加速自主發展。AI服務器核心在于高性能芯片,參數規模、訓練數據隨著AI大模型的發展呈現指數級增長,相較于大量疊加服務器臺數,提升芯片性能同樣芯片領軍企業主要包括寒武紀、海光信息、景嘉微、華為海思等,寒武紀思元370芯片、昆侖芯科技昆侖二代AI芯片以及阿里平頭哥含光800芯片等在性能上進一步縮小與國際先進水平的差距,并在特定應用場景中展現出優勢;華為AI芯片異騰910在算力上和英偉達A100性能基本相當。整體而言國內AI芯片與海外龍頭企業產品仍存在較大差距,長期來看國產自研AI芯片有望逐步成為國內AI產業發展的重要支撐,有望圍繞產品形成算力、算法、應用一體化的開放生態。未來智算中心將集成更多的人工智能處理能力,推動技術融合與創新。圖表11:主流高性能芯片特性對比英偉達A100624TOPS@INT82TOPS/W312Ampere1935GB/S英偉達H1003958TOPS@INT81979Hopper3TB/SAMDMI100184.6TOPS@INT80.6TOPS/W184.6CDNA1.2TB/SAscend910512TOPS@INT82TOPS/W320HUAWEIDQVinci寒武紀思元370256TOPS@INT8MLuarch03614.4GB/S海光信息GPGPU1024GB/S百度昆侖昆侖2256TOPS@INT82.1TOPS/W128XPU-R平頭哥含光800825TOPS@INT8信息來源:科智咨詢整理目前國產化AI芯片仍處起步發展階段,在科學研究和產業應用方面具有廣闊的創新空間。下一代AI芯片開發需著力在以下方面獲得突破:架構創新,可重構芯片、存算一體、類腦智能等新興架構的研究突破有望提升芯片性能;感存算一體,在傳感器端開始對信號做初步處理,減少后端芯片的壓力;通過融合計算單元與存儲單元,減少數據訪問和搬運,顯著提升能效并降低功耗;新型存儲器,為了降低數據頻繁交換導致的延遲和功耗,以存儲為中心的計算架構逐漸興起,成為AI芯片的一大新興技術路線;復雜AI算子支持,探索能夠高效分解和映射TrQnsformer等復雜結構的芯片架構,實現算法與硬件的協同優化;稀疏化計算能力,利用神經網絡中的稀疏性,減少無效計算,優化功耗;云邊AI芯片協同,邊緣計算節省云端服務器帶寬和算力成本,帶來更多交互方式、更強的安全保護。提升智算中心算力利用率和集群可用度,需要構建超高速、超大規模的組網架構。超高速網絡技術通過提供更高的帶寬,減少網絡延遲,確保大規模集群中的數據傳輸更加高效。超大規模組網架構技術確保規模集群中的數據傳輸穩定性和可靠性,能夠實現十萬卡以上的超高速網絡互聯。當前智算中心的RDMA技術主要采用InfiniBand和ROCEV2協議。RDMA(RemoteDirectMemoryAccess,遠程直接內存訪問)是一種用于高性能網絡通信的技術,相比傳統的網絡通信方式,RDMA具有更低的延遲、更高的帶寬和更低的CPU利用率等優點,可顯著提高網絡通信的性能和效率。ROCE方案相較InfiniBand方案通用性更強,除用于構建高性能網絡外,還可以在傳統的以太網絡中使用,但在交換機的Headroom、PFC、ECN等相關參數的配置比較復雜,因此在萬卡以上的超大規模場景下ROCE網絡吞吐性能較InfiniBQn方案相對更弱。ROCE提供了一種成本效益高的解決方案,可以利用現有的以太網基礎設施,價格相對更低;InfiniBand性能突出,適合對網絡性能有極高要求的應用場景??傮w而言,智算中心網絡架構的選擇取決于具體的應用需求、預算和現有基礎設施。圖表12:InfiniBand和ROCE方案比較RoCE協議基礎獨立于以太網,專為高性能計算(HPC)環境設計基于以太網,ROCEv2版本支持跨VLAN和IP子網通信,克服了ROCEv1的局限提供更高的帶寬和更低的延遲,最高可達200Gbps提供低延遲和高吞吐量,但通常低于InfiniBand。ROCEv2的最大帶寬為100Gbps易用性和可擴展性通常需要專門的硬件支持,部署成本較高可以利用現有的網絡基礎設施,易于部署和擴展容錯性和可靠性使用星型拓撲結構和鏈路聚合,提供冗余路徑和高級的容錯機制提供多路徑技術和糾錯重傳機制,確保數據傳輸的可靠性硬件支持主要由MellQnox提供支持,提供全面的硬件和軟件解決方案有多家供應商提供支持ROCE的網絡適配器和交換機"東數西算"工程實施以來,國家政策持續推動全國一體化算力網絡建設。2023年12月發布的《國家發展改革委等部門關于深入實施"東數西算"工程加快構建全國一體化算力網的實施意見》指出,加快建設跨區域、多層次算力高速直連網絡,積極推進算網深度融合;建立跨區域算力資源調度機制,構建立體聯動的算力調度體系,促進東中西部算力資源實現供需平衡。為推動算網協同、加快全國一體化算力網絡建設,算力網絡建設需要做到彈性、敏捷、無損、安全、感知。算力網絡需具備彈性帶寬需求,適應不同計算場景的帶寬變化。具備泛在算力敏捷接入的能力,提升用戶的算力獲取效率。AI芯片性能提升帶動服務器及單機柜功耗大幅增加,液冷方案成為智算中心制冷更優選擇。傳統風冷系統的散熱效率無法與高功率機柜的散熱需求相匹配,一方面,受數據中心建筑面積與單位運營成本等因素的影響,數據中心單機柜功率密度將持續上升,在AIGC的推動下單機柜功率上升速度有望較預期更快。另一方面,風冷方式移熱速率較低,相對于風冷散熱,液冷能更好地支持20KW以上高密機柜冷卻,提高換熱效率,實現數據中心PUE低至1.2以下,符合機房高密度演進趨勢,同時促進數據中心減少碳排放。液冷技術類型根據冷卻液和發熱設備接觸換熱方式的不同,可劃分為冷板式液冷、浸沒式液冷和噴淋式液冷。相較于其他液冷技術路線,冷板式液冷應用更加普遍。據科智咨詢統計,冷板式液冷方案應用比例達到91%,是現階段及未來較長一段時間的主流液冷技術形式。2022年,冷板式數據中心市場規模達到90.5億元,同比增長45.4%.目前冷板式液冷數據中心已形成相對成熟的解決方案,通過冷板和CDU帶走IT設備超過80%的熱量;不需要對數據中心機房進行大規模改造;散熱效率高,可降低PUE至1.2以下;液體不與設備接觸,可靠性高、易展開維護性設計,噪音低,空間利用率高、且熱能可回收。與浸沒式液冷相比,熱交換受到冷板的限制,節能效果相對降低。但浸沒式液冷和噴淋式液冷直接接觸冷卻液,兼容性差,專用機柜對于管路要求高,維護復雜,且存在冷卻液揮發的問題,運行成本較高。圖表13:數據中心液冷技術方案對比接觸形式冷卻液不接觸發熱體,采用導熱板傳熱冷卻液浸泡發熱體冷卻液噴淋發熱體建設成本主要成本在換熱系統和式相比,成本高通過改造機柜增加必須裝置,成本較小服務器改造成本改造成本高運維成本運維成本低運維成本適中運維成本適中冷卻液冷卻液使用量大,對冷卻液安全性要求高冷卻液用量適中,要求高服務器兼容性根據服務器定制冷板,兼容所有機器兼容性測試根據冷卻液不同,需進行兼容性測試利用率噪音程度較低低較低環境影響無冷卻液相變過程可能會導致氣體蒸發外散冷卻液霧滴和氣體可能散發到機箱外冷卻效果較好優秀優秀使用場景無限制有限制應用程度目前應用最廣泛適用于對功率密度、節能性要求較高的大型數據中心不適合高密度服務器和超大規模數據中心,現階段落地應用相對較少主流曙光數創廣東合一液冷方案在算力中心的規?;瘧萌蕴幱诔跫夒A段,目前為小規模部署。經前期積淀,液冷產品及技術解決方案基本成型,但最終技術選型還需要經過一定周期的驗證和市場篩選。超算中心及部分頭部互聯網企業開展液冷試點應用,積極尋求技術驗證、產品適配等方面的生態協作,為液冷大規模商用提供寶貴經驗和良好的示范帶動作用,加速液冷產業發展。圖表14:中國高性能算力中心先進制冷方案應用案例(部分)天府智算西南算風冷項目使用42kw智算風冷算力倉,采用冷熱通道全密封+列間空調高溫進水模式,將冷熱氣流循環與外界環境進行隔離。相比傳統數據中心,進水溫度提高至18℃,制冷系統能效比提升10%以上。通過AI智能管控平臺實現制冷系統聯動調優,整體節能25%以上,風冷散熱PUE大幅降低。漢智算中心風冷+液冷采用風冷+液冷混合散熱方案,其中對主要發熱源CPU和內存進行液冷設計,解決服務器90%的散熱問題。在機房空調和冷板液冷技術雙重影響下,CPU核心的溫度低于常規風冷機型,保障CPU在低溫條件下實現超頻運行。廈門大學嘉實驗室智算數據中心風冷+液冷采用冷板式液冷系統+風冷列間空調的制冷系統架構,風液比80%,整系統按2N架構進行配置。PUE實時智能自動化調優,降低數據中心運行維護成本,實現節能減排。京東云華北(廊冷板式液冷整機柜冷板式液冷技術將室外冷源直接注入服務器主板芯片進行冷卻,達成系統去冷機化。CPU散熱由冷卻液通過室內板式換熱器換熱后,可直接利用室外冷卻塔進行散熱,實現全年運行PUE低于1.1,基礎設施能耗節省可達30%,對應碳排放總量減少10%以上。綠色智算中心浸沒式液冷芯片滿功耗平均核溫65±2℃,PUE≤1.1,在靈活擴容、模塊組裝、安全可靠的前提下,結合先進的溫控系統和管路布局等設計,有效解決服務器高熱流密度的散熱難題。在復雜環境和空間受限等非理想條件下實現全鏈路集成快速部署。浸沒式液冷通過嵌入式液冷單元,盲插總線架構,實現全場景PUE≤1.15,實現綠色低碳,可支持部署萬億參數大模型。信息來源:科智咨詢整理未來,隨著液冷技術的逐漸成熟,浸沒式冷卻帶來的液體泄漏風險和運維成本預計逐步降低,液冷系統的其他配套設施也有望因技術進步和規模生產推動成本進一步下降。全棧式液冷有望在更多的領域得到應用,從硬件到軟件,整個系統設計更加高效節能。企業和研究機構將積極開展長周期、大規模的液冷部署試驗,收集和分析實際運行數據以評估液冷技術的性能和可靠性,發現并解決潛在的問題和風險。更多行業標準的制定與落地帶動產業鏈有序發展,提升產業價值鏈地位。各設備和服務廠商正積極推動行業標準化,全力打造更開放的液冷生態。隨著機柜功率密度的增大,智算中心供電架構要求逐漸發生變化,智算中心的規劃建設將更加注重供電系統的容錯性、可靠性,確保系統正常運行。智算中心供配電架構設計需要統籌考慮相關設備的負荷容量、上下級開關保護配合、供電系統的檢修計劃、故障隔離等因素,并優化拓撲結構設計,配置完善的自動控制系統,提高系統可用性。采用更靈活可靠的電力架構提升供配電系統效率。一是一體化電源/電力模塊。傳統數據中心的供配電系統普遍采用分散式的結構,設備分散部署,占用面積大,線纜線路長、損耗大,后續的線纜檢修和系統擴容難度高。一體化電源或者電力模塊設備將中壓柜、變壓器、UPS、HVDC、饋電等預制集成交付,縮短供電鏈路和施工周期,使供電系統的供電效率提高約1%。二是直流供電模式。2NHVDC供電架構中,每臺高壓直流電源設備均可獨立承擔系統的全部負載,提供了最高級別的冗余和可靠性,相比傳統的交流電源系統通常具有更高的轉換效率和更低的能耗。10KV交流直轉240V直流供電架構中,移相變壓器柔性集成了10kv交流的配電,隔離變壓、模塊化整流器和輸出配電等環節,優化供電鏈路,系統容量可根據需求進行靈活配置。三是DR/RR供電架構。傳統數據中心主流的供電架構是2N架構,RR架構為N+1配置,可使智算中心供電系統的利用率從50%提升到N/(N+1),同時占地面積減少(N-1)/2N。DR架構中配電設備使用減少接近25%,電源設備成本低,但每套系統需要物理隔離,土建成本較DR架構高。在人工智能時代,智算中心供配電系統向融合、綠色、智能方向發展。超融合設計下的一體化電源縮短供電鏈路長度,集約高效、交付周期短,具有重要的應用和推廣價值。結合源網荷儲、AI調優、智能電網等技術,提升智算中心能源利用效率和新型電力系統需求側資源優化配置效率。通過源網荷儲一體化的方式,將新能源發電的不連續性和用電負荷的穩定性要求相匹配,提升綠電使用比例和系統運行效率。利用AI技術進行電力負荷預測、故障檢測和優化調度,結合先進AI算法實現對輸電線路的精準分析和故障預警,提升供配電系統管理的科學化與精細化水平,降低維護成本。智能電網技術有利于智算中心供配電系統與外部電網進行更為緊密的互動與協作,優化電力調度,提高電力使用效率和可靠性。六、智算中心運營服務向高效安全方向發展為高效利用各類計算資源,優化算力使用效率并降低成本,需要在算力集群中對計算資源進行分配和管理,即算力調度。算力調度以算力感知為基礎,感知并整合算力節點收集的算力資源信息,統一表達為包含計算、網絡、存儲等多維度資源的綜合模型,利用算網編排技術實現復雜算力業務的路徑編排,按需分配、實時調度不同區位、不同運營主體、不同架構的算力資源。算力交易平臺連接算力買方與賣方,根據用戶的差異化需求,實現智能、公平、開放、算力調度體系強調按需分配和靈活調度計算資源、存儲資源及網絡資源,并加強網絡安全管理。支持彈性分配以適應任務不同、變化多端的動態需求,加強算力、網絡和安全系統間的協同防御,利用人工智能提升安全技術手段與應急處置能力。為了提高資源利用率和系統性能,算力調度系統需要實現負載均衡,并利用虛擬化技術實現資源的隔離和共享。全國算力調度統籌全國不同地區算力,促進東西部算力資源高效配置,達成全國算力基礎設施化的目標。從算力調度的范圍來看,算力調度涉及區域內算力調度、跨區域算力調度、云邊端協同調度及算力和電力的協同調度。以城市算力網建設為基礎,繼而"連點成片"形成區域算力網,各區域算力網按照統一標準互聯互通,最終形成全國一體化的算力網體系,實現漸進式落地。圖表15:算力資源調度與管理架構智算中心是提供算力服務、數據服務和算法服務,推動人工智能產業發展的算力基礎設施,其安全可信環境的構建關乎個人權益、產業發展和社會運行。智算中心應全面推進數據安全技術應用,通過加密技術、匿名化技術等,加強數據安全保護和管理,實現對多種資源的全方位隔離與防護。利用深度包檢測(DPI)技術、數據丟失預防(DLP)等對網絡流量、行為日志、數據流轉、共享接口等安全監測分析。利用先進的人工智能和機器學習技術提高網絡安全防護系統的智能水平,實現智能化分析、防御、自主捕捉及未知風險應對,提供更加動態和前瞻性的安全保護。智算中心可通過建設內外部安全管理體系保障數據安全。在智算中心內部,加強網絡基礎設施的可靠性和高效性,同時積極利用數據安全技術如身份識別、數據加密、數據脫敏、數據流動管理等,以及數據服務與內容安全技術如數據交易技術管理、開放共享管理、人工智能深度防偽、數據內容合規等,提高智算中心從數據采集到算力應用層面的安全可靠。在外部層面,加強數據中心異地容災備份建設,利用分布的公有云,將新建IT系統和容災系統同時部署在云上,降低數據丟失風險,保障業務連續性和數據資產安全。通過實時監控及時發現和解決設備故障,確保智算中心不間斷平穩運行。運維監控需兼顧實時性和準確性兩大要素,若監控頻率過高,可能會對系統性能造成不利影響,反之,若監控間隔過長則可能導致關鍵事件的遺漏。智算中心運維監控與故障處理應更加高效,需要進行跨域故障感知和分析。通過對系統運行狀態的持續監測,監控智算中心計算、存儲、網絡、光模塊等設備的運行級網絡流量分析、存儲故障和性能分析等,迅速準確確定故障位置,從而縮短故障診斷時間,最大化防止訓練任務中斷。建立高效故障修復流程,發生故障時能夠立即采取相應措施恢復系統的穩定運行,縮短系統停機時間。根據實際需求定制化運維平臺配置,包括監控指標、報警規則、數據展示方式等,建立簡潔、直觀的界面,便于運維人員快速響應并處理問題。智能運維以數據為基礎,以算法為支撐,以場景為導向,為數據中心運維管理提供智能化解決方案,實時分析和處理問題。大型超大型智算中心承載的業務和數據量巨大,智能化運維體系的構建有利于提升智算中心運行的穩定性及動化運維工具通過平臺建設,將大量重復性的運維活動轉化為自動化操作,提高運維效率,增強運維過程的可視化智算中心智能化運維解決方案應具備如下特點。一是統一運維,提供智算中心一站式IT服務。二是數據驅動,聚合獨立的運維數據形成運維大數據,并結合AI分析能力,實現對智算中心運維態勢的分析及可視化,支持運維決策。三是全局可視化,提供從平臺層到底層硬件基礎設施的全棧監控可視化。四是自動化及智能化,提供自動化工具鏈,并對智算中心運行態勢進行智能化預測,形成故障應對機制,快速修復漏洞。五是安全合規,保障智算中心運維過程中的數據安全、隱私保護、合規管理等方面符合相關法規和標準,降低法律風險。智能運維方案的核心部分為智算中心基礎設施管理(DCIM)、數字化運維服務管理平臺(DOSM),并在此基礎上搭建精細化運維工作管理架構,提升智算中心智能化水平和運營效率。發展展望與倡議智算中心產業發展環境持續優化。政策推動新型智能基礎設施建設,以更好支撐社會經濟發展需求,包括AI軟硬件、智算服務、大模型應用在內的產業鏈各環節有望獲得更多政策支持。算電協同建設推進,新型電力系統與算力樞紐節點資源將進一步融合銜接,保障電力資源供給,促進算力綠色化高效運行。全國一體化算力網絡建設全面提速,為智算中心提供泛在連接、靈活高效的互聯網絡。AI應用規模落地激發智算需求增長。AI大模型商業化應用場景不斷拓展,前沿數字技術逐步轉向大規模行業應用階段,參數規??焖購膬|級突破至萬億級,產生大規模智算算力需求。近年來中國智算中心建設火熱,目前全國已有超過30個城市正在積極推進智算中心建設或規劃。未來隨著人工智能應用場景的持續創新和拓展,智算中心將更好賦能社會經濟發展。綜合的智算生態服務將成為主流模式。隨著AI技術的不斷演進與智算生態的日益成熟,智算中心各服務類型之間將實現更加緊密的協同與融合。綜合技術能力強的科技公司或具有IT基礎的智算中心集成方有望基于完善的智算中心生態,提供uIQas+paas+Maas+SQQS"的全棧式綜合智算生態服務。深度整合的服務模式不僅能夠提升服務效率和用戶體驗,也將促進技術創新與產業升級的良性循環。多元普惠的算力生態體系逐步構建。AI軟硬件協同性進一步提高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 促進學生自主管理的工作計劃
- (廣東二模)2025年廣東省高三高考模擬測試(二)歷史試卷(含答案)
- 深入分析注冊會計師考試內容試題與答案
- 證券從業資格證系統化學習試題及答案
- 2025年證券從業資格證考試內容解讀試題及答案
- 2025年注冊會計師考前心理調節試題及答案
- 2025年證券市場監管框架試題及答案
- 2024-2025學年高中語文課時精練6離騷含解析新人教版必修2
- 2025年注冊會計師考試探討試題及答案
- 企業經營風險識別的方法試題及答案
- 拳擊單招考試評分標準
- 15催收業務管理辦法
- 金融調控法律制度PPT課件
- 旅游管理專業考試題
- 混凝土格構梁護坡施工方案設計
- 航空航天概論(課堂PPT)
- 寧波明州生物質發電項目環境影響評價報告
- 高速鐵路橋梁救援疏散通道施工方案
- 蓄水池清洗方案
- 《惡臭污染物排放標準》(GB14554-93)
- 西南交通大學學報排模板
評論
0/150
提交評論