




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
金融算力基礎(chǔ)設(shè)施發(fā)展報(bào)告(2024)北京金融信息化研究所編委會翟象暉周夕崇黃程林編委會成員(排名不分先后,按姓氏拼音排序儲量董曉杰封銓賢蔣懷深王文志俞楓張樂賓張志鵬鄭金橋周慧編寫組成員(排名不分先后,按姓氏拼音排序郭偉安黃湘武李慧李侃侃李彥新李一昂劉文清劉楊蘇東明孫英明譚澤廷王愛玲王浩人王帥強(qiáng)張世澤趙義斌周輝主編單位:北京金融信息化研究所參編單位:中國農(nóng)業(yè)銀行股份有限公司中國銀行股份有限公司交通銀行股份有限公司中國郵政儲蓄銀行股份有限公司中信銀行股份有限公司平安銀行股份有限公司渤海銀行股份有限公司北京農(nóng)村商業(yè)銀行股份有限公司國泰君安證券股份有限公司萬國數(shù)據(jù)服務(wù)有限公司華為技術(shù)有限公司海光信息技術(shù)股份有限公司新華三技術(shù)有限公司北京中科仙絡(luò)智算科技股份有限公司版權(quán)聲明本報(bào)告版權(quán)屬于北京金融信息化研究所有限責(zé)任公司,并受法律保護(hù)。轉(zhuǎn)載、編摘或利用其他方式使用本報(bào)告文字或觀點(diǎn)的,應(yīng)注明來源。違反上述聲明者,將被追究相關(guān)法律責(zé)任。前言隨著金融行業(yè)數(shù)字化轉(zhuǎn)型加速,金融算力基礎(chǔ)設(shè)施作為支撐這一轉(zhuǎn)型的重要基石,正經(jīng)歷著前所未有的變革。本報(bào)告旨在全面梳理金融算力基礎(chǔ)設(shè)施的發(fā)展現(xiàn)狀,分析其在智算化變革、存算網(wǎng)融合、綠色低碳發(fā)展、產(chǎn)業(yè)鏈供應(yīng)鏈安全等方面的趨勢與挑戰(zhàn),并提出針對性的發(fā)展建議,以期為金融科技的可持續(xù)發(fā)展與金融業(yè)高質(zhì)量發(fā)展提供參考。一、總體情況 1(一)定義范疇 1(二)背景意義 1(三)發(fā)展概況 2二、智算變革加速金融機(jī)構(gòu)數(shù)智化轉(zhuǎn)型 7(一)AI應(yīng)用持續(xù)催生大規(guī)模智算需求 7(二)智算中心成為我國數(shù)字基建新熱點(diǎn) 8(三)金融業(yè)加快算力基礎(chǔ)設(shè)施智能轉(zhuǎn)型 9三、存算網(wǎng)協(xié)同構(gòu)筑一體化金融算力網(wǎng)絡(luò) (一)算力高效管理支撐算力資源高可用 (二)先進(jìn)存力應(yīng)用保障數(shù)據(jù)價(jià)值化基礎(chǔ) (三)網(wǎng)絡(luò)技術(shù)創(chuàng)新應(yīng)用促進(jìn)算力互聯(lián)互通 (四)存算網(wǎng)協(xié)同促進(jìn)算力基建一體化發(fā)展 四、節(jié)能降碳促進(jìn)金融算力中心綠色發(fā)展 (一)金融算力中心發(fā)展面臨嚴(yán)監(jiān)管約束 (二)新技術(shù)促進(jìn)綠色低碳算力中心發(fā)展 (三)有序推進(jìn)金融算力中心綠色化發(fā)展 五、信創(chuàng)提速增強(qiáng)金融算力產(chǎn)業(yè)鏈供應(yīng)鏈安全 (一)我國算力設(shè)施設(shè)備供應(yīng)形勢嚴(yán)峻 (二)國產(chǎn)算力產(chǎn)業(yè)生態(tài)持續(xù)優(yōu)化升級 (三)金融算力信創(chuàng)應(yīng)用加快探索與實(shí)踐 六、金融算力基礎(chǔ)設(shè)施發(fā)展建議 (一)加強(qiáng)金融算力建設(shè)統(tǒng)籌規(guī)劃 (二)強(qiáng)化金融算力關(guān)鍵技術(shù)攻關(guān) (三)引導(dǎo)金融業(yè)公共算力平臺建設(shè) (四)推進(jìn)金融算力基建標(biāo)準(zhǔn)化建設(shè) (五)營造金融算力開放發(fā)展生態(tài) 附錄:典型案例及解決方案 1一、總體情況算力是集信息計(jì)算力、網(wǎng)絡(luò)運(yùn)載力、數(shù)據(jù)存儲力于一體的新型生產(chǎn)力,主要通過算力基礎(chǔ)設(shè)施向社會提供服務(wù)。算力基礎(chǔ)設(shè)施是新型信息基礎(chǔ)設(shè)施的重要組成部分,呈現(xiàn)多元泛在、智能敏捷、安全可靠、綠色低碳等特征,對于助推產(chǎn)業(yè)轉(zhuǎn)型升級、賦能科技創(chuàng)新進(jìn)步、滿足人民美好生活需要和實(shí)現(xiàn)社會高效能治理具有重要意義1。金融算力基礎(chǔ)設(shè)施是指支持金融機(jī)構(gòu)進(jìn)行大量數(shù)據(jù)處理、分析以及決策支持的信息系統(tǒng)等。隨著金融科技及金融高質(zhì)量發(fā)展,金融業(yè)對高效能、高可靠性算力需求日益增加,同時對于綠色低碳的要求也越來越高,實(shí)現(xiàn)金融算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展勢在必行。1.發(fā)展新質(zhì)生產(chǎn)力的代表性力量。新質(zhì)生產(chǎn)力是以“自主創(chuàng)新”為內(nèi)核,具有高科技、高效能、高質(zhì)量特征的生產(chǎn)力形態(tài)。目前,算力已成為衡量一個國家或地區(qū)科技創(chuàng)新能力和經(jīng)濟(jì)實(shí)力的重要指標(biāo),算力基礎(chǔ)設(shè)施通過提供強(qiáng)大計(jì)算、存儲和網(wǎng)絡(luò)能力,為科技創(chuàng)新和產(chǎn)業(yè)升級提供了堅(jiān)實(shí)的基礎(chǔ)。一是算力基礎(chǔ)設(shè)施作為算力、存力、運(yùn)力等主要承載實(shí)體,有效支撐了大數(shù)據(jù)、人工智能等前沿技術(shù)研發(fā)和應(yīng)用;二是算力基礎(chǔ)設(shè)施智能化促進(jìn)了傳統(tǒng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型升級以及云計(jì)算、物聯(lián)網(wǎng)、區(qū)塊鏈等新興產(chǎn)業(yè)崛起和發(fā)展。三是算力基礎(chǔ)設(shè)施的發(fā)展帶動了芯片、服務(wù)器、存儲設(shè)備、網(wǎng)絡(luò)設(shè)備 1來源:工業(yè)和信息化部等六部門發(fā)布的《2等硬件設(shè)備以及軟件開發(fā)、系統(tǒng)集成、運(yùn)維服務(wù)等軟件和服務(wù)發(fā)展,促進(jìn)形成上下游協(xié)同的良好產(chǎn)業(yè)生態(tài)。2.賦能數(shù)字經(jīng)濟(jì)增長的核心引擎。數(shù)字經(jīng)濟(jì)是以數(shù)字化的知識和信息作為關(guān)鍵生產(chǎn)要素,以數(shù)字技術(shù)創(chuàng)新為核心驅(qū)動力,以現(xiàn)代信息網(wǎng)絡(luò)為重要載體,通過數(shù)字技術(shù)與實(shí)體經(jīng)濟(jì)深度融合,不斷提高傳統(tǒng)產(chǎn)業(yè)數(shù)字化、智能化水平,加速重構(gòu)經(jīng)濟(jì)發(fā)展與政府治理模式的新型經(jīng)濟(jì)形態(tài)。金融算力作為數(shù)字經(jīng)濟(jì)的重要組成,一是促進(jìn)了數(shù)字技術(shù)的研發(fā)與應(yīng)用,推動數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化進(jìn)程;二是為數(shù)字經(jīng)濟(jì)發(fā)展提供了高效、可靠的計(jì)算和存儲能力,支撐數(shù)字經(jīng)濟(jì)快速發(fā)展;三是通過算力基礎(chǔ)設(shè)施普及和應(yīng)用,降低數(shù)字技術(shù)使用門檻和成本,推動數(shù)字經(jīng)濟(jì)普惠化發(fā)展。3.支撐數(shù)字金融工作的重要底座。當(dāng)前數(shù)字金融已成為金融業(yè)的重要趨勢和發(fā)展方向。算力基礎(chǔ)設(shè)施為數(shù)字金融提供了強(qiáng)大的數(shù)據(jù)處理和計(jì)算能力支撐,保障金融業(yè)務(wù)的穩(wěn)定、高效運(yùn)行。一是為數(shù)字金融提供了海量數(shù)據(jù)的高效處理能力,如交易數(shù)據(jù)、用戶行為數(shù)據(jù)等,為金融風(fēng)控、客戶服務(wù)等提供有力技術(shù)支持。二是為數(shù)字金融所需的復(fù)雜計(jì)算和分析工作,如風(fēng)險(xiǎn)評估、信用評級等,提供強(qiáng)大的計(jì)算能力支撐。三是通過算力基礎(chǔ)設(shè)施的監(jiān)控和管理功能及時發(fā)現(xiàn)和處理金融系統(tǒng)異常情況保障金融系統(tǒng)的安全穩(wěn)定運(yùn)行,提供數(shù)據(jù)加密、訪問控制等安全機(jī)制保障金融數(shù)據(jù)的安全和隱私。1.金融算力總規(guī)模不斷擴(kuò)大。金融算力基礎(chǔ)設(shè)施作為金3融業(yè)數(shù)字化轉(zhuǎn)型的核心支撐,隨著數(shù)字經(jīng)濟(jì)時代加快到來,對算力尤其高頻交易、大數(shù)據(jù)分析、人工智能等關(guān)鍵領(lǐng)域算力需求不斷增長,以滿足金融機(jī)構(gòu)實(shí)時、高頻、智能、個性金融服務(wù)算力需求。在計(jì)算力方面,目前金融算力基礎(chǔ)設(shè)施浮點(diǎn)運(yùn)算能力已達(dá)到PFLOPS級別,部分領(lǐng)先金融機(jī)構(gòu)甚至開始部署EFLOPS級別的超級計(jì)算機(jī),以滿足日益增長的計(jì)算需求。《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計(jì)劃》(以下簡稱智能算力占比要達(dá)到35%,這需要金融行業(yè)在機(jī)架規(guī)模擴(kuò)大、上架率提升等方面做出努力。在存儲力方面,金融業(yè)需要處理數(shù)據(jù)量持續(xù)爆炸性增長,為滿足大數(shù)據(jù)、云計(jì)算等技術(shù)對存儲需求,金融算力基礎(chǔ)設(shè)施的存儲規(guī)模不斷擴(kuò)大,同時通過采用先進(jìn)的存儲技術(shù)和優(yōu)化存儲架構(gòu)使得金融算力基礎(chǔ)設(shè)施的存儲效率和可靠性也得到了顯著提升。在運(yùn)載力方面,新一代網(wǎng)絡(luò)建設(shè),包括5G、6G技術(shù)的應(yīng)用,以及SD-WAN、NFV等網(wǎng)絡(luò)虛擬化技術(shù)使用,大幅提升金融算力基礎(chǔ)設(shè)施的網(wǎng)絡(luò)傳輸速度和穩(wěn)定性,為金融業(yè)務(wù)提供更加可靠的網(wǎng)絡(luò)支持。在業(yè)務(wù)承載方面,隨著金融科技快速發(fā)展與升級,金融算力基礎(chǔ)設(shè)施不僅能夠支持傳統(tǒng)金融服務(wù),還能夠承載區(qū)塊鏈、數(shù)字貨幣等新興金融科技業(yè)務(wù)以及如智能投顧、量化交易等創(chuàng)新應(yīng)用,為金融業(yè)發(fā)展提供了強(qiáng)大的技術(shù)支持。總體而言,近年來金融算力基礎(chǔ)設(shè)施在總體算力規(guī)模、業(yè)務(wù)承載能力等方面均取得了顯著發(fā)展成果,同時通過采用先進(jìn)計(jì)算技術(shù)、優(yōu)化存儲解決方案、搭建高效網(wǎng)絡(luò)架構(gòu)以及引入人工4智能、機(jī)器學(xué)習(xí)等技術(shù),推動金融算力基礎(chǔ)設(shè)施整體效能不斷提升,為金融業(yè)創(chuàng)新發(fā)展提供有力支撐。展望未來,金融算力基礎(chǔ)設(shè)施將繼續(xù)擴(kuò)大規(guī)模、提升性能,為金融業(yè)數(shù)智化發(fā)展提供更強(qiáng)大動力。隨著技術(shù)進(jìn)步和市場需求擴(kuò)大,金融算力基礎(chǔ)設(shè)施也將為金融業(yè)帶來更多創(chuàng)新和可能性。2.金融算力大格局不斷優(yōu)化。金融算力基礎(chǔ)設(shè)施的布局對于確保金融服務(wù)的連續(xù)性、穩(wěn)定性和安全性起著至關(guān)重要作用。在數(shù)字化時代,金融機(jī)構(gòu)對于算力的需求不斷增長,促使金融機(jī)構(gòu)越來越重視算力基礎(chǔ)設(shè)施布局規(guī)劃。在建設(shè)方式方面,金融業(yè)主要采用自建、租用、自建與租用相結(jié)合等方式,其中大型金融機(jī)構(gòu)以自建為主,大中型金融機(jī)構(gòu)以自建與租用結(jié)合為主,中小型機(jī)構(gòu)以租用為主,云廠商等金融科技企業(yè)加快提供第三方算力租賃服務(wù),未來隨著分布式、大數(shù)據(jù)、AI等技術(shù)發(fā)展及算力需求大幅提升,租用方式將成為后續(xù)擴(kuò)展主要方式。在連續(xù)性和安全保障方面,為應(yīng)對潛在的自然災(zāi)害和技術(shù)故障,金融機(jī)構(gòu)普遍采取了“兩地三中活”布局以提高了業(yè)務(wù)的可用性和靈活性,此外“多活”布局也有一定程度發(fā)展,進(jìn)一步提高了業(yè)務(wù)的可用性和靈活性。據(jù)調(diào)研2,60%的金融機(jī)構(gòu)實(shí)現(xiàn)“兩地三中心”布局,20%的金融機(jī)構(gòu)采用了多地多中心布局,反映金融機(jī)構(gòu)普遍建成了有較高災(zāi)備能力的算力基礎(chǔ)設(shè)施。在地域分布方面,隨著國家東數(shù)西算工程推進(jìn),全國性金融機(jī)構(gòu)采取了以一線城市為主2數(shù)據(jù)來源:北京金融信息化研究所面向金融機(jī)構(gòu)組織的關(guān)于金融算力基5向二線城市及西部發(fā)展的整體布局策略,越來越多將算力中心布局或規(guī)劃布局至西部地區(qū),尤其大數(shù)據(jù)類、AI類應(yīng)用向西部遷移趨勢明顯,而區(qū)域性金融機(jī)構(gòu)算力中心則主要部署在本地區(qū)。展望未來,面向更加數(shù)字智能時代需要,金融算力基礎(chǔ)設(shè)施布局將繼續(xù)朝著更加靈活、高效和安全方向發(fā)展,更加重視綠色節(jié)能技術(shù)應(yīng)用,并加強(qiáng)與云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)融合,以適應(yīng)不斷變化市場需求和技術(shù)進(jìn)步。此外,金融算力基礎(chǔ)設(shè)施直接影響金融機(jī)構(gòu)未來金融服務(wù)的質(zhì)量和競爭力,其布局規(guī)劃不僅需要技術(shù)層面考量,也將上升至機(jī)構(gòu)戰(zhàn)略規(guī)劃層面,得到更高層級總體設(shè)計(jì)與資源支持。3.金融算力供需鏈不斷暢通。“算力即國力”,隨著國家競爭日益激烈,算力既成為衡量一個國家綜合實(shí)力的重要指標(biāo),也成為大國博弈焦點(diǎn)。例如2021年美國推出新版本《無盡前沿法案》即《2021年美國創(chuàng)新和競爭法案》,被稱為美版“核高基”十四五計(jì)劃;同年中國宣布“東數(shù)西算”工程;2022年日本政府計(jì)劃將云計(jì)算服務(wù)列為涉及國家安全的“特定重要物資”;此外美國頻頻出臺關(guān)稅、禁運(yùn)等政策對中國進(jìn)行算力核心部件的供應(yīng)限制,國際算力競爭范圍和力度持續(xù)加大。為此,近年來各國政府都在加大對算力的投入和支持力度,通過制定相關(guān)政策、建設(shè)算力基礎(chǔ)設(shè)施等方式推動算力產(chǎn)業(yè)快速發(fā)展。從需求端看,隨著人工智能尤其DeepSeek等大模型技術(shù)與產(chǎn)品逐步成熟,大模型加快從實(shí)驗(yàn)室走向產(chǎn)業(yè)端應(yīng)用,推動金融業(yè)算力需求爆發(fā)增長,為金融算力基礎(chǔ)設(shè)施建設(shè)提供了有力內(nèi)生驅(qū)動。數(shù)據(jù)顯示,被調(diào)研6金融機(jī)構(gòu)過去三年算力增長率平均約為44%,而部分算力薄弱機(jī)構(gòu)為縮小差距也計(jì)劃在未來實(shí)現(xiàn)超過100%算力增長,以應(yīng)對快速增長的業(yè)務(wù)需求。從供應(yīng)端看,國內(nèi)算力行業(yè)正迎來歷史性機(jī)遇,雖然高端AI算力芯片和服務(wù)器市場被國外巨頭壟斷,但隨著國內(nèi)企業(yè)在芯片設(shè)計(jì)、制造等領(lǐng)域不斷突破,國產(chǎn)算力產(chǎn)品正在逐步替代進(jìn)口產(chǎn)品,例如華為、寒武紀(jì)等企業(yè)在AI芯片領(lǐng)域取得顯著進(jìn)展,其產(chǎn)品性能逐漸接近國際領(lǐng)先水平;國內(nèi)數(shù)據(jù)中心和云計(jì)算服務(wù)商也加速布局,推動國產(chǎn)算力生態(tài)完善。從算力來源3看,當(dāng)前金融算力供給 仍以通用算力為主,但通用算力中CPU是主要的算力提供者,預(yù)計(jì)2030年會接近硅工藝極限,通過工藝提升帶來性能提升可能實(shí)現(xiàn)但帶來成本急劇上升,摩爾定律放緩,而面向人工智能需要的智算增長更迅猛,或超越通用算力成為金融算力主要來源和支撐,此外超算、量子計(jì)算、光子計(jì)算等算力在金融算力基礎(chǔ)設(shè)施中的應(yīng)用探索正處于起步階段但已展現(xiàn)巨大的潛力和價(jià)值,將為金融業(yè)帶來更多創(chuàng)新和變革。展望未來,在國際算力競爭激烈、算力供需兩旺、傳統(tǒng)與新興算力競相發(fā)展背景下,我國算力產(chǎn)業(yè)鏈、供應(yīng)鏈將仍將保持較快發(fā)展速度,加快夯實(shí)金融業(yè)算力基礎(chǔ)設(shè)施底座,為我國金融算力需要提供有力保障。為更深入和針對性探討我國金融算力基礎(chǔ)設(shè)施發(fā)展情況,結(jié)合以上分析和研判,下文將重點(diǎn)圍繞金融算力基礎(chǔ)設(shè)施建設(shè)的智能化、一體化、綠色化、信創(chuàng)化等四個趨勢分別展開論述,并提出針對性政策建議,供金融業(yè)參考。 3算力來源主要包括基礎(chǔ)通用算力、智能算力、超算算力等三類,以及量子7二、智算變革加速金融機(jī)構(gòu)數(shù)智化轉(zhuǎn)型隨著數(shù)字經(jīng)濟(jì)尤其人工智能時代的加快到來,金融業(yè)智能轉(zhuǎn)型趨勢明顯,發(fā)展智算成為金融業(yè)共識并獲得積極實(shí)踐。(一)AI應(yīng)用持續(xù)催生大規(guī)模智算需求隨著人工智能時代漸行漸近,生成式人工智能(AIGC)快速崛起帶來算力尤其是智算需求的迅猛增加,推動算力規(guī)模持續(xù)擴(kuò)張。據(jù)統(tǒng)計(jì)4,2024年,中國智能算力規(guī)模達(dá)725.3百億次/秒(EFLOPS同比增長74.1%,增幅是同期通用算未來,隨著AI技術(shù)的進(jìn)一步深化以及應(yīng)用場景的持續(xù)拓展,AI算力正不斷從互聯(lián)網(wǎng)領(lǐng)域向不同行業(yè)數(shù)字化轉(zhuǎn)型以及基礎(chǔ)研究等領(lǐng)域滲透,人工智能算力需求將持續(xù)攀升,預(yù)計(jì)2030年我國人工智能算力需求將達(dá)到16206EFLOPS,約是2018年的390倍5。《行動計(jì)劃》中也明確提到,到2025年算力規(guī)模超過300EFLOPS,智能算力占比達(dá)到35%。近年來,隨著大模型快速迭代尤其是DeepSeek的出現(xiàn),以及應(yīng)用場景的復(fù)雜多樣,大模型規(guī)模和需要學(xué)習(xí)數(shù)據(jù)呈現(xiàn)爆發(fā)式增長,算力需求逐步從TFLOPS增加到PFLOPS級別,甚至進(jìn)入EFLOPS級別,AI算力需求遠(yuǎn)超摩爾定律增長速度。而GPT-4參數(shù)量是GPT-3的500倍,算力需求將進(jìn)一步大幅增加;雖然DeepSeek模型通過動態(tài)路由機(jī)制和稀疏化設(shè)計(jì),4數(shù)據(jù)來源:國際數(shù)據(jù)公司(IDC)與浪潮信息聯(lián)合發(fā)布的《中國人工智能計(jì)算5數(shù)據(jù)來源:國家工業(yè)信息安全發(fā)展研究中心發(fā)布的《智能計(jì)算中心2.0時代展望報(bào)告》。8有效降低了算力消耗,但隨著其應(yīng)用的廣泛落地和用戶規(guī)模持續(xù)擴(kuò)大,將使得整體算力需求不降反升。此外,DeepSeek應(yīng)用的成功,將推動大模型在2C領(lǐng)域大規(guī)模落地并促進(jìn)2B領(lǐng)域不斷成熟,從聊天類應(yīng)用到智慧辦公類再到文生圖應(yīng)用,帶動推理算力需求爆發(fā)增長,持續(xù)增加智能算力消耗和需求。(二)智算中心成為我國數(shù)字基建新熱點(diǎn)政策支持方面,智算中心作為我國新型基礎(chǔ)設(shè)施的重要組成部分,近年來受到國家和地方政府的高度重視,相關(guān)支持政策不斷出臺。比如《“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》提出推動智能計(jì)算中心有序發(fā)展,打造智能算力、通用算法和開發(fā)平臺一體化的新型智能基礎(chǔ)設(shè)施;《“十四五”國家信息化規(guī)劃》強(qiáng)調(diào)統(tǒng)籌建設(shè)面向區(qū)塊鏈和人工智能等的算力和算法中心;工信部發(fā)布《新型數(shù)據(jù)中心發(fā)展三年行動計(jì)劃(2021—2023年)》,強(qiáng)調(diào)加快高性能、智能計(jì)算中心的部署,推進(jìn)智能計(jì)算中心標(biāo)準(zhǔn)建設(shè);國家信息中心發(fā)布《智能計(jì)算中心規(guī)劃建設(shè)指南》,明確智算中心作為新型公共算力基礎(chǔ)設(shè)施的重要性,強(qiáng)調(diào)其在推動AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化以及社會治理智能化中的關(guān)鍵作用。市場驅(qū)動方面,自ChaptGPT引發(fā)的新一輪人工智能技術(shù)突破以來,全球算力需求呈現(xiàn)井噴式增長,同時相比小模型,大模型需要大量AI芯片組成大集群進(jìn)行分布式并行訓(xùn)練計(jì)算,其快速應(yīng)用推動智算中心邁向萬卡集群時代,以更好支持大規(guī)模AI模型的訓(xùn)練與應(yīng)用。比如美國的谷歌、Meta、微軟、亞馬遜、特斯拉不斷擴(kuò)大其萬卡集群規(guī)模,提升智算能力;我國的騰訊、9字節(jié)跳動、三大運(yùn)營商等知名企業(yè)逐步建成萬卡集群,迎頭趕上萬卡集群算力發(fā)展步伐,為用戶提供一站式智算服務(wù);特別是大型金融機(jī)構(gòu),其集群規(guī)模需要上千張甚至上萬張加速卡、數(shù)百臺高性能計(jì)算設(shè)備。在政策與市場雙重驅(qū)動下,各地方政府、運(yùn)營商、金融機(jī)構(gòu)、互聯(lián)網(wǎng)企業(yè)等紛紛啟動智算中心建設(shè)。據(jù)工業(yè)和信息化部部長金壯龍表示,我國數(shù)據(jù)中心規(guī)模近五年年均增速達(dá)近30%。據(jù)統(tǒng)計(jì),截至2024年上僅2024年前七個月就涌現(xiàn)140個新中標(biāo)項(xiàng)目;截至5月底,全國規(guī)劃具有超萬張GPU集群的智算中心已有十多個。這些智算中心不僅覆蓋了北京、上海、南京等一線城市,還在鄭州、武漢等中部城市以及內(nèi)蒙古、寧夏等西部地區(qū)加速落地。(三)金融業(yè)加快算力基礎(chǔ)設(shè)施智能轉(zhuǎn)型在智算建設(shè)策略方面,金融機(jī)構(gòu)為保障安全合規(guī)多數(shù)采用了自建及私有化方式部署智算能力,據(jù)調(diào)研,85%的金融機(jī)構(gòu)采用自建智能算力的方式,不租用第三方資源,展現(xiàn)出對智能算力的重視。同時,根據(jù)各機(jī)構(gòu)自身實(shí)力和業(yè)務(wù)需求實(shí)際,在智能算力基礎(chǔ)設(shè)施建設(shè)上呈現(xiàn)明顯差異化策略。其中,大型金融機(jī)構(gòu)特別是國有銀行和跨國金融企業(yè),通常具備雄厚資金和技術(shù)實(shí)力,更傾向于選擇自建強(qiáng)大智能算力基礎(chǔ)設(shè)施:采用私有云或混合云架構(gòu),以確保數(shù)據(jù)的安全性和系統(tǒng)的穩(wěn)定性;投入大量資源建設(shè)專用的數(shù)據(jù)中心,確保高并發(fā)、低延遲的計(jì)算需求得到滿足;同時基礎(chǔ)設(shè)施在風(fēng)險(xiǎn)管理、合規(guī)性及業(yè)務(wù)連續(xù)性方面的設(shè)計(jì)也更穩(wěn)健和冗余。相比大型機(jī)構(gòu),中小金融機(jī)構(gòu)資源相對不足,在智能算力基礎(chǔ)設(shè)施建設(shè)方面投入有限,傾向于依賴第三方服務(wù)提供商的解決方案,借助云計(jì)算平臺快速部署所需計(jì)算資源,通過較低成本獲取先進(jìn)智能算力,同時縮短技術(shù)落地時間。在智算規(guī)模提升方面,隨著金融業(yè)數(shù)字化轉(zhuǎn)型邁向深水區(qū),作為數(shù)據(jù)與技術(shù)雙輪驅(qū)動的金融業(yè)日益依賴智能算力底座支撐,金融智能算力建設(shè)成為當(dāng)前熱點(diǎn),特別是近一兩年大模型在金融業(yè)快速應(yīng)用推動行業(yè)智能算力需求快速增長。據(jù)統(tǒng)計(jì)6,截至2023年末,200多家銀行總算力規(guī)模達(dá)到約4423PFLOPS,以CPU為代表的通用算力規(guī)模約約2492PFLOPS,以GPU、FPGA為代表的新型算力基礎(chǔ)設(shè)施算力規(guī)模約1931PFLOPS,同比增長2.36倍,新型算力規(guī)模占總算力規(guī)模的比重從2022年的18.05%增長至43.65%,遠(yuǎn)超《行動計(jì)劃》對2025年智能算力占比要求的35%水平。此外,據(jù)調(diào)研,有70%的金融機(jī)構(gòu)通過采購智能算力服務(wù)器來構(gòu)建集群,但金融機(jī)構(gòu)智能算力集群規(guī)模相對不足,最大規(guī)模均不足千卡,調(diào)研數(shù)據(jù)也顯示未來GPU采購需求超過1000TFLOPS的金融機(jī)構(gòu)占比超過了50%。在基礎(chǔ)設(shè)施智能化方面,隨著數(shù)字化轉(zhuǎn)型深入,金融算力基礎(chǔ)設(shè)施的運(yùn)維復(fù)雜度明顯上升,倒逼算力基礎(chǔ)設(shè)施運(yùn)維智能升級,比如建設(shè)運(yùn)維數(shù)據(jù)中臺、研發(fā)高效運(yùn)維工具、應(yīng)用人工智能等新技術(shù)來保障算力基礎(chǔ)設(shè)施安全可靠運(yùn)營,但智能水平仍待進(jìn)一步提升。根據(jù)調(diào)研顯示,有85%的金融機(jī)構(gòu)擁有專門的基礎(chǔ)設(shè)施運(yùn)維團(tuán)隊(duì),但多數(shù)機(jī)構(gòu)基礎(chǔ)設(shè)施存 6數(shù)據(jù)來源:北京金融科技產(chǎn)業(yè)聯(lián)盟《金融科技發(fā)展指數(shù)(FTDI)報(bào)運(yùn)維智能化不足(實(shí)現(xiàn)運(yùn)維智能化占比不足20%)等問題。三、存算網(wǎng)協(xié)同構(gòu)筑一體化金融算力網(wǎng)絡(luò)面向更高效、泛在、普惠、安全等金融算力應(yīng)用需要,支撐算力基礎(chǔ)設(shè)施的算力、存力、運(yùn)力等一體化融合進(jìn)程將加快,促進(jìn)東中西、云邊端、通智超量等多源異構(gòu)泛在算力融合成網(wǎng),提升金融算力有效性與可用性,加快滿足金融業(yè)智能化升級需要,并促進(jìn)不同區(qū)域和機(jī)構(gòu)公平普惠應(yīng)用算力。(一)算力高效管理支撐算力資源高可用目前,金融算力基礎(chǔ)設(shè)施多數(shù)通過私有化方式部署,由于算力類型多元、投入成本高昂、機(jī)構(gòu)實(shí)力懸殊等原因,導(dǎo)致金融業(yè)算力存在著可用性、易用性以及發(fā)展均衡性不足等問題,影響了算力資源的高效利用。據(jù)調(diào)研顯示,金融機(jī)構(gòu)數(shù)據(jù)中心服務(wù)器的平均CPU利用率在50%以下的機(jī)構(gòu)占比達(dá)87.88%,其中又有近四成機(jī)構(gòu)使用率在20%以下。針對上述問題,金融業(yè)主要通過算力資源池化、異構(gòu)并行、智能管理、云化服務(wù)等方式探索推進(jìn)算力高效利用。在資源池化方面,金融業(yè)積極探索算力資源虛擬化、容器化、池化、云原生混合部署等技術(shù)應(yīng)用,支持算力資源顆粒歸倉,促進(jìn)算力資源統(tǒng)一規(guī)劃和應(yīng)用,支撐算力資源利用效率提升。在異構(gòu)并行方面,加強(qiáng)多芯算力規(guī)劃部署,通過搭建“一元多芯”算力架構(gòu),促進(jìn)多元異構(gòu)算力的兼容和統(tǒng)一納管,進(jìn)一步提高算力資源可用性,打造更加多元靈活算力供應(yīng)格局。在智能管理方面,探索負(fù)載感知調(diào)度、訓(xùn)推一體化、跨集群調(diào)度等工具和機(jī)制,促進(jìn)算力資源在不同業(yè)務(wù)場景和時段的合理調(diào)配,并采用智能管理軟件進(jìn)行算力應(yīng)用資源智能畫像,提供更精確應(yīng)用資源需求描述,讓負(fù)載分布更合理。在云化服務(wù)方面,當(dāng)前金融云服務(wù)成為金融服務(wù)創(chuàng)新的重要支撐,隨著金融業(yè)務(wù)系統(tǒng)云化升級,金融算力基礎(chǔ)設(shè)施云化趨勢日益明顯,金融業(yè)積極探索通過微服務(wù)、云服務(wù)等方式以及采取多云策略,為金融服務(wù)提供更加易用和靈活的算力支撐。據(jù)調(diào)研,70%的金融機(jī)構(gòu)建立了覆蓋全業(yè)務(wù)系統(tǒng)的云平臺,且70%以上金融機(jī)構(gòu)采用了多云策略,有36.36%的金融機(jī)構(gòu)采用了多云管理軟件進(jìn)行多云管理。云服務(wù)基礎(chǔ)也加快夯實(shí),截至2023年末7,200余家銀行云納管物理服務(wù)器規(guī)模達(dá)41.87萬臺、云服務(wù)器規(guī)模達(dá)197.05萬節(jié)點(diǎn)、容器規(guī)模達(dá)284.18萬個,近五年云服務(wù)器和容器規(guī)模均保持40%以上增速。(二)先進(jìn)存力應(yīng)用保障數(shù)據(jù)價(jià)值化基礎(chǔ)數(shù)據(jù)存儲的數(shù)字基石作用日漸突出,金融業(yè)數(shù)據(jù)價(jià)值化保障對于高性能存儲需求不斷提升。在存儲需求方面,數(shù)據(jù)價(jià)值年全國數(shù)據(jù)生產(chǎn)總量達(dá)32.85ZB,但累計(jì)數(shù)據(jù)存儲總量為1.73ZB,占比不足3%,未來海量數(shù)據(jù)價(jià)值挖掘需求將帶來海量存儲需要。同時,隨著技術(shù)進(jìn)步及以DeepSeek等為代表的生成式人工智能應(yīng)用,對存儲尤其是高性能存儲需求顯著增加。據(jù)ReconAnalytics調(diào)查顯示,AI普及將推動未來數(shù)據(jù)生成爆炸式增長,到2028年存儲需求將至少翻一番;同時涉及AI數(shù)據(jù)安全的LLM檢查點(diǎn)與數(shù)據(jù)復(fù)制等保護(hù)措施也 7數(shù)據(jù)來源:北京金融科技產(chǎn)業(yè)聯(lián)盟《金融科技發(fā)展指數(shù)(FTDI)報(bào)告會進(jìn)一步助推數(shù)據(jù)存儲增長。從金融業(yè)看,根據(jù)調(diào)研,金融機(jī)構(gòu)存儲資源利用率超過60%的機(jī)構(gòu)占比接近50%,近三年存儲資源增速超過10%的機(jī)構(gòu)占比達(dá)81.82%,其中增速超過30%的機(jī)構(gòu)占比達(dá)24.24%;未來三年存儲資源計(jì)劃提升百分比超過20%的機(jī)構(gòu)占比接近70%,金融業(yè)存儲需求十分旺盛。在存儲性能提升方面,隨著技術(shù)進(jìn)步,傳統(tǒng)的數(shù)據(jù)存儲效率難以滿足數(shù)據(jù)應(yīng)用實(shí)時性需求、低效率的存儲設(shè)備無法匹配高要求的存儲場景要求等問題日益凸顯,而通過高能效、高可靠存力可實(shí)現(xiàn)“以存強(qiáng)算”“以存補(bǔ)算”,發(fā)展先進(jìn)存力日益迫切。以AI應(yīng)用為例,GPU算力發(fā)揮需要高性能存儲來高效提供數(shù)據(jù)并在整個過程中保持高利用率,存儲性能不足會導(dǎo)致GPU長時間處于空閑狀態(tài);Meta和斯坦福大學(xué)發(fā)布白皮書指出,在特定應(yīng)用場景中存儲消耗了整個服務(wù)器功耗的35%。在存儲產(chǎn)業(yè)實(shí)力方面,我國存儲產(chǎn)業(yè)水平不斷提升。從產(chǎn)業(yè)鏈看8,上游中我國企業(yè)研發(fā)的232層三維閃存芯片與美光同系列產(chǎn)品相當(dāng),代表業(yè)界最先進(jìn)水平,其中已有十幾家廠商自主研發(fā)的SSD主控芯片成功商用;中游的存儲整機(jī)和存儲系統(tǒng)整體技術(shù)達(dá)到國際領(lǐng)先水平,其中華為位居2023年全球企業(yè)級存儲設(shè)備市場第二位;下游的應(yīng)用與服務(wù)中國產(chǎn)品牌在國內(nèi)市場占比達(dá)85%,在全球市場占比達(dá)20%。在金融業(yè)存儲發(fā)展方面,當(dāng)前數(shù)字金融成為主流,實(shí)時交易、海量數(shù)據(jù)、持續(xù)創(chuàng)新的金融服務(wù)模式不斷催生具有金融業(yè)特點(diǎn)的存儲技術(shù)創(chuàng)新與應(yīng)用,實(shí)現(xiàn)金融業(yè)務(wù)與存儲產(chǎn)業(yè)的互相促進(jìn)、共同發(fā)展。比如存儲架構(gòu)形成集中式、分布式、超融 合等多元體系,確保傳統(tǒng)業(yè)務(wù)持續(xù)穩(wěn)定同時支持金融業(yè)務(wù)創(chuàng)新發(fā)展;存儲組網(wǎng)架構(gòu)衍生FC-SAN、iSCSI、NAS、RDMA等各類架構(gòu),以滿足不同金融業(yè)務(wù)場景需要;存儲介質(zhì)應(yīng)用從機(jī)械硬盤向固態(tài)硬盤等閃存技術(shù)發(fā)展,以響應(yīng)高頻交易、數(shù)據(jù)分析和快速檢索等要求更快訪問速度和低延遲的金融業(yè)務(wù)場景需要,據(jù)調(diào)研顯示,僅有不足10%的金融機(jī)構(gòu)采用純粹傳統(tǒng)磁盤存儲(HDD),采用傳統(tǒng)磁盤和固態(tài)硬盤混合的機(jī)構(gòu)占比57.58%,實(shí)現(xiàn)完全全閃存儲的機(jī)構(gòu)占比18.18%;存儲資源部署方面,存算資源逐步分離并建立獨(dú)立硬件資源池,以實(shí)現(xiàn)各類硬件靈活擴(kuò)展和應(yīng)用等。未來,金融業(yè)將繼續(xù)圍繞實(shí)時交易、AI推理等數(shù)據(jù)快速訪問,大數(shù)據(jù)分析、AI訓(xùn)練、跨域共享等數(shù)據(jù)分析共享,以及容災(zāi)備份、價(jià)值挖掘等數(shù)據(jù)安全保存,加快推進(jìn)先進(jìn)存儲技術(shù)與產(chǎn)品創(chuàng)新應(yīng)用,不斷夯實(shí)金融高質(zhì)量發(fā)展的數(shù)據(jù)存儲和價(jià)值轉(zhuǎn)化支撐。(三)網(wǎng)絡(luò)技術(shù)創(chuàng)新應(yīng)用促進(jìn)算力互聯(lián)互通隨著金融業(yè)務(wù)日益多元以及對人工智能、云計(jì)算、邊緣計(jì)算等技術(shù)應(yīng)用加速,數(shù)據(jù)中心向兩地多中心甚至多地多中心演變,云邊端算力服務(wù)需求加快涌現(xiàn),突破算內(nèi)網(wǎng)絡(luò)與算間網(wǎng)絡(luò)等技術(shù),提升算力高效運(yùn)載質(zhì)量,促進(jìn)算力資源的高速互聯(lián)顯得越發(fā)重要。在算力互聯(lián)需求方面,隨著金融業(yè)務(wù)日益復(fù)雜化、多元化,尤其金融服務(wù)向線上服務(wù)、24小時不間斷服務(wù)以及面向更多長尾或偏遠(yuǎn)地區(qū)客戶發(fā)展,線上金融場景向高頻市場交易、多元理財(cái)服務(wù)等領(lǐng)域拓展,推動?xùn)|中西、云邊端等各類算力加快融合與互聯(lián)互通,以滿足日益旺盛的底層算力需求。在算力互聯(lián)網(wǎng)絡(luò)需求方面,面向用戶高品質(zhì)入算、城市內(nèi)算力互聯(lián)、樞紐間算力互聯(lián)等算力互聯(lián)需求對網(wǎng)絡(luò)提出了新要求,如面向用戶入算需要便捷接入、安全可靠及靈活敏捷,面向算力互聯(lián)需要大容量、低時延及云邊協(xié)同,面向一體化算力調(diào)度需要算網(wǎng)協(xié)同及算力資源智能管理,超大帶寬、超低時延、安全可靠、泛在覆蓋、靈活敏捷、智能管控等成為算力網(wǎng)絡(luò)互聯(lián)創(chuàng)新的重要方向。在網(wǎng)絡(luò)技術(shù)創(chuàng)新重點(diǎn)方面,面向前述算力互聯(lián)需求,支持算力高效運(yùn)載互聯(lián)互通的網(wǎng)絡(luò)創(chuàng)新技術(shù)包括:提升算力中心基礎(chǔ)設(shè)施處理能力和數(shù)據(jù)傳輸能效比的高性能數(shù)據(jù)處理器(DPU)研發(fā),滿足數(shù)據(jù)中心內(nèi)部高效數(shù)據(jù)傳輸和低延遲交互需要的基于RoCE的智算網(wǎng)絡(luò)建設(shè),支持智算集群低功耗、高帶寬、低延遲需求的光交換組網(wǎng)關(guān)鍵技術(shù),支撐分布式智算中心間業(yè)務(wù)高可靠傳輸?shù)木W(wǎng)絡(luò)關(guān)鍵技術(shù)等。通過以上網(wǎng)絡(luò)技術(shù)攻關(guān)與創(chuàng)新發(fā)展,將有效支撐算力資源的高速互聯(lián)。在金融網(wǎng)絡(luò)創(chuàng)新發(fā)展方面,金融機(jī)構(gòu)普遍積極提升網(wǎng)絡(luò)承載能力,同時加強(qiáng)IPv6、SD-WAN及算力智能調(diào)度等網(wǎng)絡(luò)創(chuàng)新技術(shù)應(yīng)用,不斷夯實(shí)金融算力互聯(lián)互通網(wǎng)絡(luò)基礎(chǔ)。調(diào)研數(shù)據(jù)顯示,不足10%的金融機(jī)構(gòu)網(wǎng)絡(luò)帶寬超過40Gbps,30%的機(jī)構(gòu)網(wǎng)絡(luò)帶寬介于10—40Gbps,35%的機(jī)構(gòu)帶寬介于1—10Gbps,剩余機(jī)構(gòu)帶寬低于1Gbps;有85%的機(jī)構(gòu)支持超過10000個并發(fā)連接;金融機(jī)構(gòu)普遍應(yīng)用IPv6、SD-WAN等技術(shù),應(yīng)用機(jī)構(gòu)占比達(dá)70%及以上,其中SD-WAN部署完成度超過75%的機(jī)構(gòu)占比已過半;實(shí)現(xiàn)算力自動化調(diào)度的機(jī)構(gòu)占比超過30%,算力調(diào)度應(yīng)用場景集中于大數(shù)據(jù)處理、平滑業(yè)務(wù)峰值、AI訓(xùn)練、AI推理等領(lǐng)域。(四)存算網(wǎng)協(xié)同促進(jìn)算力基建一體化發(fā)展金融算力基礎(chǔ)設(shè)施涉及算力、存力、運(yùn)力三大支柱,要將算力打造成為“一點(diǎn)接入、即取即用”的社會級服務(wù),需要算力、存力與運(yùn)力協(xié)同發(fā)展并構(gòu)建一體化算力服務(wù)網(wǎng)絡(luò)。從存算網(wǎng)協(xié)同看,主要包括存算融合設(shè)計(jì)、存儲與網(wǎng)絡(luò)協(xié)同、算力與網(wǎng)絡(luò)融合等三方面協(xié)同。一是存算融合設(shè)計(jì),促進(jìn)存算合理配比,進(jìn)而提升算力效率。“存算比”是衡量一國或地區(qū)IT基礎(chǔ)設(shè)施效能的重要指標(biāo),據(jù)統(tǒng)計(jì)存算比每提高0.1個百分點(diǎn)就能帶來約5%的算力利用率提升。倪光南院士指出為提高算力利用率,需合理配置存力資源,目前美國存算比達(dá)1.11TB/GFlops,而中國僅為0.42TB/GFlops。二是存儲與網(wǎng)絡(luò)協(xié)同,實(shí)現(xiàn)存儲資源智能感知、編排與調(diào)度。隨著金融科技發(fā)展尤其人工智能應(yīng)用,存儲系統(tǒng)既要應(yīng)對海量數(shù)據(jù)、多模態(tài)數(shù)據(jù)等復(fù)雜數(shù)據(jù)處理需求,也要響應(yīng)和支撐云邊端等各類場景數(shù)據(jù)存儲與交互需要,推動存儲加快向分布式、云化、閃存化、智能化等方向發(fā)展,存儲類型多元化以及高性能要求對于通過存儲與網(wǎng)絡(luò)協(xié)同促進(jìn)存儲與算力等更好適配提出新需求,如跨域多算的存力調(diào)度、存網(wǎng)編排和存算網(wǎng)一體化系統(tǒng)等,以有效降成本、提性能和支撐業(yè)務(wù)。三是算力與網(wǎng)絡(luò)融合,實(shí)現(xiàn)算力資源的智能管理。隨著金融算力資源日益多源、異構(gòu)和泛在分布,如何動態(tài)高效管理算力資源越來越依賴高性能的網(wǎng)絡(luò)支撐。通過算力與網(wǎng)絡(luò)融合設(shè)計(jì),有助于提升算力資源動態(tài)感知能力,推動算力和網(wǎng)絡(luò)由網(wǎng)隨算動、算網(wǎng)融合走向算網(wǎng)一體,網(wǎng)絡(luò)也從支持連接算力演進(jìn)為感知算力、承載算力,實(shí)現(xiàn)網(wǎng)在算中、算在網(wǎng)中。四、節(jié)能降碳促進(jìn)金融算力中心綠色發(fā)展金融算力設(shè)施綠色化成為不可逆轉(zhuǎn)趨勢,嚴(yán)格監(jiān)管約束、新技術(shù)應(yīng)用、多元化策略將促進(jìn)算力中心綠色化量質(zhì)齊升。(一)金融算力中心發(fā)展面臨嚴(yán)監(jiān)管約束從能效現(xiàn)狀看,隨著數(shù)據(jù)中心及機(jī)架規(guī)模的快速增長,數(shù)據(jù)中心用電量急劇攀升,據(jù)統(tǒng)計(jì),2022年全國數(shù)據(jù)中心耗電量占全社會用電量約3%左右,預(yù)計(jì)到2025年提升至5%,人工智能將進(jìn)一步推升數(shù)據(jù)中心能耗,其應(yīng)用采用大量大功耗的高性能計(jì)算設(shè)備(如GPU、TPU會顯著增加能源消耗,并對供電系統(tǒng)也提出更高要求。金融數(shù)據(jù)中心能效管理水平方面仍需大力提升,據(jù)調(diào)研,金融機(jī)構(gòu)數(shù)據(jù)中心的能源使用效率(PUE)平均水平為1.56,其中最大PUE水平超過1.5為響應(yīng)和落實(shí)國家雙碳戰(zhàn)略,數(shù)據(jù)中心相關(guān)主管部門持續(xù)推動綠色數(shù)據(jù)中心建設(shè)。比如中國人民銀行《金融科技發(fā)展規(guī)劃(2022—2025年)》,提出積極應(yīng)用綠色節(jié)能技術(shù)和清潔可再生能源、加快綠色數(shù)據(jù)中心建設(shè)和改造、加強(qiáng)能耗數(shù)據(jù)監(jiān)測與管理等要求;對于新建大型、超大型數(shù)據(jù)中心電能利用效率PUE值要求不超過1.3,到2025年,數(shù)據(jù)中心電能利用效率PUE值普遍不超過1.5;國家發(fā)改委會同中國人民銀行等有關(guān)單位印發(fā)《綠色低碳轉(zhuǎn)型產(chǎn)業(yè)指導(dǎo)目錄(2024年版)》,提出引導(dǎo)數(shù)據(jù)中心綠色低碳轉(zhuǎn)型,推動信息基礎(chǔ)設(shè)施綠色升級;國家發(fā)展改革委等部門印發(fā)《數(shù)據(jù)中心綠色低碳發(fā)展專項(xiàng)行動計(jì)劃》,推動數(shù)據(jù)中心綠色低碳發(fā)展,加快節(jié)能降碳改造和用能設(shè)備更新,支持完成“十四五”能耗強(qiáng)度降低約束性指標(biāo)。從金融行業(yè)特性看,金融業(yè)對數(shù)據(jù)中心安全、可靠等方面有著極高要求,在降低數(shù)據(jù)中心能耗上面臨更大約束和挑戰(zhàn)。比如金融機(jī)構(gòu)數(shù)據(jù)中心建設(shè)遵循《金融業(yè)信息系統(tǒng)機(jī)房動力系統(tǒng)規(guī)范》(JR/T0131-2015部分條款要求高于國家標(biāo)準(zhǔn);由于強(qiáng)調(diào)安全,各級基礎(chǔ)設(shè)施須按容錯熱備運(yùn)行,負(fù)載率低,會導(dǎo)致PUE值、CUE值偏高;數(shù)據(jù)中心是金融機(jī)構(gòu)的“心臟”,其穩(wěn)定運(yùn)行事關(guān)國家金融安全,也就面臨著監(jiān)管部門極為嚴(yán)格的高可靠和高可用要求,導(dǎo)致金融機(jī)構(gòu)選擇綠色節(jié)能技術(shù)首要原則是高可用性、高可靠性而不是高資產(chǎn)回報(bào)率,一定程度限制了其產(chǎn)品選用范圍,更不能以犧牲安全為代價(jià)降低運(yùn)行成本。此外,老舊數(shù)據(jù)中心改造升級面臨挑戰(zhàn)。我國金融數(shù)據(jù)中心一般于2000年前后開始建設(shè),2012年前后隨著云計(jì)算技術(shù)快速應(yīng)用實(shí)現(xiàn)快速擴(kuò)張,但當(dāng)時國家對數(shù)據(jù)中心節(jié)能降碳及PUE值等指標(biāo)尚無明確要求,建設(shè)標(biāo)準(zhǔn)遠(yuǎn)達(dá)不到目前相關(guān)節(jié)能減排指標(biāo)要求。如《金融建筑電氣設(shè)計(jì)規(guī)范》(JGJ284-2012)中,對數(shù)據(jù)中心能耗要求PUE值中位數(shù)為2.0,推算CUE值接近1.16,遠(yuǎn)高于現(xiàn)在國家政策對老舊機(jī)房減碳要求閾值;早期數(shù)據(jù)中心使用時間長,功耗大,承擔(dān)核心生產(chǎn)業(yè)務(wù),且多數(shù)設(shè)計(jì)為傳統(tǒng)方案,在線翻新改造需將核心生產(chǎn)業(yè)務(wù)切換至災(zāi)備環(huán)境再進(jìn)行離線改造,面臨困難大且風(fēng)險(xiǎn)極高。(二)新技術(shù)促進(jìn)綠色低碳算力中心發(fā)展隨著新一輪科技革命的到來,算力基礎(chǔ)設(shè)施綠色化發(fā)展也迎來更多的創(chuàng)新技術(shù)手段支持,為金融數(shù)據(jù)中心節(jié)能減排提供有力支撐。在高效能源管理方面,通過引入可再生新能源、余熱回收、儲能調(diào)峰等技術(shù)或方案,促進(jìn)數(shù)據(jù)中心能源結(jié)構(gòu)優(yōu)化同時提升能源管理效率。比如光伏、風(fēng)能等綠色新能源在我國廣泛利用,數(shù)據(jù)中心應(yīng)用新能源不僅可以減少對化石能源的依賴,同時可降低電網(wǎng)負(fù)載壓力;余熱回收再利用技術(shù)可以將數(shù)據(jù)中心的IT設(shè)備等產(chǎn)生的熱能用于建筑供熱、生活熱水等,促進(jìn)降低碳排放,提高能源利用效率;儲能調(diào)峰技術(shù)通過利用水蓄能、冰蓄能或者蓄電池儲能等方式在電價(jià)谷時進(jìn)行儲能充電、峰時平時進(jìn)行放電,即可規(guī)避高峰期電力資源緊張局面,同時又可節(jié)約企業(yè)電費(fèi)。據(jù)調(diào)研,但使用可再生能源比例多在10%以下,發(fā)展空間依然廣闊。在液冷技術(shù)應(yīng)用方面,液冷技術(shù)加快成為金融數(shù)據(jù)中心進(jìn)一步節(jié)能降耗的關(guān)鍵。傳統(tǒng)風(fēng)冷和水冷系統(tǒng)架構(gòu)在單機(jī)柜功率超過15kW后,制冷能力短板明顯,隨著服務(wù)器功率和單機(jī)柜功率密度持續(xù)走高,液冷技術(shù)加快應(yīng)用于數(shù)據(jù)中心制冷。行業(yè)內(nèi)主要液冷系統(tǒng)大致分為非接觸式的板式液冷和接觸式的浸沒液冷,其中非接觸式的板式液冷因可操作性強(qiáng)、運(yùn)行穩(wěn)定且節(jié)能最低PUE可達(dá)1.1左右,在市場上應(yīng)用較其他液冷類型相對廣泛;浸沒式液冷是將服務(wù)器的發(fā)熱元器件完全浸沒在冷卻液中,通過冷卻液對流或相變將服務(wù)器的熱量帶走,冷卻液比熱可達(dá)空氣比熱的1000多倍,PUE最低可達(dá)到1.04左右。據(jù)調(diào)研,絕大部分金融機(jī)構(gòu)仍采用風(fēng)冷技術(shù),但有18.18%的機(jī)構(gòu)采用了風(fēng)冷與液冷混合的制冷系統(tǒng),液冷技術(shù)在金融算力中心得到初步應(yīng)用。在水資源管理方面,提升WUE成為金融數(shù)據(jù)中心關(guān)注的另一個熱點(diǎn)。多地市出臺了針對數(shù)據(jù)中心用水定額,如北京出臺數(shù)據(jù)中心用水定額DB11/T1764.11—2023,其中規(guī)定新建或改擴(kuò)建項(xiàng)目WUE應(yīng)低于1.4,既有數(shù)據(jù)中心WUE應(yīng)低于2.1;循環(huán)冷卻水處理技術(shù)加快在數(shù)據(jù)中心應(yīng)用,同時加大再生(中水)應(yīng)用、雨水回收利用力度,助力WUE提升。但據(jù)調(diào)研,金融機(jī)構(gòu)中多數(shù)表示將維持現(xiàn)有WUE值不做改善,僅有21.21%的機(jī)構(gòu)提出5%以下的WUE年度改善目標(biāo),金融機(jī)構(gòu)算力中心水資源管理空間依然較大。在綠色創(chuàng)新探索方面,通過在濱海城市建設(shè)海底算力中心實(shí)現(xiàn)“陸數(shù)海算”,促進(jìn)算力基礎(chǔ)設(shè)施綜合能效水平提升,比如海南陵水建設(shè)的全球首個商用UDC(海底數(shù)據(jù)中心)。該方案通過采用海水自然冷卻,降低數(shù)據(jù)中心能耗同時服務(wù)器設(shè)備故障率僅為陸地?cái)?shù)據(jù)中心的八分之一;通過與海洋潮汐能、風(fēng)能等可再生能源結(jié)合,實(shí)現(xiàn)新能源就近消納;主要數(shù)據(jù)用戶多位于濱海城市,可實(shí)現(xiàn)就近部署,降低數(shù)據(jù)傳輸時延等。(三)有序推進(jìn)金融算力中心綠色化發(fā)展目前,金融數(shù)字化轉(zhuǎn)型進(jìn)入全面深化階段,數(shù)據(jù)中心建造速度和規(guī)模進(jìn)入快速上升期,同時數(shù)據(jù)中心也加快從簡單建筑轉(zhuǎn)變成為復(fù)雜超融合綜合性算力基礎(chǔ)設(shè)施,這對金融數(shù)據(jù)中心綠色發(fā)展提出了更高要求。金融機(jī)構(gòu)加快推進(jìn)數(shù)據(jù)中心綠色低碳轉(zhuǎn)型,需要合理平衡安全與發(fā)展的關(guān)系,通過老舊數(shù)據(jù)中心改造、新型綠色數(shù)據(jù)中心合理規(guī)劃和設(shè)計(jì)等方式,切實(shí)提升金融數(shù)據(jù)中心的綠色節(jié)能水平。一是合理平衡數(shù)據(jù)中心建設(shè)的“不可能三角”。金融機(jī)構(gòu)數(shù)據(jù)中心由于起步早,主要是通過增加投入來獲得數(shù)據(jù)中心的安全穩(wěn)定。隨著國家全面落實(shí)“雙碳”目標(biāo),金融機(jī)構(gòu)數(shù)據(jù)中心需要在SLA高等級(高可靠、高可用)、PUE值低(低碳節(jié)能)、TCO低(成本低)這一“不可能三角”中做好平衡,以國標(biāo)A級數(shù)據(jù)中心標(biāo)準(zhǔn)為基線,確定合理的數(shù)據(jù)中心建設(shè)標(biāo)準(zhǔn),不盲目追求可用性、可靠性更高的Tier4等級。二是積極推進(jìn)老舊數(shù)據(jù)中心翻新改造。由于部分金融機(jī)構(gòu)存量數(shù)據(jù)中心建設(shè)較早,電能利用效率普遍在1.6—2.0左右,不同程度地存在機(jī)房設(shè)備空間布局不合理、制冷系統(tǒng)效率低、機(jī)房資源負(fù)載率及運(yùn)維管理效率不高等問題,節(jié)能減排空間較大。主要考慮提升數(shù)據(jù)中心的運(yùn)行、維護(hù)、保養(yǎng)等三方面的能力,其中運(yùn)行能力可推進(jìn)數(shù)據(jù)中心氣流組織優(yōu)化,并在日常運(yùn)行中調(diào)節(jié)節(jié)能設(shè)備的可變參數(shù),降低數(shù)據(jù)中心運(yùn)行能耗,降低PUE;維護(hù)能力可以提高空調(diào)、電氣設(shè)備等設(shè)備運(yùn)行健康度,提高設(shè)備冗余程度,充分發(fā)揮變頻優(yōu)勢,從而降低能耗;設(shè)備保養(yǎng)可通過及時保養(yǎng),提高空調(diào)蒸發(fā)器、冷凝器、末端表冷器、冷卻塔等換熱設(shè)備的換熱效率,保障設(shè)備充分換熱,避免能源浪費(fèi)。三是高標(biāo)準(zhǔn)推進(jìn)新型綠色數(shù)據(jù)中心規(guī)劃設(shè)計(jì)。區(qū)域布局方面,積極向綠電資源富集地區(qū)進(jìn)行多地多中心布局。按照國家“東數(shù)西算”戰(zhàn)略規(guī)劃,將對網(wǎng)絡(luò)傳輸時延要求高的數(shù)據(jù)中心建設(shè)在上海、北京等金融消費(fèi)一線城市,將離線分析、后臺計(jì)算、存儲備份類的非實(shí)時性數(shù)據(jù)中心的建設(shè)任務(wù)轉(zhuǎn)移到可再生能源豐富、土地充足、氣候適宜的西部地區(qū),就近消納西部綠色能源,緩解一線城市能耗指標(biāo)緊張、電力成本高等壓力,提高數(shù)據(jù)中心綠色發(fā)展水平。設(shè)計(jì)優(yōu)化方面,新建數(shù)據(jù)中心規(guī)劃設(shè)計(jì)既要對標(biāo)人民銀行、國家發(fā)改委等各主管部門與數(shù)據(jù)中心建設(shè)相關(guān)的政策與標(biāo)準(zhǔn)規(guī)范,確保符合監(jiān)管規(guī)范和要求,也要跟進(jìn)當(dāng)前主流和前沿綠色節(jié)能新技術(shù),從規(guī)劃選址、建筑節(jié)能、供電系統(tǒng)、冷卻系統(tǒng)、能源供給、水資源管理、智能運(yùn)維等各方面入手,做好新建數(shù)據(jù)中心規(guī)劃設(shè)計(jì),從源頭夯實(shí)數(shù)據(jù)中心綠色發(fā)展基礎(chǔ)。五、信創(chuàng)提速增強(qiáng)金融算力產(chǎn)業(yè)鏈供應(yīng)鏈安全作為新質(zhì)生產(chǎn)力的代表性力量,強(qiáng)化安全可信算力基礎(chǔ)軟硬件建設(shè),并通過算力產(chǎn)業(yè)鏈協(xié)同形成自主可控解決方案,保障供應(yīng)鏈安全,是保障金融安全、防范金融風(fēng)險(xiǎn)必要前提。(一)我國算力設(shè)施設(shè)備供應(yīng)形勢嚴(yán)峻從全球供應(yīng)格局看,我國算力基礎(chǔ)設(shè)施核心技術(shù)與器件外部依賴較為明顯。隨著人工智能和大數(shù)據(jù)技術(shù)飛速發(fā)展,以算力為代表的算力基礎(chǔ)設(shè)施需求加速涌現(xiàn),推動算力芯片等核心器件需求爆發(fā)式增長。其中,英偉達(dá)系列芯片以強(qiáng)算力、高通信帶寬和大HBM容量,成為行業(yè)的主導(dǎo)性廠商。以O(shè)penAI為代表的頭部企業(yè)長期依賴英偉達(dá)GPU,引來產(chǎn)業(yè)鏈的眾多追隨者效仿,形成了大模型技術(shù)和海外供應(yīng)鏈的深度綁定。我國金融業(yè)在AI探索應(yīng)用階段普遍基于英偉達(dá)生態(tài)體系,使用TensorFlow、PyTorch等主流深度學(xué)習(xí)框架以及英偉達(dá)芯片進(jìn)行模型訓(xùn)練,同時美國對華芯片出口管制升級,臺積電、三星等算力芯片核心供應(yīng)企業(yè)加入其中,使得我國在高端算力芯片供應(yīng)上面臨巨大壓力。據(jù)調(diào)研顯示,采用了英偉達(dá)AI加速卡的金融機(jī)構(gòu)占比接近70%,國外算力占智算比重超過75%的金融機(jī)構(gòu)占比達(dá)45.45%,采用TensorFlow、PyTorch等人工智能算法開發(fā)框架的金融機(jī)構(gòu)占比達(dá)72.73%,智算平臺采用英偉達(dá)CUDA生態(tài)的金融機(jī)構(gòu)占比達(dá)63.64%,從算力芯片到算法及工具生態(tài)等均對外依賴明顯。從國產(chǎn)供給看,金融業(yè)算力性能要求提升或進(jìn)一步凸顯國產(chǎn)算力供應(yīng)短板。隨著金融業(yè)高質(zhì)量發(fā)展以及大模型技術(shù)發(fā)展更加成熟,疊加DeepSeek對大模型產(chǎn)業(yè)生態(tài)的沖擊,金融業(yè)對算力需求加快從單純追求“量的擴(kuò)張”轉(zhuǎn)變?yōu)樽⒅厮懔Φ馁|(zhì)量與效率。金融機(jī)構(gòu)不僅需要強(qiáng)大的計(jì)算能力,更需要高效、穩(wěn)定且安全的算力支持,以滿足復(fù)雜業(yè)務(wù)場景和快速迭代的需求。但從國產(chǎn)算力產(chǎn)業(yè)鏈的需求適配看,仍存在不少難題亟待解決:國產(chǎn)算力芯片在制程和性能上與國際先進(jìn)水平存在差距,硬件開發(fā)周期長,復(fù)雜性和試錯成本高;算力產(chǎn)業(yè)鏈的上游、中游和下游發(fā)展不同步,產(chǎn)業(yè)發(fā)展碎片化現(xiàn)象明顯;我國對芯片、軟件、整機(jī)、系統(tǒng)和行業(yè)應(yīng)用等層面雖有布局,但關(guān)鍵環(huán)節(jié)骨干企業(yè)規(guī)模小而分散;算力基礎(chǔ)設(shè)施部分領(lǐng)域的產(chǎn)業(yè)標(biāo)準(zhǔn)尚不明確,產(chǎn)品融合適配有障礙。此外,面對前期積累的海外算力產(chǎn)品及技術(shù)架構(gòu),在打造自主可控AI算力技術(shù)體系中,如何將模型快速平穩(wěn)地遷移至國產(chǎn)基礎(chǔ)設(shè)施之上,讓業(yè)務(wù)層無感知,不影響業(yè)務(wù)效果,也是國產(chǎn)算力應(yīng)用不容忽視的問題和挑戰(zhàn)。(二)國產(chǎn)算力產(chǎn)業(yè)生態(tài)持續(xù)優(yōu)化升級近年來,在政策與技術(shù)的雙重驅(qū)動下國產(chǎn)算力產(chǎn)業(yè)穩(wěn)健發(fā)展,生態(tài)加快優(yōu)化,和經(jīng)濟(jì)發(fā)展形成效能放大、疊加、倍增的正反饋。整體看,在《行動計(jì)劃》等頂層設(shè)計(jì)指引下,以京津冀、長三角、粵港澳大灣區(qū)等國家戰(zhàn)略區(qū)域?yàn)橐I(lǐng),各地政府持續(xù)加強(qiáng)算力資源集聚,推動算力產(chǎn)業(yè)鏈條完善,形成了積極向上、蓬勃發(fā)展的算力產(chǎn)業(yè)生態(tài)。截至2024年9家、高新技術(shù)企業(yè)2.7萬家。各環(huán)節(jié)看,我國算力產(chǎn)業(yè)鏈主要環(huán)節(jié)加快創(chuàng)新驅(qū)動,如計(jì)算芯片、計(jì)算系統(tǒng)、計(jì)算軟件等環(huán)節(jié)相繼取得突破,CPU與GPU異構(gòu)計(jì)算技術(shù)基本成熟;存儲設(shè)備的數(shù)據(jù)I/O速度、低時延、高可靠等核心性能不斷提升,在分布式存儲等細(xì)分市場表現(xiàn)優(yōu)于國外廠商;溫控設(shè)備、電源設(shè)備等規(guī)模提升較快,氟泵、模塊化、液冷等綠色節(jié)能技術(shù)完成試點(diǎn)應(yīng)用,進(jìn)入深化推廣階段;國產(chǎn)芯片制造能力持續(xù)加強(qiáng),逐步補(bǔ)齊產(chǎn)業(yè)短板等等。重點(diǎn)突破看,DeepSeek的發(fā)布打破了大模型領(lǐng)域“越強(qiáng)越貴”成本詛咒,實(shí)現(xiàn)算力優(yōu)化,顯著降低訓(xùn)練和推理成本,催生海量算力需求。國產(chǎn)算力產(chǎn)業(yè)迎來技術(shù)驗(yàn)證和商業(yè)化落地新契機(jī),全產(chǎn)業(yè)積極投入DeepSeek系列模型適配,近期國產(chǎn)算力適配競賽展示出國產(chǎn)算力產(chǎn)業(yè)鏈技術(shù)積累,將加速“國產(chǎn)算力+國產(chǎn)大模型”閉環(huán)生態(tài)構(gòu)建,為金融算力信創(chuàng)與安全發(fā)展夯實(shí)產(chǎn)業(yè)基礎(chǔ)。(三)金融算力信創(chuàng)應(yīng)用加快探索與實(shí)踐《行動計(jì)劃》提出,加快算力在金融領(lǐng)域的創(chuàng)新應(yīng)用,為金融業(yè)務(wù)發(fā)展提供更為精準(zhǔn)、高效的算力支持。為支持業(yè)務(wù)發(fā)展、保障供應(yīng)鏈安全可持續(xù),金融業(yè)各方積極開展算力信創(chuàng)測試、適配、遷移以及產(chǎn)業(yè)鏈上下游協(xié)同與生態(tài)優(yōu)化,推動金融算力信創(chuàng)工作邁上新臺階。當(dāng)前國內(nèi)不少金融機(jī)構(gòu)正有序開展國產(chǎn)算力產(chǎn)品應(yīng)用測試、適配驗(yàn)證乃至落地實(shí)踐等工作,積極為算力資源替代、智算擴(kuò)容或算力底座平移做準(zhǔn)備,同時與供給端協(xié)同發(fā)力并探索構(gòu)建自主可控算力生態(tài)。據(jù)調(diào)研顯示,有39.39%的金融機(jī)構(gòu)采用如華為昇海光信息等國產(chǎn)智算芯片。具體應(yīng)用領(lǐng)域看,算力芯片方面,CPU基本采用C86+ARM雙技術(shù)路線,處理器性能已基本追平國際一流產(chǎn)品,X86生態(tài)向C86生態(tài)和ARM生態(tài)的快速遷移能力成為金融用戶重點(diǎn)考量要素;GPUAI芯片初步形成GPGPU+DSA雙技術(shù)路線,金融業(yè)開始嘗試國產(chǎn)芯片替代國外芯片,芯片總體性能、CUDA生態(tài)的兼容或快速遷移能力納入金融AI應(yīng)用人員的關(guān)注點(diǎn)。云計(jì)算方面,部分金融機(jī)構(gòu)構(gòu)建了自主可控的云平臺,并通過虛擬化和容器技術(shù),實(shí)現(xiàn)資源動態(tài)調(diào)配和按需擴(kuò)展;國產(chǎn)云平臺和DevOps工具鏈的結(jié)合,實(shí)現(xiàn)從開發(fā)到運(yùn)維的全流程自主管理。AI計(jì)算方面,金融機(jī)構(gòu)通過“一云多芯”架構(gòu)整合ARM、x86、GPU、DPU等多類型算力資源;利用國產(chǎn)操作系統(tǒng)和算力池化技術(shù),構(gòu)建異構(gòu)算力資源的靈活調(diào)配和高效利用;通過國產(chǎn)算力平臺,實(shí)現(xiàn)算力跨區(qū)域調(diào)度和標(biāo)準(zhǔn)化接入;實(shí)現(xiàn)華為、寒武紀(jì)等異構(gòu)算力混合部署、統(tǒng)一調(diào)度,支持4000以上并發(fā)查詢。量子計(jì)算方面,金融機(jī)構(gòu)正在研究后量子密碼來應(yīng)對量子計(jì)算帶來的安全挑戰(zhàn),并探索利用量子密鑰分發(fā)技術(shù)提高數(shù)據(jù)傳輸?shù)陌踩裕缃ㄐ沤鹂埔殉晒ρ邪l(fā)“量子投資組合優(yōu)化算法”和“量子貝葉斯網(wǎng)絡(luò)算法”,并在金融場景中落地應(yīng)用;行業(yè)性的“金融量子云實(shí)驗(yàn)平臺”上線,平臺封裝了常用的量子算法庫函數(shù)并持續(xù)擴(kuò)展量子金融算法模塊,打通量子金融領(lǐng)域的應(yīng)用、平臺、算力層次,實(shí)現(xiàn)量子真機(jī)算力和模擬算力的云化提供。此外,隨著我國完全自主知識產(chǎn)權(quán)的DeepSeek大模型快速推廣應(yīng)用,在推動各行業(yè)智能化轉(zhuǎn)型同時也將帶來整體算力需求的增長,進(jìn)一步推動我國算力硬件廠商、云服務(wù)商、大模型廠商等合作,推動我國算力產(chǎn)業(yè)鏈協(xié)同、高效發(fā)展,為金融業(yè)提供更優(yōu)算力解決方案。未來,金融業(yè)將持續(xù)推進(jìn)國產(chǎn)智能算力產(chǎn)品、高性能AI存儲以及高通量網(wǎng)絡(luò)設(shè)備的規(guī)模化應(yīng)用和替代,為金融高質(zhì)量發(fā)展提供自主可控安全高效的算力基礎(chǔ)保障。六、金融算力基礎(chǔ)設(shè)施發(fā)展建議(一)加強(qiáng)金融算力建設(shè)統(tǒng)籌規(guī)劃政策層面,金融管理部門加強(qiáng)金融業(yè)新型算力基礎(chǔ)設(shè)施建設(shè)相關(guān)頂層設(shè)計(jì)或總體規(guī)劃,引導(dǎo)金融業(yè)科學(xué)、合理開展新型算力基礎(chǔ)設(shè)施建設(shè),同時及時開展政策輔導(dǎo),扎實(shí)推動政策相關(guān)要求落地。機(jī)構(gòu)層面,高度重視新型算力基礎(chǔ)設(shè)施建設(shè),推動納入數(shù)字化轉(zhuǎn)型總體戰(zhàn)略;結(jié)合發(fā)展與安全、成本與效益、短期與長期等原則,合理規(guī)劃布局算力基礎(chǔ)設(shè)施建設(shè),重點(diǎn)建設(shè)綠色智能數(shù)據(jù)中心;針對技術(shù)架構(gòu)、算力底座、應(yīng)用場景、綜合配套等開展系統(tǒng)謀劃,避免資源浪費(fèi)。重點(diǎn)圍繞金融算力基礎(chǔ)設(shè)施的智算化、一體化、綠色化等領(lǐng)域發(fā)展的關(guān)鍵技術(shù)開展聯(lián)合攻關(guān)與應(yīng)用,包括通用算力性能提升、智算集群建設(shè)與效率提升、算力中心智能運(yùn)維等智算能力提升相關(guān)技術(shù),多源異構(gòu)算力融合、算力資源池化與智能管理、磁光電融合存儲等高性能存儲、高性能數(shù)據(jù)處理器(DPU)等高通量網(wǎng)絡(luò)設(shè)備、基于RoCE的智算網(wǎng)絡(luò)等高性能網(wǎng)絡(luò)架構(gòu)等促進(jìn)存算網(wǎng)一體化發(fā)展相關(guān)技術(shù),新能源、余熱回收、儲能調(diào)峰、液冷等促進(jìn)算力綠色節(jié)能技術(shù)。(三)引導(dǎo)金融業(yè)公共算力平臺建設(shè)由金融管理部門指導(dǎo),行業(yè)組織或行業(yè)機(jī)構(gòu)牽頭,組織金融機(jī)構(gòu)、科技企業(yè)、高校院所等聯(lián)合建設(shè)行業(yè)性智能算力公共平臺。平臺通過建設(shè)統(tǒng)一的算力調(diào)度和資源管理平臺,支持跨區(qū)域、跨機(jī)構(gòu)調(diào)度外部算力服務(wù),并對多種AI算力資源統(tǒng)一納管,建立統(tǒng)一資源池,實(shí)現(xiàn)資源跨云靈活分配,支持行業(yè)機(jī)構(gòu)按需使用算力資源或聯(lián)合開展金融業(yè)大模型訓(xùn)練推理,緩解行業(yè)算力資源瓶頸。基于平臺還可開展金融業(yè)高質(zhì)量語料集建設(shè)、訓(xùn)練金融領(lǐng)域垂直大模型,并支持行業(yè)機(jī)構(gòu)以微調(diào)方式訓(xùn)練服務(wù)自身的“小而美”特色模型。(四)推進(jìn)金融算力基建標(biāo)準(zhǔn)化建設(shè)針對多元異構(gòu)算力不兼容以及接口多樣化、算力運(yùn)維觀測指標(biāo)多元化、算力資源信創(chuàng)改造挑戰(zhàn)大等痛點(diǎn)難點(diǎn)問題,開展相關(guān)行業(yè)標(biāo)準(zhǔn)、團(tuán)體標(biāo)準(zhǔn)建設(shè),支持金融業(yè)多元異構(gòu)算力資源的融合共享和高效管理。金融機(jī)構(gòu)與產(chǎn)業(yè)側(cè)加強(qiáng)合作,推動算力基礎(chǔ)設(shè)施建設(shè)的標(biāo)準(zhǔn)化、模塊化和預(yù)制化,提高算力基礎(chǔ)設(shè)施供應(yīng)鏈產(chǎn)業(yè)化水平,同時積極開發(fā)高效智能算力設(shè)施運(yùn)維工具,支撐金融機(jī)構(gòu)算力基礎(chǔ)設(shè)施安全高效運(yùn)維。發(fā)揮政產(chǎn)學(xué)研用多方力量,持續(xù)建設(shè)開放、競爭、安全的金融算力產(chǎn)業(yè)生態(tài)。在技術(shù)路線方面,鼓勵算力產(chǎn)業(yè)開放開源發(fā)展,發(fā)揮我國金融科技人才密集與市場規(guī)模龐大優(yōu)勢,充分凝聚行業(yè)合力,群策群力推進(jìn)金融算力基礎(chǔ)設(shè)施發(fā)展。在產(chǎn)業(yè)鏈協(xié)同方面,加快完善上游的關(guān)鍵技術(shù)與器件聯(lián)合攻關(guān)、中游的工具鏈與工程化方案等創(chuàng)新完善、下游的應(yīng)用場景挖掘與商業(yè)模式創(chuàng)新,促進(jìn)金融算力產(chǎn)業(yè)鏈上下游協(xié)同生態(tài)。在政府與市場協(xié)同方面,結(jié)合不同區(qū)域和場景特色算力需求,發(fā)揮地方政府、金融機(jī)構(gòu)、產(chǎn)業(yè)機(jī)構(gòu)等力量,有序發(fā)展公共算力、私有算力及第三方算力,穩(wěn)妥推進(jìn)算力基礎(chǔ)設(shè)施互聯(lián)互通,為金融業(yè)高質(zhì)量發(fā)展持續(xù)提供多元算力適配驗(yàn)證、落地實(shí)踐等工作,積極為算力資源替代、智算擴(kuò)容或算力底座平移做準(zhǔn)備,同時與供給端協(xié)同發(fā)力并探索構(gòu)建自主可控算力生態(tài),夯實(shí)金融高質(zhì)量發(fā)展的算力底座。附錄:典型案例及解決方案一、案例背景近年來,隨著數(shù)字經(jīng)濟(jì)和智慧銀行的蓬勃發(fā)展,銀行數(shù)據(jù)中心作為金融業(yè)基礎(chǔ)設(shè)施的重要組成部分,規(guī)模和能耗持續(xù)攀升。為積極響應(yīng)國家雙碳戰(zhàn)略,認(rèn)真落實(shí)“雙碳”工作方案,竭力緩解智慧銀行轉(zhuǎn)型過程中算力需求增加帶來的能耗增加與節(jié)能減排之間的矛盾,某大型銀行數(shù)據(jù)中心積極研究探索,在有效保障全行安全生產(chǎn)的前提下,開展了一系列構(gòu)建綠色低碳數(shù)據(jù)中心的探索與實(shí)踐,實(shí)現(xiàn)能效顯著提升,并有效指導(dǎo)行業(yè)機(jī)房綠色運(yùn)維以及新機(jī)房規(guī)劃建設(shè)。二、案例內(nèi)容(一)新建機(jī)房規(guī)劃建設(shè)實(shí)踐1.首次結(jié)合熱島漂移效應(yīng)科學(xué)選址以上海市為例,參考上海城市風(fēng)玫瑰圖,上海存在向岸風(fēng)的現(xiàn)象,導(dǎo)致熱島發(fā)生漂移。機(jī)房設(shè)計(jì)團(tuán)隊(duì)結(jié)合熱島漂移間接蒸發(fā)空調(diào)系統(tǒng)比市平均能耗降低約3%。2.業(yè)界首次提出低碳設(shè)計(jì)“四短”原則一是短電流:電流路徑變短,可以減少電阻損失,降低電壓降,減少電能損失。例如選用母排垂直配電技術(shù)減少電力傳輸靜態(tài)損失,選用一體化電力模組減少電力變換動態(tài)損失。二是短氣流:氣流變短,減少冷氣因?qū)α鳌⑿孤兜葘?dǎo)致的能量損失,提高循環(huán)效率,降低空調(diào)負(fù)荷。例如選用間接蒸發(fā)冷卻設(shè)備直接空-空熱交換,減少了熱對流和熱傳導(dǎo)導(dǎo)致的熱量損失。三是短水流:水流變短,減少冷媒水流動阻力,減少管道和環(huán)境熱交換的溫度損失,提高水泵工作效率。例如合理設(shè)計(jì)管道路徑,減少管道彎頭,選用變頻水泵,靈活調(diào)節(jié)水流量,節(jié)能供水。四是短碼流:遵循星型結(jié)構(gòu),配置環(huán)形橋架,網(wǎng)絡(luò)設(shè)備就近布置,簡化結(jié)構(gòu)。例如選用TOR布線技術(shù),減少網(wǎng)絡(luò)柜、跳線架和配線架的使用量。(二)在用機(jī)房節(jié)能降碳實(shí)踐數(shù)據(jù)中心的運(yùn)行能耗主要包括IT設(shè)備能耗、制冷系統(tǒng)能耗、變壓器及UPS等電氣損耗、照明等其他能耗構(gòu)成。IT設(shè)備的能耗主要取決于設(shè)備的能效比,而電氣損耗則與負(fù)載率直接相關(guān),因此,這兩類節(jié)能優(yōu)化工作需要從業(yè)務(wù)層面進(jìn)行統(tǒng)籌規(guī)劃。制冷系統(tǒng)能耗在數(shù)據(jù)中心中占比較大,運(yùn)行工況較為靈活,存在諸多優(yōu)化空間。大型數(shù)據(jù)中心一般采用水冷空調(diào)系統(tǒng),其節(jié)能降碳探索與實(shí)踐主要從空調(diào)末端、空調(diào)冷源、AI調(diào)優(yōu)三方面開展。1.優(yōu)化空調(diào)末端控制邏輯,滿足按需供冷數(shù)據(jù)中心機(jī)房精密空調(diào)采用送風(fēng)量調(diào)節(jié)與冷凍水量調(diào)節(jié)相結(jié)合的方式,控制邏輯采用先調(diào)水閥后變風(fēng)量。選取典型精密空調(diào)開展風(fēng)機(jī)轉(zhuǎn)速-功率特性測試。風(fēng)機(jī)轉(zhuǎn)速比在80%以上時,風(fēng)機(jī)能耗隨風(fēng)機(jī)轉(zhuǎn)速比的增加急劇增加。以該行某機(jī)房模塊為研究測試對象,將精密空調(diào)EC風(fēng)機(jī)轉(zhuǎn)速比手動調(diào)至80%,穩(wěn)定后使用風(fēng)量罩測試每塊格柵地板風(fēng)量,并與機(jī)柜實(shí)際需求計(jì)算風(fēng)量(基于IT設(shè)備功率、實(shí)測溫差計(jì)算)進(jìn)行對比,實(shí)測風(fēng)機(jī)輸出上限設(shè)置為80%是可行的,風(fēng)量不足之處實(shí)施格柵地板調(diào)整和氣流優(yōu)化等局部調(diào)整。在制定完整回退計(jì)劃后,以某機(jī)房作為局部試點(diǎn),然后在整個機(jī)房開展調(diào)優(yōu)。調(diào)優(yōu)后機(jī)房精密空調(diào)總功率降幅達(dá)52.9%,效果顯著。2.精細(xì)調(diào)節(jié)冷源冷卻水溫度,充分利用室外冷源理論上,降低冷卻水出水溫度可提升機(jī)組COP,但會導(dǎo)致冷卻塔散熱風(fēng)扇能耗提升,總體是否節(jié)能需要實(shí)測分析。此外冷卻水溫度不能無限制降低,主要原因是冷卻水溫度太低不利于潤滑油系統(tǒng)回油。在分析數(shù)據(jù)中心機(jī)房6個月間冷水機(jī)組的運(yùn)行數(shù)據(jù)基礎(chǔ)上,進(jìn)行相關(guān)冷卻水水溫調(diào)優(yōu):使用群控系統(tǒng)所記錄數(shù)據(jù)中心機(jī)房年度冷水機(jī)組的運(yùn)行數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗擬合,可知冷水機(jī)組COP隨冷卻水回水溫度Tw的升高而明顯降低。為探究冷卻水溫度降低的節(jié)能潛力,某日將冷卻塔出水溫度設(shè)定為17℃,并記錄冷機(jī)油位計(jì)油位,每次巡檢觀察油位,若出現(xiàn)油位異常立即啟動回退方案。為排除室外天氣干擾,在分析數(shù)據(jù)時,選取調(diào)整前后室外濕球溫度相近的兩周運(yùn)行數(shù)據(jù)開展分析。經(jīng)此調(diào)優(yōu)后,年節(jié)電量約為14.5萬度。3.空調(diào)系統(tǒng)AI節(jié)能調(diào)優(yōu)實(shí)踐在用機(jī)房空調(diào)系統(tǒng)AI節(jié)能調(diào)優(yōu)實(shí)踐是利用AI技術(shù)開展空調(diào)節(jié)能的一次嘗試。通過對該在用機(jī)房空調(diào)系統(tǒng)運(yùn)行數(shù)據(jù)整合、訓(xùn)練,利用AI技術(shù),建立針對數(shù)據(jù)中心機(jī)房的空調(diào)制冷能效預(yù)測模型,實(shí)現(xiàn)空調(diào)系統(tǒng)能效智能尋優(yōu),從而優(yōu)化空調(diào)系統(tǒng)工況,動態(tài)降低機(jī)房運(yùn)行能耗,進(jìn)一步提升數(shù)據(jù)中心綠色低碳運(yùn)行水平。AI調(diào)優(yōu)整體過程算法架構(gòu)設(shè)計(jì)如下圖,主要包括空調(diào)設(shè)備運(yùn)行參數(shù)模型、冷負(fù)荷預(yù)測模型、尋優(yōu)算法、強(qiáng)化學(xué)習(xí)迭代優(yōu)化四部分。空調(diào)系統(tǒng)AI實(shí)踐主要針對數(shù)據(jù)中心機(jī)房冷源系統(tǒng),通過AI智能優(yōu)化算法實(shí)現(xiàn)冷源系統(tǒng)運(yùn)行參數(shù)的智能推薦,經(jīng)運(yùn)維人員評估后手動下發(fā)執(zhí)行,以降低數(shù)據(jù)中心機(jī)房冷源側(cè)的運(yùn)行能耗。數(shù)據(jù)中心機(jī)房空調(diào)AI節(jié)能算法的數(shù)據(jù)均來自動環(huán)監(jiān)控平臺,使用SNMP協(xié)議獲取動環(huán)監(jiān)控平臺中的實(shí)時監(jiān)控?cái)?shù)據(jù),實(shí)現(xiàn)空調(diào)系統(tǒng)狀態(tài)及功耗情況的實(shí)時感知。完成算法建模、范圍確認(rèn)及監(jiān)控對接后,AI軟件可以根據(jù)模型自動計(jì)算出空調(diào)運(yùn)行參數(shù)的優(yōu)化調(diào)整意見,運(yùn)維人員對推薦參數(shù)進(jìn)行評估,據(jù)此完成優(yōu)化參數(shù)的下發(fā)執(zhí)行。在參數(shù)下發(fā)后,調(diào)優(yōu)軟件通過獲取最新的空調(diào)運(yùn)行數(shù)據(jù)及能耗數(shù)據(jù),判斷參數(shù)調(diào)整對系統(tǒng)節(jié)能效果的影響,利用自身學(xué)習(xí)機(jī)制開展迭代優(yōu)化,逐步提升推薦參數(shù)的效能。三、案例創(chuàng)新點(diǎn)及成效新建機(jī)房規(guī)劃建設(shè)方面,一是發(fā)明了基于數(shù)字孿生的機(jī)房設(shè)計(jì)方法,填補(bǔ)了金融機(jī)構(gòu)在機(jī)房設(shè)計(jì)領(lǐng)域發(fā)明專利的空白。二是利用城市熱島漂移效應(yīng)科學(xué)選址,為機(jī)房節(jié)能取得先天優(yōu)勢。三是首次提出雙碳目標(biāo)下低碳設(shè)系統(tǒng)性地優(yōu)化機(jī)房設(shè)計(jì),為數(shù)據(jù)中心低碳設(shè)計(jì)提供了指導(dǎo),具有重要的實(shí)踐意義和推廣價(jià)值。在用機(jī)房節(jié)能降碳實(shí)踐方面,一是末端側(cè)的調(diào)優(yōu)。基于廣泛的實(shí)驗(yàn)測試和深入的數(shù)據(jù)分析,制定綜合策略優(yōu)化方案,大量節(jié)省了機(jī)房末端側(cè)能耗。二是冷源側(cè)的調(diào)優(yōu)。在歷史數(shù)據(jù)分析基礎(chǔ)上,綜合考慮氣象數(shù)據(jù),合理優(yōu)化冷卻水水溫,提升水冷機(jī)運(yùn)行效率,降低水冷機(jī)運(yùn)行能耗。三是智能降耗平臺的應(yīng)用。在該大型商業(yè)銀行數(shù)據(jù)中心中,首次利用AI技術(shù)在風(fēng)冷-水冷異構(gòu)雙冷源系統(tǒng)的工程實(shí)踐,在參數(shù)調(diào)優(yōu)、數(shù)據(jù)分析以及在線故障診斷等方面,節(jié)省大量人力,能實(shí)時、在線地幫助環(huán)境運(yùn)維者分析潛在的節(jié)能點(diǎn)、隱藏的優(yōu)化點(diǎn)以及可能的故障點(diǎn),大幅提升暖通設(shè)備運(yùn)行效率,降低潛在運(yùn)行風(fēng)險(xiǎn)。1.重視新建機(jī)房的低碳節(jié)能設(shè)計(jì)根據(jù)機(jī)房所在地區(qū)的氣候特點(diǎn)等因素,因地制宜開展選址建設(shè),并選取適合的綠色低碳技術(shù)節(jié)流開源。新建機(jī)房采用了間接蒸發(fā)冷卻、氟泵雙循環(huán)、光伏發(fā)電等技術(shù),節(jié)能應(yīng)用水平處于行業(yè)領(lǐng)先水平。針對新技術(shù)應(yīng)用利弊及部分重要技術(shù)細(xì)節(jié),機(jī)房設(shè)計(jì)團(tuán)隊(duì)通過現(xiàn)場考察、外部專家論證等方式,充分調(diào)研了金融業(yè)及其他行業(yè)的應(yīng)用案例、效果和經(jīng)驗(yàn),并對新技術(shù)供應(yīng)商應(yīng)用情況、行業(yè)內(nèi)規(guī)范、技術(shù)規(guī)格及政策支持進(jìn)行分析,確保新技術(shù)應(yīng)用“有據(jù)可依”;同時,對關(guān)鍵技術(shù)細(xì)節(jié)進(jìn)行充分論證,保障機(jī)房能夠安全投產(chǎn)。2.深度挖掘在用機(jī)房的節(jié)能減排發(fā)力點(diǎn)數(shù)據(jù)中心排名前三的“用能大戶”分別為IT設(shè)備、空調(diào)設(shè)備、電氣設(shè)備,其中IT設(shè)備、電氣設(shè)備能耗主要取決于先天設(shè)計(jì),難以在保障安全基礎(chǔ)上通過運(yùn)維降低其能耗,而空調(diào)設(shè)備能耗很大程度取決于運(yùn)維水平,在保障基礎(chǔ)設(shè)施安全運(yùn)行的前提下,深入地分析暖通設(shè)備運(yùn)行控制原理,靈活地應(yīng)對暖通設(shè)備復(fù)雜的運(yùn)行工況,開拓地應(yīng)用人工智能輔助策略,多措并舉,可實(shí)現(xiàn)數(shù)據(jù)機(jī)房安全降碳。02某大型商業(yè)銀行:AI算力基礎(chǔ)設(shè)施轉(zhuǎn)型創(chuàng)新案例一、案例背景隨著人工智能場景和數(shù)字化業(yè)務(wù)的加速落地,AI大模型算法和數(shù)據(jù)巨量化對算力需求呈指數(shù)級增長,傳統(tǒng)基礎(chǔ)設(shè)施已無法滿足AI大模型的大算力需求,亟需建設(shè)支撐AI大模型所需要的大規(guī)模分布式AI算力基礎(chǔ)設(shè)施。同時為降低供應(yīng)鏈風(fēng)險(xiǎn),確保AI業(yè)務(wù)創(chuàng)新應(yīng)用的持續(xù)穩(wěn)定開展,某商業(yè)銀行深入調(diào)研AI算力基礎(chǔ)設(shè)施技術(shù)及產(chǎn)業(yè)應(yīng)用發(fā)展,積極開展AI算力基礎(chǔ)設(shè)施轉(zhuǎn)型創(chuàng)新,提供高效可靠的AI算力解決方案。在取得自身建設(shè)成效的同時,該行還積極推進(jìn)創(chuàng)新成果輸出和行業(yè)生態(tài)建設(shè),協(xié)助行業(yè)伙伴提升金融服務(wù)的智能化水平和安全可控能力。二、案例內(nèi)容設(shè)計(jì)AI算力基礎(chǔ)設(shè)施轉(zhuǎn)型解決方案,實(shí)現(xiàn)AI芯片、網(wǎng)絡(luò)、訓(xùn)練框架以及云平臺等軟硬件系統(tǒng)全面可控,為大模型訓(xùn)練業(yè)務(wù)提供高性能、高可靠的AI算力基礎(chǔ)設(shè)施資源,保障大模型業(yè)務(wù)訓(xùn)練的高效率與高穩(wěn)定性。1.技術(shù)目標(biāo)一是建設(shè)全棧可控集群。著力解決AI算力基礎(chǔ)設(shè)施在AI服務(wù)器、GPU算力芯片、高速互聯(lián)交換機(jī)、AI算力框架的關(guān)鍵組件轉(zhuǎn)型創(chuàng)新。二是構(gòu)建異構(gòu)算力管理能力。建設(shè)支持統(tǒng)一納管GPU、NPU、MLU等AI芯片的算力管理平臺,實(shí)現(xiàn)AI異構(gòu)算力資源統(tǒng)一按需調(diào)度。三是提升網(wǎng)絡(luò)高速互聯(lián)能力。通過網(wǎng)絡(luò)高速帶寬接入、參數(shù)面多鏈路流量均衡、網(wǎng)絡(luò)接入架構(gòu)優(yōu)化等技術(shù)突破,進(jìn)一步提高大規(guī)模算力集群的AI線性度,建成訓(xùn)練效率更高的AI算力基礎(chǔ)設(shè)施。滿足千億級大模型訓(xùn)練分鐘級checkpoint的保存頻率要求,進(jìn)一步提升大模型AI算力集群的存儲性能。五是加強(qiáng)集群連續(xù)運(yùn)行能力。研究金融科技運(yùn)維領(lǐng)域的智能運(yùn)維技術(shù),針對金融科技領(lǐng)域運(yùn)維數(shù)據(jù)量龐大、數(shù)據(jù)結(jié)構(gòu)復(fù)雜、預(yù)測準(zhǔn)確性和自動化處理效率要求高等訴求,解決人工標(biāo)注成本高、周期長、準(zhǔn)確性不高等問題,賦能數(shù)據(jù)中心安全生產(chǎn)。六是賦能金融行業(yè)全域生態(tài)。推動技術(shù)和行業(yè)生態(tài)建設(shè),實(shí)現(xiàn)網(wǎng)絡(luò)、服務(wù)器、AI芯片以及訓(xùn)練框架層面全鏈路的主流廠商產(chǎn)品與AI算力基礎(chǔ)設(shè)施轉(zhuǎn)型解決方案的適配兼容。2.業(yè)務(wù)目標(biāo)設(shè)計(jì)新型AI算力基礎(chǔ)設(shè)施部署方案,實(shí)現(xiàn)AI模型訓(xùn)練效率和算力資源利用率雙提升,賦能大模型技術(shù),實(shí)現(xiàn)端到端業(yè)務(wù)與科技智能融合創(chuàng)新。本解決方案通過AI算力底座轉(zhuǎn)型創(chuàng)新,賦能千億級大模型技術(shù)體系,支撐遠(yuǎn)程銀行、網(wǎng)點(diǎn)運(yùn)營、個人營銷等近20個業(yè)務(wù)領(lǐng)域,并向中小銀行機(jī)構(gòu)輸出大模型應(yīng)用服務(wù)能力。遠(yuǎn)程銀行業(yè)務(wù)應(yīng)用場景如下圖:網(wǎng)點(diǎn)運(yùn)營業(yè)務(wù)應(yīng)用場景如下圖:個人營銷業(yè)務(wù)應(yīng)用場景如下圖:1.功能架構(gòu)本解決方案重點(diǎn)關(guān)注底層AI算力基礎(chǔ)設(shè)施關(guān)鍵軟硬件轉(zhuǎn)型創(chuàng)新,實(shí)現(xiàn)AI算力、高性能網(wǎng)絡(luò)、NAS文件存儲、云平臺等軟硬件系統(tǒng)全棧可控集成,全面支持國內(nèi)外AI訓(xùn)練框架,有力支撐AI業(yè)務(wù)系統(tǒng)平穩(wěn)運(yùn)行。如下圖所示:2.系統(tǒng)架構(gòu)本解決方案從基礎(chǔ)設(shè)施、訓(xùn)練框架、模型以及業(yè)務(wù)場景等多個層面完成AI技術(shù)體系全棧可控建設(shè)及適配。如下圖所示:一是場景層。通過AI算力基礎(chǔ)設(shè)施創(chuàng)新賦能大模型技術(shù),實(shí)現(xiàn)顛覆性、端到端業(yè)務(wù)與科技智能融合創(chuàng)新,在工作中提質(zhì)增效、激活經(jīng)營活力、增強(qiáng)風(fēng)險(xiǎn)防控等方面成效顯著。千問-14B/32B、GLM2-66B等百億大模型的二次訓(xùn)練+微調(diào)。三是框架層。全面適配支持Mindspore、Paddle、Tensorflow、Pytorch等國內(nèi)外主流訓(xùn)練框架。四是基礎(chǔ)設(shè)施層。建立可控AI算力、網(wǎng)絡(luò)、存儲的智能化統(tǒng)一運(yùn)維機(jī)制。圍繞算存網(wǎng)協(xié)同的目標(biāo),深入研究并采用了智能無損以太網(wǎng)技術(shù),加大算力網(wǎng)絡(luò)與存儲技術(shù)創(chuàng)新及應(yīng)用,適配飛速發(fā)展的AI算力技術(shù)和大規(guī)模AI算力集群,構(gòu)建滿足數(shù)字化、智能化轉(zhuǎn)型創(chuàng)新需要的算力基礎(chǔ)設(shè)施。如下圖所示:其中的關(guān)鍵技術(shù)設(shè)計(jì)包括以下六個方面:一是智能無損網(wǎng)絡(luò)技術(shù)。通過實(shí)時采集流量特征和網(wǎng)絡(luò)狀態(tài),結(jié)合AI算法,對未來的流量模型進(jìn)行預(yù)測,從全局視角實(shí)時決策并刷新網(wǎng)卡和網(wǎng)絡(luò)參數(shù)配置,使得網(wǎng)絡(luò)交換機(jī)緩存被合理高效利用,實(shí)現(xiàn)整網(wǎng)零丟包。二是死鎖避免技術(shù):通過感知全網(wǎng)拓?fù)溆?jì)算出破除死鎖環(huán)的最佳點(diǎn),將感知到發(fā)生死鎖環(huán)點(diǎn)的流量切換到新隊(duì)列,并且通過PFC反壓幀反壓回原隊(duì)列。解決死鎖對原隊(duì)列的buffer依賴,破除死鎖環(huán)形成的條件。三是跨節(jié)點(diǎn)高速互聯(lián)技術(shù)。通過高性能RoCE網(wǎng)絡(luò)替代業(yè)界常用的Infini-Band組網(wǎng)方案實(shí)現(xiàn)高密度AI算力節(jié)點(diǎn)互聯(lián),集群算力加速比達(dá)0.95,處于同業(yè)領(lǐng)先水平。四是動態(tài)負(fù)載均衡技術(shù)。根據(jù)整網(wǎng)交換機(jī)節(jié)點(diǎn)流擁塞狀態(tài)和全網(wǎng)拓?fù)溥M(jìn)行全局算路,識別出最優(yōu)路徑,實(shí)現(xiàn)多任務(wù)流量全局均衡。五是算網(wǎng)協(xié)同技術(shù)。以算網(wǎng)協(xié)同聯(lián)動提升集群AI訓(xùn)練效率,實(shí)現(xiàn)網(wǎng)絡(luò)拓?fù)涓兄I算力芯片感知、網(wǎng)卡出口感知的智能調(diào)度,提升AI算力資源整體利用率。六是分層存儲架構(gòu)技術(shù)。創(chuàng)新提出分層存儲架構(gòu)的高性能存儲解決方案,原始數(shù)據(jù)由對象存儲來承擔(dān),發(fā)揮大容量優(yōu)勢并實(shí)現(xiàn)與大數(shù)據(jù)存儲共享;支撐訓(xùn)練數(shù)據(jù)由企業(yè)級文件存儲來承擔(dān),通過存儲加速層進(jìn)一步提升AI算力集群存儲性能。三、案例創(chuàng)新點(diǎn)及成效建成基于RoCE高性能網(wǎng)絡(luò)的分布式AI算力集群,實(shí)現(xiàn)AI模型訓(xùn)練效率和算力資源利用率雙提升,是首家具備支持千億級參數(shù)大模型訓(xùn)練能力的銀行。不斷深化大模型技術(shù)面向全業(yè)務(wù)流程的綜合化運(yùn)用,形成端到端智能化解決方案,提質(zhì)增效效果顯著。其中,在遠(yuǎn)程銀行領(lǐng)域,貫穿客戶服務(wù)業(yè)務(wù)全流程,覆蓋事前運(yùn)營、事中輔助和事后質(zhì)檢等環(huán)節(jié),實(shí)現(xiàn)座席工作效率全面升級,平均通話時長壓降10%,座席服務(wù)效率提升18%。在運(yùn)營管理領(lǐng)域,面向20萬網(wǎng)點(diǎn)基層員工,融會貫通跨境支付、遠(yuǎn)程授權(quán)等50多種專業(yè)和上千萬字篇幅的金融業(yè)務(wù)知識,提升網(wǎng)點(diǎn)員工業(yè)務(wù)處理效率與服務(wù)質(zhì)量,支撐銀行業(yè)智慧金融業(yè)務(wù)創(chuàng)新。為保障AI算力基礎(chǔ)設(shè)施平穩(wěn)投產(chǎn)運(yùn)行,采取了如下5項(xiàng)保障措施:1、充分驗(yàn)證,確保業(yè)務(wù)平穩(wěn)上線。試點(diǎn)投產(chǎn)前,綜合分析基礎(chǔ)設(shè)施環(huán)境架構(gòu)特點(diǎn),對大模型算力集群方案進(jìn)行全面系統(tǒng)設(shè)計(jì),開展性能與高可用驗(yàn)證,確保上線后的業(yè)務(wù)可用性。在試點(diǎn)投產(chǎn)后,設(shè)計(jì)模擬局部故障應(yīng)急演練,確保高可用滿足生產(chǎn)運(yùn)行需求,同時,持續(xù)分析投產(chǎn)后應(yīng)用運(yùn)行情況,保障投產(chǎn)應(yīng)用質(zhì)量,避免造成業(yè)務(wù)影響。2、分階段穩(wěn)步推動擴(kuò)大試點(diǎn)。自2021年起,遵循由簡單到復(fù)雜、由小規(guī)模試點(diǎn)到大規(guī)模推廣的原則,首先試點(diǎn)基于高性能RoCE網(wǎng)絡(luò)的分布式AI集群;隨后2022年完成首個國芯分布式AI算力集群建設(shè),算力規(guī)模達(dá)到數(shù)十PFlops;2023年完成金融同業(yè)首個支撐千億算力的國芯AI算力集群建設(shè),算力規(guī)模達(dá)到數(shù)百PFlops;2024年完成第二個千億的AI算力集群。3、提煉全流程應(yīng)用方法論,革新大模型業(yè)務(wù)賦能模式。從商業(yè)銀行實(shí)際應(yīng)用視角出發(fā),業(yè)務(wù)技術(shù)雙向融合,從大模型的金融應(yīng)用解決方案、金融業(yè)務(wù)賦能兩方面提煉方法論,一是首創(chuàng)“3-1-N”基于范式的AI技術(shù)規(guī)模化轉(zhuǎn)換方法論,建成以智能中樞為核心的1+X應(yīng)用范式,實(shí)現(xiàn)高效高質(zhì)量的業(yè)務(wù)場景應(yīng)用;二是首創(chuàng)兩階六步金融大模型應(yīng)用創(chuàng)新方法論,從分析現(xiàn)有工作流到重塑未來工作流,發(fā)現(xiàn)堵點(diǎn)、挖掘爆款、重塑流程,有效指導(dǎo)大模型在金融領(lǐng)域下端到端、規(guī)模化落地。4、配套建設(shè),保障網(wǎng)絡(luò)安全及運(yùn)維管理能力。大模型AI算力基于以太網(wǎng)構(gòu)建,實(shí)現(xiàn)數(shù)據(jù)中心內(nèi)算力網(wǎng)絡(luò)與云網(wǎng)絡(luò)統(tǒng)一運(yùn)維。考慮到算力網(wǎng)絡(luò)的重要性,對安全和運(yùn)維監(jiān)控管理系統(tǒng)進(jìn)行了詳細(xì)的研究梳理,圍繞AI算力集群算存網(wǎng)協(xié)同運(yùn)維的目標(biāo),研究提升AI算力集群的故障定界以及自動故障隔離等能力,提升整個IT基礎(chǔ)設(shè)施高可用和自動化水平。03中信銀行:金融云化算力基礎(chǔ)設(shè)施轉(zhuǎn)型創(chuàng)新實(shí)踐一、案例背景為支持?jǐn)?shù)字化轉(zhuǎn)型深入推進(jìn)、確保供應(yīng)鏈安全,中信銀行在核心系統(tǒng)主機(jī)下移和基于ARM服務(wù)器的全棧云基礎(chǔ)上,不斷加大技術(shù)創(chuàng)新,構(gòu)建了全棧可控、“一云多芯”的金融算力基礎(chǔ)設(shè)施,為金融應(yīng)用創(chuàng)新提供安全穩(wěn)定的基礎(chǔ)算力平臺,夯實(shí)金融數(shù)字化轉(zhuǎn)型技術(shù)基座。二、案例內(nèi)容中信銀行在完成覆蓋全行的中信銀行云建設(shè)后,按照中信銀行“十四五”規(guī)劃,重點(diǎn)圍繞安全可控、支持云原生應(yīng)用、高效支撐數(shù)字化轉(zhuǎn)型等,不斷提升可用性、擴(kuò)展能力,實(shí)現(xiàn)更加敏捷和彈性的資源供給。通過引入全棧云技術(shù),實(shí)現(xiàn)云技術(shù)跨越式升級,并與主流云廠商保持技術(shù)同步,融合計(jì)算、存儲、網(wǎng)絡(luò)等底層技術(shù),構(gòu)建敏捷、彈性、安全可控的laaS、PaaS一體化的云基礎(chǔ)設(shè)施,為云原生應(yīng)用提供全棧可控的基礎(chǔ)設(shè)施支撐。通過為中信銀行數(shù)字化轉(zhuǎn)型提供堅(jiān)實(shí)的技術(shù)基座,達(dá)到同業(yè)領(lǐng)先水平。按照超大規(guī)模標(biāo)準(zhǔn)設(shè)計(jì),項(xiàng)目攻克了公有云技術(shù)在銀行私有化部署時各類適配問題,實(shí)現(xiàn)以軟件定義、分布式為特征的公有云技術(shù)全面落地,全面支持容器、Mesh、微服務(wù)、DevOps等各類云原生應(yīng)用。與ARM生態(tài)和麒麟生態(tài)密切合作,在促進(jìn)產(chǎn)業(yè)側(cè)技術(shù)發(fā)展的同時,實(shí)現(xiàn)了基礎(chǔ)算力的安全可控,建立了完備的安全防護(hù)體系,達(dá)到等保4級的要求。1.實(shí)施全量安全可控中信銀行云基于全量安全可控原則,推動實(shí)現(xiàn)云計(jì)算技術(shù)、系統(tǒng)和應(yīng)用軟件全面轉(zhuǎn)型、迭代,實(shí)現(xiàn)對各類銀行業(yè)務(wù)的全方位支持,對同業(yè)轉(zhuǎn)型創(chuàng)新起到重要的示范作用。一是應(yīng)用轉(zhuǎn)型攻關(guān)。通過DevOps工具鏈與代碼掃描工具相結(jié)合,實(shí)現(xiàn)批量代碼遷移。通過仿真測試和智能擋板技術(shù)實(shí)現(xiàn)全量的業(yè)務(wù)場景比對測試,保障交易全覆蓋。二是服務(wù)器轉(zhuǎn)型攻關(guān)。針對ARM架構(gòu)進(jìn)行深入剖析,對NUMA調(diào)優(yōu)、操作系統(tǒng)內(nèi)核層調(diào)優(yōu)、IO調(diào)優(yōu),Java程序調(diào)優(yōu),充分發(fā)揮ARM服務(wù)器性能。三是負(fù)載均衡轉(zhuǎn)型攻關(guān)。在關(guān)鍵業(yè)務(wù)場景實(shí)現(xiàn)負(fù)載均衡設(shè)備轉(zhuǎn)型創(chuàng)新,使用軟件負(fù)載均衡取代硬件負(fù)載均衡,解決各類業(yè)務(wù)場景難題。2.主流云計(jì)算技術(shù)全面落地對中信銀行云進(jìn)行了全面技術(shù)升級,交付了金融領(lǐng)域公有云技術(shù)私有化部署的完整方案,建成了先進(jìn)的云原生技術(shù)平臺。以超大規(guī)模數(shù)據(jù)中心為目標(biāo),中信銀行自主設(shè)計(jì)了高擴(kuò)展性、高可用的架構(gòu)平臺。一是軟件SDN技術(shù)方面。通過隔離技術(shù),解決軟件隔離技術(shù)帶來的各類適配問題,通過互通技術(shù),攻關(guān)軟件網(wǎng)關(guān)技術(shù)在高TPS場景下跨網(wǎng)絡(luò)區(qū)域互通的性能問題。二是虛擬化方面。管理方式上,用全棧云中的AZ模型替代傳統(tǒng)虛擬化技術(shù)的集群模型,實(shí)現(xiàn)大資源池管理。重點(diǎn)解決新技術(shù)棧給運(yùn)維、升級帶來的挑戰(zhàn)。三是規(guī)模運(yùn)用裸金屬技術(shù)。進(jìn)行技術(shù)攻關(guān),實(shí)現(xiàn)敏捷彈性,像虛機(jī)一樣靈活地發(fā)放裸金屬。實(shí)現(xiàn)資源池化,像虛機(jī)一樣池化的管理裸金屬。四是應(yīng)用全棧云容器技術(shù)。實(shí)現(xiàn)laaS、PaaS一體化的云原生技術(shù)平臺。將云與運(yùn)維工具融合,實(shí)現(xiàn)整個體系的云原生化。進(jìn)行網(wǎng)絡(luò)創(chuàng)新,容器和虛擬機(jī)同一網(wǎng)絡(luò)平面,云內(nèi)、云外同一個網(wǎng)絡(luò)平面,直接通信。實(shí)現(xiàn)容器地址暴露,直接在Mesh中注冊。進(jìn)行運(yùn)維創(chuàng)新,容器在堡壘機(jī)自動注冊,堡壘機(jī)直接登錄容器。進(jìn)行部署模式創(chuàng)新,容器資源一站式申請,容器應(yīng)用全自動化上線。3.通過運(yùn)維創(chuàng)新為全棧云的規(guī)模使用保駕護(hù)航全棧云以全部軟件定義為特色,帶來了技術(shù)體系的巨大變化,給原有的運(yùn)維工作方式也帶來了巨大變化。中信銀行將全棧云完整地納入運(yùn)維體系和管理流程,實(shí)現(xiàn)了敏捷性和安全性的平衡,實(shí)現(xiàn)一體化管理。為匹配云原生技術(shù),運(yùn)維等進(jìn)行了適配性改造,實(shí)現(xiàn)全流程管控、全流程敏捷。實(shí)現(xiàn)了五個“一體化”,即一體化用戶管理、一體化監(jiān)控、一體化網(wǎng)絡(luò)運(yùn)維、一體化變更及一體化域名解析。三、案例創(chuàng)新點(diǎn)及成效中信銀行金融云化算力基礎(chǔ)設(shè)施轉(zhuǎn)型創(chuàng)新項(xiàng)目是中信銀行和中信集團(tuán)戰(zhàn)略級項(xiàng)目,通過基于全棧云技術(shù)的算力基礎(chǔ)設(shè)施轉(zhuǎn)型創(chuàng)新,支持銀行業(yè)務(wù)守正創(chuàng)新發(fā)展。首先,全面落
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 微生物檢驗(yàn)技師考試實(shí)務(wù)案例分析及試題及答案
- 2025年特許金融分析師考試分析技巧試題及答案
- 項(xiàng)目管理團(tuán)隊(duì)互信構(gòu)建試題及答案
- 復(fù)習(xí)要點(diǎn)2025年特許金融分析師考試試題及答案
- 黑龍江鶴崗市本年度(2025)小學(xué)一年級數(shù)學(xué)統(tǒng)編版專題練習(xí)(下學(xué)期)試卷及答案
- 項(xiàng)目管理考試評估標(biāo)準(zhǔn)與試題及答案
- 2025年注會考試重要知識試題及答案
- 項(xiàng)目管理專業(yè)人士考試中的個人學(xué)習(xí)計(jì)劃試題及答案
- 適應(yīng)職場需求的注冊會計(jì)師考試課程設(shè)置分析試題及答案
- 深刻理解證券從業(yè)資格證試題及答案
- 機(jī)電副礦長風(fēng)險(xiǎn)管理標(biāo)準(zhǔn)和管理措施
- 防洪工程施工組織設(shè)計(jì)+
- CAD培訓(xùn)課件(基礎(chǔ)教程)
- 大學(xué)生心理朋輩技能大賽考試題庫(含答案)
- DB32T 3544-2019 臨床級人體組織來源間充質(zhì)干細(xì)胞 質(zhì)量控制管理規(guī)范
- 國藥茶色素講稿30課件
- 魯科版五年級英語下How many ducks do you have?課件2
- 醫(yī)院藥品信息管理系統(tǒng)(DOC)
- isa-381g站用變接地保護(hù)測控裝置技術(shù)使用說明書南網(wǎng)版v3
- 計(jì)算機(jī)應(yīng)用基礎(chǔ)(中等職業(yè)學(xué)校校本教材)
- 完整版健康管理師
評論
0/150
提交評論