2025年新質(zhì)算力發(fā)展白皮書(shū)-生成式AI驅(qū)動(dòng)算力基礎(chǔ)設(shè)施向縱深升級(jí)-IDC_第1頁(yè)
2025年新質(zhì)算力發(fā)展白皮書(shū)-生成式AI驅(qū)動(dòng)算力基礎(chǔ)設(shè)施向縱深升級(jí)-IDC_第2頁(yè)
2025年新質(zhì)算力發(fā)展白皮書(shū)-生成式AI驅(qū)動(dòng)算力基礎(chǔ)設(shè)施向縱深升級(jí)-IDC_第3頁(yè)
2025年新質(zhì)算力發(fā)展白皮書(shū)-生成式AI驅(qū)動(dòng)算力基礎(chǔ)設(shè)施向縱深升級(jí)-IDC_第4頁(yè)
2025年新質(zhì)算力發(fā)展白皮書(shū)-生成式AI驅(qū)動(dòng)算力基礎(chǔ)設(shè)施向縱深升級(jí)-IDC_第5頁(yè)
已閱讀5頁(yè),還剩53頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

新質(zhì)算力發(fā)展白皮書(shū)生成式AI驅(qū)動(dòng)算力基礎(chǔ)設(shè)施向縱深升級(jí)報(bào)告主旨:為了推動(dòng)新質(zhì)生產(chǎn)力的發(fā)展,實(shí)現(xiàn)算力市場(chǎng)的高質(zhì)量增長(zhǎng),IDC聯(lián)合寧暢共同提出了新質(zhì)算力概念,旨在幫助企業(yè)突破傳統(tǒng)算力在成本、效率、靈活性和適用性等方面的瓶頸,加速以智能化場(chǎng)景為核心的業(yè)務(wù)融合創(chuàng)新進(jìn)程。本白皮書(shū)在解讀新質(zhì)算力的基礎(chǔ)上,為企業(yè)用戶制定出算力效率雷達(dá)、算力建設(shè)路徑圖和算力產(chǎn)品選型標(biāo)準(zhǔn),指引企業(yè)更加科學(xué)地規(guī)劃、設(shè)計(jì)和建設(shè)面向未來(lái)的全棧AI算力基礎(chǔ)設(shè)施,實(shí)現(xiàn)AI應(yīng)用場(chǎng)景的全面落地,持續(xù)推動(dòng)企業(yè)智能化轉(zhuǎn)型升級(jí)和內(nèi)容框架:今年以來(lái),DeepSeek的異軍突起引發(fā)了市場(chǎng)對(duì)生成式AI的新一輪關(guān)注,從模型結(jié)構(gòu)、計(jì)算通信、訓(xùn)推流程、成本控制、開(kāi)源生態(tài)等維度帶來(lái)一系列創(chuàng)新,為企業(yè)用戶帶來(lái)更低門檻、更多樣化的AI應(yīng)用空間,基于其開(kāi)源模型,只需要后續(xù)通過(guò)百卡結(jié)合客戶數(shù)據(jù)微調(diào)即可打造垂直化業(yè)務(wù)模型。行業(yè)大模型、行業(yè)智能體正在向深化場(chǎng)景持續(xù)邁進(jìn),算力的使用需求也將隨著垂直場(chǎng)景的爆發(fā)式發(fā)展呈現(xiàn)出多樣化、定制化、精細(xì)化特征。未來(lái)推理所需要的算力將來(lái)會(huì)成為思路:全新定義的新質(zhì)算力,從客戶最為關(guān)注的算效提升、體系化管理、一體化調(diào)度以及應(yīng)用落地優(yōu)化等方面進(jìn)行整體統(tǒng)籌,幫助企業(yè)突破傳統(tǒng)算力服務(wù)的瓶頸,推動(dòng)從算力到算效的全面思維轉(zhuǎn)變。企業(yè)通過(guò)新質(zhì)算力棧建設(shè),還可以有效推動(dòng)綠色計(jì)算理念的實(shí)踐落地,建立行動(dòng):在算力中心建設(shè)和運(yùn)行過(guò)程中,企業(yè)可圍繞軟硬協(xié)同、綠色節(jié)能、高效存儲(chǔ)、網(wǎng)絡(luò)互聯(lián)、智能運(yùn)維五個(gè)維度,形成算力運(yùn)營(yíng)效率的聯(lián)合評(píng)估框架體系,并參考PEEIE算力設(shè)施產(chǎn)品選型標(biāo)準(zhǔn),重點(diǎn)考評(píng)產(chǎn)品豐富度、關(guān)鍵性能指標(biāo)、工程化落地支持、行業(yè)落地實(shí)踐、服務(wù)與生態(tài)建設(shè)等能力指標(biāo)。此外,企業(yè)還須重點(diǎn)關(guān)注面向智能化場(chǎng)景的算力需求,綜合考慮自身的規(guī)模、資金現(xiàn)狀、發(fā)展規(guī)劃、市場(chǎng)環(huán)境以及技術(shù)發(fā)展趨勢(shì)等因素,選擇適合當(dāng)前和未來(lái)第一章新環(huán)境:生成式AI持續(xù)進(jìn)化,企業(yè)算力場(chǎng)景加速爆發(fā)011.1生成式AI規(guī)?;涞卦诩?,算力市場(chǎng)進(jìn)入高質(zhì)量增長(zhǎng)階段021.2算力場(chǎng)景需求持續(xù)深化04第二章新挑戰(zhàn):傳統(tǒng)算力基礎(chǔ)設(shè)施效率低下,企業(yè)亟需升級(jí)服務(wù)2.1算力粗放建設(shè)帶來(lái)供需脫節(jié)072.2企業(yè)算力建設(shè)面臨五大挑戰(zhàn)09第三章新定義:新質(zhì)算力幫助企業(yè)突破發(fā)展壁壘3.1全新定義新質(zhì)算力123.2橫縱聯(lián)合,突破傳統(tǒng)算力服務(wù)瓶頸153.3從投入到產(chǎn)出全鏈條優(yōu)化16第四章新路徑:算力效率雷達(dá)指引企業(yè)新質(zhì)算力建設(shè)4.1算力效率雷達(dá)聯(lián)合評(píng)估算力運(yùn)營(yíng)效率184.2企業(yè)新質(zhì)算力建設(shè)路徑圖204.3算力產(chǎn)品選型標(biāo)準(zhǔn)24第五章新實(shí)踐:新質(zhì)算力建設(shè)場(chǎng)景和案例分析5.1算力集群建設(shè)場(chǎng)景275.2算力建設(shè)的實(shí)踐案例及分析39第六章IDC建議與未來(lái)展望316.1機(jī)遇與挑戰(zhàn)326.2結(jié)語(yǔ)32第七章關(guān)于寧暢337.1綠色智能算力專家開(kāi)創(chuàng)全局智算347.2企業(yè)榮譽(yù)351.1生成式AI規(guī)?;涞卦诩?,算力市場(chǎng)有望進(jìn)入高質(zhì)量增長(zhǎng)階段1.2算力場(chǎng)景需求持續(xù)深化021.1生成式AI規(guī)模化落地在即,算力市場(chǎng)進(jìn)入高質(zhì)量DeepSeek引發(fā)市場(chǎng)對(duì)生成式AI的新一輪關(guān)注,帶來(lái)了生態(tài)的繁榮以及對(duì)模型開(kāi)發(fā)的進(jìn)一步思考。從生成式AI生態(tài)來(lái)看,DeepSeek在短期內(nèi)接連發(fā)布新的模型并刷新榜單,以高質(zhì)量、高可靠的推理過(guò)程和回答體驗(yàn)快速積累了龐大的用戶群體。同時(shí),低成本、開(kāi)源特性也讓DeepSeek相比OpenAI更加友好,促使全球和中國(guó)的AI技術(shù)供應(yīng)商、云廠商紛紛在自有平臺(tái)服務(wù)中上線支持DeepSeek模型,截止目前已有上百家技術(shù)供應(yīng)商和企業(yè)宣布接入DeepSeek模型,這加速了AI對(duì)更廣泛用戶群體的覆蓋。從模型開(kāi)發(fā)來(lái)看,DeepSeek在全球產(chǎn)生巨大影響的核心是高性價(jià)比的模型訓(xùn)練和高質(zhì)量的結(jié)果輸出,通過(guò)MLA多頭潛在注意力機(jī)制、MOE混合專家模型、GRPO組相對(duì)優(yōu)化策略、MTP優(yōu)化訓(xùn)練成本與同等最優(yōu)模型相比大幅度降低。但需要強(qiáng)調(diào)的是,高性能算力仍然是打造領(lǐng)先AI大模型的基礎(chǔ),另一方面對(duì)于模型訓(xùn)練、優(yōu)化、推理步驟的拆解,以及對(duì)算力AI智能體(AIAgent)的廣泛實(shí)踐落地進(jìn)一步帶動(dòng)了用戶端的巨大變革,深刻影響各行各業(yè)的創(chuàng)新格局。AI智能體作為承載技術(shù)、業(yè)務(wù)和人智能化融合形式,正逐漸滲透到各行各業(yè)?從智能客服到虛擬業(yè)務(wù)助手,從智能家居到自動(dòng)駕駛,應(yīng)用場(chǎng)景愈發(fā)豐富多樣,技術(shù)邊界不斷拓展延伸。與此同時(shí),市場(chǎng)對(duì)AI智能體的認(rèn)知與應(yīng)用仍存在諸多盲點(diǎn),技術(shù)選型、產(chǎn)品選型及具體實(shí)踐應(yīng)用及模型訓(xùn)練優(yōu)化以及推理流程拆解時(shí)的算力資源全棧整合與持續(xù)優(yōu)化問(wèn)題。在智能化推動(dòng)行業(yè)轉(zhuǎn)型升級(jí)的大背景下,生成式AI將持續(xù)成為算力規(guī)?;投鄻踊l(fā)展的有力推手。IDC認(rèn)為在AI戰(zhàn)略的影響下,2025年將會(huì)有更多的企業(yè)致力于在算力資源軟硬件協(xié)同、算網(wǎng)協(xié)同、精細(xì)化/一體化IDC的數(shù)據(jù)顯示,中國(guó)智算服務(wù)市場(chǎng)規(guī)模增速顯著。2024年上半年,中國(guó)智算服務(wù)整體市場(chǎng)同比增長(zhǎng)79.6%,市場(chǎng)規(guī)模達(dá)到146.1億元人民幣。其中,智算集成服務(wù)市場(chǎng)同比增長(zhǎng)168.4%,市場(chǎng)規(guī)模達(dá)57.0億元人民幣;面向生成式AI的智算服務(wù)市場(chǎng)(GenAIIaaS)同比增長(zhǎng)203.6%,市場(chǎng)規(guī)模達(dá)52.0億元人民幣;而其他AIIaaS市場(chǎng)則同比縮減13.7%,市場(chǎng)規(guī)模為37.1億元人民幣。生成式AI的發(fā)展是帶動(dòng)算力市場(chǎng)快速增長(zhǎng)的主要?jiǎng)恿υ础Ec傳統(tǒng)AI領(lǐng)域的圖像識(shí)別、語(yǔ)音自然語(yǔ)言處理等相比,深度學(xué)習(xí)模型和通用AI旨在構(gòu)建更加廣泛的理解能力,面向復(fù)雜的行業(yè)業(yè)務(wù),持續(xù)提升感知、認(rèn)知和決策水平,推動(dòng)更大范圍的流程自動(dòng)化、智能化。這意味著需要提供03中國(guó)智算服務(wù)市場(chǎng)規(guī)模,2022H1-2024H116,00014,00012,00010,0008,0006,0004,0002,000014,60911,4738,1336,1385,1192022H12022H22023H12023H22024H1智算集成服務(wù)OtherAIlaaSGenAIlaaS來(lái)源:IDC中國(guó),2025生成式AI向行業(yè)縱深快速挺進(jìn),也會(huì)進(jìn)一步對(duì)算力服務(wù)提出更加全面、更具效能、更精細(xì)化的要求。一方面,在算力需求旺盛的泛互聯(lián)網(wǎng)、自動(dòng)駕駛、智能制造以及科研教育等領(lǐng)域,大模型正在加速融入業(yè)務(wù)流程,大幅提升智能化服務(wù)水平和效率。在泛互聯(lián)網(wǎng)領(lǐng)域,大量AI應(yīng)用被快速開(kāi)發(fā)和推廣,通過(guò)交互式軟件形態(tài)持續(xù)改變B端、C端用戶的使用習(xí)慣。在自動(dòng)駕駛領(lǐng)域,端到端大模型已經(jīng)成為主流應(yīng)用形態(tài),讓智駕系統(tǒng)快速適應(yīng)更多、更復(fù)雜的路況;在智能制造領(lǐng)域,AI通過(guò)分析海量數(shù)據(jù),優(yōu)化生產(chǎn)工藝流程,預(yù)測(cè)設(shè)備故障,全面檢測(cè)產(chǎn)品質(zhì)量并持續(xù)提升生產(chǎn)效率。另一方面,生成式AI也在傳統(tǒng)行業(yè)轉(zhuǎn)型升級(jí)的過(guò)程體現(xiàn)出極大的應(yīng)用價(jià)值。在農(nóng)業(yè)領(lǐng)域,AI被越來(lái)越多的用于農(nóng)情監(jiān)測(cè)、病蟲(chóng)害防治以及作物生長(zhǎng)周期管理;在醫(yī)療健康領(lǐng)域,AI持續(xù)學(xué)習(xí)海量醫(yī)學(xué)影像資料,用于輔助診斷和治療方案設(shè)計(jì)等。隨著行業(yè)應(yīng)用的不斷深入,用戶需要快速增強(qiáng)大模型的行業(yè)深度,通過(guò)模型精調(diào)、RLHF、Prompt等手段,強(qiáng)化大模型的專業(yè)理解力和決策041.2算力場(chǎng)景需求持續(xù)深化為了應(yīng)對(duì)行業(yè)發(fā)展的需要,一大批行業(yè)大模型、行業(yè)智能體正在不斷邁向深化場(chǎng)景。IDC與寧暢聯(lián)合研究發(fā)現(xiàn),伴隨垂直場(chǎng)景的發(fā)展,算力的使用需求日益呈現(xiàn)出多樣化、定制化、精細(xì)化特多樣化定制化精細(xì)化來(lái)源:IDC中國(guó),2025首先是類型需求多樣化,例如生成式AI的大模型訓(xùn)練和推理工作需要足夠的計(jì)算密度,同時(shí)支持高效的內(nèi)存訪問(wèn)和數(shù)據(jù)傳輸;科研、氣象等領(lǐng)域的高性能計(jì)算(HPC)更關(guān)注強(qiáng)大的并行計(jì)算能力和高精度浮點(diǎn)運(yùn)算;而交通、應(yīng)急等行業(yè)在構(gòu)建中心化算力的同時(shí),還需要大量使用邊緣算力設(shè)備。其次是性能需求多樣化,例如互聯(lián)網(wǎng)行業(yè)普遍看重算力設(shè)施的高效數(shù)據(jù)吞吐能力和低延遲響應(yīng),金融行業(yè)更關(guān)注算力的穩(wěn)定性和實(shí)時(shí)性,而傳統(tǒng)行業(yè)則更加需要算力設(shè)施具備自動(dòng)化運(yùn)維監(jiān)控能力,以及對(duì)IoT、邊緣算力設(shè)備的各行業(yè)應(yīng)用場(chǎng)景將越來(lái)越復(fù)雜,傳統(tǒng)的標(biāo)準(zhǔn)化算力服務(wù)滿足企業(yè)用戶的個(gè)性化需求。為了保證足夠的經(jīng)濟(jì)性和適配能力,用戶需具備對(duì)算力的靈活定制和優(yōu)化能力。在定制化算力模式下,用戶可以按照具體需求,靈活配置軟硬件資源,搭建更加高效、經(jīng)濟(jì)的算力服務(wù)。例如,影像分析場(chǎng)景,可以增加高性能的數(shù)據(jù)并行存儲(chǔ)和處理設(shè)備;行業(yè)推理場(chǎng)景,可以通過(guò)算力和網(wǎng)絡(luò)的協(xié)同優(yōu)化,使算力服務(wù)更行業(yè)場(chǎng)景的持續(xù)深化過(guò)程,需要對(duì)算力資源進(jìn)行更細(xì)致、更精準(zhǔn)的管理和調(diào)度。例如多場(chǎng)景融合應(yīng)用使算力規(guī)模和復(fù)雜度成倍增加,資源的使用效率和協(xié)同水平將顯著影響綜合成本和用戶體驗(yàn)。算力的精細(xì)化管理包含了對(duì)算力資源的實(shí)時(shí)監(jiān)控、算網(wǎng)協(xié)同以及動(dòng)態(tài)優(yōu)化回收機(jī)制等,保障算力資源在不同的業(yè)務(wù)場(chǎng)景下都能夠得到合理的分配和高效的052.1算力粗放建設(shè)帶來(lái)供需脫節(jié)2.2企業(yè)算力建設(shè)面臨五大挑戰(zhàn)2.1算力粗放建設(shè)帶來(lái)供需脫節(jié)IDC的調(diào)研數(shù)據(jù)顯示:全球幾乎所有地區(qū)、行業(yè)和企業(yè)的生成式AI資源投入都在快速增長(zhǎng)。至2024年11月,已經(jīng)有34.4%的企業(yè)將若干生成式AI應(yīng)用引入到生產(chǎn)中,并致力于持續(xù)進(jìn)行擴(kuò)展,圖3全球企業(yè)對(duì)生成式AI投資顯著增加34.4%已經(jīng)在生產(chǎn)中引入了幾個(gè)生成式AI的應(yīng)用/服務(wù),并16.6%33.6%35.6%對(duì)生成式AI進(jìn)行規(guī)模化的投資,并對(duì)相關(guān)的培訓(xùn)、獲取生成式AI33.6%35.6%22.4%31.1%8.6%15.3%2024年1月2024年11月來(lái)源:IDC中國(guó),2025值得注意的是,規(guī)模中小型的企業(yè)對(duì)于生成式AI的投資增幅更大,這也印證了大模型應(yīng)用門檻降0708圖4全球中小企業(yè)加速對(duì)生成式AI的投資$50.0$40.0$30.0$20.0$10.0$0.065%68%$43.694%123%143%$34.8$20.794%123%143%$34.8$20.7$17.1$16.0$16.4$17.1$8.9$6.6$7.3$8.9500-999人1,000-2,499人2,500-4,999人5,000-9,999人10,000以上2024年1月2024年11月來(lái)源:IDC中國(guó),2025生成式AI的需求高漲引發(fā)了企業(yè)對(duì)算力服務(wù)市場(chǎng)的高度關(guān)注,但過(guò)去幾年間建設(shè)的大量算力中心卻常常無(wú)法與企業(yè)需求順利對(duì)接,從而出現(xiàn)大量的供需脫節(jié)現(xiàn)象。目前,傳統(tǒng)算力基礎(chǔ)設(shè)施在技術(shù)架構(gòu)、投資回報(bào)、使用效率等方面正在陸續(xù)顯現(xiàn)出問(wèn)題,隨著規(guī)模和需求復(fù)雜度的增長(zhǎng),這些機(jī)房建設(shè)人力成本軟硬件采購(gòu)機(jī)房建設(shè)人力成本軟硬件采購(gòu)低產(chǎn)出低產(chǎn)出粗放規(guī)劃使用低效來(lái)源:IDC中國(guó),202509盲目高投入推升算力投資風(fēng)險(xiǎn):算力建設(shè)中的機(jī)房建設(shè)、軟硬件采購(gòu)和長(zhǎng)期運(yùn)維都涉及到大量資金的投入。在算力投資熱潮中,很多算力中心單純追求規(guī)模和性能參數(shù),盲目做大設(shè)備規(guī)模。隨著技術(shù)的快速進(jìn)步和需求的頻繁變化,算力基礎(chǔ)設(shè)施的更新?lián)Q代速度也會(huì)加快,使規(guī)劃和設(shè)計(jì)能力不足導(dǎo)致供需對(duì)接不暢:很多算力中心在規(guī)劃和建設(shè)時(shí),沒(méi)有進(jìn)行相關(guān)的需求調(diào)研,盲目采購(gòu)熱門算力設(shè)備,并隨意確定規(guī)模和技術(shù)指標(biāo),導(dǎo)致資源布局不合理、組件規(guī)模不匹配、內(nèi)容缺項(xiàng)等嚴(yán)重問(wèn)題。事實(shí)上,傳統(tǒng)模式下建設(shè)的大量算力中心往往以采購(gòu)硬件設(shè)備為主,大量的算力只能以裸金屬形式交付給用戶,使很多中小企業(yè)無(wú)法有效得到算力算力中心綜合運(yùn)營(yíng)效率亟待提升:由于算力資源管理和調(diào)度方面的技術(shù)能力嚴(yán)重不足,算力設(shè)施整體利用率和使用效率不高,設(shè)備閑置比例過(guò)大。很多算力基于整機(jī)進(jìn)行分配,算力浪費(fèi)現(xiàn)象十分嚴(yán)重,給用戶帶來(lái)額外的經(jīng)濟(jì)負(fù)擔(dān)。更值得關(guān)注的是,算力市場(chǎng)的整體服務(wù)機(jī)制不健全,應(yīng)用推廣力度普遍不足,導(dǎo)致算力方面的投資沒(méi)有給企業(yè)帶來(lái)降本增效的成果,不能充分體現(xiàn)出智能化升級(jí)帶來(lái)的效益提升。此外,在算力使用過(guò)程中還可能存在惡意入侵、2.2企業(yè)算力建設(shè)面臨五大挑戰(zhàn)隨著行業(yè)算力場(chǎng)景的深化和日趨復(fù)雜,大量傳統(tǒng)算力基礎(chǔ)設(shè)施逐漸難以滿足業(yè)務(wù)轉(zhuǎn)型升級(jí)和創(chuàng)新的需求,亟需提升綜合服務(wù)能力。因此,企業(yè)需要在駕馭算力使用效率、強(qiáng)化場(chǎng)景化算力匹配和駕馭算力效率問(wèn)題:企業(yè)在規(guī)?;褂盟懔Y源時(shí),首先要具備動(dòng)態(tài)評(píng)估算力效率的技術(shù)手段,例如構(gòu)建多算力管理和監(jiān)控工具,讓用戶能夠?qū)崟r(shí)、細(xì)粒度地跟蹤和評(píng)估算力、網(wǎng)絡(luò)的整體協(xié)同運(yùn)行狀態(tài),并配合智能化手段動(dòng)態(tài)調(diào)整資源配置,從而提升算力的整體利用率和有讓算力精準(zhǔn)匹配場(chǎng)景:行業(yè)里將出現(xiàn)更多場(chǎng)景化、個(gè)性化的算力需求,涉及行業(yè)模型訓(xùn)練、大數(shù)據(jù)分析、高性能計(jì)算、邊緣分析等。提供場(chǎng)景化算力服務(wù)的難點(diǎn)在于深入理解業(yè)務(wù)需求,精準(zhǔn)評(píng)估算力需求架構(gòu),并能夠非常靈活地調(diào)配算力資源。同時(shí),為應(yīng)對(duì)企業(yè)業(yè)務(wù)的變持續(xù)強(qiáng)化管理調(diào)度能力:隨著算力規(guī)模的快速增長(zhǎng)以及算力架構(gòu)的日趨復(fù)雜,保障算力服務(wù)的持續(xù)高效輸出將變得越來(lái)越困難。算力的整體管理調(diào)度能力包含了多元算力融合管理、算網(wǎng)協(xié)同以及良好的動(dòng)態(tài)分配、負(fù)載均衡以及故障恢復(fù)等機(jī)制。先進(jìn)的算力管理和調(diào)度系統(tǒng)可讓算力更易用:隨著AI向傳統(tǒng)行業(yè)的持續(xù)滲透,大量的傳統(tǒng)企業(yè)需要借助算力資源來(lái)推動(dòng)智能化業(yè)務(wù)創(chuàng)新,但傳統(tǒng)算力設(shè)施的高門檻讓很多用戶望而生畏。新一代算力基礎(chǔ)設(shè)施需要具備更為友好的操作界面和良好的可交互性,利用智能化工具簡(jiǎn)化算力資源的操作和運(yùn)營(yíng)流滿足日趨嚴(yán)格的綠色節(jié)能指標(biāo)要求:隨著國(guó)內(nèi)生態(tài)環(huán)境壓力的持續(xù)加大以及能源結(jié)構(gòu)轉(zhuǎn)型需求的日益迫切,企業(yè)算力中心的綠色節(jié)能建設(shè)已成為必然選擇。算力設(shè)施需要采用引入更加體系化的節(jié)能技術(shù),并建立完善的能源監(jiān)測(cè)和分析機(jī)制,以持續(xù)優(yōu)化算力資源的能耗結(jié)構(gòu),103.1全新定義新質(zhì)算力3.2橫縱聯(lián)合,突破傳統(tǒng)算力服務(wù)瓶頸3.3從投入到產(chǎn)出全鏈條優(yōu)化12DeepSeek廣受關(guān)注的核心因素之一,是其可以基于更加豐富的算力類型,通過(guò)可調(diào)控、可優(yōu)化的訓(xùn)練和推理資源管理手段,形成更具想象力的應(yīng)用形態(tài)。這有助于改變傳統(tǒng)算力基礎(chǔ)設(shè)施存在在更低門檻、更多樣化的算力需求背景下,新質(zhì)算力的理念正在快速推向市場(chǎng)。新質(zhì)算力旨在集合從底層硬件到上層應(yīng)用的一體化算力技術(shù),將算力芯片、板卡、服務(wù)器、軟件算法、網(wǎng)絡(luò)架構(gòu)3.1全新定義新質(zhì)算力IDC與寧暢合作,全新定義了新質(zhì)算力概念模來(lái)源:IDC中國(guó),202513當(dāng)前較為先進(jìn)的液冷服務(wù)器實(shí)質(zhì)上低數(shù)據(jù)中心PUE的目標(biāo)后,無(wú)法進(jìn)一步突破能效與成本的桎梏。如何平衡不同硬件規(guī)格之間的差異性,實(shí)現(xiàn)覆蓋處理器、內(nèi)存模塊、存儲(chǔ)設(shè)備等多類組建的整體“全液冷”大幅提升算效:隨著企業(yè)AI應(yīng)用進(jìn)程的深入,用戶的關(guān)注點(diǎn)將從粗放的算力規(guī)模、算力類型轉(zhuǎn)變?yōu)楦恿炕乃懔π实戎笜?biāo)。算效概念可理解為數(shù)據(jù)中心算力與功率的比值,即利用算力設(shè)施的計(jì)算性能和功率指標(biāo),綜合衡量整體工作效率。多種技術(shù)方法都可被用于提升算效,例如在訓(xùn)練時(shí)引入多精度平衡、網(wǎng)絡(luò)平衡、內(nèi)存平衡、IO平衡等多種設(shè)計(jì)手段,提升算力當(dāng)前較為先進(jìn)的液冷服務(wù)器實(shí)質(zhì)上低數(shù)據(jù)中心PUE的目標(biāo)后,無(wú)法進(jìn)一步突破能效與成本的桎梏。如何平衡不同硬件規(guī)格之間的差異性,實(shí)現(xiàn)覆蓋處理器、內(nèi)存模塊、存儲(chǔ)設(shè)備等多類組建的整體“全液冷”在很多AI訓(xùn)練中,不僅要考慮半精度運(yùn)算性能,還需要綜合分配FP64、FP32、TP32、FP16、BF16、Int4、Int8的多精度能力,實(shí)現(xiàn)多精度平衡設(shè)計(jì)具有十分重要的意義。如金融量化的場(chǎng)景中對(duì)雙精能力較高,可以在虛擬化基礎(chǔ)上體系化管理:在很多AI訓(xùn)練中,不僅要考慮半精度運(yùn)算性能,還需要綜合分配FP64、FP32、TP32、FP16、BF16、Int4、Int8的多精度能力,實(shí)現(xiàn)多精度平衡設(shè)計(jì)具有十分重要的意義。如金融量化的場(chǎng)景中對(duì)雙精能力較高,可以在虛擬化基礎(chǔ)上14面向深度學(xué)習(xí)場(chǎng)景的高性能云平臺(tái),可基于TensorFlow、PyTorch和Jupyter框架滿足用戶的任務(wù)管理、數(shù)據(jù)管理、共享中心、文件管提交深度學(xué)習(xí)訓(xùn)練任務(wù),并通過(guò)任務(wù)管理頁(yè)面可以實(shí)時(shí)查看深度學(xué)習(xí)訓(xùn)練任務(wù)的運(yùn)行狀態(tài)、模型詳細(xì)信息、數(shù)據(jù)集詳細(xì)信息、使用的深度學(xué)習(xí)框架鏡像版本、訓(xùn)練曲線和硬件資源使用情況等,實(shí)現(xiàn)自上而下一體化調(diào)度:面向深度學(xué)習(xí)場(chǎng)景的高性能云平臺(tái),可基于TensorFlow、PyTorch和Jupyter框架滿足用戶的任務(wù)管理、數(shù)據(jù)管理、共享中心、文件管提交深度學(xué)習(xí)訓(xùn)練任務(wù),并通過(guò)任務(wù)管理頁(yè)面可以實(shí)時(shí)查看深度學(xué)習(xí)訓(xùn)練任務(wù)的運(yùn)行狀態(tài)、模型詳細(xì)信息、數(shù)據(jù)集詳細(xì)信息、使用的深度學(xué)習(xí)框架鏡像版本、訓(xùn)練曲線和硬件資源使用情況等,實(shí)現(xiàn)自上而下面向AI模型開(kāi)發(fā)管理的容器化人工智能訓(xùn)練平臺(tái),包含PyTorch和面向AI模型開(kāi)發(fā)管理的容器化人工智能訓(xùn)練平臺(tái),包含PyTorch和TensorFlow等主流深度學(xué)習(xí)框架,靈活支持單機(jī)和分布式訓(xùn)練,并提供容器生命周期管理、權(quán)限管理、鏡像倉(cāng)庫(kù)等功能。通過(guò)SLURM和Kubernetes子系統(tǒng)滿足不同的計(jì)算環(huán)境需求,其中SLURM適用于高端計(jì)算環(huán)境,Kubernetes適用于容器化應(yīng)用。平臺(tái)同時(shí)支持兩大調(diào)度框架的納管,更好的滿足不同客戶群從應(yīng)用需求出發(fā)增加平臺(tái)層面的優(yōu)化技術(shù)手段,例如根據(jù)大模型訓(xùn)練的性能、可用性需求,合理析、調(diào)度技術(shù)提高訓(xùn)練過(guò)程中的算力有效利用率采用標(biāo)準(zhǔn)統(tǒng)一的算力服務(wù)接口和協(xié)議,實(shí)現(xiàn)跨平臺(tái)的算力資源共享利用,進(jìn)一步增強(qiáng)算力對(duì)應(yīng)用153.2橫縱聯(lián)合,突破傳統(tǒng)算力服務(wù)瓶頸新質(zhì)算力解決方案能夠幫助企業(yè)突破傳統(tǒng)算力服務(wù)的瓶頸,推動(dòng)從算力到算效的全面思維轉(zhuǎn)變。企業(yè)將面對(duì)可持續(xù)發(fā)展的更高維度目標(biāo),依托先進(jìn)的技術(shù)和算法,保障算力資源持續(xù)工作在高效狀態(tài),并通過(guò)新的算力棧建設(shè)推動(dòng)綠色計(jì)算理念的實(shí)踐落地,建立持續(xù)改進(jìn)的新局面,在橫向廣從橫向來(lái)看:新質(zhì)算力有助于企業(yè)將AI能力拓展到更多業(yè)務(wù)范疇。通過(guò)技術(shù)創(chuàng)新構(gòu)建多層次的算力調(diào)度和服務(wù)能力,提供貼近應(yīng)用場(chǎng)景的算力服務(wù)。目前,規(guī)?;懔φ谕苿?dòng)基礎(chǔ)大模型的高效進(jìn)化,強(qiáng)大的自然語(yǔ)言處理能力和預(yù)測(cè)、優(yōu)化能力,能夠在企業(yè)數(shù)據(jù)挖掘、流程創(chuàng)新、內(nèi)容創(chuàng)作、智能服務(wù)以及定制化應(yīng)用等方面創(chuàng)造出更具想象力的成果。AI向行業(yè)的滲透也體現(xiàn)在MaaS服務(wù)市場(chǎng)和大模型tokens調(diào)用量的增長(zhǎng)率數(shù)據(jù)上。IDC數(shù)據(jù)顯示,2024上半年中國(guó)MaaS的規(guī)模已達(dá)2.5億元人民幣,中國(guó)AI大模型解決方案市場(chǎng)的規(guī)模為13.8億元人民從縱向看:更具定制化特性和協(xié)同效率的算力服務(wù),正在幫助生成式AI從一些簡(jiǎn)單場(chǎng)景服務(wù)和功能呈現(xiàn),發(fā)展為可以應(yīng)對(duì)多模態(tài)場(chǎng)景下的復(fù)雜業(yè)務(wù)理解。例如,在醫(yī)療領(lǐng)域,生成式AI可以用于讀取影像資料、病歷記錄和趨勢(shì)數(shù)據(jù),輔助醫(yī)生快速、精準(zhǔn)地確定病情,制定更具針對(duì)性的方案。在互聯(lián)網(wǎng)媒體領(lǐng)域,生成式AI廣泛用于多樣化的內(nèi)容生成,在新聞制作、文通過(guò)引入一系列效率管理手段,企業(yè)在從簡(jiǎn)單計(jì)算需求過(guò)渡到大量的高端/高密度計(jì)算需求時(shí),可以將精細(xì)化的算力服務(wù)快速提供至更廣和更深度的應(yīng)用中,從新質(zhì)算力中切實(shí)獲取到預(yù)期的收目前,寧暢已為國(guó)內(nèi)多家一線互聯(lián)網(wǎng)廠商提供了高效的算力基礎(chǔ)設(shè)施產(chǎn)品及服務(wù)目前,寧暢已為國(guó)內(nèi)多家一線互聯(lián)網(wǎng)廠商提供了高效的算力基礎(chǔ)設(shè)施產(chǎn)品及服務(wù)定制化方案設(shè)計(jì)。通過(guò)引入新的算力棧,這些企業(yè)可以實(shí)現(xiàn)更高效的數(shù)據(jù)處理和計(jì)算任務(wù)執(zhí)行,同消耗和運(yùn)營(yíng)成本。伴隨寧暢推出的AI算力棧,提供了從底層硬件到頂層應(yīng)用平臺(tái)的系統(tǒng)化方案,可幫助企業(yè)快速構(gòu)建全棧AI環(huán)境,滿足大模型落地所需的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、建設(shè)、管理、應(yīng)用及液冷等需求,支持機(jī)器學(xué)習(xí)、AI推163.3從投入到產(chǎn)出全鏈條優(yōu)化從企業(yè)用戶的角度看,新質(zhì)算力在建設(shè)投入、運(yùn)營(yíng)、產(chǎn)出的全鏈條上均施行了區(qū)別于傳統(tǒng)算力的優(yōu)化手段。在建設(shè)投入環(huán)節(jié),一體化的規(guī)劃設(shè)計(jì)保證了算力資源在供需兩端的充分匹配,能夠按照用戶智能化轉(zhuǎn)型升級(jí)的要求,組合形成細(xì)粒度的定制化服務(wù)。在運(yùn)營(yíng)環(huán)節(jié),豐富的自動(dòng)化、智能化工具可以減少很多不必要的操作,減少資源消耗、人力開(kāi)發(fā)成本、持續(xù)運(yùn)維成本以及故障風(fēng)險(xiǎn)。在產(chǎn)出方面,與傳統(tǒng)算力服務(wù)對(duì)比,新質(zhì)算力在成本、效率、業(yè)務(wù)成果等方面都能夠體現(xiàn)出集約化效應(yīng)更顯著:新質(zhì)算力通常采用集中統(tǒng)籌部署和管理模式,具有多種資源優(yōu)化手段。相較于傳統(tǒng)算力服務(wù),在同等服務(wù)能力要求下,一體化算力中心對(duì)硬件資源的限制更少,總服務(wù)體驗(yàn)更佳:新質(zhì)算力擁有更加先進(jìn)的軟硬件技術(shù),有高效的管理和調(diào)度能力,可以為用運(yùn)行維護(hù)更簡(jiǎn)捷:新質(zhì)算力具備更豐富的自動(dòng)運(yùn)行維護(hù)手段,能夠大幅減輕運(yùn)維的復(fù)雜度,更貼近行業(yè)需求:新質(zhì)算力更加貼近行業(yè)場(chǎng)景需求,能夠支持大規(guī)模的數(shù)據(jù)分析和多種類型新質(zhì)算力也改變和優(yōu)化了傳統(tǒng)算力設(shè)施復(fù)雜的建設(shè)流程。以往的算力中心建設(shè)通常需要經(jīng)歷需求分析、架構(gòu)設(shè)計(jì)、硬件采購(gòu)、場(chǎng)地準(zhǔn)備、硬件與軟件安裝調(diào)試、運(yùn)維管理等過(guò)程。相比之下,新質(zhì)算力建設(shè)通常會(huì)采用標(biāo)準(zhǔn)化與定制相結(jié)合的方案,通過(guò)良好的算力棧設(shè)計(jì),快速搭建一體化的算力環(huán)境,無(wú)需從零開(kāi)始進(jìn)行硬件采購(gòu)和系統(tǒng)配置。相關(guān)企業(yè)可以提供從硬件選型、系統(tǒng)配置、軟件部署到運(yùn)維管理的全方位服務(wù),并在技術(shù)支持、數(shù)據(jù)保障、應(yīng)急管理等方面提供豐富的增值4.1算力效率雷達(dá)聯(lián)合評(píng)估算力運(yùn)營(yíng)效率4.2企業(yè)新質(zhì)算力建設(shè)路徑圖4.3算力產(chǎn)品選型標(biāo)準(zhǔn)184.1算力效率雷達(dá)聯(lián)合評(píng)估算力運(yùn)營(yíng)效率當(dāng)前,算力的簡(jiǎn)單堆砌已越來(lái)越難以帶動(dòng)AI的規(guī)?;l(fā)展和垂直落地,企業(yè)和用戶應(yīng)進(jìn)入追求高算效、高效能、精細(xì)化、智能化的新階段。針對(duì)企業(yè)最為關(guān)心的算力中心運(yùn)營(yíng)效率問(wèn)題,IDC與寧暢聯(lián)合對(duì)算力市場(chǎng)開(kāi)展了觀察和研究,并圍繞企業(yè)算力中心建設(shè)和運(yùn)營(yíng)過(guò)程中重點(diǎn)關(guān)注的軟硬協(xié)同、綠色節(jié)能、高效存儲(chǔ)、網(wǎng)絡(luò)互聯(lián)、智能運(yùn)維五個(gè)目標(biāo)維度,形成聯(lián)合評(píng)估算力運(yùn)營(yíng)效率的整個(gè)評(píng)估框架以生成式AI時(shí)代的大模型訓(xùn)練和推理需求為核心,圍繞五維目標(biāo),將企業(yè)各類算力理I處化聯(lián)理I處化聯(lián)算資熱AI大模型布式存數(shù)據(jù)動(dòng)態(tài)緩自定義本地/云存力:高效存儲(chǔ)來(lái)源:IDC中國(guó),202519通過(guò)軟硬件一體化協(xié)同提升算力使用效率。其第1優(yōu)先級(jí)是評(píng)估基礎(chǔ)算力資源的一體化調(diào)度能力,涉及軟件管理調(diào)度平臺(tái)在算力虛擬化、算力分配機(jī)制、網(wǎng)絡(luò)協(xié)同等方面所具備的技術(shù)水平和測(cè)試結(jié)果。第2優(yōu)先級(jí)是評(píng)估算子層面的優(yōu)化能力,包括對(duì)不同算子的統(tǒng)一封裝以及目標(biāo)是持續(xù)提升綠色節(jié)能水平。其第1優(yōu)先級(jí)是基于全液冷等先進(jìn)技術(shù),評(píng)估對(duì)相關(guān)能耗的動(dòng)態(tài)監(jiān)測(cè)、分析、管理手段是否健全。第2優(yōu)先級(jí)是引入AI手段持續(xù)優(yōu)化能耗方案,并從碳足跡層面評(píng)估整個(gè)運(yùn)營(yíng)周期的能耗變化趨勢(shì)。第3優(yōu)先級(jí)是基于可視化分析手段,引入更多評(píng)圍繞數(shù)據(jù)使用效能提升AI應(yīng)用效率。其第1優(yōu)先級(jí)是評(píng)估底層的分布式存儲(chǔ)吞吐率、時(shí)延、一致性、安全性、兼容性等指標(biāo)。第2優(yōu)先級(jí)是評(píng)估冷熱數(shù)據(jù)的分級(jí)、分類方案和響應(yīng)的數(shù)據(jù)即通過(guò)高性能的網(wǎng)絡(luò)互聯(lián)保障算力集群持續(xù)高效運(yùn)行。其第1優(yōu)先級(jí)是評(píng)估網(wǎng)絡(luò)的物理性能、穩(wěn)定性等指標(biāo),確保底層網(wǎng)絡(luò)暢通。第2優(yōu)先級(jí)關(guān)注算力調(diào)度過(guò)程中對(duì)于流量的多路徑負(fù)載均衡方案,提供更多流量調(diào)度手段。第3優(yōu)先級(jí)評(píng)估點(diǎn)對(duì)點(diǎn)的通信效率優(yōu)化,保證算網(wǎng)關(guān)注算力中心長(zhǎng)期運(yùn)營(yíng)過(guò)程中的人力投入。其第1優(yōu)先級(jí)是評(píng)估算力中心的全周期監(jiān)管技術(shù)手段和體制機(jī)制,體現(xiàn)運(yùn)營(yíng)的規(guī)范有序。第2優(yōu)先級(jí)評(píng)估對(duì)運(yùn)維任務(wù)和運(yùn)維故障的自動(dòng)化干預(yù)能力,這關(guān)系到運(yùn)維工作的人力投入規(guī)模和工作成效。第3優(yōu)先級(jí)是進(jìn)一步關(guān)注運(yùn)維和運(yùn)204.2企業(yè)新質(zhì)算力建設(shè)路徑圖企業(yè)建設(shè)新的算力棧是一個(gè)復(fù)雜的系統(tǒng)工程,涉及多個(gè)方面的戰(zhàn)略考量、資源投入、組織與人戰(zhàn)略考量:企業(yè)首先應(yīng)結(jié)合自身的業(yè)務(wù)發(fā)展方向,確定算力棧的建設(shè)目標(biāo)、規(guī)模以及運(yùn)營(yíng)模式等。了解重點(diǎn)行業(yè)對(duì)于算力的具體應(yīng)用模式,特別是本行業(yè)的龍頭企業(yè)對(duì)于算力棧的技術(shù)投入規(guī)劃:根據(jù)需求規(guī)模和性能要求,制定合理的資金預(yù)算,保證建設(shè)資金充足且風(fēng)險(xiǎn)可控。同時(shí)評(píng)估企業(yè)現(xiàn)有的計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)和安全資源,考慮發(fā)展路徑的延續(xù)性,并確定如組織與人力:為了更好的支撐智能化業(yè)務(wù)創(chuàng)新,企業(yè)在建設(shè)算力棧時(shí)應(yīng)考慮建立良好的跨部門溝通和協(xié)作機(jī)制,明確部門和人員職責(zé)。企業(yè)應(yīng)根據(jù)自身情況,通過(guò)培養(yǎng)、外聘等方式組技術(shù)路徑:根據(jù)企業(yè)當(dāng)前算力資源情況和未來(lái)需求評(píng)估結(jié)果,全新建設(shè)算力?;蚧诋?dāng)前算力設(shè)施進(jìn)行升級(jí)擴(kuò)容。并對(duì)IDC、服務(wù)器、算力卡、算力管理調(diào)度平臺(tái)等關(guān)鍵產(chǎn)品進(jìn)行技術(shù)安全與監(jiān)管:建設(shè)安全保障體系,制定算力棧的安全策略,包括訪問(wèn)控制、數(shù)據(jù)加密、防火墻設(shè)置等。建立安全監(jiān)控機(jī)制和應(yīng)急響應(yīng)計(jì)劃,隨時(shí)掌握算力資源運(yùn)行動(dòng)態(tài),有能力對(duì)安全事件進(jìn)行快速響應(yīng)和處理。此外,深入了解國(guó)家和地方關(guān)于算力棧建設(shè)的監(jiān)管要求,確保算高效、穩(wěn)定地向外輸出。在對(duì)關(guān)鍵環(huán)節(jié)進(jìn)行考察評(píng)估的基礎(chǔ)上,企業(yè)可參考21第一階段建設(shè)規(guī)劃第一階段建設(shè)規(guī)劃戰(zhàn)略管理戰(zhàn)略管理第二階段集群部署第二階段集群部署第三階段追蹤優(yōu)化第三階段追蹤優(yōu)化AI模型及算子開(kāi)發(fā)AI模型及算子開(kāi)發(fā)來(lái)源:IDC中國(guó),202522從確定戰(zhàn)略目標(biāo)、規(guī)劃業(yè)務(wù)升級(jí)實(shí)施路徑以及全面確認(rèn)需求三個(gè)方面,適時(shí)開(kāi)展前期準(zhǔn)備工作。面向算力中心的戰(zhàn)略、管理體系以及研發(fā)、運(yùn)維、運(yùn)營(yíng)、財(cái)務(wù)等關(guān)鍵過(guò)程,確定方法和執(zhí)行路戰(zhàn)略設(shè)計(jì):明確算力建設(shè)所要達(dá)成的遠(yuǎn)期目標(biāo)和分期建設(shè)路徑,梳理算力需求,對(duì)內(nèi)部已有管理體系:構(gòu)建與算力建設(shè)相適配的組織和管理體系,建立相關(guān)的組織機(jī)構(gòu)并協(xié)調(diào)各專業(yè)崗位人員。通過(guò)引入新的管理方法、機(jī)構(gòu)設(shè)置以及跨部門的協(xié)同機(jī)制,保證整個(gè)算力建設(shè)和運(yùn)研發(fā)過(guò)程:明確相關(guān)場(chǎng)景功能需求,形成與算力棧建設(shè)內(nèi)容相匹配的資源定制化策略,確定運(yùn)維過(guò)程:結(jié)合算力棧建設(shè)成果和智能化的運(yùn)維工具,建立運(yùn)維團(tuán)隊(duì)和運(yùn)維流程機(jī)制,覆蓋財(cái)務(wù)管理:根據(jù)預(yù)算規(guī)模和企業(yè)的實(shí)際經(jīng)營(yíng)情況,提前制定好分階段資金使用計(jì)劃,對(duì)建設(shè)、運(yùn)維、運(yùn)營(yíng)過(guò)程中的資金使用情況進(jìn)行嚴(yán)格監(jiān)管和審計(jì),通過(guò)有效的財(cái)務(wù)管理措施提升推動(dòng)算力集群的部署和交付工作,從合作篩選、集群部署、業(yè)務(wù)上線、持續(xù)運(yùn)營(yíng)四個(gè)階段分別落合作篩選:對(duì)相關(guān)廠商進(jìn)行考察,圈定潛在合作伙伴范圍,實(shí)施POC測(cè)試,對(duì)各項(xiàng)測(cè)試指標(biāo)進(jìn)行綜合評(píng)估。按照規(guī)范化流程選定服務(wù)商,并與服務(wù)商合作建立項(xiàng)目組織,推動(dòng)概要設(shè)23集群部署:與服務(wù)商合作搭建算力集群,部署計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、安全等硬件設(shè)備和操作系統(tǒng)、中間件、分布式計(jì)算框架等軟件平臺(tái),并通過(guò)集成、調(diào)試、效果評(píng)估和性能優(yōu)化等措業(yè)務(wù)上線:將相關(guān)業(yè)務(wù)數(shù)據(jù)接入算力集群,并根據(jù)智能化業(yè)務(wù)對(duì)模型參數(shù)、速度等指標(biāo)的要求,選擇合適的大模型進(jìn)行適配和精調(diào),以支持業(yè)務(wù)智能體開(kāi)發(fā)等應(yīng)用開(kāi)發(fā)活動(dòng)。在此基礎(chǔ)持續(xù)運(yùn)營(yíng):當(dāng)算力集群進(jìn)入正式運(yùn)行階段后,需遵循第一階段(建設(shè)規(guī)劃)面向運(yùn)維、運(yùn)營(yíng)算力系統(tǒng)依照運(yùn)營(yíng)流程向各需求方提供長(zhǎng)期服務(wù)后,可從兩個(gè)發(fā)展方向關(guān)注算力體系的提升和優(yōu)化,一是持續(xù)推動(dòng)智能化業(yè)務(wù)經(jīng)驗(yàn)賦能算力使用全環(huán)節(jié)能力提升,二是確保算力資源、算力開(kāi)在追蹤優(yōu)化階段,可特別關(guān)注在行業(yè)深度場(chǎng)景和跨場(chǎng)景使用時(shí),系統(tǒng)的資源調(diào)度、持續(xù)優(yōu)化能力以及相關(guān)實(shí)踐體驗(yàn)。根據(jù)使用情況沉淀問(wèn)題和改進(jìn)需求,并聯(lián)合服務(wù)商進(jìn)行持續(xù)優(yōu)化,特別是在AI模型和算子開(kāi)發(fā)層面不斷進(jìn)行創(chuàng)新,使算力資圍繞評(píng)估雷達(dá)中的算力、碳力、存力、運(yùn)力、智力五個(gè)方面,企業(yè)在建設(shè)新質(zhì)算力底座后,需要進(jìn)行持續(xù)的升級(jí)迭代,并針對(duì)模型開(kāi)發(fā)以及整體資源管理的深層邏輯和優(yōu)化路徑,實(shí)現(xiàn)正循環(huán)反饋,結(jié)合實(shí)際工程化問(wèn)題和經(jīng)驗(yàn)進(jìn)一步提升AI在企業(yè)內(nèi)部和外部的應(yīng)用性能,加速業(yè)務(wù)、產(chǎn)品、244.3算力產(chǎn)品選型標(biāo)準(zhǔn)為幫助市場(chǎng)用戶選型,IDC還與寧暢合作制定了PEEIE(Product,E?ciency,Engineering,Indus-try,Ecology)算力設(shè)施產(chǎn)品選型標(biāo)準(zhǔn),即在選擇技術(shù)供應(yīng)商時(shí)重點(diǎn)考評(píng)產(chǎn)品豐富度、關(guān)鍵性能指產(chǎn)品豐富度:主要關(guān)注技術(shù)供應(yīng)商算力產(chǎn)品的可選類型范圍、定制化能力和靈活配置能力等,以考察其在滿足場(chǎng)景多樣化需求時(shí)的適配性和便捷性。其中,可選類型除能覆蓋常見(jiàn)的AI計(jì)算、高端計(jì)算需求外,還應(yīng)配備相關(guān)優(yōu)化、加速、管控平臺(tái)軟件以及其他邊緣設(shè)備等,以滿足不同領(lǐng)域的需求。在操作層面應(yīng)通過(guò)友好的交互界面支持用戶多樣化定制需求,支持細(xì)粒度的資源調(diào)度等,能夠推薦多種配置選項(xiàng),如處理器規(guī)格、存儲(chǔ)容量等,方便用戶根據(jù)關(guān)鍵性能指標(biāo):用于衡量算力產(chǎn)品的整體性能,包括處理器的定點(diǎn)/浮點(diǎn)運(yùn)算能力、緩存大產(chǎn)品能否支撐更多、更復(fù)雜的數(shù)據(jù)和模型。此外,在綠色低碳和可持續(xù)發(fā)展的背景下,算力工程化落地支撐:主要評(píng)估算力產(chǎn)品的穩(wěn)定性、易用性和可維護(hù)性。包括產(chǎn)品自身是否能夠長(zhǎng)期穩(wěn)定運(yùn)行,故障恢復(fù)機(jī)制是否健全,產(chǎn)品是否具備友好的交互界面,是否提供豐富的操作和運(yùn)行維護(hù)工具,是否有清晰、簡(jiǎn)捷的部署和配置管理流程等。此外,服務(wù)商的產(chǎn)品相關(guān)行業(yè)落地實(shí)踐:考察算力產(chǎn)品是否在政務(wù)、金融、教育、醫(yī)療等重點(diǎn)行業(yè)獲得過(guò)成功的落地實(shí)踐案例,綜合評(píng)估其典型案例中的應(yīng)用成效,特別是關(guān)注行業(yè)用戶對(duì)產(chǎn)品的真實(shí)評(píng)價(jià),以全面深入了解產(chǎn)品的特性和優(yōu)劣勢(shì)。此外,還應(yīng)特別注意算力產(chǎn)品在行業(yè)中的應(yīng)用深度,例如是否實(shí)際對(duì)AI大模型的訓(xùn)練和推理提供關(guān)鍵支撐,是否有大型互聯(lián)網(wǎng)公司的服務(wù)案例,是服務(wù)與生態(tài)建設(shè):評(píng)估算力產(chǎn)品服務(wù)商能夠提供完善的售前、售后服務(wù),包括設(shè)計(jì)咨詢、產(chǎn)品集成、技術(shù)支持、維修巡檢等,是否提供符合預(yù)期的故障應(yīng)急響應(yīng)服務(wù)。在生態(tài)方面,主要關(guān)注潛在的產(chǎn)品能否與其他的云服務(wù)、大數(shù)據(jù)、應(yīng)用平臺(tái)產(chǎn)品進(jìn)行良好的集成與被集成,推理模型帶動(dòng)的用戶需求爆發(fā),再次證明了AI市場(chǎng)的巨大潛力和多變特性。因此,企業(yè)圍繞上述標(biāo)準(zhǔn)篩選技術(shù)供應(yīng)商時(shí),還應(yīng)特別關(guān)注其定制化和快速適配能力,以及是否能夠結(jié)合企業(yè)業(yè)務(wù)環(huán)境采取高水平的深度優(yōu)化和升級(jí)措施,以進(jìn)為加速人工智能大模型技術(shù)在企業(yè)級(jí)場(chǎng)景中的規(guī)?;鎸?duì)推理模型激發(fā)的企業(yè)AI部署需求,為解決不同功能、版本、場(chǎng)景下的并行處理、成本、安全、開(kāi)發(fā)問(wèn)題,寧暢全新打造全系列軟硬件一體方案,覆蓋從數(shù)B級(jí)輕量版、十B級(jí)&百B級(jí)推理到千億級(jí)訓(xùn)練的全場(chǎng)景產(chǎn)品,可支持金融、工業(yè)、文本等全場(chǎng)景和類型的模型全棧開(kāi)發(fā)和優(yōu)化,并配合AIManager和Ncentre智能平臺(tái),實(shí)現(xiàn)算子級(jí)別的此外,該方案還支持模型蒸餾、微調(diào)和工作流編排,集成多款行業(yè)知識(shí)庫(kù)與模板,快速滿足自動(dòng)駕駛、金融風(fēng)控、醫(yī)療影像分析和工業(yè)質(zhì)檢等垂直場(chǎng)景需求。通過(guò)端到端全生命周期服務(wù),覆蓋從前期咨詢到彈性擴(kuò)縮容、智能運(yùn)維255.1算力集群建設(shè)場(chǎng)景5.2算力建設(shè)的實(shí)踐案例及分析275.1算力集群建設(shè)場(chǎng)景算力效率雷達(dá)為企業(yè)算力底座的建設(shè)和長(zhǎng)期高效運(yùn)營(yíng)提供了基礎(chǔ)引導(dǎo),但在面對(duì)細(xì)分場(chǎng)景和具體落地需求時(shí),由于不同企業(yè)的戰(zhàn)略目標(biāo)、組織架構(gòu)和發(fā)展空間不盡相同,因此還需要將方法論和指標(biāo)體系與具體的業(yè)務(wù)內(nèi)容相結(jié)合,形成場(chǎng)景化的關(guān)鍵舉措。在推進(jìn)算力集群建設(shè)時(shí),通常要基于場(chǎng)景目標(biāo),綜合考慮自身的規(guī)模、資金現(xiàn)狀、發(fā)展規(guī)劃、市場(chǎng)環(huán)境以及技術(shù)發(fā)展趨勢(shì)等因素,傳統(tǒng)計(jì)算—重點(diǎn)關(guān)注軟硬協(xié)同與AI提質(zhì)增效:傳統(tǒng)計(jì)算通過(guò)計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、安全以及數(shù)據(jù)庫(kù)、大數(shù)據(jù)等資源,為企業(yè)業(yè)務(wù)系統(tǒng)的運(yùn)行和管控提供集約、彈性、可擴(kuò)展的服務(wù)能力,滿足企業(yè)數(shù)據(jù)分析、業(yè)務(wù)管理、工程計(jì)算、科學(xué)計(jì)算、圖形計(jì)算等多種需求。面向傳統(tǒng)計(jì)算需求,應(yīng)持續(xù)關(guān)注軟硬件協(xié)同能力的提升,并引入AI技術(shù)提高傳統(tǒng)計(jì)算的效率和精度,例如在氣象預(yù)報(bào)場(chǎng)景中,通過(guò)AI分析和歸納歷史數(shù)據(jù),更高效地構(gòu)建預(yù)報(bào)模型,大幅增強(qiáng)模型計(jì)算的效率和精準(zhǔn)度。在企業(yè)數(shù)據(jù)分析場(chǎng)景中,AI依托高性能存儲(chǔ)和強(qiáng)大的算力支撐,可以加速處理和分析過(guò)程,幫助企業(yè)更加快速、精準(zhǔn)地觸達(dá)用戶,及時(shí)調(diào)整企業(yè)內(nèi)部運(yùn)營(yíng)出現(xiàn)的卡點(diǎn)問(wèn)題。此外,AI還能推動(dòng)跨學(xué)科知識(shí)融合,探索新的研究方法,讓傳統(tǒng)計(jì)算獲得超預(yù)AI計(jì)算—重點(diǎn)強(qiáng)化訓(xùn)練和推理效率:大模型推動(dòng)的智能化轉(zhuǎn)型為AI計(jì)算帶來(lái)快速增長(zhǎng)的需求空間。企業(yè)在規(guī)模化引入人工智能技術(shù)成果時(shí),應(yīng)通過(guò)IaaS和PaaS平臺(tái)的優(yōu)化和加速能力,強(qiáng)化AI大模型的訓(xùn)練和推理效率。目前,大模型已經(jīng)在許多行業(yè)開(kāi)展不同程度的應(yīng)用融合工作,不但包括泛互聯(lián)網(wǎng)、自動(dòng)駕駛、金融、生物醫(yī)藥等先行行業(yè),也正在快速滲透至交通、制造、能源、電力等傳統(tǒng)領(lǐng)域。一些大型企業(yè)自建算力集群用于大模型的預(yù)訓(xùn)練、精調(diào)、強(qiáng)化學(xué)習(xí)、prompt工程等,并將大模型用于實(shí)際的分析、預(yù)測(cè)和決策過(guò)程,進(jìn)而又產(chǎn)生物聯(lián)網(wǎng)與邊緣計(jì)算—重點(diǎn)提升適配、協(xié)同和融合能力:工業(yè)制造、自動(dòng)駕駛、智能交通等行業(yè)引入了大量傳感器和邊緣設(shè)備,使邊緣處的算力適配、協(xié)同和融合變得愈發(fā)重要。一些算力集群的建設(shè)需求將變得更加靈活多樣,如何實(shí)現(xiàn)與邊緣設(shè)備深度結(jié)合的定制化設(shè)計(jì),大幅提升邊緣算效和能效,將成為亟需解決的面對(duì)上述場(chǎng)景,新質(zhì)算力能夠顯著體現(xiàn)出一體化、全流程的服務(wù)優(yōu)勢(shì)多個(gè)環(huán)節(jié)能力的基礎(chǔ)上,幫助企業(yè)用戶搭建出更具定制化特性的算力服務(wù)。通過(guò)對(duì)高效能服務(wù)器、集群管理平臺(tái)和大模型平臺(tái)的高效整合,以及軟硬件一體一站式交付,可以助力不同行業(yè)用集群搭建業(yè)務(wù)接入集群搭建業(yè)務(wù)接入GPU服務(wù)器AI開(kāi)發(fā)通用側(cè)場(chǎng)景AI服務(wù)AI開(kāi)發(fā)通用側(cè)場(chǎng)景AI服務(wù)計(jì)算隊(duì)列服務(wù)容器SLURMKBS計(jì)算隊(duì)列服務(wù)容器SLURMKBS計(jì)算資源池分布式存儲(chǔ)資源池AI開(kāi)發(fā)全流程AI算力棧來(lái)源:IDC中國(guó),202528295.2算力建設(shè)的實(shí)踐案例及分析某車企客戶擁有多款汽車子品牌和熱門車型,面對(duì)當(dāng)前激烈的市場(chǎng)競(jìng)爭(zhēng),客戶希望在智能駕駛、智能座艙、車輛運(yùn)營(yíng)等領(lǐng)域強(qiáng)化AI能力的融合,通過(guò)高強(qiáng)度的研發(fā)投入,形成為滿足汽車研發(fā)中的復(fù)雜仿真模擬和設(shè)計(jì)優(yōu)化需求,推動(dòng)自動(dòng)駕駛技術(shù)的模型訓(xùn)練、算法優(yōu)化及實(shí)時(shí)數(shù)據(jù)處理決策,提升智能座艙體驗(yàn)和車輛遠(yuǎn)程監(jiān)控管理水平,客戶希望建寧暢與客戶密切合作,采用高端AI計(jì)算平臺(tái)X660G45,形成算力中心的核心智算基礎(chǔ)設(shè)施,通過(guò)NVLink高速互聯(lián),滿足深度學(xué)習(xí)訓(xùn)練開(kāi)發(fā)應(yīng)用場(chǎng)景。200Gb高速網(wǎng)絡(luò)組網(wǎng),能夠顯著加速客戶海量數(shù)據(jù)的并發(fā)處理能力,為自動(dòng)駕駛、智能座艙開(kāi)發(fā)時(shí)的模型訓(xùn)練、客戶依托智算中心構(gòu)建了智能仿真平臺(tái),基于強(qiáng)大的計(jì)算性能加速汽車研發(fā)過(guò)程。平臺(tái)支持開(kāi)展大量復(fù)雜的計(jì)算任務(wù),例如全場(chǎng)景虛擬碰撞試驗(yàn)、虛擬道路耐久測(cè)試等,為汽車的安全性和耐久性研發(fā)提供有力的數(shù)據(jù)支持。同時(shí),平臺(tái)有力支撐了自動(dòng)駕駛模型的此外,平臺(tái)還顯著推動(dòng)了整車智能化服務(wù)能力的提升,讓智能座艙能夠提供更加快速的30某互聯(lián)網(wǎng)企業(yè)客戶擁有短視頻、直播、電商等多類功能平臺(tái)和運(yùn)營(yíng)業(yè)態(tài)。面對(duì)當(dāng)前AI領(lǐng)域的飛速發(fā)展態(tài)勢(shì),客戶希望抓住AI大模型的時(shí)代機(jī)遇,找到業(yè)務(wù)創(chuàng)新突破口。一方面,通過(guò)對(duì)語(yǔ)言大模型、推薦大模型、視覺(jué)生成大模型的訓(xùn)練、精調(diào),形成核心AI能力矩陣,覆蓋內(nèi)容理解、分發(fā)、生成等多個(gè)層面。同時(shí),利用大模型實(shí)現(xiàn)文/圖生視頻、視為滿足客戶的規(guī)?;?xùn)練和推理需求,寧暢提供了軟硬一體化組合保障方案,并構(gòu)建出能夠覆蓋多類應(yīng)用需求的豐富算力服務(wù)體系。超高算力的X660G45機(jī)型,通過(guò)高速互聯(lián)加速客戶的大模型訓(xùn)練進(jìn)度。X640G40機(jī)型則更加側(cè)重于均衡算力服務(wù),為客戶提供更為了更好的基于客戶自研大模型體系開(kāi)展應(yīng)用場(chǎng)景開(kāi)發(fā)和推廣工作,寧暢還根據(jù)不同的算力使用場(chǎng)景,對(duì)多種算力設(shè)備進(jìn)行組合搭建。其中,現(xiàn)象級(jí)AI應(yīng)用的首選推理平臺(tái)采用了X620G50機(jī)型,支持4卡PCleGPU,并以此為核心實(shí)現(xiàn)了應(yīng)用級(jí)推理解決方案。行業(yè)大模型訓(xùn)推一體算力底座采用X640G50機(jī)型,支持8卡PCleGPU,形成全方位推理訓(xùn)練集群。此外,更高性能的X680G55機(jī)型,支持NVLinkGPU,構(gòu)建極致性能的框架性寧暢為用戶構(gòu)建了包含標(biāo)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論