




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
人工智能行業AI算力市場簡析01算力是智能世界的基礎,產業生態和投資圖譜逐步清晰算力是智能世界的基礎,基礎設施從云向算泛在演進智能世界三要素:數據、算力、算法是智能世界三要素,其中算力平臺是核心基礎。算力兩大類:通用算力、HPC(高性能計算,High-performancecomputing)算力。其中通用算力計算量小,用于常規應用。HPC算力是一個計算機集群系統,通過各種互聯技術將多個計算機系統連接在一起,利用所有被連接系統的綜合計算能力來處理大型計算問題。算力基礎設施從云向算泛在演進,其位置的分布從中心向邊緣和端側泛在延伸,將出現云、邊、端三級算力架構。AI大模型帶動算力需求超越摩爾定律增長AI模型訓練算力增長速度超越芯片摩爾定律。AI訓練任務中的算力增長(所需算力每3.5個月翻一倍)已經超越摩爾定律(晶體管數量每18月翻一倍)。ChatGPT僅推出兩個月,月活躍用戶數預計已達1億。ChatGPT在2023年1月達到1億月活躍用戶,平均每天有1,300多萬訪客,用2個月時間達到1億月活數,成為史上最快達到1億月活躍用戶的應用,TikTok、Instagram、Facebook、Twitter則分別用了9個月、2年半、4年半、5年的時間。MR、車載等數字經濟新型應用場景帶來新的算力需求MR的推出更帶來對低延時網絡傳輸和底層算力技術升級的需求。虛擬世界需要強大的圖像實時渲染能力、計算和存儲海量數據資源,頭顯交互設備的出現將進一步增加對云計算和邊緣計算的應用需求。云計算能將終端渲染逐步遷移至云端,基于規模效應攤低運算成本,提升服務器使用效率,提升虛擬世界的可進入性。而邊緣計算則更能滿足實時數據分析需求、緩解中心云的計算負載。汽車智能化需求持續升級帶來數據流量的急劇飆升。隨著自動駕駛等級提升,車載信息娛樂系統、長續航電池及5G網絡的引入,車輛要面對的計算量越來越大,網絡架構升級、本地實時處理能力、“大容量緩存和存儲”規格將成為硬需求。中美算力布局較為領先,中國智能算力在追趕智能算力規模和增速亮眼。根據信通院算力白皮書,2021年全球算力增速超過40%,華為GIV預測2030年人類將迎來YB數據時代,全球算力平均年增速達到65%,其中基礎算力平均年增速達27%;智能算力占大頭,平均年增速超過80%;超算算力平均年增速超過34%。中美算力在全球屬于領先地位。美國、中國、歐洲、日本在全球算力規模中的份額分別為34%、33%、14%和5%,其中全球基礎算力美國份額達37%,中國以26%份額排名第二;智能算力方面,中國、美國分別占比為45%和28%;美國、日本、中國在超級計算綜合性能指標方面份額分別為48%、22%、18%。02基礎設備:數據中心加速升級,芯片PCB等上游部件量價齊升AI服務器采用異構式架構,GPU數量遠高于普通服務器。AI服務器和普通服務器的主要區別在于:1)架構不同,AI服務器采用CPU+GPU/FPGA/ASIC等異構式架構,而普通服務器一般是CPU架構;2)GPU數量差別巨大,AI服務器單服務器GPU用量通常在4顆以上。例如:NVIDIADGXA100包括8個A100GPU+2個AMDRomeCPU,而浪潮英信服務器NF5280M6僅配置1-2個英特爾第三代Xeon處理器。GPU架構為主流加速架構,是服務器核心成本構成。GPU采用并行計算,適用于處理密集型運算,如圖形渲染、機器學習等場景,AI算力需求的提升推動了GPU卡的運算速度和用量需求進一步增長。根據IDC數據,2022年GPU加速卡占據AI市場89%的份額,在機器學習型服務器中GPU成本占比達72.8%。高速互連技術開創者,多卡互聯優勢顯著。為實現超算模型的高速通信需求,英偉達開創式提出NVLink和NVSwitch技術:NVLink主要用于連接多個GPU,以加速高性能計算和深度學習等應用;NVSwitch用于連接多個GPU和CPU,形成高性能計算系統,適用于更復雜和大規模的場景,用戶可根據具體應用需求和系統配置來決定使用NVLink或NVSwitch。GH200超級芯片所采用的NVLink-C2C技術,通過Chiplet工藝將CPU+GPU組合到同一封裝,相比于PCIe5在能效方面提升25倍,面積效率提升90倍。CUDA生態不斷演進,滿足各類行業需求。英偉達依托于CUDA軟件棧進行第三方應用及工具的擴展,形成了廣義的CUDA生態,并在此基礎上向上擴展出CUDA-X,以對接不同的行業應用需求,分為面向AI計算的CUDA-XAI和面向HPC計算的CUDA-XHPC。受益大模型熱潮,國內AI服務器市場增量明顯。ChatGPT橫空出世,引發科技企業大模型競賽,全球算力需求呈指數級增加,帶動國內AI服務器市場快速增長,以浪潮信息為主的國內廠家占據國內AI服務器主要市場。頭部廠商持續加單,國內AI芯片需求強勁。全球頭部互聯網廠商相繼入局大模型賽道,以英偉達GPU為代表的算力核心產品訂單暴增,一批中國AI芯片企業立足于不同技術路徑開展研發,面向云計算、汽車、智能家居等領域,國內AI芯片市場同樣前景廣闊。大力發展硬件的同時,軟件也是及其重要的一環。英偉達不僅在硬件方面具有統治力,在軟件平臺也具有很強的競爭力,CUDA生態已成為行業標的。對國內企業而言,兼顧軟硬的發展路徑至關重要,大力發展算力的同時,國產軟件生態的建立刻不容緩。共建生態開發平臺,加速AI芯片落地。寒武紀不僅實現了終端、云端、邊緣端產品的完整布局,還為云邊端全系列智能芯片與處理器產品提供統一的平臺級基礎系統軟件CambriconNeuware,使開發的應用可以在云邊端互相兼容,大幅減少云邊端不同平臺的開發和應用遷移成本。華為同樣致力于“一平臺雙驅動”為核心的昇騰AI生態,已有200多家合作伙伴經過認證,圍繞昇騰的開發者超30萬,其中核心開發者超2000,并在100多所高校開展了昇騰的人工智能課程。HBM:需求暴增,產能緊缺HBM內存技術:新型高性能存儲產品的競爭與短缺。HBM(HighBandwidthMemory,高帶寬內存)是一款新型的CPU/GPU內存芯片,是將多個DDR芯片堆疊在一起后和GPU封裝在一起,實現大容量和高位寬的DDR組合陣列。目前HBM占整個DRAM市場比重約1.5%,為新型高性能存儲產品,處于缺貨低庫存階段。SK海力士、三星、美光等存儲巨頭都在HBM領域展開了升級競賽。SerDes作為底層接口技術,是充分發揮AI硬件算力效能的關鍵。SerDes是Serializer/Deserializer的縮寫,即串行器和解串器,是目前主流的串行通信技術。通過數據在發送端并轉串—串行傳輸—在接收端串轉并,實現芯片間信號的有線傳輸。相比于傳統并行接口傳輸,SerDes具有更高的速率(Gbps級)、更低的功耗,以及顯著的成本優勢,能夠滿足AI訓練&推理等場景下高帶寬、低延遲的數據傳輸要求,適用于電信、汽車、工業等領域。PCB及載板:規格加速升級,單機ASP持續上升OAM卡,是承載GPU加速卡片的PCB板,以NVIDIADGXH100服務器為例,其可搭載8顆GPU,顯著高于普通服務器,因此其PCB用量顯著高于普通服務器。AI服務器的OAM卡需要用更高層數的PCB板,價值量更大。由于AI服務器電路更加復雜,需要更大帶寬和更高傳輸速率,因此OAM需要更高層數PCB。NVIDIAOAM共兩個版本,SXM約需要20層PCB,而Pcle版本層數相對較少;相比傳統服務器,AI服務器的PCB層數更高,單臺PCB價值量大幅提升。AI服務器的OAM由于芯片性能的提升,對布線密度提出了更高要求。其需要4階及以上HDI加工工藝,根據靖邦電子,HDI板增加一階,成本增加18%左右,因此帶動OAM的ASP上升。目前國內企業鵬鼎控股、滬電股份、奧士康、勝宏科技等均有領先布局。交換機:速率需求升級,銳捷和新華三競爭力提升數據流量快速增長和人工智能快速發展推動數據中心網絡架構轉型,有望驅動交換機數量和端口速率上行,高速以太網交換機市場有望實現強勁增長。根據IDC預測,中國25G端口交換機市場規模到2022年將達到4.4億美元,而100G交換機市場規模將達到13.87億美元。國內交換機市場集中度較高,銳捷和新華三市場份額提升。根據IDC測算,2022前三個季度新華三、華為、星網銳捷三家市占率已經超過80%,國產份額持續保持領先。03網絡連接:算力配套的核心,兼顧800G主線和擴散行情800G主線:互聯帶寬快速提升,催化800G模塊需求網絡性能是決定AI集群算力效率的核心要素。根據阿姆達爾定律,并行系統節點數越多,而其通信占比越高,對整體系統運行效率的影響越大。因此AI芯片的互聯帶寬都需要非常巨大,如H100互聯達到了900GB(1B=8bps)。以Nvidia歷代GPU為例,芯片互聯速率顯著提升,GPU互聯速率提升=nvlink自身單通道的升級*link的數量。芯片互聯性能持續提升,對于節點外的芯片互聯,需要經過數據中心網絡,帶來網絡架構的變革。以Nvidia的DGXH100集群為例,單節點服務器側(8卡)接入帶寬為3.2T,交換機側采用32*800G的交換機。核心要點:1)在非Nvlink組網中,接入帶寬是由網卡的速率*網卡的個數決定的。2)Nvidia構建的基本都是無阻塞的收斂比為1:1的架構。3)實際上Nvidia的推薦方案中部分端口是閑置的,不能直接數交換機端口數。4)對于谷歌TPU、MI300等,也取決于接入網絡的帶寬到底是多少,有一個初始值,我們既可以算出不同層數下需要的800G端口數。數據中心底層硬件,保障高速高質量信號傳輸。連接器作為連接系統、實現光/電信號傳輸交換所必需的基礎配件,廣泛應用于通信、汽車、消費電子、工業交通、航空航天、軍事等領域。傳輸高速高頻數據信號的同時須保證電路阻抗連續性好、串擾小、時延低、信號完整性高。數據中心連接新趨勢不斷涌現,對連接器&線束性能要求持續提升。隨著數據中心規模不斷擴大、組網模式日益復雜,研發更快速度、更高密度和更小型化的連接器以及更高集成度的線束成為行業技術發展的趨勢。連接器順應光模塊迭代趨勢實現用量增長。根據集成光纖數量的不同,常見的光模塊連接器可分為LC接口和MPO/MTP接口,100G以下光模塊多使用LC接口,100G以上光模塊則需要光纖集成度更高的MPO/MTP接口(常用2~48芯)。隨著光模塊速率從100G/200G向400G/800G躍升,單個光模塊的通道數量增加,所需使用的單個連接器的通道密度&分支端連接器數量也增加,即需要更多的MPO/MTP連接器。04終端:邊緣算力建設加速,MR是最具潛力的Al終端谷歌PaLM2全面進化,“大語言模型的小型化”迎重大突破。在谷歌I/O2023大會上,推出PaLM2,改進了數學、代碼、推理、多語言翻譯和自然語言生成能力。PaLM2包含了4個不同參數的模型,包括壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨角獸(Unicorn。其中,PaLM2最輕量版本Gecko小到可以在手機上運行。小型化模型將打破智能終端性能冗余窘境,終端接口的硬件性能將迎大升級。目前,以手機為代表的智能終端性能冗余,算力需求基本滿足目前應用需求場景,導致終端消費者換機動力不足。而AI大語言模型的小型化發展,將帶來智能終端的再升級。在手機、MR、機器人等終端應用上內嵌部署AI模型,將迎來終端的核心架構的變化,終端推理計算能力要求將大升級,對應存儲、傳輸、執行、感知等硬件需求也將同步升級。MR:蘋果VisionPro震撼發布,最具潛力的AI終端VisionPro通過VST(videoseethrough)實現MR(數字與現實的混合)。VisionPro通過傳感器實時感知現實環境,將數字化的現實運算后發給顯示屏
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 作品著作權公證考核試卷
- 膠合板產品的物流配送網絡優化考核試卷
- 船舶導航與通信技術考核試卷
- 綠化管理的發展趨勢與展望考核試卷
- 電子元器件封裝技術考核試卷
- 山東省煙臺市重點名校2025屆初三下第一次五校聯考綜合試題含答案
- 四川省南充市2024-2025學年數學四下期末綜合測試試題含解析
- 蘭州石化職業技術大學《現代生物儀器分析》2023-2024學年第二學期期末試卷
- 寧夏石嘴山市第十五中學2024-2025學年中考物理試題模擬題及解析(天津卷)含解析
- 西藏職業技術學院《GIS開發實踐》2023-2024學年第二學期期末試卷
- 護理人文關懷質量評價標準
- 防輻射內墻抹灰施工方案
- 經腋窩無充氣完全腔鏡甲狀腺手術拉鉤
- 灌溉與排水工程設計規范標準
- 《工會會計制度》管理系統升級及使用
- 詳解科魯茲儀表系統圖
- 老年智能手環產品需求說明書(PRD)
- T∕AOPA 0018-2021 直升機臨時起降場選址與建設規范
- 七八年級人教古詩詞集錦
- JAVAweb開發課件
- 國內外相關生產廠家、口腔產品信息表-20130507
評論
0/150
提交評論