




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
浙江大學計算機學院浙江大學人工智能協同創新中心王則可2025年2月DeepSeek優勢的優勢:系統感知的算法創新(量化基因)算力的基本概念■什么算力?“對信息數據進行計算,實現目標結果的能力”■現代算力:信息計算力、數據存儲力、網絡運載力■原生算力:大腦(可處理復雜邏輯,但不能高速處理簡單運算)外部算力工具:■計算機:算力提供者(可高速簡單運算,不能處理復雜邏輯)浙江大學浙江大學(我想全世界只需要五臺電腦)--ThomasWatson,IBM創始人,1943PC時代:一個應用只需一臺電腦,算力夠人工智能大模型算力估計2,計算次數C≈6*N*D人工智能計算平臺成本估計算力存力運力算力(每秒)運力生態12萬25萬萬):1.5*1010秒(174000天)■1000張H800(2.5億):1.5*107秒(174天)浙江大學大模型指導法則ScalingLaw:富則火力覆蓋浙江大學數據集模型參數量數據集模型參數量76543軸),模型效果越好(TestLoss小)軸),模型效果越好■模型參數:參數越多(x軸),模型效果越好國際人工智能企業OpenAIOpenAl商業模式(循環以下四步)■1,華爾街融資■例子:2019-21年融資20億美元■例子:購買2.5萬A100GPU(英偉達掙錢)■3,用最新GPU訓練性能領先的大模型■例子:2023年出ChatGPT,壟斷市場(290億美元估值)■4,用訓練的GPU給客戶提供高質量模型服務2025年特朗普的“星際之門”為OpenAl籌5000億美元Al基礎設■國內人工智能商業模式(循環以下四步)■1,國內融資(億美金)■可行性分析:資金沒問題,尤其優質生產力領域2,購買最新GPU■4,用訓練的GPU給客戶提供高質量模型服務■可行性分析:國內做工業化低成本有絕對優勢美國限制中國AI發展的策略■國內人工智能商業模式(循環以下四步)■1,國內融資(億美金)可行性分析:資金沒問題,尤其優質生產力領域2,購買最新2,購買最新GPU■可行性分析:美國可以發禁令■4,用訓練的GPU給客戶提供高質量模型服務■可行性分析:國內做工業化低成本有絕對優勢時代背景:算力卡脖子時代背景:算力卡脖子美國政府對我國的禁令現成成熟算力:2023年禁止出口高端Al芯片算力:2024年禁止臺積電代工7nm工藝的國內芯片光刻機:2024年限制荷蘭ASML出口7nm光刻機到中國卡脖子后果:國內AI優質算力有差距算力(每秒)運力生態12萬25萬CC-BYDeepSeek上甘嶺”大資金、大算力、大模型大資金、大算力、大模型Al算法與系統協同深度優化反斜面坑道(戰術穿插)DeepSeekDeepSeekV3公開的單次極低預訓練成本泛大發布時間GPU時(小時)訓練成本(美元)2024年7月2024年12月發展歷程:窮則戰術穿插發展歷程:窮則戰術穿插發布時間2024年1月2024年6月2024年12月2024年7月稠密稠密concatenatefconcotenatelk回apply1MoE:1共享專家+256路由專家MLA:低秩壓縮671B參數(GPT-3:175B、GPT-4:1.76T?)參數(~5.5%),降低計算量核心技術DeepSeekMoE:顯著減少計算量■核心技術DeepSeekMoE:顯者減少計算量(窮則戰術穿插)■核心思想:1共享專家+256路由專家,激活8個路由專家■路由專家:量大、細粒度、靈活組合、方便知識表達MultiHeadAtention(MHA)|Grouped-QueryAttention(GQA)!MulMLA:少許計算量換HBM空間(窮則戰術穿插,已開源)■針對美國的HBM芯片禁令(Al算力嚴重依賴高性能內存)■結果:KVCache使用降低93.3%000576%ofmaximumthroughp ATTN(W)▲ATTN(FMLP(W)▲MLP(F)△自研輕量級框架(允許系統極致性能優化)PTX優化繞開CUDA護城河(單獨解讀)DeepSeekDeepSeek有無繞開CUDA護城河?selectsonly8routedexpertsin(4nodes×3.2experts/node)whilesuchacommunicationstrategy,only20SMsaresuffi來自Indetail,weemploythewarpspecializationtechnique(Baueretal.,201420SMsinto10communicationchannels.DIB-to-NVLinkforwarding,and(3)NVLinkreceivingarehandled來自DeepSeek'sAlbreakthro改用類似匯編的PTX編程DeepSeek的AI突破繞過行業標準改用類似匯編的PTX編程actualactualworkloadacrossallShandledbydynamicallyadjustedoverlapwiththecomputationstream,soweakernels.Specifically,weemploycustomizedPTX(ParallelThreadExecutioauto-tunethecommunicationchunksizePTX(ParallelThreadExecution)類英偉達匯編1)內存讀寫到L2、內存和2)GPU內部硬件引擎■個人猜測:GPU的內存一致性模型做的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 房屋認購合同書范本
- 贈與個人財產合同書
- 電腦期貨委托買賣合同
- 2025標準借款合同協議樣本
- 法國餐館轉讓協議書
- 動葉可調軸流電站用風機項目風險分析和評估報告
- 多功能氣象衛星接收系統項目風險分析和評估報告
- 河北旅游職業學院《組織文化研究》2023-2024學年第一學期期末試卷
- 楚雄師范學院《土木工程施工組織》2023-2024學年第二學期期末試卷
- 石家莊市元氏縣2025屆六年級下學期小升初數學試卷含解析
- 2025年興安職業技術學院單招職業技能測試題庫新版
- 機器學習原理與應用課件 第10章 高斯混合模型
- 檢驗生化年終總結
- 《腦脊液幻燈》課件
- 2024年許昌電氣職業學院高職單招職業技能測驗歷年參考題庫(頻考版)含答案解析
- 湖北省武漢市重點中學5G聯合體2023-2024學年高一下學期期末考試英語試卷 含答案
- 2025年重慶中煙工業限責任公司招聘21人高頻重點提升(共500題)附帶答案詳解
- 零星維修工程施工組織設計方案
- 2025年福建省南平事業單位招考筆試高頻重點提升(共500題)附帶答案詳解
- 星際分子光譜分析學的研究方法探究系列如下-洞察分析
- IATF16949基礎知識培訓教材
評論
0/150
提交評論