




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
DeepSeek爆火--C端:Deepseek全球破圈,成為用戶規模增長最快的移動AI應用超級app增長1億用戶所用時間App上線后同樣天數DeepSeek與ChatGPT移動端全球DAU對比情況DeepSeek爆火--B端:科技巨頭積極擁抱DeepSeekDeepSeek明星產品:DeepSeek的LLM模型分為三個版本:基座模型V3、強化推理版R1-Zero、泛化推理版R1DeepSeek爆火的原因:一流的性能表現、大幅降低的算力成本、開源模式低成本實現高性能低成本實現高性能開源策略推動技術普及術門檻,促進全球開發者參與,推和FP8混合精度訓練,大幅提升模型一流的性能表現:DeepSeek-V3性能對齊海外領軍閉源模型一流的性能表現:DeepSeek-R1性能對標OpenAI-o1正式版?DeepSeek-R1性能比肩O技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學8大幅降低的算力成本:訓練算力下降90%DeepSeek-V3和R1模型不僅性能出色,用2048塊H800GPU訓練2個月,消耗278.8萬GPU小時。Llama3-405B消耗了3080萬GPU小時,是V3的11倍。按H800GPU每小時2美金計算,V3的訓練成本僅為557.6萬美金,而同等性能的模型通常需要0.6-1億美金。R1模型在V3基礎上,通過引入大規模強化學習和多階段訓練,進一步提升了推理能力,成本API定價下降89%(V3)、96%(R1)開源大模型:打破OpenAI等閉源模型生態DeepSeekV3與R1模型實現了開源,采用MIT協議。這產生多方面影響:?對大模型發展:這提升了世界對中國AI大模型能力的認自有數據訓練,從而適合具體下游場景;此外,模型訓推成本降低,將果訓練其他模型),盡可能降低用戶使用壁壘,全球范圍出圈和更中國智能算力市場規模持續增長,算力中心從訓練側向推理側轉移2022202320242025智能算力推理訓練訓練算力頭部集中,推理算力爆發式增長頭部企業會持續進行教師模型的訓練:模型蒸餾的前提是有一個好的教師模型,字節、阿里、百度等已經明確會持續加大投入;24年H2有些停滯的大模型訓練各模型廠商會借鑒deepseek的優化方法如FP8精度訓練、跨節點通信等,與自身模型訓練結合,探索更高效的模型訓練方法推理算力爆發式增長:杰文斯悖論在推理側上演,開源模型和較低的推理成本,有助于應用的繁榮,助推推理25年,字節資本開支有望達到1600億元,宏提到,百度需要繼續在芯片、數據中心和云基礎設施上加大投入,目的是為?硅谷四大科技巨頭(谷歌、微軟、Meta、亞馬遜)2025年合,重點投向AI數據中心建設。模型輕量化催生端側算力的崛起DeepSeek通過知識蒸餾技術,將大模型壓縮至輕量數據安全與隱私計算剛需推動隱私計算技術發展,2024年數據治理一體機等端側算力市場擴容優刻得、寶德、華鯤振宇、超聚變等均推AI服務器出貨量增長,2025年市場規模預從“算力堆砌”到“算效優化”的產業轉型DeepSeek提出的“四兩撥千斤”的技術路徑推翻了統治了2023年-2024年的全球大模型產業的“暴力美學”邏輯,2025年再次進入算算效優化的必要性算力堆砌的傳統模式算效優化的必要性算力、數據、算法的三角創新體系,在動態循環中?2023年:數據創新為主,數據合成、成為高質量數據集建設的熱點方向算力運營商等產業新物種誕生AI應用AI應用DeepSeek通過PTX優化等創新技術,降低了模型訓練對NV芯片的依賴,推動國產算力的應用落地,對國產GPU的底層接口適配有一定幫助(需要重新設計工具鏈,短期內難以實現無縫遷移)成適配,包括華為昇騰、沐曦、天數智芯、摩爾線程、海光信息、鯤云科技、希姆計算、算能、清微智能和芯動力等?英偉達?英偉達H800芯片互聯帶寬相比H100被閹割,為彌補這一缺陷,DeepSeek借助PTX手動優化跨芯片通信,保障數據傳輸效率。?PTX是CUDA編譯的中間代碼,處于高級編程語言(如CUDAC/C++)和底層機器碼(SASS)之間,起到在CUDA和最終機器碼之間的橋梁作用。?借助PTX,開發者能夠直接對GPU的寄存器分配、線程調度等硬件級操作進行控制,實現細粒度的性能優化。在多GPU協同訓練場景中,可通過PTX手動調整跨芯片通信效率,提升整體訓練效能。私有化部署及端側小模型大量涌現,為國產芯片在實際場景的應用及試錯提供了大量機會,為國產芯片的設計、性能提升等提供空間 芯片智算中心大模型AI應用 DeepSeek采用FP8混合精度訓練取得較好效果,國內芯片企業亟待增強對原生FP8支持出來效率最高的計算方式。如果不是原生支持FP8,而是需要通過度的轉譯,至少損失30%性能和20%的智商采用FP8數據格式的整體混合精度框架?在DeepSeek的訓練過程中,絕大多數核心計算核(即通用矩陣乘法GE。這些GEMM操作接受FP8張量作為輸入,并輸出BF16或FP32格式的結果。如下圖所示,與線性算?對以下模塊維持原有精度(如BF16或FP32嵌入模塊(embeddinghead)、混合專家門控模塊(MoEgatingmodul注意力算子(attentionoperators)。(盡管FP8格式具有計算效率優勢,但由于部分算子對低精國內芯片對三種計算精度的支持情況企業200多家AI應用AI應用A類的原創教師大模型,A100/A800A100/A800、 芯片智算中心大模型AI應用推理類智算中心爆發增長,超大規模智算中心建設加快A類建設速度不減:頭部科技大廠仍計劃大量投資;超前建設的需要;下一輪AI技術的涌現(如多模態等)仍需要十倍左右的算力支美博弈(美國“星際之門”、歐洲“InvestAI計劃”等)結構性過剩,建設減緩:規模小、位置偏僻、型號舊&性價比低、國產算力等類型的智算中心閑置狀況新建要看是不是有強主體包銷,如果有強主題的3-5年包爆發式增長:推理算力需求大幅增加,端側、邊緣側分布式算力部署快速增長,私有化部署1~10臺GPU服務器的小規模集群需求在內算力包銷合同主題分強、弱兩類,市場上更多的?強主體:各個參與方資質和信譽主題都很強。央國企、A股上市公司承建、金融機構墊資、互聯網大廠包銷,這種風險非常高,H系列租金每個月6~8w/臺。這類的算力中心風險非常大,需要AI應用AI應用中國大模型主要有兩類玩家eAliAI創業公司 芯片智算中心大模型AI應用 Deepseek發布后科技大廠:擁抱DeepSeek,同時跟進類似的自研產品及模型路線規模的調整及模型路線規模的調整專家模型),它使用了與DeepSeek-R1類線?百度宣布文心一言4月1日起開源免費,并計劃推出文/知識引擎、國民應用微信、AI智能工作臺ima、主力AI應用元寶全方位擁抱DeepSeek,紛紛宣布接入R1模型/合作,基于昇騰云服務推出DeepSeek-R1/V3推Deepseek發布后AI創業企業:從參數競爭到進入理性期AI六小虎的策略變化發布新語言大模型Step-2-mini和Step-2文學大師版/舉辦首屆“StepUp生態開放日”創立發起人唐杰出席第三屆人工智能行動峰AgenticGLM登陸三星最新款GalaxyS/升級發布T2A-01系列語音模型,并上線海螺語 芯片智算中心大模型AI應用大模型領域迎來“安卓時刻”,大量AI應用將爆發式出現回顧安卓與iOS應用的發展,安卓系統發布一年后,大量的安卓應用開始出現?,F在的deepse?GitHub的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45585-2025大豆莖潰瘍病菌檢疫鑒定方法
- 材料疲勞裂紋擴展控制重點基礎知識點
- 材料疲勞壽命預測數據可視化重點基礎知識點
- 行政管理實踐案例試題及答案
- 店鋪火災疏散應急預案模板(3篇)
- 幼兒園火災應急預案反思(3篇)
- 血液透析火災應急預案(3篇)
- 檔案火災應急演練預案(3篇)
- 宿舍樓火災應急預案體系(3篇)
- 高考數學成就探討試題及答案
- 【蘇教版數學】小學四年級下冊1-4單元教案+教材分析
- 3.2金屬材料 課件高一上學期化學人教版(2019)必修第一冊
- 餐飲加盟合同合同范本
- 陌生拜訪情景演練
- 絕經后子宮內膜增厚診療2024課件
- 八年級數學家長會課件
- 慢性過敏性結膜炎科普講座課件
- 幼兒園營養膳食蔬菜水果認知主題課件
- 河北省五個一名校2025屆高考物理押題試卷含解析
- 人力資源許可證制度(服務流程、服務協議、收費標準、信息發布審查和投訴處理)
- 2024年秋新冀教版三年級上冊英語教學課件 U6L1
評論
0/150
提交評論