計算機行業深度分析-三大要素齊發力AI應用步入全面加速期_第1頁
計算機行業深度分析-三大要素齊發力AI應用步入全面加速期_第2頁
計算機行業深度分析-三大要素齊發力AI應用步入全面加速期_第3頁
計算機行業深度分析-三大要素齊發力AI應用步入全面加速期_第4頁
計算機行業深度分析-三大要素齊發力AI應用步入全面加速期_第5頁
已閱讀5頁,還剩42頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

本報告版權屬于中原證券股份有限公司計算機tangyue@021-證券研究報告證券研究報告-行業深度分析強于大市(上調)——計算機滬深30051%40%29%19% 8%-3%-14%2024.032024.072024.112025.03-24%2024.032024.072024.112025.03《計算機行業月報:DeepSeek-R1帶來AI技術突破,持續關注GPT-5的推出進程》2025-02-13《計算機行業深度分析:美國制裁密集出臺,全面圍堵對我國的AI算力供應能力》2025-01-24《計算機行業月報:AI模型成果密集發布,制裁或將全面升級》2025-01-10聯系人:李智電話下降,開源陣營在性能上實現超越。至此,AI應用集齊全面落地的三大關鍵要素,這一階段具有里程碑式意義。理能力的提升路徑,DeepSeek首次公度訓練框架、DualPipe算法、跨節點All-to-All通信內核等一系列追平了最先進的閉源模型的能力,同時在成生態的發展,彌補了中國企業上云(特別是公有云本報告版權屬于中原證券股份有限公司 41.1.o1開啟邏輯推理能力提升的新路徑 41.2.DeepSeek首次公開驗證了強化學習對于大模型推理能力提升的有效性 5 72.1.DeepSeek開啟低成本路線 72.2.DeepSeek算力節省的關鍵點 82.3.兩大模型訓練路徑 2.4.DeepSeek運營成本及相關數據測算 3.1.開源大模型陣營首次在先進性上超越了閉源陣營 3.2.DeepSeek開源條款更加開放,有利推動模型的推廣和應用 3.3.DeepSeek將核心代碼悉數開源,極大地促進了AI技術的發展 20 22 23 4 5 6 7 7 8 8 9 10 10 13 14 14 18 19 22 23 23 24 5 6 7 12 12本報告版權屬于中原證券股份有限公司 16 18 20本報告版權屬于中原證券股份有限公司注推理、AI應用和液冷需求》中提出了“o1的問世”“性能雖然超過了OpenAI現有的模型,但是面臨了新訓練數據要是一種交流的工具,而不是一種思考的工具》(Languageisprimarilyatoocommunicationratherthanthought),論文中證明了負責語言的神經和負債思破,已經表現得比較出色,但是在推理和邏輯能力方面的表現仍圖1:人腦中負責語言和邏輯推理的神經網絡本報告版權屬于中原證券股份有限公司碼、數學和類似領域的復雜問題。因而o1對于LLM實現AGI具有重要的意義,是OpenAI表1:OpenAI大模型產品-4K/16K-圖2:推理模型與語言模型在數學、科學、編碼方面的能力對比本報告版權屬于中原證券股份有限公司訓練方法的基礎上加入了多階段的訓練,包括在強化學),新得到的DeepSeek-R1具有了圖3:DeepSeek-R1的訓練流程為了能夠將推理能力遷移到不適合MoE架構的場景,DeepSeek還用DeepSeek表2:硅基流動上DeepSeek主要模型情況及調用價格428DeepSeek-R1-Zero的AIME精度的能力。與監督微調通過給模型大量人類標注數據進行學習我學習和獲得獎勵的方式,完成自主的學習。因而我們看到強化學習依賴于先驗知識,模型自我學習的過程中或能涌現出超越人類思維上限的推理能力2)無需標注數據,監督微調需要的人工標注數據往往需要耗費較長的時間周期和較高的成本,還容易因為標記者喜好產生訓練偏差。圖4:DeepSeek-R1-Zero在訓練中AIME精度提升情況圖5:DeepSeek-R1-Zero在訓練中的平均響應時長表3:DeepSeek的主要模型發布情況2024年12月發布的DeepSeek-V3在性能本報告版權屬于中原證券股份有限公司請閱讀最后一頁各項聲明本報告版權屬于中原證券股份有限公司圖6:DeepSeek-R1與o1在調用成本差距(美元/百萬token)Cache)較大,DeepSeek通過將低秩近似方法引入鍵值緩存壓縮中,圖7:DeepSeek-V2中MLA對于降低KVCache和訓練成本的作用):),數據只選擇激活其中一部分專家模型,因而可以減少計算量本報告版權屬于中原證券股份有限公司圖8:DeepSeek-V3整體架構架構上展現出了軟硬協同優化能力,這成為了他們超越國內其他大模型團容易損失數據信息。為此,DeepSeek結合自身在GPU硬件架構和訓練誤差方面強大的整合行,而一些關鍵操作則保持了原有數據格式,兼顧了訓練本報告版權屬于中原證券股份有限公司圖9:FP8混合精度訓練框架示意圖圖10:DualPipe算法示意圖(1)通過精細化模型和軟硬件結合的訓練構架的構建模型能力建設。DeepSeek在這個方向上展現出超強的能力和開創性,也很好契合我國本報告版權屬于中原證券股份有限公司圖11:DeepSeek-V3與Grok-3訓練小時數對比(萬GPU小時)圖12:頭部大模型的ChatbotArena成績但可以預見的是,無論從經濟性上來說,還是從能源消耗等因素來看,簡單依靠大力出奇跡的發展路徑的瓶頸都顯而易見。而Dee型應用推廣和能力進一步提升,都創造了更多發展本報告版權屬于中原證券股份有限公司表4:OpenAI大模型產品競品推出情況模型Anthropic騰訊Anthropic根據DeepSeek在3月1日發布的《De表5:DeepSeek運營數據及測算本報告版權屬于中原證券股份有限公司342*1000*0.14+(608-342)*1000*0.55+168*資料來源:DeepSeek,中原證券研究所(圖13:DeepSeek在不同時段用于推理服務的節點數按照理論測算,DeepSeek會有日均47.5萬美元的利潤,對應的毛利率高達84.5%,但實際利潤會少于理論值,對比在理論收入測算中與實本報告版權屬于中原證券股份有限公司預計從2023年到2028年,OpenAI將蒙受440億美元的損失,其中2024年將損失50億美元,到2026年年度損失可能高達140億美元,到2029年OpenAI看,DeepSeek憑借強大的成本控制能力,已經可以實現M論毛利率,都是超出市場預期的。圖14:2024年OpenAI支出預測服務接入后,在用餐時段或將產生更多的服務需求。圖15:DeepSeek成本與理論收入測算本報告版權屬于中原證券股份有限公司除此以外,Anthropic、騰訊、華為目前也都Grok-3達到一般可用性后開源。這意味著xAI的開源節奏將會在發布模型的開源,整體模型能力也將落后于目前主谷歌:作為AI領域的老牌廠商,谷歌在2024年2月和6月分別推出了開源模型億等多個參數大小尺寸,且模型效果始終在開源屆本報告版權屬于中原證券股份有限公司表6:主流開源大模型億以上商用需授權億Apache2.0億億億、570億參數支持32K上下文支持8192上下文,同時發布了90億和2億允許商用,要標注版權,月本報告版權屬于中原證券股份有限公司模型Apache2.0Qwen許可,億支持128k上下文,激活370億參數,訓練億Apache2.0Meta:其在2023年2月推出Llama-1的時候僅可用于研究,而不能進行商Meta進一步允許使用其模型的輸出來改進其他),尼亞州法律管轄,加利福尼亞法院具司法管轄權,或影響受貿易制裁的企業的使用。遵守Apache2.0,其中規模最大的720億參數模型為Qwen許可,30億模型為QwenResearch許可。以Qwen許可為例,允許商用但需要標注通義千問的貢獻,要求當產品擁有爭議適用于中國法律,杭州法院具司法管轄權。阿里在R1后開源的QwQ-32B選擇了定法律管轄相關條款。MIT與Apache同屬于較寬松的開源協議,但是Apache要求在衍生作品中包含原始許可證、版權聲明和貢獻者聲明等,MI本報告版權屬于中原證券股份有限公司圖16:常見開源協議對比通過以上對比來看,DeepSeek在開源協議上保持了更加開放的友好,對于全球被許可人來說,也可以避免受到國際政治及法律變化的影響。在Deep-R1和DeepSeek-V3發布以后并提供MaaS服務,省去了開發者買卡、裝驅動、配加速了在大模型的應用落地,也可以很好地滿足更多私有化的行業需求。表7:各大廠商接入DeepSeek的情況DeepSeek-R1模型可以在AmazonWebServices上使用經過硅基流動和華為云團隊連日攻堅,現在,雙方聯合首發并上線基于華為云昇騰云服務的本報告版權屬于中原證券股份有限公司百度智能云千帆平臺已正式上架DeepSeek-R1和Dee南京智算中心與寒武紀、蘇寧科技合作,成功上線全金山云中國移動通信集團青海有限公司基于寒武紀MLU590國產化算力資源池,已全面部署上線根據Canalys數據,從2024年全球智能手機出貨量市場來看,安卓占據了約78%的市場份額,也極大地降低了手機廠商和應用廠商發展的門檻,促進了手機生態的成熟。因而,業界也對大模型開源生態的發展給與積極的響應。圖17:2024年全球智能手機出貨量市場份額在閉源生態發展的過程中,由于中國企業上云(特別是公有云)比例遠低于海外,AI的本報告版權屬于中原證券股份有限公司B端應用推廣也因此受限。而隨著最強大模型的開源傳統軟件開源的定義中,關注點在于源代碼的公開可獲取,來自全世界的開發者可以很容易地為軟件提供貢獻。而對于大模型來說,涉及到的核心要的代碼、模型參數、用于訓練的技術和方法、標記訓練數據天的代碼庫開源活動就此展開。從芯片級優化到系統級設計,從算法到工程通過破譯英偉達后臺指令,并巧妙地使用,極致優化了算法性能。在此次活動中,DeepSeek將其在節省算力和高效運算方面的核心技術毫無保留地進行悉數開源,在全球范圍內引起了廣泛的關注和強烈的反響,其開源的誠意也贏得了全世界的贊表8:DeepSeek在“OpenSourceWeek”的開源情況核本報告版權屬于中原證券股份有限公司請閱讀最后一頁各項聲明本報告版權屬于中原證券股份有限公司圖18:英偉達DeepSeek-R1推理輸出能力同時,考慮到DeepSeek可以通過低成本取得大廠閉源系統同等水平的大模型,那么DeepSeek也可以在前期實現更加純粹的和具有可持續性的開源、開放,從而加龐大AI開源生態體系,也借助這樣的開源實現群策群力,更快地走向AGI。也在考慮加大開源策略;連一向低調的火山引擎也開源了“大模型應用實驗型的算力主要集中在預訓練(Pre-training)階段,而未來模型在后訓練(Post-tra消耗的算力進一步加大,同時由于模型在推理階段需要進行更長時間的思考過程應用爆發期,B端AI應用成為了企業應對科技變革沖擊的重要手段,阿里、字節、小米等科技大廠也在加速AI投入,完成向下個時代的布局。機終端一類的應用落地形成日常調用,模型調用需求將在種類和頻次上獲得極大的提升。本報告版權屬于中原證券股份有限公司在數據端的長期積累和龐大的工程師團隊,在底層模型能力實現突破以后,我們在的發展目標,同時規劃智算、超算等高性能論總算力、智算算力、智算占比目標都名列前茅,也意圖將算力和人工智能作為新質生產力來帶動河南的發展。圖19:各地算力規劃中關于總算力的相關目標(EFLOPS)圖20:各地算力規劃中關于智能算力的相關目標(EFLOPS)本報告版權屬于中原證券股份有限公司圖21:各地算力規劃中關于智能比例的相關目標部署和推理服務,成為河南省第一個提供該服務的城市級算力中心,河南空本報告版權屬于中原證券股份有限公司強于大市:未來6個月內行業指數相對滬深300漲幅10%以上;同步大市:未來6個月內行業指數相對滬深300漲幅-10%至10%之間;弱于大市:未來6個月內行業指數相對滬深300跌幅10%以上。買入:未來6個月內公司相對滬深300漲幅15%以上;增持:未來6個月內公司相對滬深300漲幅5%至15%;謹慎增持:未來6個月內公司相對滬深300漲幅-10%至5%;減持:未來6個月內公司相對滬深300漲幅-15%至-10%;賣出:未來6個月內公司相對滬深300跌幅15%以上。本報告署名分析師具有中國證券業協會授予的證券分析師執業資格,本人任職符合監管機構相關合規要求。本人基于認真審慎的職業態度、專業嚴謹的研究方法與分析邏輯,獨立、客觀的制作本報告。本報告準確的反映了本人的研究觀點,本人對報告內容和觀點負責,保證報告信息來源合法合規。中原證券股份有限公司具備證券投資咨詢業務資格。本報告由中原證券股份有限公司(以下簡稱“本公司”)制作并僅向本公司客戶發布,本公司不會因任何機構或個人接收到本報告而視其為本公司的當然客戶。本報告中的信息均來源于已公開的資料,本公司對這些信息的準確性及完整性不作任何保證,也不保證所含的信息不會發生任何變更。本報告中的推測、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論