




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Q1盤古大模型為何能在AI領域中脫穎而出?生態建設與合作伙伴華為云的全棧AI能力盤古大模型盤古大模型集成了華為云團隊在AI領域數十項研究成果,并且受益于華為的全棧式AI解決方案,與昇騰(Ascend)芯片、昇思(MindSpore)語言、ModelArts平臺深度結合。技術創新與突破 計算能力與應用場景盤古大模型在處理復雜、不均勻的3D
氣象數據時,創造性地提出了適應地球坐標系統的三維神經網絡(3DEarth-Specific
Transformer),并使用了層次化時域聚合策略來減少預報迭代次數,從而減少迭代誤差。這一創新使得盤古大模型在氣象預報領域取得了顯著成果,并在《Nature》正刊上發表了相關研究成果。基于華為自研達芬奇架構廣泛的應用場景三維神經網絡與層次化時域聚合策略全系列、多模態、強思維與鴻蒙系統的協同ISV生態建設華為云在
to
B
和to
G
領域有著深厚積累,同時多年來致力于ISV(獨立軟件提供商)的生態建設。中軟動力、軟通動力、南威軟件等深耕各行業的軟件服務商都是華為云的合作伙伴,共同推動了盤古大模型的行業落地和應用。華為云構建了包括AI原生的云基礎設施、數據湖和數據治理、算子庫、算法框架以及AI開發平臺和大模型的全棧工業AI能力。其云基礎設施架構
CloudMatrix
將CPU、NPU、DPU、存儲和內存等資源進行了全面互聯和池化,為AI應用提供了強大的算力支持。鴻蒙系統作為華為面向萬物互聯時代的原生操作系統,與盤古大模型形成了良好的協同效應。資料來源:華為官網、Nature、鳳凰網、中國基金報、網易、CSDN134盤古礦山大模型、盤古政務大模型、盤古氣象大模型、盤古汽車大模型、盤古醫學大模型、盤古數字人大模型、盤古研發大模型盤古自然語言大模型、盤古多模態大模型、盤古視覺大模型、盤古預測大模型、盤古科學計算大模型L2層是盤古大模型的最上層,包含了可以讓用戶自主訓練的更多細化場景模型。這些模型是基于L1層行業通用大模型進一步細化和定制化的結果。L1層是基于L0層基礎大模型進一步開發的行業2 通用大模型。這些模型針對特定行業進行了優化和微調,以適應不同行業的特定需求。L0層是盤古大模型的基石,包含了五個基礎大模型,這些模型是構建更高級別模型的基礎。解決行業難題,釋放AI生產力L0、L1、L2三層架構重塑行業技術扎根開放同飛傳送帶異物檢測、重介選煤洗選、政務熱線、城市事件處理、臺風路徑預測、自動駕駛研發、車輛輔助設計、輔助醫療、數字人直播、智能運維等資料來源:每日經濟新聞L2
場景模型L0
基礎大模型盤古大模型L1
行業大模型根據OpenAI自己發布的最新測試結果,從這個評測看,數學 例方面,GPT-4-turbo-2024-04-09版本的模都有不同程度的提高,最高可以提升
19%主要優勢抓住機遇啟示GPT-4-Turbo的優勢GPT-4-Turbo的優勢包括:增強的上下文處理能力(可處理高達128K個token),更新的知識庫(包含至2023年12月的信息),更低的成本效益,以及新功能集(如JSON模式、可復現輸出等),這些使其
處理復雜任務時更準確、高效,并吸引更多開發者使用。啟示抓住機遇主要優勢上下文處理能力模 規模知識庫成本效益新功能集AI技術快速發展市 需求OpenAI品牌影響力資料來源:OpenAI、數據學習、網易、電子技術設計對盤古大模 的啟示華為盤古大模 可從GPT-4-Turbo的成功中汲取經驗,注重技術創新與升級,緊密貼合市
需求,加強品牌建設,并積極推動應用落
。Q2盤古大模型推出的背景和發展如何?行業應用廣泛定制化需求增加新興應用場景不斷涌現技術融合與創新AI技術逐漸成熟市場需求多元化小數據與優質數據應用、人機對齊技術、可解釋性模型增強、大規模預訓練模型優化、全模態大模型發展、具身智能與實體AI系統、以及量子計算與AI的結合等,這些創新正引領AI技術邁向新高度。競爭格局多元化技術創新與突破數字化轉型趨勢資料來源:人民網、前瞻網、CSDN、《瞭望》(郭方達)、澎湃新聞、中國科學技術協會、網易國內市場:大模型發展勢頭尤為迅猛。大型語言模型可分為四大競爭派系:互聯網公司(如百度、阿里、騰訊、華為等)、AI公司(如瀾舟科技、昆侖萬維等)、學術及科研機構(如清華、北大、中科院等)以及行業專家團隊初創公司。目前國內已經有300多個AI大模型,同臺競技。2024年10月,世界經濟論壇
(WEF)
公布我國有72家入選“燈塔工廠”,占全球“燈塔工廠”總數的42%,位居全球首位。截至2023年,我國AI大模型行業規模已達到147億元,且近三年復合增速高達114%。金融、政府、影視游戲和教育領域是大模型滲透率最高的四大行業,滲透率均超過50%。預計到2028年,我國AI大模型行業的市場規模將突破千億元,五年復合增速將超過50%。產業生態構建華為基于鯤鵬與昇騰兩大基礎芯片族,構建了包括歐拉、鴻蒙等基礎軟硬件在內的開源開放生態。其中,鯤鵬面向通用計算,昇騰面向人工智能計算。20232020202120222023立項與研發華為開始在華為云內部立項盤古大模型項目。首次發布盤古大模型正式對外發布。盤古大模型2.0版本發布。華為與能源集團等合作伙伴開始將大模型初步應用于企業、工業和科學研究。技術深化與領域拓展面向行業的全面升級華為云盤古大模型3.0正式發布。盤古大模型3.0是完全面向行業的大模型,采用了“5+N+X”的三層架構包含L0基礎大模型、L1行業大模型及L2場景模型三層架構。持續優化華為云以昇騰AI云服務為算力底座,以盤古大模型聯合創新為基礎,以模型社區和全面升級的云學堂為雙引擎,攜手伙伴、開發者合作共建“百模千態”。持續創新與突破2024年6月21日,盤古大模型5.0正式發布。該版本在全系列、多模態、強思維三個方面進行了全面升級。盤古大模型是由華為公司開發的一款基于深度學習和自然語言處理技術的中文AI模型,涵蓋了自然語言處理(NLP)、計算機視覺(CV)和科學計算等多個領域,擁有超過1.7萬億個參數,是目前世界上最大的中文AI模型之一。盤古大模型采用完全的分層解耦設計,包括L0層的5個基礎大模型、L1層的N個行業通用大模型、以及L2層可以讓用戶自主訓練的更多細化場景模型。2024資料來源:華為官網、環球科技網、百度百科、CSDNQ3盤古大模型5.0有什么優勢?華為自研盤古大模型,跳級迭代:
Pangu3.0Pangu5.0包含了不同參數規格的模型,以適配不同的業務場景。從十億級參數的Pangu
E系列到萬億級參數的Pangu
S系列,分別適用于手機、PC端側智能應用、低時延推理場景、復雜任務處理及跨領域多任務處理,滿足多樣化的業務需求。
不僅支持文本、圖片、視頻等常見模態,還新增了對雷達、紅外、遙感等模態的支持,且在多模態理解和生成能力上均有顯著提升,尤其在自動駕駛、工業制造等領域有廣泛應用前景。復雜任務及調用各種工具和資源,從而成為更高效的行業助手。華為云已經從盤古3.0時代的3T
Tokens的數據,演進到了盤古5.0的10T
Tokens的高質量數據,其中合成數據占比超過了30%。盤古大模型5.0采用了優質的、面向高階能力的數
據
合
成
方
法
。
這
種
方
法
以
弱
模
型
輔
助
強
模
型
的weak2strong方式,通過迭代式合成高質量數據,確保數據的完整性、相關性和知識性不弱于真實數據。數據高效參
盤古大模型5.0提出了基于Transformer架構的新型大語言模數
型架構盤古π。這一新架構通過增廣殘差連接和改造激活函高
數等方式,解決了Transformer架構中的特征坍塌問題,提效
升了模型的精度。華為云通過優化昇騰AI云服務,顯著提升了模型訓練的穩定性和效率,如萬億參數模型訓練可40天無中斷,集群故障恢復時間縮短至10分鐘。此外,華為云創新推出CloudMatrix云基礎設施,實現多元算力對等全互聯,將AI算力從單體提升至矩陣級別。為解決“內存墻”問題,華為云還發布了EMS彈性內存存儲服務,利用顯存擴展等技術釋放極致算力。算力高效全系列升級多模態升級強思維升級在數學能力、復雜任務規劃能力和工具調用能力上均有所增強,能夠更好地處理數學問題、規劃盤古大模型5.0的訓練過程Pangu5.0資料來源:華為云、新華網、騰訊網、觀察者網、中國日報網、中國發展改革百家號、東興證券研究所PanguEmbeded十億級手機/PC/車PanguProfessional百億級單卡可推PanguUltra千億級復雜推理PanguSuper萬億級跨領域多任務盤古自然語言大模型盤古多模態大模型盤古視覺大模型盤古預測大模型盤古科學計算大模型5.0版本不再局限于單一模型,而是推出了不同參數規格的模型,以適配不同的業務場景。包括PG-Alpha、PG-Beta、PG-Gamma、PG-Delta等不同規格的模型,以適配不同的業務場景。結合物理世界:盤古大模型5.0在全系列升級中,更加注重與物理世界的結合。例如,推出了PG-Radar系列模型,將AI與物理世界更好地結合起來,實現智能的萬物互聯。這一技術創新不僅提升了模型對物理世界的理解能力,也為邊緣智能等特定場景提供了更好的解決方案。資料來源:華為開發者大會2024、華為官網精準理解可控生成在內容生成方面,盤古大模型5.0采用了業界首創的STCG(SpatioTemporalControllableGeneration,可控時空生成)技術,能夠生成更加符合物理規律的多模態內容。這一技術使得盤古大模型在自動駕駛、工業制造、建筑等多個行業場景中都有廣泛的應用前景。5.0
版本不僅支持文本、圖片、視頻等常見模態,還新增了對雷達、紅外、遙感等模態的支持,且在多模態理解和生成能力上均有顯著提升,尤其在自動駕駛、工業制造等領域有廣泛應用前景。大規模生成和實際場景相一致的內容大模型+行業知識理解物理規律除文本、圖片、視頻外,5.0版本還增加了雷達、紅外、遙感等更多模態。盤古大模型5.0版本演進了模型架構,提出了基于Transformer
架構的新型大語言模型架構盤古π(PanGu-π),通過增廣殘差連接和新的級數激活函數等方式,大幅提升了模型的精度。資料來源:華為、騰訊網、機器之心華為云提出基于多步生成和策略搜索的MindStar方法。該方法首先把復雜推理任務分解成多個子問題,每個子問題都會生成多個候選方案,通過搜索和過程反饋的獎勵模型,來選擇最優多步回答的路徑。在華為自建的難例評測集中,MindStar方法使模型的平均能力提升了30分,使用了MindStar的百億模型達到業界主流千億模型的推理能力,這相當于使用慢思考能帶來10倍以上的參數量的加成。目前在單步任務和文本記憶類任務,例如知識問答和考試上,大模型已經展現出超過人類的卓越表現。而在多步推理和復雜任務的處理上,AI還沒有達到人類的平均水平,這一方面涉及到的任務包括代碼生成、數學運算、邏輯推理等。這體現了人類在知識的抽象和推理上的能力難以替代。技術挑戰關鍵結果關鍵技術 MindStar資料來源:華為官網、騰訊網90%任務成功率加速模型開發10分鐘快恢:集群故障恢復時長40天長穩:千億模型訓練中無中斷時長使能百模千態目前昇騰AI云服務已全面適配行業主流的100多個大模型,以云服務的方式協助客戶開發,訓練,托管和應用模型,打造百模千態的“黑土地”。100+全面適配主流大模型服務優勢高效的遷移工具鏈AIgallery生態繁榮極致的資源利用生態兼容與易用性領先的昇騰達芬奇架構資料來源:華為云、觀察者網、網易Q
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 裝修收款合同協議書范本
- 設備代理分銷合同協議書
- 經濟法學習心得的總結與分享試題及答案
- 現代漢語的課堂管理技巧試題及答案
- 百度兼職合同協議書
- 租豬棚合同協議書
- 怎么寫夫妻合同協議書模板
- 計算機二級ACCESS高分試題及答案解析
- 2025年C語言考試探討會試題及答案
- 專賣店合同協議書樣本
- 大廈垃圾房管理制度
- 北汽昌河Q25-汽車使用手冊用戶操作圖示圖解詳解駕駛指南車主車輛說明書電子版
- D500-D505 2016年合訂本防雷與接地圖集
- 念珠菌定植與藥物選擇
- 寧夏回族自治區社會保險變更登記表
- GB/T 18684-2002鋅鉻涂層技術條件
- 拘留所教育課件02
- 31小動物本領大-課件
- 干部人事檔案管理工作實務
- 品質異常8D改善報告(雜項)
- 深圳城市更新工改工專題研究報告
評論
0/150
提交評論