工業(yè)大模型技術(shù)應(yīng)用與發(fā)展報(bào)告1.0_第1頁(yè)
工業(yè)大模型技術(shù)應(yīng)用與發(fā)展報(bào)告1.0_第2頁(yè)
工業(yè)大模型技術(shù)應(yīng)用與發(fā)展報(bào)告1.0_第3頁(yè)
工業(yè)大模型技術(shù)應(yīng)用與發(fā)展報(bào)告1.0_第4頁(yè)
工業(yè)大模型技術(shù)應(yīng)用與發(fā)展報(bào)告1.0_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

工業(yè)大模型技術(shù)應(yīng)用與發(fā)展報(bào)告1.0

2023.12

編寫(xiě)單位(排名不分先后)

牽頭編寫(xiě)單位:中國(guó)信息通信研究院

參與編寫(xiě)單位:

百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司中科云谷科技有限公司

羚羊工業(yè)互聯(lián)網(wǎng)股份有限公司浪潮集團(tuán)有限公司

創(chuàng)新奇智科技集團(tuán)股份有限公司中科視語(yǔ)科技有限公司

智昌科技集團(tuán)股份有限公司蘇州海賽人工智能有限公司

中國(guó)科學(xué)院自動(dòng)化研究所北京通用AI研究院

中工互聯(lián)北京科技集團(tuán)有限公司樹(shù)根互聯(lián)股份有限公司

西門子股份公司華為技術(shù)有限公司

航天云網(wǎng)科技發(fā)展有限責(zé)任公司美云智數(shù)科技有限公司

威派格智慧水務(wù)股份有限公司

卡奧斯COSMOPlat

阿里云計(jì)算有限公司

騰訊計(jì)算機(jī)系統(tǒng)有限公司

人工智能的幾個(gè)相關(guān)概念

大模型:即預(yù)訓(xùn)練的基礎(chǔ)模型,在海量數(shù)據(jù)和計(jì)算資源的基

模型結(jié)構(gòu)礎(chǔ)上通過(guò)預(yù)先訓(xùn)練出來(lái)的,具有大參數(shù)規(guī)模的深度學(xué)習(xí)模型

狹義多指大語(yǔ)言模型,廣義還包括CV、多模態(tài)等各種模型類型

細(xì)分模型GPT:生成式預(yù)訓(xùn)練模型,大模型的一種類型,可生成內(nèi)容

ChatGPT是GPT的一個(gè)典型產(chǎn)品

大規(guī)模預(yù)訓(xùn)練模型

生成式AI:能夠生成文本、圖片、視頻等內(nèi)容的智能技術(shù),

人工智能機(jī)器學(xué)習(xí)深度學(xué)習(xí)

GPT大模型為其提供了新的技術(shù)手段

生成式AI技術(shù)場(chǎng)景早期GAN用于內(nèi)容生成效果有限,如NLP逐詞生成

(AIGC)大模型拓展了生成能力,如實(shí)現(xiàn)多領(lǐng)域多風(fēng)格圖像/文本生成

目標(biāo)使命

通用人工智能:AI終極發(fā)展目標(biāo),具備認(rèn)知、理解、推理、

學(xué)習(xí)、創(chuàng)造和社會(huì)協(xié)作等能力

通用人工智能(AGI)大模型具備學(xué)習(xí)、生成等能力,但還缺少完備的推理、認(rèn)知能力

1.1大模型成為通用AI新范式,引發(fā)工業(yè)應(yīng)用變革討論

大模型+大數(shù)據(jù)+大算力成為AI產(chǎn)品滲透速度全球排名第2引發(fā)產(chǎn)業(yè)領(lǐng)域應(yīng)用的熱烈討論與憧憬

發(fā)展主旋律(ChatGPT)

干億參數(shù)基礎(chǔ)模型

2年產(chǎn)業(yè)應(yīng)用場(chǎng)景成為大模型最佳

GPT-1:1.17億熱門應(yīng)用用戶破億所需時(shí)間“練兵場(chǎng)”——科技日?qǐng)?bào)

GPT-2:15億

GPT-3:1750億

GPT=4:1.48萬(wàn)億......AI大模型落地背后,正帶來(lái)一場(chǎng)

應(yīng)智能制造的系統(tǒng)重構(gòu)——百度

TB級(jí)數(shù)據(jù)用1.2年

程9個(gè)月

超3000億單詞序工業(yè)大模型將會(huì)帶來(lái)一場(chǎng)新的工

830GB代碼數(shù)據(jù)即

商時(shí)短業(yè)革命,它將來(lái)會(huì)成為工業(yè)領(lǐng)域

1000個(gè)外包團(tuán)隊(duì)標(biāo)注店

通視的基礎(chǔ)設(shè)施——中工互聯(lián)

訊頻2個(gè)月

E級(jí)智能超算總算力交5天制造業(yè)是AI大模型的重要戰(zhàn)場(chǎng),未

AppStore微信TikTokChatGPT來(lái)10年最大的機(jī)會(huì)——阿里

超195PFlops我國(guó)最Threads

快超算“神威·太湖之…

光”1.7倍

1.2工業(yè)大模型與專用小模型成為工業(yè)AI發(fā)展的兩條協(xié)同路徑

工業(yè)大模型=工業(yè)+大模型

工業(yè)大模型

Transformer結(jié)構(gòu)工業(yè)專用小模型

傳統(tǒng)模型結(jié)構(gòu)

1滿足大模型技術(shù)基本特征

Transformer為基礎(chǔ)框架新場(chǎng)景:代碼生成、特定任務(wù):點(diǎn)狀場(chǎng)

應(yīng)CAD生成等新應(yīng)用…景應(yīng)用效果更好

在大量通用數(shù)據(jù)上進(jìn)行預(yù)先訓(xùn)練,用

以實(shí)現(xiàn)良好的通用性層泛化性強(qiáng):?jiǎn)文P?/p>

模型參數(shù)一般達(dá)十億以上(最大應(yīng)對(duì)多任務(wù),更適

模型參數(shù)已達(dá)萬(wàn)億級(jí))合長(zhǎng)尾落地

2具備在工業(yè)各環(huán)節(jié)進(jìn)行應(yīng)用的能力,

工低成本運(yùn)維:低成本模型更新快:參數(shù)量

或與工業(yè)裝備軟件等融合賦能程開(kāi)發(fā)+維護(hù)少,可進(jìn)行快速迭代

輕量化部署:所需存

儲(chǔ)空間和算力更小

1.3大模型初步形成賦能工業(yè)的核心方式與產(chǎn)品形態(tài)

3類主要賦能方式當(dāng)前(可用于)工業(yè)領(lǐng)域大

模型超30個(gè)4類模型產(chǎn)品形態(tài)

ChatGPT大模型API調(diào)用或軟件方案

PLC編程

?基于ChatGPT直接開(kāi)展智能客服等應(yīng)用

基于通用底座直接賦YonGPT

能行業(yè)星火大模型

式說(shuō)大模型…成熟工業(yè)產(chǎn)品疊加基礎(chǔ)模型能力

制造、礦山等行?倍福將大模型融入TwinCATXAE客

業(yè)大模型戶端,實(shí)現(xiàn)基于對(duì)話輔助編程

基于通用底座進(jìn)行場(chǎng)航天、能源等行

業(yè)大模型

景化適配調(diào)優(yōu)或形成外掛插件工具

EinsteinGPT

?工業(yè)管理軟件企業(yè)Authentise推出插件,用

外掛插件工具…

3D打印GPT戶可查詢最大的增材制造知識(shí)庫(kù)

?浙大開(kāi)發(fā)用于表格處理的TableGPT

AlphaFold2

ESMFold用于私有化部署的一體機(jī)

面向工業(yè)或具體任務(wù)

針對(duì)性開(kāi)發(fā)Uni-Mol?科大訊飛推出星火一體機(jī)

科學(xué)大模型

2.1大模型賦能工業(yè)領(lǐng)域的適用邊界與核心能力

適用問(wèn)題:大模型并非萬(wàn)金油核心能力工業(yè)領(lǐng)域應(yīng)用變革

大場(chǎng)景

語(yǔ)言理解

工業(yè)場(chǎng)景具備一定通用性預(yù)置型對(duì)話→與設(shè)備/工業(yè)系統(tǒng)的自然交互與推理

涉及關(guān)聯(lián)復(fù)雜的智能任務(wù)

數(shù)據(jù)邊界對(duì)決策效果有直接影響

生成創(chuàng)作規(guī)則式生成→工業(yè)代碼/圖文內(nèi)容的”涌現(xiàn)式”生成

大語(yǔ)料

工業(yè)場(chǎng)景的基礎(chǔ)數(shù)據(jù)/語(yǔ)料/規(guī)則識(shí)別/模擬/局部建模預(yù)測(cè)→基于全局信息高效高精度預(yù)測(cè)優(yōu)化

約束充足預(yù)測(cè)

問(wèn)題邊界清晰多模態(tài)單一格式工業(yè)數(shù)據(jù)處理→多格式數(shù)據(jù)綜合轉(zhuǎn)換分析

結(jié)果存在于封閉信息環(huán)境,不

依賴語(yǔ)料外的信息

2.2應(yīng)用總體視圖:4類核心模型、15+應(yīng)用場(chǎng)景,目前處于初步探索階段

部署方式應(yīng)用模式

語(yǔ)言大模型專用大模型多模態(tài)大模型視覺(jué)大模型

8%

15%

2%

75%

*信通院統(tǒng)計(jì)的全球79個(gè)大模型工業(yè)應(yīng)用案例

工業(yè)各環(huán)節(jié)圍繞語(yǔ)言、專用、多模態(tài)和視覺(jué)四類大

模型開(kāi)展探索

當(dāng)前以大語(yǔ)言模型為主,4類模型應(yīng)用占比:75%、

15%、8%和2%

通用模型的場(chǎng)景化適配調(diào)優(yōu)是主要部署方式,問(wèn)答

率先切入最具變革潛力率先切入交互為主要應(yīng)用模式

2.2(1)大語(yǔ)言模型:主要應(yīng)用于工業(yè)問(wèn)答交互、內(nèi)容生成,以提升任務(wù)

處理效率為主,暫未觸及工業(yè)核心環(huán)節(jié)

有望形成具有認(rèn)知智能的數(shù)字員工及超級(jí)自動(dòng)化鏈路,實(shí)現(xiàn)從需求理解到規(guī)劃、自動(dòng)化執(zhí)行及結(jié)果交付的全鏈條能力

工業(yè)相關(guān)性

3%

24%

74%

68%

2%

高工業(yè)代碼生成:基于8%

輸入文本實(shí)現(xiàn)PLC代21%

碼生成與輔助編程

問(wèn)答交互:應(yīng)用相對(duì)廣泛,行業(yè)與設(shè)備的(半)開(kāi)放數(shù)據(jù)是主要語(yǔ)料

設(shè)備控制與維保助手:工業(yè)管理助手:實(shí)現(xiàn)BI羅克韋爾:將數(shù)字孿生與AIGC相結(jié)合,

運(yùn)維助手

從基于對(duì)話實(shí)現(xiàn)設(shè)備指數(shù)據(jù)查詢與圖表繪制實(shí)現(xiàn)設(shè)備狀態(tài)以及設(shè)備故障原因咨詢

令識(shí)別與維保知識(shí)獲取

工業(yè)文檔外掛與快速檢C3:通過(guò)自然語(yǔ)言對(duì)話,以文字+統(tǒng)計(jì)

索:實(shí)現(xiàn)設(shè)備診斷、知管理助手圖完成業(yè)務(wù)指標(biāo)的分析和洞察

識(shí)查詢、員工培訓(xùn)、設(shè)

計(jì)合規(guī)檢查檢索助手中工互聯(lián):基于智工大模型實(shí)現(xiàn)跨行業(yè)、

跨領(lǐng)域和跨崗位工業(yè)專用知識(shí)檢索

通用文檔生成:基于

低輸入文本實(shí)現(xiàn)設(shè)計(jì)方內(nèi)容生成:已能實(shí)現(xiàn)通用內(nèi)容和PLC基本控制邏輯代碼的生成

案、報(bào)告與郵件編寫(xiě)

西門子:與微軟合作,基于GPT開(kāi)發(fā)代碼

工業(yè)代碼生成工具,可通過(guò)NLP輸入生成PLC代碼

研發(fā)生產(chǎn)設(shè)備管理

通用內(nèi)容BACANCY:基于RPA+GPT實(shí)現(xiàn)自動(dòng)郵

內(nèi)容生成問(wèn)答交互件回復(fù)等功能

2.2(2)專業(yè)任務(wù)大模型:圍繞研發(fā)形成輔助設(shè)計(jì)、藥物研發(fā)兩個(gè)重點(diǎn)方

向,進(jìn)一步增強(qiáng)研發(fā)模式的創(chuàng)新能力

面向工業(yè)設(shè)計(jì)、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)及藥物研發(fā)創(chuàng)新等場(chǎng)景,擴(kuò)展創(chuàng)新邊界、降低創(chuàng)新成本與時(shí)間

工業(yè)相關(guān)性

需求導(dǎo)向的輔助設(shè)計(jì)29%77%

高13%

智能輔助設(shè)計(jì):自動(dòng)71%

生成大量符合需求的10%

設(shè)計(jì),并與既有零組

件及加工能力結(jié)合優(yōu)藥物/材料研發(fā)智能輔助設(shè)計(jì):基于圖像或文本進(jìn)行2D-CAD草圖構(gòu)建

化突破

高效研發(fā):整合基因庫(kù)DeepMind:基于圖像或文本進(jìn)行2D-CAD草圖構(gòu)建,受樣

/結(jié)構(gòu)庫(kù),加速材料發(fā)本數(shù)量+生成規(guī)范的限制,僅個(gè)別企業(yè)開(kāi)展驗(yàn)證性探索

現(xiàn)、藥物分子結(jié)構(gòu)發(fā)現(xiàn)、基于470萬(wàn)CAD草圖數(shù)據(jù)訓(xùn)練

性能預(yù)測(cè)效率每個(gè)CAD草圖對(duì)應(yīng)構(gòu)建草圖生成規(guī)范

藥物材料研發(fā):聚焦蛋白質(zhì)/藥物的性質(zhì)、結(jié)構(gòu)與匹配能力的預(yù)測(cè)優(yōu)化

Meta:ESMFold模型能夠基于序列輸入,實(shí)現(xiàn)蛋白質(zhì)結(jié)構(gòu)和

低序列的預(yù)測(cè),模型參數(shù)已達(dá)150億,僅2周完成包含罕見(jiàn)物質(zhì)

的6億+蛋白結(jié)構(gòu)預(yù)測(cè)

華為:盤古藥物分子大模型,能夠基于圖結(jié)構(gòu)藥物分子輸入,

研發(fā)設(shè)備、生產(chǎn)、管理實(shí)現(xiàn)高效的藥物分子生成和藥物分子定向優(yōu)化,生成1億藥物分

子,新穎性達(dá)99.68%

格式轉(zhuǎn)換知識(shí)發(fā)現(xiàn)

2.2(3)多模態(tài)大模型與視覺(jué)大模型:在裝備智能化和視覺(jué)識(shí)別領(lǐng)域應(yīng)用

獲得初步嘗試

結(jié)合視頻、語(yǔ)義、執(zhí)行等多類型數(shù)據(jù)綜合分析,有望構(gòu)建認(rèn)知能力的裝備、系統(tǒng)方案及智能工廠

工業(yè)相關(guān)性

多模態(tài)大模型10%14%

38%

設(shè)備診斷:多模態(tài)大模型73%

+外掛知識(shí)庫(kù),對(duì)異常圖41%

高17%7%

像、故障機(jī)理等進(jìn)行融合多模態(tài)大模型視覺(jué)大模型

分析,提升復(fù)雜異常識(shí)別

精度視覺(jué)大模型:在有限數(shù)據(jù)前提下增強(qiáng)單個(gè)AI質(zhì)檢/巡檢模型的能

具身智能復(fù)雜環(huán)境虛力,降低開(kāi)發(fā)門檻與成本

擬訓(xùn)練與交互:基于國(guó)家電網(wǎng):電力大模型每分鐘處理100張異常圖像、同時(shí)

視覺(jué)-語(yǔ)言-動(dòng)作大模識(shí)別20類缺陷,識(shí)別效率是傳統(tǒng)AI算法的10倍

型識(shí)別當(dāng)前環(huán)境自動(dòng)

生成控制指令,增強(qiáng)多模態(tài)大模型:工業(yè)異常檢測(cè)與機(jī)器人領(lǐng)域?qū)崿F(xiàn)初步應(yīng)用,通

機(jī)器人復(fù)雜任務(wù)執(zhí)行缺陷檢測(cè)/設(shè)備巡檢:過(guò)多類型數(shù)據(jù)處理強(qiáng)化綜合認(rèn)知水平

能力基于視覺(jué)大模型替代

原有小模型,實(shí)現(xiàn)單設(shè)備診斷:基于對(duì)話,實(shí)現(xiàn)顏具身智能:指令理解+感知環(huán)境信息+虛

模型多視覺(jué)任務(wù)多場(chǎng)色、形狀、數(shù)量等復(fù)雜異常的擬化方式訓(xùn)練,自動(dòng)生成機(jī)器人動(dòng)作規(guī)劃

低景賦能詳細(xì)描述路徑

視覺(jué)大模型斯坦福:基于視覺(jué)語(yǔ)言模型,驅(qū)動(dòng)

哈工大:利用語(yǔ)言視覺(jué)

機(jī)器人在虛擬空間生成規(guī)劃路線

大模型根據(jù)圖像進(jìn)行工

研發(fā)設(shè)備生產(chǎn)管理業(yè)異常檢測(cè),并輸出高谷歌:RT-2基于視覺(jué)-動(dòng)作-語(yǔ)言大

質(zhì)量特征描述模型,利用網(wǎng)絡(luò)圖片文字?jǐn)?shù)據(jù)訓(xùn)練,

通用識(shí)別問(wèn)答交互綜合應(yīng)用在陌生情景執(zhí)行率達(dá)到62%

3技術(shù)體系:大模型是工業(yè)AI深度學(xué)習(xí)路徑的深化與拓展

6

工業(yè)工業(yè)場(chǎng)景與應(yīng)用適配技術(shù)

大模型部署通過(guò)場(chǎng)景適配和多種形式部署調(diào)用,實(shí)

適配數(shù)據(jù)可用(小樣本)、可解釋性、模型效率…

現(xiàn)工業(yè)大模型落地賦能

應(yīng)用AI應(yīng)用技術(shù)的工業(yè)領(lǐng)域遷移

技術(shù)機(jī)器視覺(jué)、NLP、語(yǔ)音識(shí)別

4基礎(chǔ)模型CV、語(yǔ)言、專用大模型...專用大模型有望成為賦能行業(yè)主力軍

核心理論Transformer…大模型與知識(shí)工程等固有技術(shù)融合成為

法5工業(yè)應(yīng)用探索方向

技數(shù)據(jù)科學(xué)知識(shí)工程探索技術(shù)

機(jī)器學(xué)習(xí)深度網(wǎng)絡(luò)專家系統(tǒng)知識(shí)圖譜人機(jī)&類腦

術(shù)3

其他學(xué)習(xí)方式

框架平臺(tái)硬件、數(shù)據(jù)定義大模型能力極限,高質(zhì)

基礎(chǔ)2工業(yè)數(shù)據(jù)/語(yǔ)料量工業(yè)數(shù)據(jù)成為大模型從能用到好用的

支撐有效途徑

1算力

通用AI(工業(yè))大模型

3.1算力:工業(yè)領(lǐng)域大模型推理速度為需求關(guān)鍵,未來(lái)有望向端/邊緣側(cè)推理

發(fā)展工業(yè)大模型推理速度需滿足工業(yè)應(yīng)用及峰值QPS等需求

1大模型訓(xùn)練推理算力需求相對(duì)可控2工業(yè)領(lǐng)域(邊端側(cè))對(duì)推理計(jì)算速度及滿足峰

值QPS等需求較大,

大模型每10億參數(shù)(1G模型文件)所需最低顯存需求

模型精度訓(xùn)練顯存微調(diào)顯存推理顯存百億參數(shù)大模型,使用1張英偉達(dá)A100GPU進(jìn)行

(LORA)

推理,每秒生成的token數(shù)大約為60

float32(全)14G5G4G

已有大模型一體機(jī)及端側(cè)優(yōu)化芯片,實(shí)現(xiàn)推理加速

FP167G2.4G2G

int83.5G1.2G1G

int41.8G0.6G0.5G聯(lián)合華為發(fā)布愛(ài)芯元智-

星火一體機(jī),AX650N芯片,

西工大:基于大模型的多設(shè)備協(xié)同,提供2.5P算力可達(dá)361FPS

采用云端統(tǒng)一控制,需求為單卡4090

3工業(yè)算力智能分配可能成為關(guān)鍵

二次訓(xùn)練

云端大算力和終端小算力的平衡使算力分配和性能達(dá)到最優(yōu)

3.2數(shù)據(jù):海量高質(zhì)工業(yè)數(shù)據(jù)/語(yǔ)料庫(kù)將成為落地部署的關(guān)鍵要素

預(yù)訓(xùn)練(行業(yè)級(jí))二次訓(xùn)練微調(diào)(場(chǎng)景級(jí))應(yīng)用

基礎(chǔ)數(shù)據(jù)任務(wù)數(shù)據(jù)任務(wù)數(shù)據(jù)Prompt語(yǔ)料

千張級(jí)

十萬(wàn)級(jí)對(duì)數(shù)據(jù)配比幾類核心提示語(yǔ)料

視覺(jué)大模型要求較高

某模型A:100W+工業(yè)圖像某模型A:1000-10000,庫(kù)

部分簡(jiǎn)單場(chǎng)景數(shù)百?gòu)?/p>

工業(yè)數(shù)據(jù)在所有

工業(yè)問(wèn)答檢索提示詞

數(shù)據(jù)的占比為

問(wèn)答場(chǎng)景:X查詢內(nèi)容-X回

10-15%

——千級(jí)問(wèn)答對(duì)語(yǔ)料復(fù)格式…

語(yǔ)言大模型

工業(yè)內(nèi)容/規(guī)劃生成

某模型A:40TB中文文本某模型B:2000個(gè)左右

工業(yè)問(wèn)答對(duì)提示詞

分析規(guī)劃場(chǎng)景:X目標(biāo)-X

語(yǔ)言-X生成格式…

模型效果與數(shù)據(jù)量強(qiáng)相關(guān),通常需億級(jí)以上規(guī)模數(shù)據(jù)集

專業(yè)任務(wù)/多控制指令提示詞

模態(tài)?RT-2:13個(gè)機(jī)器人在辦公室等環(huán)境中收集的17個(gè)月數(shù)據(jù)

設(shè)備控制場(chǎng)景:通過(guò)

?盤古科學(xué)計(jì)算大模型:17億個(gè)化合物分子的類藥化學(xué)空間

function+prompt將語(yǔ)言

?Meta-ESMFold:1.25億蛋白質(zhì)分子結(jié)構(gòu)數(shù)據(jù)指令和action映射

3.3工具鏈+模型:低門檻開(kāi)發(fā)和輕量化部署成為工業(yè)大模型探索重點(diǎn)

各主體圍繞通用大模型開(kāi)發(fā)到部署全流程工具鏈,多知識(shí)蒸餾成為模型層面降低工業(yè)部署應(yīng)用成本的

推理后端兼容、半自動(dòng)微調(diào)成為重點(diǎn)探索途徑

與多推理后端兼容,實(shí)現(xiàn)工業(yè)低成本遷移需兼顧減輕模型體量、

小模型-1

大模型知識(shí)傳遞維持性能衰減,較具

?飛槳通過(guò)標(biāo)準(zhǔn)化部署接口,實(shí)現(xiàn)不同推

小模型-2數(shù)學(xué)挑戰(zhàn)性

理后端的零成本遷移

2個(gè)主流路徑,工業(yè)領(lǐng)域以跟隨應(yīng)用為主

?兼容20余家芯片廠商硬件設(shè)備,實(shí)現(xiàn)云

邊端全場(chǎng)景協(xié)同

模型壓縮模型增強(qiáng)

大模型微調(diào)由手動(dòng)向半自動(dòng)化演進(jìn)

在相同的帶標(biāo)簽數(shù)據(jù)利用其它數(shù)據(jù)資源或

手動(dòng)調(diào)參半自動(dòng)化調(diào)參集上指導(dǎo)子模型訓(xùn)練,優(yōu)化策略(相互學(xué)習(xí)等)

形成高效小規(guī)模網(wǎng)絡(luò)提高子模型性能

企業(yè)調(diào)參方式

可視化界面模型性能

參數(shù)設(shè)置觀測(cè)MakerSuite工具迭代prompt數(shù)據(jù)、算法要求較高,尚無(wú)工業(yè)

對(duì)開(kāi)源大模型進(jìn)行蒸餾

自動(dòng)合成數(shù)據(jù)擴(kuò)充數(shù)據(jù)集實(shí)例

+預(yù)訓(xùn)練+指令微調(diào),

基于信息抽取能力,簡(jiǎn)化訓(xùn)練形成工業(yè)大模型AInno-

數(shù)據(jù)獲取15B(150億參數(shù))

無(wú)默認(rèn)參數(shù)

模型性能集成AIGC能力,基于自然語(yǔ)言

人工調(diào)參實(shí)現(xiàn)調(diào)參

觀測(cè)

3.4基礎(chǔ)模型:通用大模型的快速演進(jìn)和專用大模型的能力升級(jí)

面向更多樣數(shù)據(jù)類型、更強(qiáng)綜合能力的大模型技術(shù)專業(yè)任務(wù)大模型的數(shù)字支撐能力提升是主要方向,

迭代創(chuàng)新,為工業(yè)領(lǐng)域應(yīng)用創(chuàng)造更大前景在藥物創(chuàng)新發(fā)現(xiàn)與產(chǎn)品設(shè)計(jì)形成初步成果

1、時(shí)序數(shù)據(jù)大模型有望最大化利用海量工業(yè)設(shè)備與1、依托大規(guī)模結(jié)構(gòu)化專業(yè)數(shù)據(jù)嵌入表示能力,訓(xùn)練

過(guò)程數(shù)據(jù),賦能流程優(yōu)化、設(shè)備診斷和異常識(shí)別數(shù)據(jù)樣本的全面性是提升模型性能核心

TimeGPT

訓(xùn)練:超1000億個(gè)時(shí)序數(shù)2、由一維序列、二維拓?fù)鋱D轉(zhuǎn)向三維表征的先進(jìn)表

據(jù)點(diǎn)征技術(shù)是探索方向

測(cè)試:超30萬(wàn)個(gè)時(shí)序數(shù)據(jù)

集,開(kāi)展時(shí)、日、周、月的

預(yù)測(cè)評(píng)估

機(jī)構(gòu)細(xì)分方向大模型數(shù)據(jù)集大小

2、多模態(tài)能力持續(xù)創(chuàng)新,加速實(shí)現(xiàn)工業(yè)圖像幾何、蛋白質(zhì)結(jié)UR50/D

MetaESMFold

機(jī)理、文檔等各類數(shù)據(jù)模型的綜合感知和認(rèn)知推理構(gòu)預(yù)測(cè)等1.25億(1維)基于序列數(shù)據(jù)開(kāi)展優(yōu)

藥物分子藥物分子化,為現(xiàn)階段主流

華為Pangu

生成優(yōu)化17億(2維)

分子性質(zhì)多數(shù)據(jù)集混合基于分子特性開(kāi)展

深勢(shì)科技Uni-Mol

GPT-4.5融合了處理預(yù)測(cè)等2.09億(3維)探索,在領(lǐng)域93%

3D模型和視頻的能力數(shù)據(jù)集中表現(xiàn)最優(yōu)

深勢(shì)科技發(fā)布Uni-Mol,直接將分子三維結(jié)構(gòu)坐

標(biāo)信息作為模型輸入輸出

3.5大模型+工業(yè)知識(shí)圖譜:大模型可能對(duì)通用知識(shí)圖譜產(chǎn)生一定沖擊,但

與領(lǐng)域知識(shí)圖譜將融合共生,工業(yè)領(lǐng)域暫未出現(xiàn)典型探索

賦能圖譜加速圖譜構(gòu)建到應(yīng)用過(guò)程

本體構(gòu)建

大模型

使用大模型Prompt生成事件的本體

知識(shí)圖譜直接文本化,數(shù)據(jù)增強(qiáng)

訓(xùn)練前

作為預(yù)訓(xùn)練語(yǔ)料利用GPT生成標(biāo)注數(shù)據(jù)/數(shù)據(jù)清

洗,降低知識(shí)圖譜標(biāo)注端成本

將知識(shí)圖譜隱式地加入到模型訓(xùn)練,即將圖

知識(shí)抽取與應(yīng)用

訓(xùn)練中譜中的結(jié)構(gòu)化信息(三元組)融入預(yù)訓(xùn)練模型

將知識(shí)圖譜作為大模型訓(xùn)練評(píng)估基于GPT做信息抽取、圖譜補(bǔ)全

訓(xùn)練后知識(shí)圖譜注入prompt/知識(shí)庫(kù)外掛,增強(qiáng)結(jié)果可用性

對(duì)大模型生成結(jié)果進(jìn)行知識(shí)校驗(yàn),增強(qiáng)事實(shí)性知識(shí)圖譜

增強(qiáng)大模型事實(shí)驗(yàn)證能力,擴(kuò)展專業(yè)知識(shí)范疇,提升可解釋性賦能大模型

3.6應(yīng)用部署:三類核心部署方式,當(dāng)前以通用模型場(chǎng)景化應(yīng)用為主

通用模型應(yīng)用(公)通用模型場(chǎng)景化應(yīng)用特定領(lǐng)域?qū)S媚P?/p>

無(wú)參數(shù)更新-Prompt設(shè)計(jì)外掛知識(shí)庫(kù)(公/私)參數(shù)更新微調(diào)(公/私)(私)

工業(yè)應(yīng)用工業(yè)應(yīng)用工業(yè)大模型領(lǐng)域大模型

Prompt設(shè)計(jì)上下文學(xué)習(xí)/知識(shí)梳理微調(diào)/量化/蒸餾/增強(qiáng)...訓(xùn)練

部署原理

API接口/插件Prompt設(shè)計(jì)匹配/檢索私有數(shù)據(jù)庫(kù)領(lǐng)域數(shù)據(jù)庫(kù)

通用大模型通用大模型外掛知識(shí)庫(kù)通用大模型模型結(jié)構(gòu)設(shè)計(jì)

適用領(lǐng)域1.通用場(chǎng)景基于模式通用能力,結(jié)合數(shù)據(jù)相對(duì)充足,任務(wù)數(shù)據(jù)充足、專有性隱私性

2.場(chǎng)景公開(kāi)語(yǔ)料充足工業(yè)領(lǐng)域知識(shí)信息工業(yè)語(yǔ)料依賴性強(qiáng)強(qiáng),全部依賴領(lǐng)域語(yǔ)料

代碼生成、故障缺陷提藥物研發(fā)、高性能材料

典型場(chǎng)景設(shè)備控制、文檔處理、研發(fā)輔助、生產(chǎn)優(yōu)化…

郵件回復(fù)…取分析、企業(yè)培訓(xùn)…研制…

ChatGPT:可直接生百度-文心:上傳設(shè)備故障Salesforce-Einstein臉書(shū)-ESMFold:蛋白質(zhì)

文檔,分析故障原因GPT:基于ChatGPT與結(jié)構(gòu)預(yù)測(cè),150億參數(shù)

應(yīng)用案例成簡(jiǎn)單功能的西門子

哈工大:MiniGPT-4外掛自有數(shù)據(jù),提高效率谷歌-PALM-E:基于機(jī)器

PLC程序

視覺(jué)專家?guī)?,進(jìn)行缺陷分析華為-盤古行業(yè)大模型人17個(gè)月數(shù)據(jù)的VLA模型

4產(chǎn)業(yè)體系:不同主體布局以及技術(shù)產(chǎn)品升級(jí)

主體AI廠商工業(yè)技術(shù)服務(wù)商初創(chuàng)企業(yè)科研機(jī)構(gòu)/科技巨頭

體系

BI生成圖表、文件審查、設(shè)

工業(yè)大模型產(chǎn)大模型代碼生大模型異構(gòu)智

知識(shí)問(wèn)答等應(yīng)備監(jiān)控、操作

品方案工業(yè)大模型部署一體機(jī)成+檢查代碼能機(jī)器人協(xié)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論