




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
工業(yè)大模型技術(shù)應(yīng)用與發(fā)展報(bào)告1.0
2023.12
編寫(xiě)單位(排名不分先后)
牽頭編寫(xiě)單位:中國(guó)信息通信研究院
參與編寫(xiě)單位:
百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司中科云谷科技有限公司
羚羊工業(yè)互聯(lián)網(wǎng)股份有限公司浪潮集團(tuán)有限公司
創(chuàng)新奇智科技集團(tuán)股份有限公司中科視語(yǔ)科技有限公司
智昌科技集團(tuán)股份有限公司蘇州海賽人工智能有限公司
中國(guó)科學(xué)院自動(dòng)化研究所北京通用AI研究院
中工互聯(lián)北京科技集團(tuán)有限公司樹(shù)根互聯(lián)股份有限公司
西門子股份公司華為技術(shù)有限公司
航天云網(wǎng)科技發(fā)展有限責(zé)任公司美云智數(shù)科技有限公司
威派格智慧水務(wù)股份有限公司
卡奧斯COSMOPlat
阿里云計(jì)算有限公司
騰訊計(jì)算機(jī)系統(tǒng)有限公司
人工智能的幾個(gè)相關(guān)概念
大模型:即預(yù)訓(xùn)練的基礎(chǔ)模型,在海量數(shù)據(jù)和計(jì)算資源的基
模型結(jié)構(gòu)礎(chǔ)上通過(guò)預(yù)先訓(xùn)練出來(lái)的,具有大參數(shù)規(guī)模的深度學(xué)習(xí)模型
狹義多指大語(yǔ)言模型,廣義還包括CV、多模態(tài)等各種模型類型
細(xì)分模型GPT:生成式預(yù)訓(xùn)練模型,大模型的一種類型,可生成內(nèi)容
ChatGPT是GPT的一個(gè)典型產(chǎn)品
大規(guī)模預(yù)訓(xùn)練模型
生成式AI:能夠生成文本、圖片、視頻等內(nèi)容的智能技術(shù),
人工智能機(jī)器學(xué)習(xí)深度學(xué)習(xí)
GPT大模型為其提供了新的技術(shù)手段
生成式AI技術(shù)場(chǎng)景早期GAN用于內(nèi)容生成效果有限,如NLP逐詞生成
(AIGC)大模型拓展了生成能力,如實(shí)現(xiàn)多領(lǐng)域多風(fēng)格圖像/文本生成
目標(biāo)使命
通用人工智能:AI終極發(fā)展目標(biāo),具備認(rèn)知、理解、推理、
學(xué)習(xí)、創(chuàng)造和社會(huì)協(xié)作等能力
通用人工智能(AGI)大模型具備學(xué)習(xí)、生成等能力,但還缺少完備的推理、認(rèn)知能力
1.1大模型成為通用AI新范式,引發(fā)工業(yè)應(yīng)用變革討論
大模型+大數(shù)據(jù)+大算力成為AI產(chǎn)品滲透速度全球排名第2引發(fā)產(chǎn)業(yè)領(lǐng)域應(yīng)用的熱烈討論與憧憬
發(fā)展主旋律(ChatGPT)
干億參數(shù)基礎(chǔ)模型
2年產(chǎn)業(yè)應(yīng)用場(chǎng)景成為大模型最佳
GPT-1:1.17億熱門應(yīng)用用戶破億所需時(shí)間“練兵場(chǎng)”——科技日?qǐng)?bào)
GPT-2:15億
GPT-3:1750億
GPT=4:1.48萬(wàn)億......AI大模型落地背后,正帶來(lái)一場(chǎng)
應(yīng)智能制造的系統(tǒng)重構(gòu)——百度
TB級(jí)數(shù)據(jù)用1.2年
程9個(gè)月
超3000億單詞序工業(yè)大模型將會(huì)帶來(lái)一場(chǎng)新的工
830GB代碼數(shù)據(jù)即
商時(shí)短業(yè)革命,它將來(lái)會(huì)成為工業(yè)領(lǐng)域
1000個(gè)外包團(tuán)隊(duì)標(biāo)注店
通視的基礎(chǔ)設(shè)施——中工互聯(lián)
訊頻2個(gè)月
社
E級(jí)智能超算總算力交5天制造業(yè)是AI大模型的重要戰(zhàn)場(chǎng),未
AppStore微信TikTokChatGPT來(lái)10年最大的機(jī)會(huì)——阿里
超195PFlops我國(guó)最Threads
快超算“神威·太湖之…
光”1.7倍
1.2工業(yè)大模型與專用小模型成為工業(yè)AI發(fā)展的兩條協(xié)同路徑
工業(yè)大模型=工業(yè)+大模型
工業(yè)大模型
Transformer結(jié)構(gòu)工業(yè)專用小模型
傳統(tǒng)模型結(jié)構(gòu)
1滿足大模型技術(shù)基本特征
Transformer為基礎(chǔ)框架新場(chǎng)景:代碼生成、特定任務(wù):點(diǎn)狀場(chǎng)
應(yīng)CAD生成等新應(yīng)用…景應(yīng)用效果更好
在大量通用數(shù)據(jù)上進(jìn)行預(yù)先訓(xùn)練,用
以實(shí)現(xiàn)良好的通用性層泛化性強(qiáng):?jiǎn)文P?/p>
面
模型參數(shù)一般達(dá)十億以上(最大應(yīng)對(duì)多任務(wù),更適
模型參數(shù)已達(dá)萬(wàn)億級(jí))合長(zhǎng)尾落地
2具備在工業(yè)各環(huán)節(jié)進(jìn)行應(yīng)用的能力,
工低成本運(yùn)維:低成本模型更新快:參數(shù)量
或與工業(yè)裝備軟件等融合賦能程開(kāi)發(fā)+維護(hù)少,可進(jìn)行快速迭代
層
輕量化部署:所需存
面
儲(chǔ)空間和算力更小
1.3大模型初步形成賦能工業(yè)的核心方式與產(chǎn)品形態(tài)
3類主要賦能方式當(dāng)前(可用于)工業(yè)領(lǐng)域大
模型超30個(gè)4類模型產(chǎn)品形態(tài)
ChatGPT大模型API調(diào)用或軟件方案
PLC編程
?基于ChatGPT直接開(kāi)展智能客服等應(yīng)用
基于通用底座直接賦YonGPT
能行業(yè)星火大模型
式說(shuō)大模型…成熟工業(yè)產(chǎn)品疊加基礎(chǔ)模型能力
制造、礦山等行?倍福將大模型融入TwinCATXAE客
業(yè)大模型戶端,實(shí)現(xiàn)基于對(duì)話輔助編程
基于通用底座進(jìn)行場(chǎng)航天、能源等行
業(yè)大模型
景化適配調(diào)優(yōu)或形成外掛插件工具
EinsteinGPT
?工業(yè)管理軟件企業(yè)Authentise推出插件,用
外掛插件工具…
3D打印GPT戶可查詢最大的增材制造知識(shí)庫(kù)
?浙大開(kāi)發(fā)用于表格處理的TableGPT
AlphaFold2
ESMFold用于私有化部署的一體機(jī)
面向工業(yè)或具體任務(wù)
針對(duì)性開(kāi)發(fā)Uni-Mol?科大訊飛推出星火一體機(jī)
…
科學(xué)大模型
2.1大模型賦能工業(yè)領(lǐng)域的適用邊界與核心能力
適用問(wèn)題:大模型并非萬(wàn)金油核心能力工業(yè)領(lǐng)域應(yīng)用變革
大場(chǎng)景
語(yǔ)言理解
工業(yè)場(chǎng)景具備一定通用性預(yù)置型對(duì)話→與設(shè)備/工業(yè)系統(tǒng)的自然交互與推理
涉及關(guān)聯(lián)復(fù)雜的智能任務(wù)
數(shù)據(jù)邊界對(duì)決策效果有直接影響
生成創(chuàng)作規(guī)則式生成→工業(yè)代碼/圖文內(nèi)容的”涌現(xiàn)式”生成
大語(yǔ)料
工業(yè)場(chǎng)景的基礎(chǔ)數(shù)據(jù)/語(yǔ)料/規(guī)則識(shí)別/模擬/局部建模預(yù)測(cè)→基于全局信息高效高精度預(yù)測(cè)優(yōu)化
約束充足預(yù)測(cè)
問(wèn)題邊界清晰多模態(tài)單一格式工業(yè)數(shù)據(jù)處理→多格式數(shù)據(jù)綜合轉(zhuǎn)換分析
結(jié)果存在于封閉信息環(huán)境,不
依賴語(yǔ)料外的信息
2.2應(yīng)用總體視圖:4類核心模型、15+應(yīng)用場(chǎng)景,目前處于初步探索階段
部署方式應(yīng)用模式
語(yǔ)言大模型專用大模型多模態(tài)大模型視覺(jué)大模型
8%
15%
2%
75%
*信通院統(tǒng)計(jì)的全球79個(gè)大模型工業(yè)應(yīng)用案例
工業(yè)各環(huán)節(jié)圍繞語(yǔ)言、專用、多模態(tài)和視覺(jué)四類大
模型開(kāi)展探索
當(dāng)前以大語(yǔ)言模型為主,4類模型應(yīng)用占比:75%、
15%、8%和2%
通用模型的場(chǎng)景化適配調(diào)優(yōu)是主要部署方式,問(wèn)答
率先切入最具變革潛力率先切入交互為主要應(yīng)用模式
2.2(1)大語(yǔ)言模型:主要應(yīng)用于工業(yè)問(wèn)答交互、內(nèi)容生成,以提升任務(wù)
處理效率為主,暫未觸及工業(yè)核心環(huán)節(jié)
有望形成具有認(rèn)知智能的數(shù)字員工及超級(jí)自動(dòng)化鏈路,實(shí)現(xiàn)從需求理解到規(guī)劃、自動(dòng)化執(zhí)行及結(jié)果交付的全鏈條能力
工業(yè)相關(guān)性
3%
24%
74%
68%
2%
高工業(yè)代碼生成:基于8%
輸入文本實(shí)現(xiàn)PLC代21%
碼生成與輔助編程
問(wèn)答交互:應(yīng)用相對(duì)廣泛,行業(yè)與設(shè)備的(半)開(kāi)放數(shù)據(jù)是主要語(yǔ)料
設(shè)備控制與維保助手:工業(yè)管理助手:實(shí)現(xiàn)BI羅克韋爾:將數(shù)字孿生與AIGC相結(jié)合,
運(yùn)維助手
從基于對(duì)話實(shí)現(xiàn)設(shè)備指數(shù)據(jù)查詢與圖表繪制實(shí)現(xiàn)設(shè)備狀態(tài)以及設(shè)備故障原因咨詢
令識(shí)別與維保知識(shí)獲取
工業(yè)文檔外掛與快速檢C3:通過(guò)自然語(yǔ)言對(duì)話,以文字+統(tǒng)計(jì)
索:實(shí)現(xiàn)設(shè)備診斷、知管理助手圖完成業(yè)務(wù)指標(biāo)的分析和洞察
識(shí)查詢、員工培訓(xùn)、設(shè)
計(jì)合規(guī)檢查檢索助手中工互聯(lián):基于智工大模型實(shí)現(xiàn)跨行業(yè)、
跨領(lǐng)域和跨崗位工業(yè)專用知識(shí)檢索
通用文檔生成:基于
低輸入文本實(shí)現(xiàn)設(shè)計(jì)方內(nèi)容生成:已能實(shí)現(xiàn)通用內(nèi)容和PLC基本控制邏輯代碼的生成
案、報(bào)告與郵件編寫(xiě)
西門子:與微軟合作,基于GPT開(kāi)發(fā)代碼
工業(yè)代碼生成工具,可通過(guò)NLP輸入生成PLC代碼
研發(fā)生產(chǎn)設(shè)備管理
通用內(nèi)容BACANCY:基于RPA+GPT實(shí)現(xiàn)自動(dòng)郵
內(nèi)容生成問(wèn)答交互件回復(fù)等功能
2.2(2)專業(yè)任務(wù)大模型:圍繞研發(fā)形成輔助設(shè)計(jì)、藥物研發(fā)兩個(gè)重點(diǎn)方
向,進(jìn)一步增強(qiáng)研發(fā)模式的創(chuàng)新能力
面向工業(yè)設(shè)計(jì)、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)及藥物研發(fā)創(chuàng)新等場(chǎng)景,擴(kuò)展創(chuàng)新邊界、降低創(chuàng)新成本與時(shí)間
工業(yè)相關(guān)性
需求導(dǎo)向的輔助設(shè)計(jì)29%77%
高13%
智能輔助設(shè)計(jì):自動(dòng)71%
生成大量符合需求的10%
設(shè)計(jì),并與既有零組
件及加工能力結(jié)合優(yōu)藥物/材料研發(fā)智能輔助設(shè)計(jì):基于圖像或文本進(jìn)行2D-CAD草圖構(gòu)建
化突破
高效研發(fā):整合基因庫(kù)DeepMind:基于圖像或文本進(jìn)行2D-CAD草圖構(gòu)建,受樣
/結(jié)構(gòu)庫(kù),加速材料發(fā)本數(shù)量+生成規(guī)范的限制,僅個(gè)別企業(yè)開(kāi)展驗(yàn)證性探索
現(xiàn)、藥物分子結(jié)構(gòu)發(fā)現(xiàn)、基于470萬(wàn)CAD草圖數(shù)據(jù)訓(xùn)練
性能預(yù)測(cè)效率每個(gè)CAD草圖對(duì)應(yīng)構(gòu)建草圖生成規(guī)范
藥物材料研發(fā):聚焦蛋白質(zhì)/藥物的性質(zhì)、結(jié)構(gòu)與匹配能力的預(yù)測(cè)優(yōu)化
Meta:ESMFold模型能夠基于序列輸入,實(shí)現(xiàn)蛋白質(zhì)結(jié)構(gòu)和
低序列的預(yù)測(cè),模型參數(shù)已達(dá)150億,僅2周完成包含罕見(jiàn)物質(zhì)
的6億+蛋白結(jié)構(gòu)預(yù)測(cè)
華為:盤古藥物分子大模型,能夠基于圖結(jié)構(gòu)藥物分子輸入,
研發(fā)設(shè)備、生產(chǎn)、管理實(shí)現(xiàn)高效的藥物分子生成和藥物分子定向優(yōu)化,生成1億藥物分
子,新穎性達(dá)99.68%
格式轉(zhuǎn)換知識(shí)發(fā)現(xiàn)
2.2(3)多模態(tài)大模型與視覺(jué)大模型:在裝備智能化和視覺(jué)識(shí)別領(lǐng)域應(yīng)用
獲得初步嘗試
結(jié)合視頻、語(yǔ)義、執(zhí)行等多類型數(shù)據(jù)綜合分析,有望構(gòu)建認(rèn)知能力的裝備、系統(tǒng)方案及智能工廠
工業(yè)相關(guān)性
多模態(tài)大模型10%14%
38%
設(shè)備診斷:多模態(tài)大模型73%
+外掛知識(shí)庫(kù),對(duì)異常圖41%
高17%7%
像、故障機(jī)理等進(jìn)行融合多模態(tài)大模型視覺(jué)大模型
分析,提升復(fù)雜異常識(shí)別
精度視覺(jué)大模型:在有限數(shù)據(jù)前提下增強(qiáng)單個(gè)AI質(zhì)檢/巡檢模型的能
具身智能復(fù)雜環(huán)境虛力,降低開(kāi)發(fā)門檻與成本
擬訓(xùn)練與交互:基于國(guó)家電網(wǎng):電力大模型每分鐘處理100張異常圖像、同時(shí)
視覺(jué)-語(yǔ)言-動(dòng)作大模識(shí)別20類缺陷,識(shí)別效率是傳統(tǒng)AI算法的10倍
型識(shí)別當(dāng)前環(huán)境自動(dòng)
生成控制指令,增強(qiáng)多模態(tài)大模型:工業(yè)異常檢測(cè)與機(jī)器人領(lǐng)域?qū)崿F(xiàn)初步應(yīng)用,通
機(jī)器人復(fù)雜任務(wù)執(zhí)行缺陷檢測(cè)/設(shè)備巡檢:過(guò)多類型數(shù)據(jù)處理強(qiáng)化綜合認(rèn)知水平
能力基于視覺(jué)大模型替代
原有小模型,實(shí)現(xiàn)單設(shè)備診斷:基于對(duì)話,實(shí)現(xiàn)顏具身智能:指令理解+感知環(huán)境信息+虛
模型多視覺(jué)任務(wù)多場(chǎng)色、形狀、數(shù)量等復(fù)雜異常的擬化方式訓(xùn)練,自動(dòng)生成機(jī)器人動(dòng)作規(guī)劃
低景賦能詳細(xì)描述路徑
視覺(jué)大模型斯坦福:基于視覺(jué)語(yǔ)言模型,驅(qū)動(dòng)
哈工大:利用語(yǔ)言視覺(jué)
機(jī)器人在虛擬空間生成規(guī)劃路線
大模型根據(jù)圖像進(jìn)行工
研發(fā)設(shè)備生產(chǎn)管理業(yè)異常檢測(cè),并輸出高谷歌:RT-2基于視覺(jué)-動(dòng)作-語(yǔ)言大
質(zhì)量特征描述模型,利用網(wǎng)絡(luò)圖片文字?jǐn)?shù)據(jù)訓(xùn)練,
通用識(shí)別問(wèn)答交互綜合應(yīng)用在陌生情景執(zhí)行率達(dá)到62%
3技術(shù)體系:大模型是工業(yè)AI深度學(xué)習(xí)路徑的深化與拓展
6
工業(yè)工業(yè)場(chǎng)景與應(yīng)用適配技術(shù)
大模型部署通過(guò)場(chǎng)景適配和多種形式部署調(diào)用,實(shí)
適配數(shù)據(jù)可用(小樣本)、可解釋性、模型效率…
現(xiàn)工業(yè)大模型落地賦能
應(yīng)用AI應(yīng)用技術(shù)的工業(yè)領(lǐng)域遷移
技術(shù)機(jī)器視覺(jué)、NLP、語(yǔ)音識(shí)別
4基礎(chǔ)模型CV、語(yǔ)言、專用大模型...專用大模型有望成為賦能行業(yè)主力軍
核心理論Transformer…大模型與知識(shí)工程等固有技術(shù)融合成為
算
法5工業(yè)應(yīng)用探索方向
技數(shù)據(jù)科學(xué)知識(shí)工程探索技術(shù)
機(jī)器學(xué)習(xí)深度網(wǎng)絡(luò)專家系統(tǒng)知識(shí)圖譜人機(jī)&類腦
術(shù)3
其他學(xué)習(xí)方式
框架平臺(tái)硬件、數(shù)據(jù)定義大模型能力極限,高質(zhì)
基礎(chǔ)2工業(yè)數(shù)據(jù)/語(yǔ)料量工業(yè)數(shù)據(jù)成為大模型從能用到好用的
支撐有效途徑
1算力
通用AI(工業(yè))大模型
3.1算力:工業(yè)領(lǐng)域大模型推理速度為需求關(guān)鍵,未來(lái)有望向端/邊緣側(cè)推理
發(fā)展工業(yè)大模型推理速度需滿足工業(yè)應(yīng)用及峰值QPS等需求
1大模型訓(xùn)練推理算力需求相對(duì)可控2工業(yè)領(lǐng)域(邊端側(cè))對(duì)推理計(jì)算速度及滿足峰
值QPS等需求較大,
大模型每10億參數(shù)(1G模型文件)所需最低顯存需求
模型精度訓(xùn)練顯存微調(diào)顯存推理顯存百億參數(shù)大模型,使用1張英偉達(dá)A100GPU進(jìn)行
(LORA)
推理,每秒生成的token數(shù)大約為60
float32(全)14G5G4G
已有大模型一體機(jī)及端側(cè)優(yōu)化芯片,實(shí)現(xiàn)推理加速
FP167G2.4G2G
int83.5G1.2G1G
int41.8G0.6G0.5G聯(lián)合華為發(fā)布愛(ài)芯元智-
星火一體機(jī),AX650N芯片,
西工大:基于大模型的多設(shè)備協(xié)同,提供2.5P算力可達(dá)361FPS
采用云端統(tǒng)一控制,需求為單卡4090
3工業(yè)算力智能分配可能成為關(guān)鍵
二次訓(xùn)練
云端大算力和終端小算力的平衡使算力分配和性能達(dá)到最優(yōu)
3.2數(shù)據(jù):海量高質(zhì)工業(yè)數(shù)據(jù)/語(yǔ)料庫(kù)將成為落地部署的關(guān)鍵要素
預(yù)訓(xùn)練(行業(yè)級(jí))二次訓(xùn)練微調(diào)(場(chǎng)景級(jí))應(yīng)用
基礎(chǔ)數(shù)據(jù)任務(wù)數(shù)據(jù)任務(wù)數(shù)據(jù)Prompt語(yǔ)料
千張級(jí)
十萬(wàn)級(jí)對(duì)數(shù)據(jù)配比幾類核心提示語(yǔ)料
視覺(jué)大模型要求較高
某模型A:100W+工業(yè)圖像某模型A:1000-10000,庫(kù)
部分簡(jiǎn)單場(chǎng)景數(shù)百?gòu)?/p>
工業(yè)數(shù)據(jù)在所有
工業(yè)問(wèn)答檢索提示詞
數(shù)據(jù)的占比為
問(wèn)答場(chǎng)景:X查詢內(nèi)容-X回
10-15%
——千級(jí)問(wèn)答對(duì)語(yǔ)料復(fù)格式…
語(yǔ)言大模型
工業(yè)內(nèi)容/規(guī)劃生成
某模型A:40TB中文文本某模型B:2000個(gè)左右
工業(yè)問(wèn)答對(duì)提示詞
分析規(guī)劃場(chǎng)景:X目標(biāo)-X
語(yǔ)言-X生成格式…
模型效果與數(shù)據(jù)量強(qiáng)相關(guān),通常需億級(jí)以上規(guī)模數(shù)據(jù)集
專業(yè)任務(wù)/多控制指令提示詞
模態(tài)?RT-2:13個(gè)機(jī)器人在辦公室等環(huán)境中收集的17個(gè)月數(shù)據(jù)
設(shè)備控制場(chǎng)景:通過(guò)
?盤古科學(xué)計(jì)算大模型:17億個(gè)化合物分子的類藥化學(xué)空間
function+prompt將語(yǔ)言
?Meta-ESMFold:1.25億蛋白質(zhì)分子結(jié)構(gòu)數(shù)據(jù)指令和action映射
3.3工具鏈+模型:低門檻開(kāi)發(fā)和輕量化部署成為工業(yè)大模型探索重點(diǎn)
各主體圍繞通用大模型開(kāi)發(fā)到部署全流程工具鏈,多知識(shí)蒸餾成為模型層面降低工業(yè)部署應(yīng)用成本的
推理后端兼容、半自動(dòng)微調(diào)成為重點(diǎn)探索途徑
與多推理后端兼容,實(shí)現(xiàn)工業(yè)低成本遷移需兼顧減輕模型體量、
小模型-1
大模型知識(shí)傳遞維持性能衰減,較具
?飛槳通過(guò)標(biāo)準(zhǔn)化部署接口,實(shí)現(xiàn)不同推
小模型-2數(shù)學(xué)挑戰(zhàn)性
理后端的零成本遷移
2個(gè)主流路徑,工業(yè)領(lǐng)域以跟隨應(yīng)用為主
?兼容20余家芯片廠商硬件設(shè)備,實(shí)現(xiàn)云
邊端全場(chǎng)景協(xié)同
模型壓縮模型增強(qiáng)
大模型微調(diào)由手動(dòng)向半自動(dòng)化演進(jìn)
在相同的帶標(biāo)簽數(shù)據(jù)利用其它數(shù)據(jù)資源或
手動(dòng)調(diào)參半自動(dòng)化調(diào)參集上指導(dǎo)子模型訓(xùn)練,優(yōu)化策略(相互學(xué)習(xí)等)
形成高效小規(guī)模網(wǎng)絡(luò)提高子模型性能
企業(yè)調(diào)參方式
可視化界面模型性能
參數(shù)設(shè)置觀測(cè)MakerSuite工具迭代prompt數(shù)據(jù)、算法要求較高,尚無(wú)工業(yè)
對(duì)開(kāi)源大模型進(jìn)行蒸餾
自動(dòng)合成數(shù)據(jù)擴(kuò)充數(shù)據(jù)集實(shí)例
+預(yù)訓(xùn)練+指令微調(diào),
基于信息抽取能力,簡(jiǎn)化訓(xùn)練形成工業(yè)大模型AInno-
數(shù)據(jù)獲取15B(150億參數(shù))
無(wú)默認(rèn)參數(shù)
模型性能集成AIGC能力,基于自然語(yǔ)言
人工調(diào)參實(shí)現(xiàn)調(diào)參
觀測(cè)
3.4基礎(chǔ)模型:通用大模型的快速演進(jìn)和專用大模型的能力升級(jí)
面向更多樣數(shù)據(jù)類型、更強(qiáng)綜合能力的大模型技術(shù)專業(yè)任務(wù)大模型的數(shù)字支撐能力提升是主要方向,
迭代創(chuàng)新,為工業(yè)領(lǐng)域應(yīng)用創(chuàng)造更大前景在藥物創(chuàng)新發(fā)現(xiàn)與產(chǎn)品設(shè)計(jì)形成初步成果
1、時(shí)序數(shù)據(jù)大模型有望最大化利用海量工業(yè)設(shè)備與1、依托大規(guī)模結(jié)構(gòu)化專業(yè)數(shù)據(jù)嵌入表示能力,訓(xùn)練
過(guò)程數(shù)據(jù),賦能流程優(yōu)化、設(shè)備診斷和異常識(shí)別數(shù)據(jù)樣本的全面性是提升模型性能核心
TimeGPT
訓(xùn)練:超1000億個(gè)時(shí)序數(shù)2、由一維序列、二維拓?fù)鋱D轉(zhuǎn)向三維表征的先進(jìn)表
據(jù)點(diǎn)征技術(shù)是探索方向
測(cè)試:超30萬(wàn)個(gè)時(shí)序數(shù)據(jù)
集,開(kāi)展時(shí)、日、周、月的
預(yù)測(cè)評(píng)估
機(jī)構(gòu)細(xì)分方向大模型數(shù)據(jù)集大小
2、多模態(tài)能力持續(xù)創(chuàng)新,加速實(shí)現(xiàn)工業(yè)圖像幾何、蛋白質(zhì)結(jié)UR50/D
MetaESMFold
機(jī)理、文檔等各類數(shù)據(jù)模型的綜合感知和認(rèn)知推理構(gòu)預(yù)測(cè)等1.25億(1維)基于序列數(shù)據(jù)開(kāi)展優(yōu)
藥物分子藥物分子化,為現(xiàn)階段主流
華為Pangu
生成優(yōu)化17億(2維)
分子性質(zhì)多數(shù)據(jù)集混合基于分子特性開(kāi)展
深勢(shì)科技Uni-Mol
GPT-4.5融合了處理預(yù)測(cè)等2.09億(3維)探索,在領(lǐng)域93%
3D模型和視頻的能力數(shù)據(jù)集中表現(xiàn)最優(yōu)
深勢(shì)科技發(fā)布Uni-Mol,直接將分子三維結(jié)構(gòu)坐
標(biāo)信息作為模型輸入輸出
3.5大模型+工業(yè)知識(shí)圖譜:大模型可能對(duì)通用知識(shí)圖譜產(chǎn)生一定沖擊,但
與領(lǐng)域知識(shí)圖譜將融合共生,工業(yè)領(lǐng)域暫未出現(xiàn)典型探索
賦能圖譜加速圖譜構(gòu)建到應(yīng)用過(guò)程
本體構(gòu)建
大模型
使用大模型Prompt生成事件的本體
知識(shí)圖譜直接文本化,數(shù)據(jù)增強(qiáng)
訓(xùn)練前
作為預(yù)訓(xùn)練語(yǔ)料利用GPT生成標(biāo)注數(shù)據(jù)/數(shù)據(jù)清
洗,降低知識(shí)圖譜標(biāo)注端成本
將知識(shí)圖譜隱式地加入到模型訓(xùn)練,即將圖
知識(shí)抽取與應(yīng)用
訓(xùn)練中譜中的結(jié)構(gòu)化信息(三元組)融入預(yù)訓(xùn)練模型
將知識(shí)圖譜作為大模型訓(xùn)練評(píng)估基于GPT做信息抽取、圖譜補(bǔ)全
訓(xùn)練后知識(shí)圖譜注入prompt/知識(shí)庫(kù)外掛,增強(qiáng)結(jié)果可用性
對(duì)大模型生成結(jié)果進(jìn)行知識(shí)校驗(yàn),增強(qiáng)事實(shí)性知識(shí)圖譜
增強(qiáng)大模型事實(shí)驗(yàn)證能力,擴(kuò)展專業(yè)知識(shí)范疇,提升可解釋性賦能大模型
3.6應(yīng)用部署:三類核心部署方式,當(dāng)前以通用模型場(chǎng)景化應(yīng)用為主
通用模型應(yīng)用(公)通用模型場(chǎng)景化應(yīng)用特定領(lǐng)域?qū)S媚P?/p>
無(wú)參數(shù)更新-Prompt設(shè)計(jì)外掛知識(shí)庫(kù)(公/私)參數(shù)更新微調(diào)(公/私)(私)
工業(yè)應(yīng)用工業(yè)應(yīng)用工業(yè)大模型領(lǐng)域大模型
Prompt設(shè)計(jì)上下文學(xué)習(xí)/知識(shí)梳理微調(diào)/量化/蒸餾/增強(qiáng)...訓(xùn)練
部署原理
API接口/插件Prompt設(shè)計(jì)匹配/檢索私有數(shù)據(jù)庫(kù)領(lǐng)域數(shù)據(jù)庫(kù)
通用大模型通用大模型外掛知識(shí)庫(kù)通用大模型模型結(jié)構(gòu)設(shè)計(jì)
適用領(lǐng)域1.通用場(chǎng)景基于模式通用能力,結(jié)合數(shù)據(jù)相對(duì)充足,任務(wù)數(shù)據(jù)充足、專有性隱私性
2.場(chǎng)景公開(kāi)語(yǔ)料充足工業(yè)領(lǐng)域知識(shí)信息工業(yè)語(yǔ)料依賴性強(qiáng)強(qiáng),全部依賴領(lǐng)域語(yǔ)料
代碼生成、故障缺陷提藥物研發(fā)、高性能材料
典型場(chǎng)景設(shè)備控制、文檔處理、研發(fā)輔助、生產(chǎn)優(yōu)化…
郵件回復(fù)…取分析、企業(yè)培訓(xùn)…研制…
ChatGPT:可直接生百度-文心:上傳設(shè)備故障Salesforce-Einstein臉書(shū)-ESMFold:蛋白質(zhì)
文檔,分析故障原因GPT:基于ChatGPT與結(jié)構(gòu)預(yù)測(cè),150億參數(shù)
應(yīng)用案例成簡(jiǎn)單功能的西門子
哈工大:MiniGPT-4外掛自有數(shù)據(jù),提高效率谷歌-PALM-E:基于機(jī)器
PLC程序
視覺(jué)專家?guī)?,進(jìn)行缺陷分析華為-盤古行業(yè)大模型人17個(gè)月數(shù)據(jù)的VLA模型
4產(chǎn)業(yè)體系:不同主體布局以及技術(shù)產(chǎn)品升級(jí)
主體AI廠商工業(yè)技術(shù)服務(wù)商初創(chuàng)企業(yè)科研機(jī)構(gòu)/科技巨頭
體系
BI生成圖表、文件審查、設(shè)
工業(yè)大模型產(chǎn)大模型代碼生大模型異構(gòu)智
知識(shí)問(wèn)答等應(yīng)備監(jiān)控、操作
品方案工業(yè)大模型部署一體機(jī)成+檢查代碼能機(jī)器人協(xié)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 購(gòu)房租賃合同經(jīng)典
- 農(nóng)業(yè)機(jī)械租賃合同范文
- 二手?jǐn)z影器材買賣合同
- 初中數(shù)學(xué)問(wèn)題解決策略 特殊化教案2024-2025學(xué)年北師大版(2024)七年級(jí)數(shù)學(xué)下冊(cè)
- 中國(guó)古典舞的審美特征
- 弧形座椅埋件的精確定位與安裝質(zhì)量控制QC成果
- 第一章 第三節(jié) 測(cè)量:長(zhǎng)度與時(shí)間2024-2025學(xué)年新教材八年級(jí)上冊(cè)物理新教學(xué)設(shè)計(jì)(滬科版2024)
- AR-6-低泡強(qiáng)效除油表面活性劑
- 居間傭金合同標(biāo)準(zhǔn)版
- 初中生物北師大版八年級(jí)下冊(cè)第4節(jié) 生態(tài)系統(tǒng)的穩(wěn)定性教學(xué)設(shè)計(jì)及反思
- 無(wú)違法犯罪記錄證明申請(qǐng)表(個(gè)人)
- 公共衛(wèi)生概論課件
- 農(nóng)村垃圾清運(yùn)投標(biāo)方案
- 涉密計(jì)算機(jī)安全策略
- 雨污水施工組織設(shè)計(jì)
- (6.3)-第三節(jié) 種子凈度分析
- 性激素六項(xiàng)的解讀 課件
- 漢語(yǔ)言文學(xué)專業(yè)自評(píng)報(bào)告
- 中建項(xiàng)目目標(biāo)成本測(cè)算操作指南
- 新課標(biāo)背景下:如何進(jìn)行大單元整體教學(xué)設(shè)計(jì)
- 現(xiàn)金盤點(diǎn)表完整版
評(píng)論
0/150
提交評(píng)論