CESA-2022-1-002《人工智能 深度合成圖像系統(tǒng)技術規(guī)范》團體標準(征求意見稿)編制說明_第1頁
CESA-2022-1-002《人工智能 深度合成圖像系統(tǒng)技術規(guī)范》團體標準(征求意見稿)編制說明_第2頁
CESA-2022-1-002《人工智能 深度合成圖像系統(tǒng)技術規(guī)范》團體標準(征求意見稿)編制說明_第3頁
CESA-2022-1-002《人工智能 深度合成圖像系統(tǒng)技術規(guī)范》團體標準(征求意見稿)編制說明_第4頁
CESA-2022-1-002《人工智能 深度合成圖像系統(tǒng)技術規(guī)范》團體標準(征求意見稿)編制說明_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

中國電子工業(yè)標準化技術協(xié)會

一、工作簡況

(一)產品和行業(yè)發(fā)展情況

隨著人工智能時代的到來,下一代媒體將由人工智能驅動,人工智能可能給數字內容領

域帶來重塑。近幾年,人工智能內容生成技術正在快速興起,利用AI算法生產、修改數據和

信息內容,從而讓文字、語音、圖像、視頻等都可以由AI自動生成。尤其是隨著生成對抗網

絡(GAN)這一AI算法的誕生,AI內容生成中的“深度合成”(deepsysthesis)技術可以

實現換臉、人臉合成、語音合成、視頻生成甚至數字人等諸多應用,獲得了各界的廣泛關注。

2017年是深度合成技術進行入大眾視野的第一年,隨后的兩年里,隨著GAN算法的發(fā)展應用

和開源項目的增多,諸多AI初創(chuàng)公司試水生成內容工具的開發(fā),相繼尋找下一個能引發(fā)爆點

的應用,在通訊、社交、電影、網絡購物等領域的嘗試令人驚喜。與此同時,深度合成技術

強大的仿真能力也引發(fā)對技術作惡和技術濫用的擔憂,例如金融詐騙、色情復仇、隱私侵犯、

威脅信息安全、商業(yè)詆毀,乃至威脅國家安全、公共安全。回顧技術的發(fā)展歷程可以發(fā)現,

經歷過技術初問世時的狂熱追捧以及隨之而來的“威脅論”和“恐慌論”,社會對深度合成

技術及相關應用的認識逐漸趨于理性。

(二)任務來源

2022年2月21日,中國電子工業(yè)標準化技術協(xié)會下達2022年第一季度第一批團體標準,

擬研制《人工智能深度合成圖像系統(tǒng)技術規(guī)范》相關標準。本標準為自主制定標準,計劃

編號為CESA-2022-1-002,歸口單位為中國電子技術標準化研究院,由中國電子技術標準化

研究院和騰訊云計算(北京)有限責任公司牽頭組織編制。

(三)標準主要起草單位

本標準起草單位:中國電子技術標準化研究院、騰訊云計算(北京)有限責任公司、上

海計算機軟件技術開發(fā)中心、上海商湯智能科技有限公司、北京曠視科技有限公司、深圳市

矽赫科技有限公司、云從科技集團股份有限公司、西安深信科創(chuàng)信息技術有限公司、美的集

團(上海)有限公司、海信集團控股股份有限公司、馬上消費金融股份有限公司、西安交通

中國電子工業(yè)標準化技術協(xié)會

大學、西北工業(yè)大學、北京百度網訊科技有限公司、京東科技信息技術有限公司、武漢精測

電子集團股份有限公司、上海人工智能研究院有限公司。

(四)標準主要起草人

本標準主要起草人及具體分工如下:董建(標準整個流程和資料編寫)、馬珊珊(標準

整個流程和資料編寫)、劉海濤(整體技術部分編寫)、劉晶(第3章、第4章)、汪鋮杰(第

6章、第7章)、周磊(第6章、第7章)、邰穎(第6章、第7章)、羅棟豪(第6章、第7章)、

許元博(第6章、第7章)、劉嘉怡(第6章、第7章)、朱俊偉(第6章、第7章)、陳敏剛(第

5章、第8章)、吳庚(第6章、第7章)、徐浩(第6章、第7章)、梅敬青(第5章、第8章)、

洪智濱(第8章)、洪鵬達(第5章、第8章)、李軍(第5章)、胡蓉(第5章)、翟軍治(第

8章)、楊春勇(第8章)、藺琛皓(第8章)、張磊(第8章)。

(五)主要工作過程

2021年9月3日,全國信標委人工智能分委會召開計算機視覺相關標準需求研討會,確定

對該項標準進行研制,并公開征集參編單位。

2021年11月15日,立項評審會,標準立項評審。

2022年2月15日,第一次標準編制討論會,標準參編單位對各標準的立項材料進行編寫

討論,并對標準草案進行編寫討論。

2022年2月21日,中國電子工業(yè)標準化技術協(xié)會下達2020年第一季度第一批團體標準,

擬研制《人工智能深度合成圖像系統(tǒng)技術規(guī)范》相關標準。

2022年3月15日,第二次標準編制討論會,對標準草案進行編寫討論,并形成征求意見

稿。

2022年3月16日-4月7日,起草組內部對標準征求意見并修改。

二、標準編制原則和確定主要內容的論據及解決的主要問題

1、編制原則

先進性原則:本標準的制定與當前人工智能大趨勢相匹配,為用戶、市場的規(guī)范化提供

基礎,為人工智能領域的發(fā)展提供標準支撐。

實用性原則:本標準制定時充分分析了眾多應用領域對深度合成圖像系統(tǒng)的需求,標

準制定著力于解決用戶、廠商實際應用中的共同問題,引導用戶、廠商針對產品能力達成

一致預期,在實際項目中可直接落地應用。

中國電子工業(yè)標準化技術協(xié)會

兼容性原則:本標準設計時,充分考慮了深度合成圖像系統(tǒng)與其它相關技術和產品的兼

容性,可保證與現有產品和標準的兼容性。

可擴展性原則:本標準中在設計的時候,充分考慮到標準的可擴展性,可保證各廠商

在使用時兼顧規(guī)范性的同時具備可擴展能力。

2、確定主要內容的論據

主要內容:本標準規(guī)定了深度生成圖像系統(tǒng)的技術框架、技術功能和性能要求和防偽檢

測方法。

適用范圍:本標準適用于深度生成圖像系統(tǒng)的設計、開發(fā)、測試、評估、和管理等。

本標準相關指標的制定基于行業(yè)內相關廠商的深度合成圖像系統(tǒng)的功能和性能參數而

提出。

3、主要解決的問題

隨著人工智能理論和技術的日益成熟,人工智能的場景融合能力將不斷提升,在數字中

國的政策背景下,將迎來從產業(yè)到行業(yè)的大發(fā)展。該標準屬于人工智能技術之一——深度合

成圖像技術在數字內容產業(yè)應用的范疇,該標準的貫徹實施依賴于人工智能技術各個基礎標

準。

深度合成圖像技術在數字內容產業(yè)應用涵蓋影視、娛樂、教育、社交、電子商務、內容

營銷、藝術、醫(yī)療等諸多行業(yè),通過該標準的制定,可以有效規(guī)范深度合成圖像系統(tǒng)的功能

和性能,并通過測試認證建立行業(yè)基線,更好的滿足行業(yè)訴求,同時通過制定防偽測試方法,

有效防止該技術的濫用和作惡。

三、主要試驗[或驗證]情況分析

無。

四、知識產權情況說明

無。

五、產業(yè)化情況、推廣應用論證和預期達到的經濟效果

早在1989年,AI技術已被用于創(chuàng)造新音樂,2014年生成對抗網絡(GAN)算法的出現,

使得深度合成技術快速興起,在影視、娛樂、教育、通訊、社交、電子商務、藝術、醫(yī)療等

領域得到較多應用。當前,在算法上,新的生成模型算法不斷出現,比如用于圖像的VAE、

PixelRNN/PixelCNN和Flow-basedmodal,用于音頻處理的Diffusionmodel;在內容上,除

中國電子工業(yè)標準化技術協(xié)會

了生成單一的音頻、圖像內容之外,深度合成技術朝著多模態(tài)方向發(fā)展;另外在2D之外,3D

內容生成技術尤其是數字人技術已成為業(yè)內研究熱點。

技術發(fā)展的同時,深度合成技術越來越多的開源也促進了行業(yè)發(fā)展,如Faceswap技術的

源代碼很早就被創(chuàng)建者匿名捐獻給開源平臺,并上傳到Github;另外公開的內容合成技術平

臺也蓬勃興起,根據荷蘭一家網絡安全公司deeptrace統(tǒng)計,僅統(tǒng)計中公開的13個深度合成

技術論壇,會員總數就達10萬人。

該技術在影視、娛樂、教育、社交、電子商務、內容營銷、藝術、醫(yī)療等諸多行業(yè)有較

好的應用前景。

六、采用國際標準和國外先進標準情況

計算機視覺相關的國際標準主要在ISO/IECJTC1/SC24制訂,本標準目前沒有對應或相

似的國際標準。

七、與現行相關法律、法規(guī)、規(guī)章及相關標準的協(xié)調性

本標準項目屬于國家人工智能標準體系E關鍵技術中EC計算機視覺。

八、重大分歧意見的處理經過和依據

無。

九、標準性質的建議

本標準主要目的是實現基于人工智能的深度合成圖像系統(tǒng)的規(guī)范化,解決深度合成圖像

系統(tǒng)應用問題,有利于在促進深度合成圖像技術有益和創(chuàng)新應用的同時,將其納入可控的

發(fā)展軌道,可有效指導深度合成圖像系統(tǒng)的設計、開發(fā)、評估和管理。

十、貫徹標準的要求和措施建議

標準的實施可實現產業(yè)內的統(tǒng)一探討,形成產業(yè)共認的標準規(guī)范,推動人工智能及計算

機視覺領域相關技術的良性合作和發(fā)展,具有不可取代的支撐作用。

本標準的主要內容首先規(guī)劃在國內計算機視覺公司深入地開展宣傳和推廣應用,通過將

標準貫穿于產品的設計、開發(fā)和應用過程中,提升標準的知名度和權威性。待團體標準正式

發(fā)布后,可以通過各級組織及科研單位進一步宣傳貫徹和實施,推動各級各類高校、科研機

構、企事業(yè)單位在開發(fā)人員追蹤系統(tǒng)時采用本標準。

本標準密級為“公開”,目的是最大效能地在團體內、外推廣應用。

十一、替代或廢止現行相關標準的建議

無。

中國電子工業(yè)標準化技術協(xié)會

十二、其它應予說明的事項

無。

《人工智能深度合成圖像系統(tǒng)技術規(guī)范》

團體標準編制工作組

2022年4月7日

中國電子工業(yè)標準化技術協(xié)會

一、工作簡況

(一)產品和行業(yè)發(fā)展情況

隨著人工智能時代的到來,下一代媒體將由人工智能驅動,人工智能可能給數字內容領

域帶來重塑。近幾年,人工智能內容生成技術正在快速興起,利用AI算法生產、修改數據和

信息內容,從而讓文字、語音、圖像、視頻等都可以由AI自動生成。尤其是隨著生成對抗網

絡(GAN)這一AI算法的誕生,AI內容生成中的“深度合成”(deepsysthesis)技術可以

實現換臉、人臉合成、語音合成、視頻生成甚至數字人等諸多應用,獲得了各界的廣泛關注。

2017年是深度合成技術進行入大眾視野的第一年,隨后的兩年里,隨著GAN算法的發(fā)展應用

和開源項目的增多,諸多AI初創(chuàng)公司試水生成內容工具的開發(fā),相繼尋找下一個能引發(fā)爆點

的應用,在通訊、社交、電影、網絡購物等領域的嘗試令人驚喜。與此同時,深度合成技術

強大的仿真能力也引發(fā)對技術作惡和技術濫用的擔憂,例如金融詐騙、色情復仇、隱私侵犯、

威脅信息安全、商業(yè)詆毀,乃至威脅國家安全、公共安全?;仡櫦夹g的發(fā)展歷程可以發(fā)現,

經歷過技術初問世時的狂熱追捧以及隨之而來的“威脅論”和“恐慌論”,社會對深度合成

技術及相關應用的認識逐漸趨于理性。

(二)任務來源

2022年2月21日,中國電子工業(yè)標準化技術協(xié)會下達2022年第一季度第一批團體標準,

擬研制《人工智能深度合成圖像系統(tǒng)技術規(guī)范》相關標準。本標準為自主制定標準,計劃

編號為CESA-2022-1-002,歸口單位為中國電子技術標準化研究院,由中國電子技術標準化

研究院和騰訊云計算(北京)有限責任公司牽頭組織編制。

(三)標準主要起草單位

本標準起草單位:中國電子技術標準化研究院、騰訊云計算(北京)有限責任公司、上

海計算機軟件技術開發(fā)中心、上海商湯智能科技有限公司、北京曠視科技有限公司、深圳市

矽赫科技有限公司、云從科技集團股份有限公司、西安深信科創(chuàng)信息技術有限公司、美的集

團(上海)有限公司、海信集團控股股份有限公司、馬上消費金融股份有限公司、西安交通

中國電子工業(yè)標準化技術協(xié)會

大學、西北工業(yè)大學、北京百度網訊科技有限公司、京東科技信息技術有限公司、武漢精測

電子集團股份有限公司、上海人工智能研究院有限公司。

(四)標準主要起草人

本標準主要起草人及具體分工如下:董建(標準整個流程和資料編寫)、馬珊珊(標準

整個流程和資料編寫)、劉海濤(整體技術部分編寫)、劉晶(第3章、第4章)、汪鋮杰(第

6章、第7章)、周磊(第6章、第7章)、邰穎(第6章、第7章)、羅棟豪(第6章、第7章)、

許元博(第6章、第7章)、劉嘉怡(第6章、第7章)、朱俊偉(第6章、第7章)、陳敏剛(第

5章、第8章)、吳庚(第6章、第7章)、徐浩(第6章、第7章)、梅敬青(第5章、第8章)、

洪智濱(第8章)、洪鵬達(第5章、第8章)、李軍(第5章)、胡蓉(第5章)、翟軍治(第

8章)、楊春勇(第8章)、藺琛皓(第8章)、張磊(第8章)。

(五)主要工作過程

2021年9月3日,全國信標委人工智能分委會召開計算機視覺相關標準需求研討會,確定

對該項標準進行研制,并公開征集參編單位。

2021年11月15日,立項評審會,標準立項評審。

2022年2月15日,第一次標準編制討論會,標準參編單位對各標準的立項材料進行編寫

討論,并對標準草案進行編寫討論。

2022年2月21日,中國電子工業(yè)標準化技術協(xié)會下達2020年第一季度第一批團體標準,

擬研制《人工智能深度合成圖像系統(tǒng)技術規(guī)范》相關標準。

2022年3月15日,第二次標準編制討論會,對標準草案進行編寫討論,并形成征求意見

稿。

2022年3月16日-4月7日,起草組內部對標準征求意見并修改。

二、標準編制原則和確定主要內容的論據及解決的主要問題

1、編制原則

先進性原則:本標準的制定與當前人工智能大趨勢相匹配,為用戶、市場的規(guī)范化提供

基礎,為人工智能領域的發(fā)展提供標準支撐。

實用性原則:本標準制定時充分分析了眾多應用領域對深度合成圖像系統(tǒng)的需求,標

準制定著力于解決用戶、廠商實際應用中的共同問題,引導用戶、廠商針對產品能力達成

一致預期,在實際項目中可直接落地應用。

中國電子工業(yè)標準化技術協(xié)會

兼容性原則:本標準設計時,充分考慮了深度合成圖像系統(tǒng)與其它相關技術和產品的兼

容性,可保證與現有產品和標準的兼容性。

可擴展性原則:本標準中在設計的時候,充分考慮到標準的可擴展性,可保證各廠商

在使用時兼顧規(guī)范性的同時具備可擴展能力。

2、確定主要內容的論據

主要內容:本標準規(guī)定了深度生成圖像系統(tǒng)的技術框架、技術功能和性能要求和防偽檢

測方法。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論