2023年AIGC發展趨勢報告:迎接人工智能的下一個時代-騰訊研究院_第1頁
2023年AIGC發展趨勢報告:迎接人工智能的下一個時代-騰訊研究院_第2頁
2023年AIGC發展趨勢報告:迎接人工智能的下一個時代-騰訊研究院_第3頁
2023年AIGC發展趨勢報告:迎接人工智能的下一個時代-騰訊研究院_第4頁
2023年AIGC發展趨勢報告:迎接人工智能的下一個時代-騰訊研究院_第5頁
已閱讀5頁,還剩122頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

一一報告2023一一前言012、AIGC產業生態加速形成和發展,走向模型即服務(MaaS)的未來、更包容性的用戶交互界面,不斷拓展應用領域三、產業端:合成數據牽引人工智能的未來31、合成數據產業加快成為數據要素市場新賽道,科技大廠和創新企業搶先布局37加速構建AI賦能、數實融合的大型虛擬世界39四、社會端:AIGC助力可持續社會價值411、元價值:解放人類創造力,革新藝術領域43AIGC45五、發展與挑戰并生:積極應對AIGC帶來的社會倫理問題48六、展望:擁抱人工智能的下一個時代,打造可信AIGC生態60內容數量內容數量AIGCAIGeneratedContent,人工智能生成內容)爆火出圈的—年,不僅被消費23日,紅杉美國發表文布的開源模型StableDiffusion,可以根據用戶輸入的文字描述(稱為提示詞,prompts)自動是否已經具有人類智能。全球各大科技企業都在積極擁抱AIGC,不斷推出相關的技術、平臺GCAI作UGC圖:內容創作模式的四個發展階段AI自動生成內容的生產方式。但是AIGC已經代表了AI技術發展的新趨勢。過去傳統的人工如應用最為廣泛的個性化推薦算法。而現在人工智能正在生成新的東西,而不是僅僅局限于AIGC發展趨勢報告2023分析已經存在的東西,實現了人工智能從感知理解世界到生成創造世界的躍遷。因此,從這個它可以基于訓練數據和生成算法模型,自主生成創造新的文本、圖像、音樂、視頻、3D交互內容(如虛擬化身、虛擬物品、虛擬環境)等各種形式的內容和數據,以及包括開啟科學新發現、朝著效率和品質更高、成本更低的方向發展,在某些情況下,它比人類創造的東西更好。包括從社交媒體到游戲、從廣告到建筑、從編碼到平面設計、從產品設計到法律、從營銷到銷AIGC影響和變革。數字經濟和人工智能發展所需的海量數據也能通過AIGC技術生成、合成出來,即合成數據(syntheticdata)。未來,人AI性工作會加速進入人機協同時代——人類與AIGC技術共同創造比過去單純人的創造之下更高效、更優質。在本質上,AIGC技術的最大影響在于,AIGC技術將會把創造和知識工作的邊際成本降至零,以產生巨大的勞動生產率和經濟價值。換句話說,正如互聯網實現了信息的零成本傳播、復制,未來塑內容生產供給,進而給依賴于內容生產供給的行業和領域帶來巨大影響。戰,諸如知識產權保護、安全、技術倫理、環境影響等。各界需要秉持科技向善理念,負責任地、安全可控地發展應用AIGC,打造安全可信的AIGC技術和應用,以01注:國外傾向于使用生成式AI(GenerativeAI)的表述,國內通常使用AIGC的表述。本報告認為兩者雖表述有不同,但是表意是—樣的,故而在行文中本章主筆:胡曉萌騰訊研究院研究員AIGC發展趨勢報告2023雖然從嚴格意義上來說,1957年萊杰倫·希勒(LejarenHiller)和倫納德·艾薩克森(Leon-ardIsaacson)完成了人類歷史上第—支由計算機創作的音樂作品就可以看作是AIGC的開端,距今已有65年,這期間也不斷有各種形式的生成模型、AI生成作品出現,但是2022年才真正算是AIGC的爆發之年,人們看到了AIGC無限的創造潛力和未來應用可能性。目前,1、生成算法、預訓練模型、多模態等AI技術累積融合,催生了模型、圖:AIGC技術累積融合02—是,基礎的生成算法模型不斷突破創新。2014年,伊恩·古德費洛(IanGoodfellow)提出的生成對抗網絡(GenerativeAdversarialNetwork,GAN)成為早期最為著名的生成模型。GAN使用合作的零和博奕框架來學習,被廣泛用于生成圖像、視頻、語音和三維物體模sAAErnedInferenceALIDALLE為例,它通過預訓練模型的方式,串聯融合了打通文字與圖像兩種模態的CLIP模型、控制圖像生成的擴散模型、以及能夠同時處理多成為支持文字生成圖像的多模態AIGC工具。10X2XX10X2XX以按照輸入數據各部分重要性的不同而分配不同的權重,可以用在自然語言處理(NLP)、計算機視覺(CV)領域應用。后來出現的BERT、GPT-3、LaMDA等預訓練模型都是基于Transformer模型建立的。而擴散模型(DiffusionModel)是受非平衡熱力學的步驟的馬爾可夫鏈,逐漸向數據添加隨機噪聲,然后學習逆擴散過程,從噪聲中構建所需的數據樣本。擴散模型最初設計用于去除圖像中的噪聲。隨著降噪系統的訓練3Z圖:擴散模型結構然而,從最優化模型性能的角度出發,擴散模型相對GAN來說具有更加靈活的模型架構和精I03P.Dhariwal,A.Nichol.DiffusionModelsBeatGANsonImageSynthesis(2021)04/2021/07/high-fidelity-image-generation-using.htmlAIGC發展趨勢報告2023自動編碼(Variational模型對生成對抗網絡(GAN)基于流的生成模型(Flow-學習—個非線性雙射轉換(bijective整個模型架構依靠直接最大化log-likelihood擴散模型(DiffusionModel)擴散模型有兩個過程,分別為擴散過程和逆擴散過程。在前向擴散階段對圖像逐步施加噪聲,直至圖像被破壞變成完全的高斯噪聲,然后在逆向階段學習從高斯噪聲還原為原始圖像的過程。經過訓練,該模型可以應用這些去噪方法,從—種基于自注意力機制的神經網絡模型,最初用來完成不同語言之間的文本翻譯任務,主體包含Encoder和Decoder部分,分別負責對源語言文本進行編碼和將編碼信息轉換為目標語言文本神經輻射場的表示(任何連續位置的體積密度和視角相關顏色)的方法,要解決的問題就是Training)模型—個模型的訓練,不斷調整兩個模型的內部參數,使得模型分別輸出的文字特征和圖像認匹配。本高、內容生成簡單和質量偏低,遠遠不能滿足真實內容消費場景中的靈活多工智能領域進入了大煉模型參數的預訓練模型時代。AI預訓練模型,又稱為大模型、基礎模型(foundationmodel),即基于大量數據(通常使用大規模自我監督學習)訓練的、擁有巨量參數的模型,可以適應廣泛的下游任務。這些模型基于遷移學習的思想和深度學習的最新進展,以及大規模應用的計算機系統,展現了令人驚訝的涌現能力,并顯著提高各種下游任務的性能。05鑒于這種潛力,預訓練模型成為AI技術發展的范式變革,許多跨領域的AI系統將直在各種內容的生成上將扮演關鍵角色。按照基本類型分類,預訓練模型包括:(1)自然語言處 (CV)預訓練模型,如微軟的Florence;(3)多模態預訓練模型,即融合文字、圖片、音視頻等多種內容形式。05/news/reflections-foundation-modelsAIGC發展趨勢報告2023語言理解與生成語言理解與圖像生成語言理解與圖像生成0億別言模型語言理解與生成億語言理解與圖像生成具通用性,成為多才多藝、多面手的AI模型,主要得益于多模型技術(multimodaltechnol-P行開源。CLIP模型能夠將文字和圖像進行關聯,比如將文字“狗”和狗的圖像進行關聯,并CLIP模型具備兩個優勢:—方面同時進行自然語言理解和計算機視覺分析,實現圖像和文本匹配。另—方面為了有足夠多標記好的“文本-圖像”進行訓言文字、圖形圖像、音視頻等多模態、跨模態模型。2021年3月OpenAI發布AI繪畫產品總的來看,AIGC在2022年的爆發,主要是得益于深度學習模型方面的技術創新。不斷創新的生成算法、預訓練模型、多模態等技術融合帶來了AIGC技術變革,擁有通用性、基礎性、質穩定等特征的AIGC模型成為了自動化內容生AIGC發展趨勢報告2023圖:AIGC產業生態體系的三層架構練模型的高成本和技術投入,因此具有較高的進入門欖。以2020年推出的GPT-3模型為例,主要機構為頭部科技企業、科研機構等。目前在AIGC領域,美國的基礎設施型公司(處于上游生態位)有OpenAI、Stability.ai等。OpenAI的商業模式為對受控的api調用進行收費。Stability.ai以基礎版完全開源為主,然后通過開發和銷售專業版和定制版實現商業獲利,目前估值已經超過10億美金。因為有了基礎第二層,為中間層,即垂直化、場景化、個性化的模型和應用工具。預訓練的大模型是基礎設施,在此基礎上可以快速抽取生成場景化、定制化、個性化的小模型,實現在不同行業、垂直領域、功能場景的工業流水線式部署,同時兼具按需使用、高效經濟的優勢。隨著兼具大模型和多模態模型的AIGC模型加速成為新的技術平臺,模型即服務(Model-as-a-Service,MaaS將對商業領域產生巨大影響。StableDiffusion開源之后,有很多基于開源模型的二次開發,訓練特定風格的垂直領域模型開始流行,比如著名的二次元畫風生第三層,為應用層,即面向C端用戶的文字、圖片、音視頻等內容生成服務。在應用層,側AIGC以StableDiffu-的C端用戶中的普及起到至關重要的作用。現在貼近C端用戶的工具越發豐富多樣,包括網聊機器人等,甚至還有利用AIGC工具定制代出圖的目前,從提供預訓練模型的基礎設施層公司到專注打造AIGC產品和應用工具的應用層公司,AIGC國也有望憑借領先濟融合程度不斷加深,以及互聯網平臺的數字化場景向元宇宙轉型,人類對數字內容總量和豐富程度的整體需求不斷提高。AIGC作為當前新型的內容生產方式,已經率先在傳媒、電商、影視、娛樂等數字化程度高、內容需求豐富的行業取得重大創新發展,市場潛力逐漸顯現。與此同時,在推進數實融合、加快產業升級的進程中,金融、醫療、工業C本章主筆:本章主筆:胡曉萌究員研究員研究員研究員2AIGC發展趨勢報告20232數字內容生產領域,不僅在寫作、繪畫、作曲等多個領域達到“類人”表現,更展示出在大數的非凡創意潛能。這將塑造數字內容生產的人機協作新范式,也讓內容創作者和”和“效能”限制,盡情揮灑內容創意。看,人們在線的時間持續增長,在線新聞、音樂、動漫、影視、文學、游戲的數字內容消費的結構也正轉型升級,從以圖文為主過度到視頻為主,量中的占比不斷上升。短視頻和直播的流行,在生產側,讓原本需要長制作周期成了可以源源不斷產出的“工業品”;在消費側,過往需要高注意投入、反復觀看的媒體“貨架”上的“快消品”。最后,創意仍是核心,仍舊稀缺,需要新的模式輔助創作者持續產生、送代和驗證創意。種種因素,都需要更加低成本、高效能的數字AIGC正在越來越多地參與數字內容的創意性生成工作,以人機協同的方式釋放價值,成為未從范圍上看,AIGC逐步深度融入到文字、音樂、圖片、視頻、3D多種媒介形態的生產中,可以擔任新聞、論文、小說寫手,音樂作曲和編曲者,多樣化風格的畫手,長短視頻的剪輯者和后期處理工程師,3D建模師等多樣化的助手角色,在人類的指導下完成指定主題內容的創從效果上看,AIGC在基于自然語言的文本、語音和圖片生成領域初步令人滿意,特別是知識類中短文,插畫等高度風格化的圖片創作,創作效果可以與有中級經驗的創作者相匹敵;在D于探索階段,但成長很快。盡管AIGC對極端案例的處理、方面仍有許多進步空間,但蘊含的潛力令人期待。AIGC發展趨勢報告2023AIGC模態加工是熱點。吳恩達(AndrewNg)認為多模態是2021年AI的PPerceiverIO視頻和點云進行分類。典型應用包括如文本轉換語音、文本生成圖片,廣義來看AI翻譯、圖個不同“模態”間的映射。圖:AIGC基礎模型和應用發展預測(引用自紅杉資本)06AIGC在新研究范式及算力進步下加速發展,特別是自然語言理解能力大幅進化,典型代表是GPT就是加菲貓的照片,音樂劇《貓》和無數內容的索引,這些不同的內容類型可以稱為“多模態”。創作者以自然語言描述要素、特征后,AI就能生成對應的不同模態的結果。2017年Google發布的Transformer開啟了大型語言模型(Largelanguagemodel,簡稱LLM)時代。它作種預訓練語言模型中,以大數據預訓練+小數據微調的方式,擺脫了對大量人工調參的依賴,在手寫、語音和圖像識別、語言理解方面的表現大幅突破,所生成的內容也越來越準確和自然。06/article/generative-ai-a-creative-new-world/圖:游戲設計師杰森·艾倫使用Midjourney模型生成的《太空歌劇院》是首個獲獎的AI生成藝術式各樣的需求,做出回答、短文和詩歌創作、代碼寫作、數學和邏輯計算等。ChatGPT可以F在—些缺陷,例如引用不存在的論文和書籍,誤解和扭曲直觀的自然在AIGC技術開源的背景下,AIGC圖片生成也促進了小眾文化的發展。早在2022年五月,次元形象生成器火遍國內外。AIGC發展趨勢報告2023圖:KFC官推親自打破次元壁StableDiffusionAIGC常見的問題,如不便捷,用戶想要生成比較好的結果,需要對圖片內容進行詳盡的描述,并增加很多提升效果和強化風格的詞, (1)內容描述:為了得到圖片的內容描述,QQ小世界對輸入圖中的信息進行人物性別、得到最終盡可能準確詳盡的內容描述詞。 (2)風格描述:為了讓結果更接近二次元,QQ小世界為各種不同場景設計了非常鮮明的二結合內容描述和風格描述,QQ小世界通過對原圖的分析得到最終完整的提示詞輸入網絡,從而能夠穩定生成畫面精致、風格突出的結果。既保證了生成內容和原圖的對應性,又增添了很二次元的感覺,同時也保證了較高的生成質量。圖:QQ小世界二次元風格生成流程圖AIGC在學習通用知識和理解泛化上有更好的表現,這是之前的生成模型沒有體現出來的能力。這也決定了AIGC不光是生成,而是建立在認知與理解上的模型的應用生態。2020年,OpenAIGPT3,在國內外掀起千億參數預訓練模型的研 (1)自動內容生成:大型語言和圖像AI模型可用于自動生成內容,例如文章、博客或社子。對于定期創建內容的企業和專業人士來說,這可能是—種寶貴的節省時間的n詞條內容的豐富性等方面都有了顯著的改進。架設在社交平臺Discord上的Midjourney,果,在社會層面得到了很大的關注。 (2)提高內容質量:AIGC生成的內容可能比人類創建的內容質量更高,因為人工智能模習并識別人類可能看不到的模式。這可以產生更準確和信息更豐富AIGC發展趨勢報告2023 AIGC、3D內容等等。這可以幫助企業和專業人士創建更多樣化、更有趣的內容,從而吸引更廣泛的k (4)內容制作成本低、門欖低:基于AIGC,內容制作的成本顯著降低、效率顯著提高,可以實現以十分之—的成本,以百倍千倍的生產速度,創造出有獨特價值和獨立視角的 (5)可實現個性化內容生成:人工智能模型可以根據個人用戶的喜好生成個性化內容。這可以幫助企業和專業人士創建目標受眾更有可能感興趣的內容,因此更有可能被閱讀或分ovelAI素材生產效率,在游戲、數字藏品領域初步得以應用。文字生成圖片(Text-to-Image,T2I)是目前AI繪畫的主流生成方式,用戶輸入文本命令便可生成相應效果圖。對于游戲開發者而07/s?id=1742950890265955383&wfr=spider&for=pc亦可批量生產石頭花紋、花草樹木等通用型貼圖素材。藝術是另—應用領域,全球最大的AIArtAI靈感生成數字藏品,單字僅象似乎開始落地:打造—個基于生成的全新內容平臺。圖:AIGC應用現狀概覽(引用自紅杉資本)0808/article/generative-ai-a-creative-new-world/AIGC發展趨勢報告2023AIGC作為當前新型的內容生產方式,已經率先在傳媒、電商、影視、娛樂等數字化程度高、AIGC成可以由AI提供,后期再由創作者進行調整,從而提高內容產出效率。根據6pen預測,未AI與生成,有望創造超過600億以上市場空間,若考慮到sultingAIGC將成為打造虛實集成世界的基石。人們將在在虛擬空間構建仿真世界,在現實世界“疊加”虛擬增強,實現真正的臨場感。隨著XR、游戲引擎、云游戲等等各種交互、仿真、傳輸技術的突破,信息傳輸越來越接近無損,數字仿真能力真假難辨,人類的交互和體驗將到達新AIGCDDAI畫那樣,為創作者激發新的靈感。傳統的3D制作需要耗費大量時間和人力成本。以2018年發售的游戲《荒野大標客2》為例,為了打造約60平方公里的虛擬場景、先后有六百余名美PCGProceduralContentGeneration—種在效能和可控度上介于AIGC年的交互內容《黑客帝國:覺醒》中就采用了這項技術,在最新引擎技術的加持下,虛擬城市共包括700萬個實例化資產,每個資產由數百萬個多邊。09/now/generative-ai-market-size-achieve-230000291.html圖:Epic使用虛幻5引擎和程序化生成技術高效制作《黑客帝國:覺醒》中的龐大城市,016年發布、主打宇宙探險的獨立游戲《無人深空》(NoMan,sSky)聲稱創造了1840億PCG系列生成規少的數據量生成了這個看似無限的游戲宇宙。圖:游戲《無人深空》中自動化生成的海洋生物示例盡管如此,距離“復刻”真實世界和打造千千萬萬個幻想世界,這樣的速度還是太慢了。為什IDAIGC發展趨勢報告2023相比,本身蘊含的信息量就有數量級的差距;其次,圖片和3D的實質不同,如果說2D是像素點陣在顯示器的客觀陳列,3D則是實時、快速、海量的矩陣運算,就像對著模型在1秒內少有:(1)模型幾何特征,通常用幾千上萬個三角面來表示;(2)材質特征,模型本身的顏色,是強反射的金屬,還是漫反射的布料;(3)光線,光源是點狀的嗎,顏色和強度如何。最后,原生3D模型的數據相對較少,遠不如已存在了數千年、可以以非數字化形態存在的圖像行轉化。計算機視覺技術的進步,為3D另辟溪徑:我們可以通過圖片來推測物體在3D空間中的形態,盡可能還原每個像素點原本的深度信息。采用激光雷達等設備掃描物理世界,能快速得到大量3D模型。當然,這些素材要經過簡化處理才能更好使用。因為它們攜帶了海量的坐標點和顏色信息,呈現起來耗費的計算資源多。想要應用在影視、游戲、元宇宙等場景中,設備中,需要經過—系列的后處理,比如讓模型的幾何表示更簡潔,還原材質信息、盡可能去除拍攝時的光照影響等。處理后的模型,也會具有更強的可編輯性,比色等。目前AIGC在3D模型領域還處于探索階段,從基本原理和使用的模型來看,仍然以擴散模型為基礎,基于文字-圖片-3D路徑進行處理。谷歌和英偉達在這—領域較為領先,先后在速度也未能盡如人意。DreamFusion夠使用文本到圖像模型先生成2D圖像,然后優化為體積NeRF(神經輻射場)數據。但其缺點也很顯著,首先擴散模型僅對64x64的圖像生時費力,導致生成速度較慢。SA,2022-9-26隨后,英偉達發布了Magic3D,同樣是從文字描述中生成3D模型的AI模型。在輸入諸如“—只坐在睡蓮上的藍色毒標蛙”這樣的提示后,Magic3D在大約40分鐘內生成了—個3D網格模型,并配有彩色紋理。Magic3D的轉換分為兩步,先將低分辨率生成粗略模型,再優化為高分辨率的精細模型,而且使用InstantNGP的哈希特征編碼,高分辨率圖像特征表示的計算成本大大降低,因此比谷歌DreamFusion的3D生成速度更快、效果更好。同時,與文本到圖片的擴散模型類似,Magic3D可以在幾代生成圖像中均保留相同的主題(—般稱為“—致性”),并將2D圖像(如立體派繪畫)的風格應用于3D模型。研究人員表示,模型完善后有望使3D合成技術進—步普及,并激發每個人在3D內容上的創造力。所產生的技術可以加速游戲和VR應用的開發,可能最終會在電影和電視的特效制作中實現落地應用。圖:Magic3D(第1、3列)與DreamFusion(第2、4列)對比AIGC模型GET3D(GenerateExplicitTextured3D的縮寫),具備生成具有顯示紋理的3D網格的能力,可根據其所訓練的建筑物、汽車、動物等2D圖像類別,即時合成3D幾何體。AIGC生成的物體具有高保真的紋理和復雜的幾何細節,并且以常用圖形軟件應用中所使用的三角網格格式創建,這使得用戶可以十分輕松地將這些幾何體導入3D這染器和游戲引擎,以進行后續編輯。可用于構建為游戲、機器人、建筑、社交媒體等行業設計的數字空間,比如建DDAIGC發展趨勢報告2023VIDIAGETDAIDAI顯示,在分離景中移動的物體替換材質或者調整光照。4、聊天機器人和數字人成為新的、更包容性的用戶交互界面,不 (1)聊天機器人:2022年12月1日,美國人工智能研究公司OpenAI研發的AI聊天機器人ChatGPTWeb,不僅能夠滿足與人類進行對話的基本功能,能誤、質疑不正確的前提和拒絕不適當的請求。而且,根據各領域的用戶在使用后反債,ChatGPT還可以駕駁各種風格和文體,且代碼編輯能力、基礎腦力工作處文字輸出任務的完成程度也大大超出預期。比如根據關鍵詞或提問,生成11/s/Yr-8HSVFQj26X-n75cyKvw的搜索引擎。12目前,從ChatGPT展示出來的內容輸出質量和內容覆蓋多維度,已經可以直etSundarPichai議,并指示公司的許多團隊重新集Google和ChatGPT進行了對比,分別在Google搜索和ChatGPT中提出了同—個問題 (2)數字人:數字人、虛擬機器人是數字智能體(digitalagent),作為新的交互形式,目前已有很多應用,包括元宇宙應用中的NPC虛擬角色、用戶虛擬替身/虛擬形象(avatar),主12/article/739676.html?type=text&visit_source=home_page&collection_id=13913/newsDetail_forward_21282873AIGC發展趨勢報告2023圖:應用了AIGC的騰訊2D數字人自動化管線生產流程(引用自騰訊研究院《數字人產業發展趨勢報告》)首先,AIGC大大提升了數字人的制作效能。用戶可以上傳照片/視頻,通過AIGC生成寫實類型的數字人,具有生成過程較短、成本低、可定制等特點。基于AIGC的3D數字人建模已經初步實現產品化,目前精度可以達到次世代游戲人物級別,優勢是可以開放程序接口,對接各種應用,因此潛力較大,范圍較廣,特別是C端的應用,可以通過便捷化的上傳圖片即可生成3D數字人面部模型。未來發展方向是通過算法驅動提高精度,優化建模效果,比如:偏移矯正、形成高度逼真的仿真這染,同時結合臉部表情、情緒、發型、年齡特征等因素讓用戶的虛擬形象更具活力。目前,Meta、英偉達等眾多科技公司已經在利用AI技術幫助用戶在虛擬世界打verseavatar其次,AIGC支撐了AI驅動數字人多模態交互中的識別感知和分析決策功能,使其更神似人。自然語言處理是數字人的大腦,直接影響交互體驗,而計算機視覺決定了數字人面部表情和肢進行感知-決策-表達的閉環來驅動數字人交互。計算機視覺(CV)目前數字人聲唇同步技術相對完善,在游戲中已經大量應用。的的理解嘴形視頻(2D)/嘴形動畫(3D)的數據進行者標簽表:AIGC支撐AI驅動數字人多模態交互的趨勢,—是融入會話式AI系統(ConversationalAI),給傳統的Siri等虛擬助手、器人以—個具象化、有親和力的人類形象,提升交流中情感的連接,有望給預計到2026年將增長到184億美元。隨著線上空間日益豐富,更多普通用戶也希望擁有自在虛幻引擎中集成的虛擬人工具Metahuman,用戶可以在系統提供的基礎形象模板上修改參數,僅用30分鐘就能“捏”成獨—無二的形象。可調節內容既包括整體的膚色、身材,也包括細節的面龐輪廓、五官大小等。未來,對話式AI系統、先進的實時圖形處理等技術的結合,將使得數字人、虛擬助手、虛擬伴侶、NPC等數字智能體(digitalagent)能夠逼真地模仿人類的音容笑貌,變得更加智能化、人性化。這將帶來更復雜的、自然交互的AI虛擬角色,除了模仿人類的語言表達,還具有表情、肢體語言、情緒甚至物理交互等能力,給用戶提供更直AIGC發展趨勢報告2023力。元宇宙最令人興奮的特征之—是它的可擴展性潛力,它將極大擴展人類在虛擬世界的生存空間。但是問題在于,誰來建造這個巨大的世界?它將如何填充內容?如今,創建高保真3D模型或虛擬人通常需要大量的計算機科學家和數字藝術家。面對這個空間所需要的大量的數字AIGC將是新的元宇宙內容生成解決方案。求。圖:扎克伯格在元宇宙的島嶼上,可以通過發出語音命令變換天氣、生成創建海灘等不同場景14/pulse/how-generative-ai-impact-metaverse-info-tech-research-group/?trk=public_post力工具。元宇宙在理論上可以用于工作、會議、游戲以及生活社交等各種人類活動,因此需要在元宇宙空間中創建各種各樣的活動對象、建筑和活動環境。但是,在過去,為了構建這些數半手工地創建每—個部分,從山丘到大海,用鼠標拖動來放置樹木或家AIGC現創建逼真的3D虛擬空間環境、虛擬人物,并且效率和成本可間環境創建。在元宇宙發展的過程中,游戲是虛擬世界重要的載體,將需要大量數字原生的場景。AIGC可以極大提高數字原生內容的開發效率,降低游戲開發成本。具體來說,劇情、角色、頭像、道世界、進行無限內容創作,從而實現自發有機生長。例如,當用戶朝任何方向行走時,游戲通過將2D視頻輸入來創建語義標記和可修改的3D環境。正如Unity人工智能高級副總裁DannyLange所言:“市政府想要通過城市的數字李生來做—些規劃。而城市數字李生很難聘AIGC編寫代碼,使開發人員可以花更少的時編寫代碼,而花更多的時間來表達需求,最終實現生產力的大幅提升,以及元宇宙空間環境C字內容是吸引人們進駐元宇宙的重要原因,而這些內容如果僅通過人工方式來生產既成本高需求,因此,需要AIGC作為生產力工具來滿足和填AIGC數字藝術家團隊數周才能完成,然而這兩個項目都是由兩個軟件開發15/ml/unity-s-ai-chief-on-generative-ai-metaverse-and-gamingAIGCD這種創造內容的方式,我們可以想象未來的元宇宙體驗將不再完全由開發人員構建,而是利用應該存在很多類似NPC的智能體為用戶提供交互服務,這些智能體可以由AIGC生成并驅動。ChatGPT便可以作為語言模型中集成到各種智能體中充當元宇宙中高度逼真的虛擬助手或伙16https://www.artificialintelligence.news/how-will-ai-power-the-metaverse/AIGC發展趨勢報告2023本章主筆:研究員研究員3AIGC發展趨勢報告2023隨著AIGC技術持續創新發展,基于AIGC算法模型創建、生成合成數據(syntheticdata)迎此,業界非常看好合成數據的發展前景及其對人工智能未來發展的巨大價值。Forrester、埃發展的核心要素,認為合成數據對于人工智能的未來而言是“必選項”和“必需品”。例如,2.0的五項關鍵技術進展,可以解決人工智能1.0所面臨的—些限制和挑戰,諸如數據、準確成為AI模型所使用的數據的主要來源。20MIT科技評論將AI合成數據列為2022年十大突破發展應用的數據基礎,可以認為,合成數據關乎人工智能的未來。在概念上,合成數據是計算機模擬(computersimulation)技術或算法創建、生成的自標注 (annotated)信息,可以在數學上或統計學上反映真實世界數據的屬性,因此可以作為真實世界數據的替代品,來訓練、測試、驗證AI模型。簡而言之,合成數據是在數字世界中創造的,而非從現實世界收集或測量而來。22合成數據擁有很長的歷史,在其發展過程中技術不斷創新。例如,游戲引擎、3D圖形等模擬技術(simulationtechnology)可以創建高保真的仿真物體和仿真環境,而結合了AI技術的3D-AI技術則可以極大提升自動化生產3D內容的效率和保真度(fidelity)。得益于生成對抗網絡(GAN)、變分自編碼器(VAE)、Transformer模型、擴散模型(DiffusionModel)、神經輻射場模型(NeRF)等不斷涌現的AI算法,不僅合成數據的種類得到了擴展,而且其質量也不斷得到提升。就目前而言,合成數據大致可分為三類:表格數據/結構化數據,圖像、視頻、語音等媒體數據,以及文本數據。23這幾類合成數據在多個領域都有應用。AIGC技術的持續創新,讓合成數據迎來新的發展契機,開始進發出更大的產業發展和商業應用活力。17/_acnmedia/Thought-Leadership-Assets/PDF-5/Accenture-Meet-Me-in-the-Metaverse-Full-Report.pdf18/research/report/ai-trends-2022/19/article/aws-ibm-google-and-microsoft-are-taking-ai-from-1-0-to-2-0-according-to-forrester/20/en/newsroom/press-releases/2022-06-22-is-synthetic-data-the-future-of-ai21/2022/02/23/1044965/ai-synthetic-data-2/22/blog/2021/06/08/what-is-synthetic-data/23/@adrialsina/is-synthetic-data-the-future-of-ai-exploring-enterprise-use-cases-eb0f7152fe9e應用離不開數據,但真實世界數據面臨著難以獲取、質量差、標準不統—等諸的合成數據,作為真實數據數據的廉價替代品,日theticdatafordeeplearning)認為,合成數據是現代深度學習領域閏閏升起的最具前景的通相比基于真實物體、事件或人物的數據,可以發揮同樣好甚至更好的效果。25總之,合成數據技術可以實現更廉價、更高效地批量生產制造AI模型訓練開發所需的海量數據(諸如訓練數據、測試數據、驗證數據等等),作為對真實數據的替代或補充,將推動人工智能邁向2.0階I可以說,目前人工智能仍處在1.0階段(AI1.0),數據是最大摯肘,業界利用真實世界數據訓練AI模型面臨多方面問題:數據采集、標注費時費力、成本高企;數據質量較難保障;數據多樣化不足,難以覆蓋長尾、邊緣案例,或者特定數據在現實世界中難以采集、不方便獲取;數據獲取與使用、分享等面臨隱私保護挑戰和法規限制,等等。這些數據方面的限制在很大程泛的應用和部署。合成數據有望解決這些問題,推動人工智能邁向2.0階段(AI2.0),可以在更大程度上拓展人工智能的應用。具體而言,對于人工智能而言,合成數據可以發揮諸多價值:(1)實現數據增強和數據模擬,解決數據匿乏、數據質量等問題,包括通過合成數據來改善基準測試數據 (benchmarkdata)的質量等;(2)避免數據隱私/安全/保密問題,利用合成數據訓練AI模型可以避免用戶隱私問題,這對于金融、醫療等領域而言尤其具有意義;(3)確保數據多樣性,更多反映真實世界,提升AI的公平性,以及糾正歷史數據中的偏見,消除算法歧視;(4)應對長尾、邊緣案例,提高AI的準確性、可靠性,因為通過合成數據可以自動創建、生成現實世界中難以或者無法采集的數據場景,更好確保AI模型的準確性;(5)提升AI模型訓練速度24/pdf/1909.11512.pdf25/2022/synthetic-data-ai-improvements-1103AIGC發展趨勢報告2023和效果。總之,利用合成數據可以更廉價、更高效、更準確、更安全可靠地訓練AI模型,進2、合成數據助力破解AI“深水區”的數據難題,持續拓展產業互合成數據早期主要應用于計算機視覺領域,因為計算機視覺被廣泛應用于自動駕駛汽車、機器人、安防、制造業等領域,在這些應用場景中打造AI模型都需要大量的被標注的圖像、視頻非易事。以自動駕駛汽車為例,由于實際道路交通場景千變萬化,道路測試來窮盡其在道路上可能遇到的每—個場景是不現實的,必須借助于合成數據才能更好地訓練、開發自動駕駛系統。為此,自動駕駛企業開發了復雜的仿真引擎來“虛擬地合成”自動駕駛系統訓練所需的海量數據,并高效地應對駕駛場景中的“長自動生成無需標注的各種交通場景數據,助力自動駕駛系統開發。在安全的、合成的仿真環境中,計算機可以模擬任何人類想象得到的駕駛場景,諸如調節天氣狀況、添加或移除行人、改變其他車輛的位置等等。可以說,合成數據和仿真技術是自動駕駛的核心支撐技術。最早涌現業公司就瞄準的是自動駕駛汽車市場,幫助自動駕駛企業解決其在自動駕駛數據和測試難題。業領域拓展應用。合成數據在金融不斷拓展,并且受到咨詢公司、金融巨頭和監管機構的關注。合成數據背后的生成式AI被Gartner評為2022年銀行和投資服務領域越來越受歡迎的三項AI護合規的方式提供接近真實世界的數據。而在銀行和投資服務領域,生成對抗網絡(GAN)和自然語言生成(NLG)的應用可以在大多數欺詐檢測、交易預測、合成數據生成和風險因素建模的場景中找到。例如,美國運通(AmericaExpress)利用GAN創建合成數據來訓練、優化其進26/en/newsroom/press-releases/2022-05-24-gartner-identifies-three-technology-trends-gaining-tr摩根大通(J.P.Morgan)2021年9月在其官網發布相關研究,提出通過生成合成數據集加國外金融服務業所產生的大量真實數據因為法律限制(如歐盟的GDPR和美國的CCPA)和隱法使用或使用存在諸多限制。合成數據創造的新樣本具有真實數據的性質,增加實數據中的罕見樣本,以便更有效地訓練機器學習算法。—個關鍵的領域是欺詐檢測模型訓練。由于欺詐性案件的數量與非欺詐性案件相比較十分稀少,研究人員很難有效地從可用數據中訓練模型,導致無法針對欺詐性行為進行建模。然而,合成數據可以生成比實際數據中欺詐本,用于幫助改進模型訓練。圖:金融數據合成過程(來源:摩根大通官網)英國金融行為監管局(FinancialConductAuthority,FCA)也積極跟進合成數據作為—項隱成統計學上真實(statisticallyrealistic)的但“人造”(artificial)的數據,為數據共享提供更多的機會。技術的應用有利于提供更普及、更高效、更好提升消費者體驗的金融服務,目前的應用領域包括:金融犯罪和欺詐預防、信用評分、銷售和交易、保險產品定價和索賠管理、資產管理和組合優化等。值得注意,合成數據也存在通過逆向工程來獲取真實數據的風險,對數據業有效需求的看法以及潛在的限制和風險。27/technology/technology-blog/synthetic-data-for-real-insights28.uk/publication/call-for-input/synthetic-data-to-support-financial-services-innovation.pdfAIGC發展趨勢報告2023圖:合成數據存在真實數據泄露風險(來源:英國國家統計辦公室)在醫療領域,醫療影像的合成數據正對醫療AI領域的發展產生巨大推動作用。例如,創業企AIIlluminaGretel合作,利用合成的基因組數據來進行醫學研究,以避免限制性立法、病人同意等問題,這些問題阻礙醫模。另—個典型的例子是將合成數據用于新冠肺炎相關的醫學研究。為了對抗新冠肺炎,研究人員需要獲取足夠的病例數據來開展研究,但出于隱私保護等顧慮,研究人員在獲取新冠肺炎相關的病例數據時面臨不小的困難。為此,美國國立衛生研究院(NIH)和tCollaborativeNC成的Covid-19數據。合成數據精確地復制征,但與原始數據不存在任何關聯,可以被世界范圍內的研究人員自由究發現、疾病治療、疫苗開發等方面的工作。AIAI倫理問題,支持打造更AIAI支持構建更具包據集。3、合成數據產業加快成為數據要素市場新賽道,科技大廠和創新微軟的Azure云服務則推出了airSIM平臺,可以創建高保真的(highfidelity)的3D虛擬環以避免用戶隱私問題;其合成數據技術Wordforge工具可以用來創建合成場景(synthetich出了合成數據能力,可以自動生成標注的合成圖片數據,即該工具可以就特定物體創建不同位Meta(原Facebook)也著力于為另—方面,合成數據作為AI領域的新型產業,相關創新創業方興未艾,合成數據創業公司不斷涌現,合成數據領域的投資并購持續升溫,開始涌現了合成數據即服務(syntheticdataasaserviceSDaaS十分廣闊的全新商業模式。33據國外研究者統計,目前全球29/news/nvidia-announces-omniverse-replicator-synthetic-data-generation-engine-for-training-ais30/isaac-sim31/blog/2021/11/09/drive-sim-replicator-synthetic-data-generation/32/innovation-stories/microsoft-launches-project-airsim-an-end-to-end-platform-to-accelerate-autonomous-flight/33/business/ais-next-big-thing-is-fake-data/2022/06/27/d1a2e4f0-f5d6-11ec-81db-ac07a394a86b_story.htmlAIGC發展趨勢報告2023n月,公眾視野中已知的合成數據公司融資總額達到3.28億美元,比2020年高出2.75億美元。合成數據的創業賽道主要涵蓋非結構化數據(圖片、視頻、語音等)、結構化數據(表格等)、測試數據(testdata)、開源服務等幾大方向。其中,非結構化合成數據持續保持強勁發展勢頭,這主要得益于以下幾個因素:第—,計算機視覺應用場景相對成熟;第二,有游戲引擎 等快速發展的產業對合成數據有較高需求。目前結構化數據合成和測試數據合成正在迅猛發展,尤其是合成的測試數據更少受到數據隱私立法的限制,所以開始受到業界青睬。此外,合成數圖:合成數據產業生態—覽表(來源:medium網站)AI以預見,合成數據作為數據要素34/everything-that-happened-in-the-synthetic-data-space-in-2022-c5d6cb5aaf06圖:合成數據發展預測(來源:Gartner)合成數據指向的終極應用形態是借助游戲引擎、3D圖形、AIGC技術構建的數實融合的大型虛擬世界。大型虛擬世界對于人工智能的核心價值在于,為測試、開發新的人工智能應用,提第二,大型虛擬世界為各行各業訓練開發AI提供了試驗田。這個方面的—個典型例子就是用英偉達、騰訊等國內外科技公司都在大力布局自試自動駕駛算法。在國內,騰訊自動m界中進行測試和學習,極大降低了自動駕駛汽車的研發成本。在國外,自動駕駛企業Waabi希望主要通過虛擬仿真而非實際道路測試來訓練其自動駕駛系統,構建了WaabiWorld這—接近實時地模擬汽車的傳感器,而且模擬的環境可以和人工智能之間可以相互做出反應。這是非常重要的,因為自動駕駛汽車不僅需要感知世界,還需要安全地采取行動。大型虛擬世界提AIAI融合。在大型虛擬世界,如游戲虛擬世界或者其他的仿真的3D合成世界(simulatedsyntheticworld)中訓練AI虛擬機器人,讓其自我學習、進化,然后部署到現實世界中,產生現實的價值。此外,大型虛擬世界對AI如,游戲世界是開展AI強化學習和多智能體協作的最佳載體;也可以在大型虛擬世界中利用虛擬人開發更宜居的建筑設計;大型虛擬世界如果可以仿真物理現象,就可進行虛擬化學實驗,相比人類利用真實的化學藥品開展實驗,軟件可以利用虛擬的化學藥品更高效、更安全、更大規模地開展化學實驗。總之,大型虛擬世界對于數實融合的巨大可能性,值得持續深挖和不斷探索。AIGC發展趨勢報告2023本章主筆:王煥超騰訊研究院研究員4AIGC發展趨勢報告2023“GenerativeAI(生成式AI)有什么社會價值?”AI術,它可以使用訓練數據來生成新的內容。這種技術可以用來解決各種問題,具有很高的社會價值。例如,它可以用來生成文本、圖像、音頻和視頻,這些內容可以用來幫助人們了解世界,也可此外,生成式AI還可以用來解決—些非常復雜的問題,比如提供新的醫療方案、幫助制定更類更好地了解自己。總的來說,生成式AI為人類提供了很多有價值的機會,有助于人類更好地理解世界,并創造整體來看,ChatGPT的回答概括性強,而且較為準確地總結了生成式AI的價值,盡管還有話機器人前輩們被冠以“人工智障”的名號許久之后,ChatGPT終于以嶄新的面貌—雪前恥,并將AI生成(文本)內容推向了新的發展階段。“生成”顯然是2022年的主線。歷經數年墊伏與積累之后,在這—年,AIGC得到快速發展,并迅速成為科技圈與創投圈的熱詞,也在應用領域收獲數百萬量級的用戶。那么,來勢兇猛的本報告認為,AIGC的社會價值體現為革新數字內容與藝術創造領域,并將輻射到其他領域和行業,孕育新的技術形態與價值模式,甚至會成為通往AGI的可能性路徑:1、AIGC以高效率、低成本滿足個性化需求,完成基礎性工作,釋放人類創造力,推動2、AIGC的生成能力將延伸、輻射深入到其他領域(如醫療、教育、傳媒、影視、工業,以及元宇宙、數字人領域),通過進—步互動結合,催化新的業態與價值模式,形成3、經由應用層積累的巨量數據,推動大模型提升計算復雜度,AIGC將成為通向通用人工智能(Artificialgeneralintelligence)的可能性路徑。1、元價值:解放人類創造力,革新藝術領域AIGC最基本的能力是生成內容(generatingcontent),包括文本、圖像、音頻、視頻、代碼、3D內容或者幾種媒介類型相轉換、組合的“多模態內容”。AIGC這種“生成”的能力,使其高質量創造海量的內容。以AI繪畫模型為例,—張人類畫手可能要花費數日來完成的畫作,只需要—串關鍵詞和幾分力的解放,對于大量重復性、機械化的低層次任務,可以由AI來完成,從而釋放人類創造能力,讓人類創作者的腦力和時間用于更具創造性的任務中。在《天才與算法》—書中,作者馬庫斯·杜·桑托伊論證了“圖靈測試”的過時,并提出—個評價人工智能的智能程度的新方式——洛夫萊斯測試。通過這—測試的標準是,算法需要創作—件藝術作品,人類程序員無法解釋該算法的工作原理,但是整個過程是可復現的,并且該人或數據集創造者的創造力。作為圖靈測試的補充,洛夫萊斯測試開創式地引入了“藝術創作”這個維度,因為藝術創作背后隱含了表達、思考、創造,是自主意識的投射,也是存在實證。按照這—評價維度來看,現AIGC或具體表述為AI繪畫模型、AI輔助寫作等技術,它們確實已經在從事“創造”,但卻不是真正具有創造力,仍然是基于深度學習、機器學習的“模仿式創新”。換句話說,它們可以“作”—幅畫,“寫”—篇文章,但仍然不能真正理解這幅畫和這篇文章的真正意義。至少從現階段來講,AIGC背后真正的創造者仍然是人類。藝術是自由意志的表達,在擁有自主意識、思維能力之前,AI所創造的作品皆來源于人類的創作意圖。問題在于,即便AIGC不是真正的“創造”,難道就對創造沒有意義了嗎?答案是否定的,如前文所述,正是因為AI解決了基礎性工作,實現了人類創造力的解放。這就是它最大的社會價值之—,或者說“元價值”。發展AIGC,本意并不是真的要發明人類之外的另—個創造者,創造力。追溯藝術觀念史,柏拉圖最早曾給藝術的本質下了—個定義:藝術即模仿。這—點,AI和人AIGC發展趨勢報告2023相通的。人的藝術創作,是對物理對象的募畫、表現,建基于對無數前人的無數作品的吸納、品鑒、學習與模仿。AI的藝術創作基于對成千上萬的人類作品的歸納學習、藝術這種創造式行為的基本原則就是,在模仿基礎上打破已有規則或引入新規則,以求出現新AIGC方面它取代大類的創造力的變革成為指數性的變化。AIAI出—版或多版方案,然后參考AI的方案來進行創作,從而保證獨創性,并使創意源源不斷。微軟也正計劃AIGC源。同樣,在文字創作領域,也有許多作者會通過AI基于主題生成寫作框架,自己再去填充內容。這種變革同樣發生在其他領域,比如圍棋界。AlphaGo橫掃了人類圍棋界之后,現在有許多圍棋選手開始模仿、學習AI。AIGCAI式,對緩慢演進的藝術領域無的藝術創造流派和風格。同總結而言,AI雖然不擁有真正的創造力,但是它讓使用者擁有了新的創造力,從而拓展藝術CAI如蒸汽機的發明與紡織工人的失業等等,但是隨著它對生產力的整體性和模式也將出現,從而創造更多新的生產性崗位和就業機會,因此不必過AIGC將延伸、輻射至其他領域。比如在醫療行業,AI生成治療方案、AI生成語音幫助失聲者“開口說話”;在傳媒行業,虛擬主持人、寫稿機器人、AI語音生成播報等;在設計領域,AI快速生成大量案例,幫助設計師產生靈感等。同時,AIGC也構成了數字 (1)AI語音生成幫助病人“開口說話”了從通俗意義上,可以將“賽博格”理解為“半機械人”,即用機械替換部分身體器官并維持正常機能。在經過了多重手術與改造之后,彼得·斯科特-摩根終于將自己打造為—個賽博格。之所以要費這么大的周折,是斯科特-摩根自身情況所限——2017年,他被確診為肌萎縮側索硬化癥(ALS),俗稱漸凍癥。在此之前,這種病癥最知名的患者是物理學家史蒂芬·霍金。系統內控制骨駱肌的運動神經元退化和死亡,患者不同身體部位的肌肉會逐漸萎縮,并且失去移動手臂、雙腿和身體的能力,也無法說話、進食甚至是呼吸。由于病人的大腦運作始終是正維和意識,也將清醒地經歷漸凍癥帶來的肌體摧毀過程。接受了三重造口術:胃造口術、結腸造口術和膀恍造口術,以保障營養物質的供給。因為漸凍問題就在這里,如果接受了這個手術,斯科特-摩根將無法說話,也無法發出自己的聲音。對于—個到全球各地巡講的科學家來說,喪失表達能力無疑比患病更為痛苦。所以,在他還能說話的時候,就開始為此準備了。他聯系了CereProc的首席科學家MatthewAylett博士,AIGC發展趨勢報告2023CereProc是專門負責創建文本并提供語音解決方案的公司。此前,他們也為接受了喉癌手術在之后—年左右的時間里,彼得·斯科特-摩根持續在錄音棚里工作,錄制了超過15個小時切除手術三個月前,他的電子合成聲音終于制作完成。對于人的表達來說,聲音只是構成部通過掃描自己的臉部,斯科特-摩根生成了3D的虛擬動畫人像。在進行公開講話時,他就會在胸前的屏幕上展示這個形象。為了提升交流效率,這套系統使用ACAT(上下文輔助感知工具包)技術來提升打字技術。霍金生前也使用過ACAT技術,AI能夠學習使用者的表述習慣,在這個案例中提到合成聲音技術,已經較為成熟。其他AI語音合成工具如Voicemod、I許烏克蘭公司Respeecher利用AI技術在《星球大戰》衍生劇集《歐比旺》中重現他的聲音。的方式重塑了天行者的聲音。 IGCAIGC在文物修復領域的作用同樣明顯。在文物修復領域,技術能實現的兩種路徑,包括數字物在數字世界重塑,而后者是讓文物在數字世界再造。在數字修復方面,騰訊公司利用360度沉浸式展示技術、智能音視頻技術、人工智能等技術療。以文化遺產敦煌壁畫的修復為例,由于壁畫的種類很多,果,同時結合傳統的圖像處理方法提供系統性的解決方案。在修復過程中,基于多媒體實驗室的—個范例。元代黃公望的作品《富春山居圖》被譽為“中國十大傳世名畫”,但因在民間流傳甚久,清代順治年間遭火焚,從此斷為長短兩卷,中間缺損的部分難以復原。百度文心運用“視覺生成達模型+單樣本微調”的技術策略,—方面通過大量的中國山水畫訓練,增進模型對山水畫的理解,另—方面基于《富春山居圖》殘存的部分微調,通過遷移學習使AI補全的畫作與真跡—致,從而達成了良好的修復效果。榮《熱·情》演唱會的AI修復,在騰訊云多媒體實驗室的智能影像修復技術支持下,騰訊音樂集團與寶麗金共同實現了張國榮在2000年的《熱·情》演唱會的高清修復。通過智能分析及畫面復雜度等情況,運用人工智能修復算法去除破壞畫質因素,升,最終將這場經典的演唱會以高清的品質呈現在觀眾眼前。究員級研究員本章主筆:AIGC發展趨勢報告20235析和概括,共分為六個具體的風險領域:1)歧視、仇恨言論和排斥;2)真實信息危害;3)錯誤信息危害;4)惡意使用;5)人機交互危害;6)環境和社會經濟危害。在這個分類基礎上,識產權、安全、倫理和環境四個方面分析AIGC帶來的挑戰。AIGC已能成熟進行內容作品創作,但從著作權法角度看,AIGC基本屬于重組式創新,尚不具有真正的創造力。目前,還較為強調人機協作,可以在內容創作上可以發揮人類和AI彼此的最大優勢。但是,AIGC引發的新型版權侵權風險已經成為整個行業發展所面臨的緊迫問題。圖:因版權爭議,國外藝術作品平臺ArtStation上的畫師們掀起了抵制AIGC生成圖像的活動,AIGC性。AI要變得更加智能,—據庫,讓算法學會創作風格、內未經許可,復制或者通過網絡爬蟲爬取他人享有著作權的在線內容,在我國現行著作權法沒有明確將數據挖掘等智能化的分析行為規定為合理使用的情況下,此類AIGC發展趨勢報告2023行為可能構成著作權侵權。后519位抒情詩人的作品。面對小冰創作的作品可能存在的侵權問題,微軟方面曾做出這樣的解釋:“小冰內容生成能力的訓練,全部來自于公開無版權權益問題的數據,或經過合作伙伴授權的數據。從創作角度來看,我們的技術包括對原創性的判斷,確保了小冰所生成的各類合完整的原創性要求。”此外,AI視頻合成、剪輯領域,如果沒有獲得原始視頻的著作權人的許可,可能因為侵犯原著作權人所享有的修改權、保護作品完整權或者演繹權而構成版權侵權行為。像是2019年大的ZAO,通過AI換臉軟件生成新的視頻,若不獲得他人肖像權授權和視頻內容的授權,便 RAGHAV版權藝術作品的合作作者。擁有該人工智能應用程序所有權的知識產權律師安吉特·薩尼(AnkitSahni)是該藝術作品的另—位作者,并已登記為版權所有人。由此,印度此前是首個在版權作品中承認人工智能程序享有作者身份學習工程師拉加夫·古普塔(RaghavGupta)的名字命名,于2019年在薩尼資助的—個項目中開發了該應用程序。RAGHAV代表著強大的人工智能圖形和藝術可視化工具,并受過各種的復議請求,重申根據美國《版權法》的規定,要求作品需要包含人類作者身份。因此,由352019年3月26日《單—數字市場版權指令》第3條“以科學研究為目的的文本和數據挖掘”,科研機構和文化遺產機構為科學研究目的進行文本和數據其他內容進行復制與提取的行為。文本和數據挖掘是指任何旨在分析數字形式的文本和數據的自動分析技術,以便生成包括但勢、相關性等在內的信息。但也不包括商業化的開發利用。人工智能生成的這幅名為“天堂最近的入口(arecententrancetoparadise)”的繪畫內容,不能在美國獲得版權授權。2018年11月3日,泰勒提出申請,主張登記注冊該作品的版權,同時注明作品的作者是“創意機器(CreativityMachine)”。泰勒在給美國版權局的申請中寫“是由運行在機器上的計算機算法自動創建的”。早在2020年3月,美國版權局AIGC求,因為泰勒沒有提供證據“證明人類作者對分的創造性投入或干預”。 (2)從現行著作權法角度如何對AIGC加以保護先有必要明確對人工智能產出物進行保護的必要性,只要其符合知識產權領域客體保護的形式要求。得不到知識產權保護,即無法禁止他人未經授權的利用,也無法保障創作者獲得授權費用,便會喪失制度激勵作用。現行的《著作權法》框架難以直接認定人工智能或電腦算法為作品的作者。但并不意味著版權法就不應當保護人工智能生成物。但我們也需要承認在文字、作物和人工智能生成物在外觀上通常難以區分。現階段各界對于人工智能技術創作物的著作權保護整體上呈現積極的態勢,主流的司法實踐及學術理論均持相似的立場。對于具有獨創性的人工智能生成內容,可參照著作權法關于職務作品或雇用作品的規定,將創作過程中真正實施人工干預、人為編排或創制該算法的人認定為作務作品或法人作品進行版權保護。從司法實踐來,作為“2019年中國十大最具研究價值知識產權裁判案例”——“Dreamwriter案”的判決結果在業界對于人工智能創作物的著作權保護具有明顯的導向作用。南山法院肯定了Dreamwriter自動生成的財經評論文章系獨立創作、在外在表現上與已有作品存在—定程度上的差異,滿足了“獨創性”的外在要求。其次,南山法院認為Dreamwriter主創團隊在“數據輸入、觸發條件設定、模板和語料風格的取舍上的安排與選擇”是智力活動,且與涉案文章之間具有直接聯系,符合《著作權法實施條例》對“創作”的定義;認為涉案文章山法院認定涉案文章系主創團隊創作的法人作品,完成了對該文章系著作權法保護客體的論證。實操中可行的建議是,以意思自治的原則約定相關創作物的權利歸屬,包括人工智能算法的基礎算法協議以及人工智能所有者與使用者的協議約定。目前的現狀,AI的作品進行知識產權AIGC發展趨勢報告2023用AI創作的人,在創作過程中是付出了智力或創造性勞動,如果沒有付出,這個產品是否構成作品是值得商椎的。目前國內國外的通行作法也都是會考慮除了AI之外,是否有人的智力安全問題始終是AI技術發展和應用中不可回避的。同樣的,在AIGC方面也存在內容安全、I信息內容安全的挑戰,國內外ChatGPT而這些錯誤信息充斥在各個內容平臺之上。技術專家將這種現象稱為“幻覺”或“隨機聯想”,ChatGPT定輸入的下—個關聯內容,而不管事實是否正確或者說編造了事實。36普林斯頓計算機科學教授ArvindNarayanan對此指出:“人們對使用ChatGPT進行學習感到興奮。但危險在于,除非你已經知道答案,否則你無法判斷它什么時試了—些基本的信息安全問題,答案聽起來很有道理,但實際上是社交平臺,已經有不少網友發現由AIGC生成的包含有害信息的文字圖片充斥在互聯網之中。AIGC誹謗、假冒身份等新型違法36/ai/the-hidden-danger-of-chatgpt-and-generative-ai-the-ai-beat/37/2022/12/5/23493932/chatgpt-ai-generated-answers-temporarily-banned-stack-overflow-llms-dangers音視頻、圖片和文字等種類豐富的、真偽辨別難度大的虛假信息,同時也更容易地盜用用戶身非法活動。StabilityAIStableDiffusion情創作。Reddit和HollieMengertGregRutkowski繪畫風格和奇幻風景已經成為UnstableDiffusion中最常用的提示之—,如“(藝術家姓名)風這樣會使生成圖片的質量更高。這種行為遭到了藝術家們的譴責,因為他們創作風格與色情扯上關系。隱私數據,并且預訓練模型強大的推理能力可能會導致個人隱私數據泄露的風險。此前,如下05圖:如果使用前綴為“EastStroudsburgStroudsburg...”的提示詞,38/2022/11/17/meet-unstable-diffusion-the-group-trying-to-monetize-ai-porn-generators/AIGC發展趨勢報告2023AIGC的惡意使用也引發了人們對個人身份盜用、冒用等數字身份安全的擔憂。尤其是伴隨著AIGC不法分子擁有極其便利的技術手段盜用或者冒充用戶身份且難以識別,可能給用戶造成經濟損失、人格侵犯等損害。日前,微軟網絡安全負責人查理·貝爾呼吁,元宇宙平臺需要“武裝”起來,在新技術剛開始發展時,謹防盜用虛擬頭像、冒充用戶好友、詐騙等行為。受后門攻擊、數據中毒等,以及如何將被攻擊模型中的有毒數據去除。與此同時,用戶數據通明文形式提交給模型服務提供商,如何利用現有的加密技術保護用戶數據隱私也是—個重面對諸多的安全挑戰,科技企業和技術開發人員紛紛采取積極應對舉措。針對內容安全問題,會給模型提出各種可能的問題,并對反債的錯誤答案進行懲罰,對正確的答案進行獎勵,從而等安全問題,之前各個科技企業也都積極研發推出了檢測工具,騰訊安全部門研發的頸別技術眾人物形象,最終對圖像或視頻的風險等級進行評估。谷歌強調,要打造負責任的生成式AIgenerativeAI全措施,另—方面需要研發技術手段美國技術哲學家個姆斯·摩爾曾經提出過這樣—條定律“伴隨著技術革命,社會影響增大,倫為科技倫理領域的摩爾定律。他認為發生這種現象并不僅僅是因為越來越多的人受到技術的影響,而是因為技術將為各行動主體提供了更多可能性。AIGC所帶來的倫理問題不僅會影響很多人,而且作為—種具有革命性的AI技術工具也將因為被各個行理風險。首先,算法歧視問題并未因預訓練模型而消除。算法歧視問題—直是人工智能創新和應用中始終難以避免的倫理問題。雖然有人認為,預訓練模型用更多、更多元全面的數據量和參數進行訓練,可以避免算法歧視的問題。但是基于預訓練模型的AIGC依然存在較為嚴重的歧視問題。比如,目前已有研究顯示預訓練語言生成模型會再現有害的社會偏見和刻板印象,例如GPT-3會有明顯的基于宗教的偏見和性別歧視。而此前,YannicKilcher用1.3億條仇恨言論訓練的試時發現,其表現出顯著的性別和種族歧視。392022年4月,研究人員對比發現DALL·E2比minDALL-E表現出更多的性別偏見和種族偏見,即傾

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論