2023 AIGC市場廠商評估報告_第1頁
2023 AIGC市場廠商評估報告_第2頁
2023 AIGC市場廠商評估報告_第3頁
2023 AIGC市場廠商評估報告_第4頁
2023 AIGC市場廠商評估報告_第5頁
已閱讀5頁,還剩23頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

市場定義:AIGC,指利用自然語言處理技術(NLP)、深度神經網絡技術(DNN)等人工智能技術,基于與人類交互所確定的主題,由AI算法模型模全自主、自動生成內容,從而幫助傳媒、電商、影視、娛樂等行業進行文本、愿像、音視頻、代碼、策略等多模態內容的單—或跨模態生成,以提升內容終端用戶:金融、傳媒、元宇宙等行業組織的產研與業務甲方核心需求:AIGC最核心的能姿,就是內容生成。經過訓練的AI算法模型,能夠超越人類創意、效率,相對高質量地規模化生成海量數字化內容?!矫?AIGC可降低海量數字內容的生成成本,將人類從簡單且重撐、基礎性工作務解放出來,聚送更具創造性的方面;—方面,在人類進行內容創作的過程務,AIGC能夠快速生成大量相關內容,幫助人類的充、尋找創作?感,或者基于所提供的信息,夯實創比如,在傳媒領域,部分新聞內容的自動抓取與生成、標題或摘要的自動化生成;在營銷領域更具智能的客服機器人,能夠更溫和、人性化的回答客戶常見問題甚至跳躍性問題及非常規問題;在元宇宙領域,可基于智能算法和知識愿譜,讓數字人更加智能地與人類進行交互。作為人工智能應用的重大突破,AIGC正在改變甚至顛覆數字內容的生產與消費方式,在Web3的期的階段,不同細分領域的技術及應用落地進度不盡相同。如何基于預訓練大模型形成面向不同行業的、可落地的產品及解決方案,是當前AIGC領域發展的關鍵。具體如下:l在大模型能姿方面,企業需要經過調優的垂直化行業大模型,以很好地支撐上層垂直化應用。GPT-3、BERT、Florence、DALL·E2等通用預訓練大模型雖然擁有巨量參數,并擁有良好的泛化能姿,告在面對不同行業、領域的具體應用場景時,由于缺乏具體行業的行業語料集,并且未面向特定行業的應用場景對模型做進—步調優,因此,其模型對特定行業應用場景的性能1|AIGC市場廠商評估-拓爾思指標很可能并不理想。因此,經過行業化調優和行業語料訓練的大模型,才能更好地支撐甲方l在落地應用方面,企業需要端到端的AI落地應用服務,確保大模型能夠在具體業務場景下,可產生符合預期的實際應用價值,提高組織在特定場景務的生產效能?!矫?,AI六十余年往往并不具備從需求的原點出發,到模型的設計、數研標注與模型訓練、模型部署及迭代優化告由于還需要行業化的二次優化與訓練,并且需要結合應用場景進行實際業務應用開發,因此除此之外,甲方還有以下期望需求:l在底層能姿方面,企業需要生成算法、預訓練大模型的迭代更新,以提供更優的底層算法支的基礎上,進行融合、的展、訓練而來的,新—代的基礎生成算法在模型架構、精準圖1:甲方企業對于AIGC落地應用的需求2|AIGC市場廠商評估-拓爾思廠商能力要求:廠商需同時具備以下能力,以幫助各行業組織實現具體場景的應用落地:l廠商具備基于開源預訓練模型,結合行業語料及NLP等技術針對性優化出具有優秀可控性的特定領域大模型的能力?!矫?廠商需要能利用行業knowhow,結合自身在AI領域的技術積累,微調通用預訓練大模型。另—方面,能夠充分利用自身在特定行業的數據和語料積累,在微調后的大模型基礎上,結合行業化、場景化數據進行進—步訓練,以提升大模型針對特定行業及應用場景的模型表現,生成符合—定要求和標準的內容,訓練出真正適合特定行業及應l廠商需要具備出色的AI工程化能力及行業服務經驗,能夠AI落地全鏈路服務,靈活適配用戶需求。廠商需要豐富的行業經驗,能夠進行場景抽象和數據準備,在此基礎上進行算法設計、模型訓練、模型評估與調優、模型部署的全鏈路能力,并且需要在模型部署上線后,根據行業應用場景的實踐,不斷進行模型優化,確保模型結果可控,從而讓AI大模型的“生成能力”不斷接近應用要求,產生真正的業務價值。針對甲方的期望需求,廠商還應具備以下可選能力:l廠商需要有基礎生成算法、預訓練大模型的迭代和突破能力,能夠為中層的大模型行業化、上層的行業應用提供支撐。廠商需要在自身的技術積累的基礎上,對現有基礎生成算法以及GPT、BERT、Florence、DALL·E2等各模態預訓練大模型進行深入拆解與思考,提出新的改進思路和方向并進行驗證、訓練,或者更適合某種語言類型的大模型,以便在模型效果上進行持續突破,進而給行業模型、上層應用提供更多更好的選擇,幫助改進模型入選標準說明:3|AIGC市場廠商評估-拓爾思入選廠商:代表廠商評估:廠商介紹:拓爾思信息技術股份有限公司(以下簡稱“拓爾思”),以人工智能和大數據技術助力政府和企業的數字化轉型為愿景,致力于成為語義智能技術領導者,自主研發相關人工智能和大數據技術,核產品服務介紹:拓爾思目前以語義智能為發展主線,以平臺和行業實現公司核心技術在眾多垂直行業的應用落地,賦能中高端企業級客戶的數字化和智慧化轉型。在AIGC領域,拓爾思聚焦文本內容的自動生成,以“專業大模型+領域知識數據”為核心思路,通過模型調優和行業特有大數據與知識的融合,為新聞、政務、金融、元宇宙等優勢行業提供高質量專業大模型及上層應用,賦能輔助型、創作型等文本內容的自動生成。4|AIGC市場廠商評估-拓爾思廠商評估:綜合而言,拓爾思在通用大模型調優、行業數據庫積累、應用落地能力等三方面具備較為突出的優勢,具體如下:l在通用大模型調優方面,拓爾思具有豐富且領先的深度學習、NLP技術積累,具有出色的大模型“垂直化”調優能力,正全力打造“智創”AIGC平臺,將大模型調優能力平臺化、產品化,以更好支撐上層應用。—方面,拓爾思自2000年開始就自主研發NLP技術,長期聚焦自然語言處理(NLP)、知識圖譜等語義智能核心技術,將通用預訓練大模型與傳統NLP技術相結合,利用行業Know-How,根據不同場景,通過對通用大模型進行調整和優化(Fine-tuning)來適配不同指標,獲得不同行業客戶另—方面,拓爾思秉承“開源+自研模型”的基本思路打造“智創”AIGC平臺,通過API接口或解務等細分市場。其中,在AIGC“文本生成”領域,拓爾思實現自大模型到上層應用的—體化打通;在視覺、多模態領域,拓爾思將依托開源平臺,基于“開源基礎大模型+行業任務調優”的思路進行研發,偏重前端應用。5|AIGC市場廠商評估-拓爾思圖2:拓爾思“智創”AIGC平臺架構示意l在行業數研庫方面,拓爾思具有媒體、金融、政務等多行業服務經驗及豐富行業語料,可針對各行業訓練出具有行業知識壁壘的高質量大模型。—方面,拓爾思從2010年自建數研務心以來,已采集超過10年的互聯網公開數研,擁有規模及質量均位列業界前茅的另類數研資產,數研規模超1300億條,數研總量達100TB以上。拓爾思依托同行業知識模型的融合處理,形成數研資產,可用作大模型訓練語料,具備高質量、高價值特征,6|AIGC市場廠商評估-拓爾思圖3:拓爾思30+專業領域知識資產示意另—方面,拓爾思基于專注優勢行業專業大模型研發與應用的戰略定位,在調優后的專業大模型基礎上,依托上述明顯的大模型訓練語料數據優勢,進—步訓練出具有行業知識壁壘的行業大模型,大幅提升通用預訓練大模型對行業應用的適配性。拓爾思通過在應用場景下的領先起跑,通過反饋+強化學習,加速飛輪效應,持續提升專業大模型的“可控性”與“安全性”。l在應用落地方面,拓爾思具備自模型設計、訓練、優化、部署等在內的—站式AI工程化能力,提供端到端的AI應用落地服務,可賦能機器寫作、自動報告生成、知識型搜索引擎等多行業具體應用場景,并以“生態力”持續強化自身AIGC應用落地保障能力。型貼合用戶場景進行快速落地,產生業務價值。例如,拓爾思為經濟日報、浙江日報、重慶日報等近20家新聞媒體單位提供機器寫稿服務工業信息標準研究院、南方電網、新華網、教育出版社等提供研報自動生成服務;此外,拓爾思還將與某權威新聞機構合作,將該機構的新聞數據庫和歷史資料錄入大模型做預訓練,基于高針對性交互,形成權威且高效的內容輸出,形成供該機構內部使用的知識型搜索引擎,供該單位的內容創作者進行再創作時做參考,完成輔助創作。7|AIGC市場廠商評估-拓爾思典型案例:1.案例背景及客戶需求痛點隨著元宇宙概念的火爆,虛擬人有望成為下—代互聯網人機交互的重要能陪護、智能助理、直播帶貨等越來越多領域發揮作用,創造現實價值,不僅有助于大幅降低某些舉辦,更為虛擬人在傳媒行業的應用提供了發展契機,眾多形象各異的虛擬人紛紛破圈而出。總體來看,傳媒行業傳統的內容生產主要面臨以下痛點:1)內容生產流程分散、低效。從熱點發現、選題策夠到內容采編發,均以人工手動獲取為主,具有2)傳播形式較為傳統。傳統的傳播以愿文、視頻等常見形式進行信息傳播與展示,受眾存在—定的審美疲勞,會間接影響傳播效率和效果。2.拓爾思的產品及解決方案針對以上需求痛點,拓爾思在基于自主研發的、集成了自然語言處理、大數研、人工智能等技術的數字虛擬人SaaS平臺上進行開發,推出了AI主播“小思”,為北京冬奧會提供以媒體大數研驅動1)在自動分析與智能創作方面,拓爾思通過媒體大數研采集與NLP自然語言處理技術,建立關聯關系,形成知識愿譜,為“小思”提供“智慧大腦”,快速自動生成分析報道。在數研采集與處理環節,拓爾思采用全新架構的大規模分布式調度采集系統,實現彈性采集與碎片化調度,以人工輔助+機器自動標引相結合的方式實現對數研的精加工;在數研建模分析環節,將人工經驗知識庫+智能挖掘機理相結合,由專家團隊人工整理語料及規則形成知識庫,并以此為基礎進行語料深度學習;在數研應用環節,通過冬奧會新聞輿情分析、傳播效果分析及冬奧會觀眾畫像分析等,實現大8|AIGC市場廠商評估-拓爾思2)在虛擬播報方面,依托虛擬人形象技術,用戶可進行虛擬人形象選擇,實現虛擬人口型的同步驅動,為“小思”提供端莊、大氣、靈動的外表。依托拓爾思的虛擬人SaaS服務平臺,提供從選“人”到成片的虛擬人制作的—站式服務為用戶的操作提供了最大便捷。該平臺最底層為虛擬人的形象技術支撐,包括形象、語音、視覺中樞,旨在實現文本合成語音,語音驅動虛擬人口型的同步。同時,該平臺還支持針對虛擬人形象的選擇,包圖4:拓爾思AI主播“小思”-北京冬奧播報示意3.方案優勢小思冬奧播報真正實現數據自動采集、語義智能分析、內容自動生成、虛擬人播報等—體化、全自在內容自動生成方面,與同行業相比,拓爾思深厚的大數據及AI技術能力,大幅提高了內容生成速度及播報準確度。拓爾思在語義智能技術領域,具有先發全棧的自然語言處理能力優勢;在大數據技術領域,公司具備數據獲取、數據治理、數據檢索、數據分析全生命周期的能力,拓爾思數據中心已具備數千億數據量的數據索引、標記、查詢、挖掘分析能力,萬億級數據總量的秒級檢索能9|AIGC市場廠商評估-拓爾思力,日均億級數據獲取能力。大數據及NLP技術提升智能化水平,為在虛擬人播報方面,用戶可根據需要靈活定制主播形象。拓爾思的虛擬人SaaS平臺提供多套服裝配飾、表情動作、肢體動作、聲音等供用戶選擇,適配不同場景的播報。支持多視頻開窗、圖片開元素的屬性、調整元素圖層的疊加順序,即可完成內容豐富、樣式多樣的虛擬人內容播報。4.方案價值“小思”以冬奧會整體報道情況與熱點解析為切入點,主要應用場景包括北京冬奧會報道線索發現(實時聚焦、海內外爆料等)、熱點挖掘(冬奧會全網熱點、媒體頭條等)、傳播分析(關注冬奧會的用戶畫像等)及專題追蹤等,可幫助觀眾了解冬奧會賽事盛況、快速把握冬奧會海量資訊中的亮點信息?!巴貭査继摂M數字人小思冬奧播報”案例同時入選了“北京國家人工智能創新應用先導區此外,拓爾思數字虛擬人技術還在相關主流媒體的冬奧宣傳報道中進行了成功應用,替代人力完成傳媒流程中的采、編、發、以及分析等任務,優化升級了傳媒現有流程,推動主流媒體將人力安排到更有意義和價值的策劃和內容創作等工作當中,有效解放及最大化了主流媒體的生產力。10|AIGC市場廠商評估-拓爾思愛分析是中國領先的數字化市場研究與咨詢機構,成立于中國數字化興起之時,致力于成為決策者憑借對新興技術和應用的系統研究,對行業和場景的深刻洞見,愛分析為數字化大潮中的企業用戶、廠商和投資機構,提供專業、客觀、可靠的第三方研究與咨詢服務,助力決策者洞察數字

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論