




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
I重要提示:本報告僅供內部研究使用,不做投資參考,未經允許,I雖然我們已經可以開始用ChatGPT進行聊天,寫出一些讓人想不到的東西。但如果想了解開源人工智能,想了解ChatGPT完整的內容時。我們還需要看各方面的報告,將信息進行拼圖。從這一角度看,人工智能要走的路還很多。我從各種渠道采集了各種的報告,希望能從一個較客觀我的角度來寫一份報告。讓系統了解這一技術進步,以及這處技術給技術發展、產品發展、人工智能的解決方案及各種應用場景帶來哪些好處。對于普通的公司與普通人有什么樣的影響呢?結合這些年的工作,以及從2020年開始展開的認知對抗的經歷,給大家盡可能呈現出一個客觀我的場景??陀^來講,ChatGPT這一次熱潮本身就是由AIGC技術本身操縱出來的。他在與大家聊天的同時,也在生成著大家關注的文章,帶著節奏。過去人工智能技術是由人幫人工智能技術去宣傳與推廣。而這一次是人工智能自己為自己炒作。當結合從去年底開始硅谷的裁員潮,可以看出傳統領先的企業已開始采用新技術為自己提升生產力。但這并沒有止步于高科技公司。帶來的影響將是社會級的變化。對于傳統的人類來講,是一次機會,同時也是一次挑戰。杜玉河龍抬頭I報告導讀ChatGPT是0penAl開發的智能聊天機器人程序。不僅能像人類一樣來聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。ChatGPT自發布以來爆火全球,月活破億用時僅2個多月,被稱為"史上用戶增長最快的消費者應用"。憑借其功能多樣,ChatGPT未來的市場規模想象空間巨大,不同領域和形式的商業化嘗試也在逐步推進中,但當下ChatGPT仍然只能起到輔助作用,技術之外的社會負面問題也值得我們關注。隨著各大巨頭的紛紛涌入,ChatGPT概念成為市場追逐的熱點,我們梳理出了部分包括百度、阿里等港股市場的關鍵公司。I一、前世今生1.1基本概念ChatGPT是美國人工智能研究實驗室OpenAI新推出的一種人工智能技術驅動的自然語言處理工具,使用了Transformer神經網絡架構,也是GPT-3.5架構。這是一種用于處理序列數據的模型,擁有語言理解和文本生成能力,尤其是它會通過連接大量的語料庫來訓練模型,這些語料庫包含了真實世界中的對話,使得ChatGPT具備上知天文下知地理,還能根據聊天的上下文進行互動的能力,做到與真正人類幾乎無異的聊天場景進行交流。ChatGPT不單是聊天機器人,還能進行撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。ChatGPT自2022年11月30日發布以來爆火全球,5天注冊用戶超100萬,月活破億用時僅2個多月,被稱為“史上用戶增長最快的消費者應用”。I1.2ChatGPT為何如此火爆?首先,最本質的出圈原因就是大家對于其功能之強大和應用范圍之廣泛的驚嘆,小到簡單的文字對話交流,大到小說文案論文寫作都不在話下,甚至可以實現代碼編寫。并且ChatGPT在經過了大量數據訓練之后,可以生成更自然、更多樣化的響應,讓人難以辨別其內容是Al生成還是真人撰寫。強大的功能使其在學生之間快速傳播,甚至導致其在教育領域遭到“封殺”。據海外媒體報道,美國某大學教授為學生作業評分時,讀到了一篇沒有錯別字和語法錯誤的“最佳論文",最后發現是學生用ChatGPT完成的。據調查顯示,美國89%的大學生在用ChatGPT做作業,因此為了避免其危害,教育部開始限制學生對于ChatGPT的使用。這也側面反應了ChatGPT的強大功能和火爆程度。過去Al技術已有諸多成功的商業化應用,例如基于人工智能算法的個性化推薦,但人們的感知并不強烈;而過去面向C端的產品,體驗并不完善,并未在社會面引起巨大反響并傳播開來。因此ChatGPT的面世與出圈,堪稱是迄今為止最成功的的C端人工智能應用,意味著Al技術對于普羅大眾正式從幕后走向臺前,這對于Al技術未來的發展和商業化運用都有著里程碑式的意義。目前,ChatGPT已經在美國通過了律師從業資格證,并且打贏了很多起法律訴訟案件!美國普林斯頓大學,還用ChatGPT拿來做醫療診斷,目前的準確率、可靠性已經遠遠超過資深的醫生!ChatGPT還通過了谷歌程序員考核,可以拿到18萬元的年薪!Ch來來來atGPT還可以幫高校畢業生書寫論文,而且不重復,并高分通過審核!ChatGPT畫出來的畫的質量也已經超過頂級畫家的水準!上面僅僅是舉幾個例子??梢哉f,ChatGPT目前顛覆了太多行業,現在各行各業的從業者也是十分的焦慮。例如,ChatGPT怎樣顛覆房地產行業?以前開發商拿地是盲目的預估,ChatGPT將會給開發商更加合理的拿地價格。拿地后怎么開發,開發什么戶型,怎么進行營銷,ChatGPT都會給出更加合理的方案。就是說,人工智能能夠通過大數據整合、信息整合并通過合理的計算方式,自行學習后給出合理的方案。業界有以下看法:也許,這是一個可以控制整個元宇宙的技術實現平臺;一場意識形態的核戰爭就要來了;比經濟危機更嚴重的危機來了。I1.3OpenAI公司深度分析1OpenAI(開放人工智能[4])是美國一個人工智能研究實驗室,由營利組織OpenAILP與母公司非營利組織OpenAIInc所組成,目的是促進和發展友好的人工智能,使人類整體受益。OpenAI成立于2015年底,總部位于加利福尼亞州舊金山,組織目標是通過與其他機構和研究者的“自由合作”,向公眾開放專利和研究成果。創始人山姆·柯曼以及伊隆·馬斯克的動機是出于對強人工智慧潛在風險的擔憂。至2018年,OpenAI的總部坐落于舊金山的米慎區,與伊隆·馬斯克的另一座公司Neuralink在同一辦公室大樓。1.3.1組織架構OpenAI于2019年轉型為營利性人工智能研究實驗室組織。公司由兩個實體組織組成:OpenAI,Inc.,由非營利組織OpenAI和營利性組織OpenAILP控制。OpenAILP由OpenAI,Inc(基金會)的董事會管理,作為普通合伙人。同時,有限合伙人包括LP的員工、部分董事會成員以及ReidHoffman的慈善基金會、KhoslaVentures和微軟,LP的主要投資者。I1.3.2創始團隊山姆·柯曼、伊爾亞·蘇茨克維、格雷格·布洛克曼、沃伊切赫·扎倫巴、伊隆·馬斯克、約翰·舒曼、安德烈·卡帕西。I1.3.3運作結構OpenAI細分為:OpenAIInc.,這是一家單一成員特拉華州有限責任公司,OpenAI和OpenAILP控制。微軟是有限合伙人,它還有一項商業協議作為2019年投資的10億美元的一部分,內容包含Microsoft/OpenAIAzureAI超級計算技術。OpenAI產品通過在微軟Azure上進行訓練,而微軟將是OpenAI人工智能新技術商業化的首選合作伙伴。IFRS(英語:IlyaSutskever,1985/1986年是一名加拿大計算機科學家,從事機器學習的研究。他是OpenAI的聯合創始人及首席科學家。蘇茨克維對深度學習領域做出多項重大貢獻。他與亞歷克斯·克里澤夫斯基和杰弗里·辛頓是卷積神經網絡AlexNet的共同發明人。他也是AlphaGo論文的眾多作者之一。21985年出生,出生地是俄羅斯諾夫哥羅德,這座城市位于俄羅斯西北部。3雖然是俄羅斯出生,但伊爾亞主要是在以色列長大,像很多計算機達人一樣,他從小就展現出對計算機的濃厚興趣,并且學習優異,甚至在大學期間,也曾連跳兩級。借由人類大腦神經元的啟發,上個世紀80年代,杰弗里·辛頓將反向傳播算法應用到了計算機深度學習,將聯結主義人工智能帶到了新的高度。2015年,OpenAI成立,伊爾亞成為這家公司的首席科學家,年薪190萬,而后續chatGPT的理論概念,誕生于伊爾亞與其他學者共同在2017年發布的一篇論文,次年,OpenAI推出了GPT的第一個版本,如今,GPT迭代到了GPT-3,參數量達到了1750億,而最近爆火的chatGPT正是基于GPT-3.5開發,上線僅僅五天,就有了100萬用戶,就在前不久,ChatGPT實現了月活破億。2012年,由于辛頓的AlexNet神經網絡大獲成功,因其徹底打開全球深度學習的熱潮,AlexNet又被看作是AI深度學習革命的開始。2002年,伊爾亞全家移民至加拿大多倫多,正是在此期間,伊爾亞遇到了世界AI領域的頂級大神、多倫多大學教授杰弗里·辛頓(GeoffreyHinton他是美國計算機協會認可的“深度學習三巨頭”之一,被業界稱為深度學習教父!2000年至2002年期間,蘇茨克維在就讀于以色列開放大學[6]。2002年,他與家人移居加拿大,并轉入多倫多大學,隨后在杰弗里·辛頓的指導下獲得數學學士學位(2005年)[6][7][3][8]、計算機科學碩士學位(2007年)[7][9]和博士學位(2012年)[8][10]。2012年畢業后,蘇茨克維在史丹佛大學的吳恩達那里做了兩個月的博士后。之后他回到多倫多大學,加入辛頓的新研究公司DNNResearch,這是辛頓研究小組的一個衍生產品。四個月后,在2013年3月,Google收購了DNNResearch,并聘請蘇茨克維為Google大腦的研究科學家。在Google大腦,蘇茨克維與奧里奧爾·維尼亞爾斯和QuocVietLe合作創建了Seq2Seq學習算法。2015年,蘇茨克維被評為《麻省理工科技評論》35位35歲以下的創新者[12]。2/zh-hans/%E4%BC%8A%E7%88%BE%E4%BA%9E%C2%B7%E8%98%87%E8%8C%A8%E5%85%8B%E7%B6%ADI2015年底,他離開Google,成為新成立的OpenAI的主管[13]。2018年,蘇茨克維是NVIDIANTECH和人工智慧前沿會議的主旨發言人。他于2022年當選為英國皇家學會院士[14]。2015年底,OpenAI成立,總部位于加利福尼亞州舊金山,組織目標是通過與其他機構和研究者的“自由合作”,向公眾開放專利和研究成果。2016年,OpenAI宣稱將制造“通用”機器人,希望能夠預防人工智能的災難性影響,推動人工智能發揮積極作用。2019年3月1日成立OpenAILP子公司,目的為營利所用。2019年7月22日微軟投資OpenAI10億美元,雙方將攜手合作替Azure云端平臺服務開發人工智慧技術。2020年6月11日宣布了GPT-3語言模型,微軟于2020年9月22日取得獨家授權。2022年11月30日,OpenAI發布了一個名為ChatGPT的自然語言生成式模型,它以對話方式進行交互。在研究預覽期間,用戶注冊并登陸后可免費使用ChatGPT。但是該項目對一些包括中國大陸、香港在內的地區暫不可用。2015年,馬斯克和OpenAI現任CEOSamAltman等人共同創辦了非營利組織OpenAI,對外宣稱要避免人工智能滅世。2018年,OpenAI突然把馬斯克踢出了董事會,據媒體稱是因為特斯拉深入研究自動駕駛的AI技術,與OpenAI出現了利益沖突。除此以外,馬斯克對于OpenAI的不滿在一定程度上還要歸咎于ChatGPT近期種種表現確實讓人大跌眼鏡,比如ChatGPT版必應搜索引擎對用戶胡說八道,向用戶示愛,突然發脾氣,遭到質疑時還會PUA用戶。結合親自試用的經驗,馬斯卡在推特上對ChatGPT開啟了冷嘲熱諷模式:I此外,對于ChatGPT把馬斯克列入具有爭議性且應該得到“特殊對待”的名單,馬斯克在一篇相關推文下面回了兩個略顯無奈的感嘆號。I1.3.4商業模式OpenAI的商業模式即API接口收費:客戶可以通過OpenAI的強大AI模型構建應用程序,例如訪問執行各種自然語言任務的GPT-3、將自然語言翻譯成代碼的Codex以及創建和編輯原始圖像的DALL·E。公司按照不同項目的AI模式和不同需求進行收費,對于AI圖像系統I按不同的圖片分辨率定價;對于AI語言文字系統按字符單價收費,對于調整模型和嵌入模型按照文字單價收費,并根據不同的調用模型區別定價。目前DALL·E方面,已有超過300萬人在使用,每天生成超過400萬張圖像。其API具備快速、靈活、可拓展等性質。1.3.4產品矩陣OpenAI不僅僅是ChatGPT:OpenAI的業務不僅僅局限于ChatGPT領域,還包括Dall·E2、Whisper等項目。DALL·E2可根據自然語言的描述創作逼真的繪畫作品,Whisper是一種語言識別系統,其魯棒性和準確性極高,支持多種語言的轉錄并翻譯成英文。一個可以根據自然語言的描述創建逼真的圖像和藝術的人工智能系統。對現有圖像進行逼真的編輯。拍攝圖像并創建受原件啟發的不同變體。2021年1月,OpenAI推出DALL·E1,并于一年后推出最新系統DALL·E2,能夠生成更逼真、更準確的圖像,分辨率提高4倍。DALL·E2優于DALL·E1的標題匹配和照片級真實感,字幕匹配度優于一代71.7%,照片級寫實程度優于DALL·E1的88.8%。DALL-E2使用了一種改進的GLIDE模型,這種模型以兩種方式使用投影的CLIP文本嵌入,DALL-E2先驗子模型和圖像生成子模型都是基于擴散模型的,體現了其在深度學習中的能力。核心產品——Whisper,一個自動語音識別(ASR)系統,對從網絡收集的68萬小時的多語言和多任務監督數據進行訓練。使用這樣一個龐大而多樣的數據集可以提高對口音、背景噪聲和技術語言的魯棒性。支持多種語言的轉錄,以及將這些語言翻譯成英語。Whisper架構:是一種簡單的端到端方法,作為編碼器-解碼器Transformer實現。輸入音頻被分成30秒的塊,轉換為log-Mel頻譜圖,然后傳遞到編碼器中。訓練解碼器來預測相應的文本標題,并與指示單個模型執行語言識別、短語級時間戳、多語言語音聽錄和英語語音翻譯等任務的特殊標記混合在一起。2023年2月10日,OpenAI在美國推出了ChatGPTPlus訂閱服務,每月收費20美元,支持以下功能:高峰時段也能正常訪問ChatGPT、更快的響應時間、優先使用新功能和改進。根據路透社,OpenAI預計2023年收入2億美元,2024年收入10億美元。據華爾街日報,截至2023年1月,OpenAI正在就收購要約進行談判,這將使公司估值達到290億美元,是公司2021年市值的兩倍。2023年1月23日,微軟宣布了一項新的對OpenAI的多年期、數十億美元的投資計劃。紅杉資本預測:ChatGPT這類生成式AI工具,讓機器開始大規模涉足知識類和創造性工作,未來預計能夠產生數萬億美元的經濟價值。1.3.5技術路線ChatGPT是基于GPT-3.5的主力模型,ChatGPT在互聯網開源數據集上進行訓練,引入人HumanFeedback,RLHF)。因此,相比于之前的模型,ChatGPT可以用更接近人類思考的方式,根據上下文和情景,模擬人類的情緒和語氣回答用戶提出的問題。OpenAI首席執行官稱,GPT-4有望成為多模態的人工智能,根據openAI創始人Altman消息,GPT-4參數預計更大,計算模型優化有望實現更優化,且GPT-4將是純文本模型(不是多模態),我們認為GPT-4的推出潛在商業價值巨大,模型更具備“擬人化”的功能,文本生成和內容創作有望更加豐富,并有望進入文字工作的相關領域,例如新聞、金融等相關行業。NLP模型首選——Transformers。2017年由GoogleBrain團隊推出深度學習模型Transformer,采用自注意力機制,對輸入數據的每一部分的重要性進行差異加權,主要用于自然語言處理(NLP)和計算機視覺(CV)領域。IBERT(BidirectionalEncoderRepresentationsfromTransformers)為谷歌于2018年推出的一種基于神經網絡的NLP預訓練技術,BERT在情緒分析和回答問題等分類任務中表現良好,在命名實體識別和下一句預測方面也表現出色。ChatGPT同樣是根據語言/語料概率來自動生成回答的每一個字(詞語),即利用已經說過的語句作為輸入條件,預測下一個時刻語句出現的概率分布。IChatGPT是一個出色的NLP(Naturallanguageprocessing-自然語言識別)新模型。NLP隨算力增長突破:在過去的十年里,通過使用簡單的人工神經網絡計算,基于以GPU、TPU為代表的強大算力資源,并在巨量的數據上進行訓練,自然語言處理(NLP)取得了令世人矚目的成就和突破。側重文本分析能力:NLP技術是人工智能(AI)和機器學習(ML)的子集,專注于讓計算機處理和理解人類語言。雖然語音是語言處理的一部分,但自然語言處理最重要的進步在于它對書面文本的分析能力。NLP/NLU領域已知局限包括對重復文本、對高度專業的主題的誤解,以及對上下文短語的誤解。IlRLHF:InstructGPT/GPT3.5(ChatGPT的前身)與GPT-3的主要區別在于,新加入了被稱為RLHF(ReinforcementLearningfromHumanFeedback,人類反饋強化學習)。l循環:訓練范式增強了人類對模型輸出結果的調節,整個訓練過程是人類、代理對目標的理解和RL訓練之間的3步反饋循環。l在InstructGPT中,以下是“goodnessofsentences”的評價標準。真實性:是虛假信息還是誤導性信息?無害性:它是否對人或環境造成身體或精神上的傷害?有用性:它是否解決了用戶的任務?TAMER(TraininganAgentManuallyviaEvaluativeReinforcement,評估式強化人工訓練代理)框架將人類標記者引入到Agents的學習循環中,可以通過人類向Agents提供獎勵反饋(即指導Agents進行訓練),從而快速達到訓練任務目標。通過TAMER+RL(強化學習借助人類標記者的反饋,能夠增強從馬爾可夫決策過程(MDP)獎勵進行強化學習(RL)的過程I1.3.6產業價值Bing&Edge+AI:2023年2月8日,微軟公司發布了新版必應AI搜索引擎和Edge瀏覽器,采用了ChatGPT開發商OpenAI的最新技術AI模型GPT3.5的升級版,率先提供更具對話性的網絡搜索和創建內容的替代方式,集搜索、瀏覽、聊天于一體,帶來前所未有的全新體驗。微軟企業副總裁兼消費領域首席營銷官YusufMehdi公布的最新推文稱,在新版Bing上線48小時內,已經有超過100萬人申請加入。I即將賦能“千行百業”以ChatGPT為代表的的AIGC作為當前新型的內容生產方式,已經率先在傳媒、電商、影視、娛樂等數字化程度高、內容需求豐富的行業取得重大創新發展,市場潛力逐漸顯現。數字媒體公司BuzzFeed表示公司將使用OpenAI開放的應用編程接口(API),該公司將依靠ChatGPT的創建者OpenAI來加強部分內容創作,并為觀眾個性化一些內容,打算2023年讓人工智能在公司的編輯和業務運營中發揮更大的作用。未來,ChatGPT亦可應用在數字營銷的多個領域,譬如內容創建、個性化廣告文案、電子郵件營銷等等,助力增強行業的生產力。I1.4AIGC:Chat所應用的技術經歷了哪幾個階段?AIGC發展可分為三階段,早期萌芽階段(上世紀50年代至90年代中期),沉淀累積階段(上世紀90年代至本世紀10年代中期),快速發展階段(本世紀10年代中期至今)。1.4.1、早期萌芽階段(1950s--1990s)由于技術限制AIGC僅限于小范圍實驗與應用,1957年出現首支電腦創作的音樂作品,弦樂四重奏《依利亞克組曲(IlliacSuite)》,80年代末至90年代中由于高成本及難以商業化,因此資本投入有限導致AIGC無較多較大成績。1.4.2、沉淀累積階段(1990s--2010s)AIGC從實驗性轉向實用性,2006年深度學習算法取得進展,同時GPU,CPU等算力設備日益精進,互聯網快速發展,為各類人工智能算法提供海量數據進行訓練。2007年首部人工I智能裝置完成的小說《ITheRoad》(《在路上》)問世,2012年微軟展示全自動同聲傳譯系統,主要基于“深度神經網絡”(DeepNeuralNetwork,DNN)自動將英文講話內容通過語音識別等技術生成中文。1.4.3、快速發展階段(2010S至今)2014年深度學習算法“生成式對抗網絡”(GenerativeAdversarialNetwork,GAN)推出并迭代更新,助力AIGC新發展。2017年微軟人工智能少年“小冰”推出世界首部由人工智能寫作的詩集《陽光失了玻璃窗》,2018年NVIDIA(英偉達)發布StyleGAN模型可自動生成圖片,2019年DeepMind發布DVD-GAN模型可生成連續視頻。2021年OpenAI推出DALL-E并更新迭代版本DALL-E-2,主要用于文本、圖像的交互生成內容。我國AIGC市場在2022年底引起較大關注,2023年開年企業端躍躍欲試。雖然行業仍處于起步階段,距離大規模證明和體系化發展仍有距離,但從資本的加碼到應用場景的探索,距離的縫隙有望逐步填補,同時,“模塊分拆+個性化推薦”的“泛AIGC”形式有望持續發展。1.5ChartGPT的發展ChatGPT是由OpenAl團隊研發創造,OpenAl是由創業家埃隆-馬斯克、美國創業孵化器YCombinator總裁阿爾特曼、全球在線支付平臺PayPal聯合創始人彼得-蒂爾等人于2015年在舊金山創立的一家非盈利的AI研究公司,擁有多位硅谷重量級人物的資金支持,啟動資金高達10億美金;OpenAl的創立目標是與其它機構合作進行Al的相關研究,并開放研究成果以促進Al技術的發展。1.5.1OpenAl的ChatGPT是一種什么樣的技術?它是生成式人工智能技術(AIGC)浪潮的一部分。與其并齊的還有其他幾個技術。1.5.2ChatGPT技術演進經歷了哪幾個過程?ChatGPT是在GPT基礎上進一步開發的自然語言處理模型。GPT模型是一種自然語言處理(NLP)模型,使用多層變換器(Transformer)來預測下一個單詞的概率分布,通過訓練在大型文本語料庫上學習到的語言模式來生成自然語言文本。從GPT-1到GPT-3智能化程度不斷提升,ChatGPT的到來也是GPT-4正式推出之前的序章1.5.3ChatGPT發布后市場影響力如何?根據UBS發布的研究報告顯示,ChatGPT在1月份的月活躍用戶數已達1億,成為史上用戶數增長最快的消費者應用。相比之下,TikTok花了九個月的時間月活躍用戶數才破億,而Instagram則花費了兩年半的時間,同時,根據SimilarWeb的披露信息,Spotify在四年半后僅積累了1億月活躍用戶。根據SimilarWeb的數據,1月份平均每天有超過1300萬名獨立訪問者使用ChatGPT,是去年12月份的兩倍多。I1.5.4.ChatGPT都能做什么事情?由于ChatGPT包含了更多主題的數據,能夠處理更多小眾主題。ChatGPT能力范圍可以覆蓋回答問題、撰寫文章、文本摘要、語言翻譯和生成計算機代碼等任務。1.5.5.ChatGPT具備哪些先進性的特征?ChatGPT嵌入了人類反饋強化學習以及人工監督微調,因而具備了理解上下文、連貫性等諸多先進特征,解鎖了海量應用場景。當前,ChatGPT所利用的數據集只截止到2021年。在對話中,ChatGPT會主動記憶先前的對話內容信息(上下文理解),用來輔助假設性的問題的回復,因而ChatGPT也可實現連續對話,提升了交互模式下的用戶體驗。同時,ChatGPT也會屏蔽敏感信息,對于不能回答的內容也能給予相關建議。II二、市場現狀2022年9月的AI繪畫作品《太空歌劇院》獲得美國科羅拉多州博覽會的藝術比賽的第一名,當時有人預測若未來五年有10%-30%的圖片在AI的幫助下誕生,那么AI繪畫則將創造超過600億元的市場空間,若考慮到下一代互聯網對內容需求的迅速提升,則可能創造更大的市場規模。隨后OpenAI的ChatGPT一問世就多次刷新之前APP注冊用戶數量突破的紀錄,業內預測帶動的市場規模將破萬億。1.ChatGPT是否已觸發新一輪的AI發展浪潮?2023年初,微軟和谷歌均宣布裁員計劃,但都加大了在Al行業的投入。2、國內外主要有哪些玩家?國內外科技巨頭積極布局深成是AI,部分公司已有成型產品。I面對ChatGPT構成的威脅,注資3億美元投資競品Anthropic.OpenAI的最大投資方,開始利用ChatGPTj是局產品競爭力。I2.3亞馬遜ChatGPT受到重點關注,已廣泛運用在各種工作職能中。2.4Buzzfoed美國新媒體巨頭2.5StabilityAlStableDiffusion大熱,OpenAl在圖片生成Al大有可為。I2.6Jasper采用同類底層技術,進一步證明ChatGPT的巨大商業潛力。百度:1月10日,百度宣布將升級百度捜素的"生成式捜索"能力,智能解答用戶的捜素提問;2月7日,百度宣布將在3月份完成其ChatGPT產品的內測,面向公眾開放,該項目名字為文心一言(ERNIEBot),百度指出,生成式AI和搜索引擎是互補關系而不是替代;據路透社報道,百度計劃于3月將類似ChatGPT的AI對話服務作為獨立血用推岀,之后再逐步將其合并到捜索引擎中。I2.7騰訊2月3日,騰訊公布一項人機對話專利,能夠實現機器與用戶之間自然且順暢的溝通。專利摘要顯示,該方法包括:當人機對話被激活時,在預設文本庫中獲取用于進行人機對話的參考文本;根據所參考文本,確定出對話過程中用于生成應答信息的背景信息;接收人機對話的對話信息;根據對話信息和背景信息,確定出對應的應答信息。通過該申請,能夠實現機器與用戶之間自然且順暢的溝通,提高用戶的使用體驗度。4該項專利與這段時間爆火的人工智能聊天機器人ChatGPT的原理十分相似,ChatGPT是由初創公司OpenAI開發,并于2022年11月30日上線的對話式AI工智能生成式內容)的一種應用和產品,能實現撰寫代碼、回答問題、書寫論文、詩歌、劇本等指令。3、與ChatGPT相比還有哪些技術公司?AIGC創業公司大比拼,國外ChatGPT的優勢遙遙領先并有望延續。 I4、成功的關鍵要素■人工智能不僅需要巨大的投入,還需要龐大的用戶數據基礎,只有互聯網巨頭才有這個能力產出偉大的產品■國外是微軟、谷歌、亞馬遜,而國內則是百度、騰訊等互聯網巨頭最具潛力;相比國外巨頭,國內巨頭正投入大量資金和人力成本快速發展人工智能技術,在沒有硝煙的人工智能競賽中,中國企業也將異軍突起I三、產業地圖關于產業地圖可以分為不同的階段與層次。包括芯片層級如上圖所示,如果沒有包括芯片,則按下面的模式進行劃分。2.1、產業上游:數據服務不論AIGC產業如何發展,人工智能的分析、創作、決策能力都依賴海量數據。因此決定不同機器間能力差異的就是數據的數量與質量。I2.1.1、數據查詢與處理通常來說數據庫有兩種模型,一種像湖泊,匯聚來自各地的水源而不作區分;另一種像倉庫,分門別類的存儲數據。近幾年在科技的推動下,現代數據庫一般都是兩種模型的結合,兼具二者的易用性、規范性等特征,還為用戶帶來降本增效、省時省力等特點。根據對其中數據的查詢與處理等時效性,涉及其中業務的公司可分為異步處理型公司和實時處理型公司。2.1.2、數據轉換與編排數據的處理主要涉及提取,加載和轉換。根據海外市場研究企業GrandViewResearch的數據,2021年全球數據集成工具市場的規模約105億美元,在未來十年將以年復合增長率約12%的速度增長。根據處理方式的區別,這種公司可以分為本地部署型公司和云端原生型公司。2.1.3、數據標注與管理不論哪種機器學習模型,都可以簡化為“老師教學生知識”,其中對知識點等數據就需要標注與管理,從而進行監督,最終形成各種不同的算法模型。根據GrandViewResearch的數據,2021年全球數據標注市場規模約為16.7億美元,在未來十年將以年復合增長率約25%的速度增長。根據公司業務拓展程度的差異,這種公司可以分為基礎型公司和擴張型公司。2.1.4、數據治理與合規在數字經濟時代,數據是和土地、人力、資本一樣舉足輕重的生產資料。因此就需要保證數據資產在管理時預先設置質量規范,在后期的訪問和調取時也要做到合法合規,因此這項服務也就成為各大企業的必需品。根據海外市場研究企業ReporterLinker的數據,全球數據治理市場規模約18億美元,預計未來幾年將以年復合增長率約22%的速度增長.根據服務交付模式,這種公司可以分為工具型公司和定制型公司。2.2、產業中游:算法模型算法模型是AIGC最核心的環節,是機器學習的關鍵所在。它包含三類參與者:專門實驗室、企業研究院、開源社區。I算法模型在AI系統中起決策作用,是它完成各種任務的基礎,可以視為AI系統的靈魂所在。很多企業為了更好地研究算法并推動商業化落地,在內部都設立專門的實驗室,因此這種實驗室可以分為獨立型實驗室和附屬型實驗室。2.2.2、企業研究院一些集團型公司或企業往往會設立專注于前沿科技領域的大型研究院,下設不同領域的細分實驗室,通過學術氛圍更濃厚的管理方式為公司的科研發展添磚加瓦。2.2.3、開源社區開源社區對AIGC非常重要,它提供了一個共享成果、代碼的平臺,還可以與其他人相互合作,共同推動AIGC相關技術的進步。根據覆蓋領域的寬度和深度,這種社區可以分為綜合型開源社區和垂直型開源社區。I2.3、產業下游:應用拓展任何優秀的科研成果都需要最終落地部署才能產生實際意義和價值,算法模型也不例外。在AIGC產業鏈的下游,可以將相關應用拓展到四個主要場景:文本處理、音頻處理、圖像處理、視頻處理。、文本處理目前,文本處理是AIGC相關技術距離普通消費者最近的場景,也是技術較為成熟的場景,許多應用公司都會從多個維度出發,輔助業務拓展與商業化過程中。一般說來文本處理可以細分為營銷型、銷售型、續寫型、知識型、通用型、輔助型、交互型、代碼型。I、音頻處理此處主要介紹由語音合成技術來生成的相關應用,與視頻相關的將放在視頻部分說明。目前的音頻處理主要分為三類:音樂型、講話型、定制型,很多公司都專注于此。AI的應用將優化供給效率,改善整體利潤水平。、圖片處理圖片的創作門檻比文字高,傳遞信息也更直觀,所以商業化的潛力自然也更高。隨著AIGC應用的日益廣泛,圖片處理也就從廣告、設計、編輯等角度帶來更大更多的機遇。圖片處理可細分為生成型、廣告型、設計型、編輯型。、視頻處理隨著時代的發展,人們在視頻上的投入逐漸超出了在圖片上的,視頻也日益成為新時代最主流的內容消費形態。因此將AIGC引入視頻將是全新的賽道,也是技術難度最大的領域。視頻處理可以細分為生成型、編輯型、定制型、數字虛擬人視頻。II五、技術架構體系I六、基本原理與技術的演進1950年,人工智能的先驅艾倫·圖靈發表了一篇劃時代的論文《計算機器與智能》,文中提出了著名的圖靈測試:“如果一臺機器能夠與人類展開對話(通過電信設備)而保證其機器身份不被識破,那么就可以認為這臺機器具有智能。”此外文章還預言了在未來可能創造出具有真正智能的機器。圖靈測試最初版本的示意圖雖然圖靈測試從理論上驗證了機器擁有智能的可能性,但AI正式發展成一門專業學科則是在1956年的達特茅斯會議,會議的組織者與參與者都是數一數二的科學家,包括約翰·麥卡錫,馬文·閔斯基,納撒尼爾·羅切斯特,克勞德·香農等。在這次會議上,“人工智能”的名稱與概念正式確立,因此這次會議也被視為AI產業的起點。1.2、人工智能發展的三種流派符號主義認為人類的一切活動(包括體力活動和智力活動)都是符合某種邏輯的,所有信息都可以用各種符號表示,人類的認知過程就可以視為基于邏輯規則的,操作這些符號的過程。根據這種理論,如果電腦能自動執行和人腦一樣的規則和過程,那么就可以視為實現了人工智能。I聯結主義與符號主義幾乎是同時提出的,人工智能的關鍵不在于讓電腦等機器實現智力活動,而應該模仿人腦的結構。這派觀點認為智能是人腦細胞與神經元彼此連接成網絡共同處理信息的結果,如果能在電腦中模擬這種結構再實現人工智能自然也更輕松。早在電腦發明前的40年代,就有持這種觀點的科學家進行了數學建模,奠定了后來人工神經網絡和專家系統的雛形。與前兩種流派不同的,行為主義于上世紀80年代提出,它倡導“感知+行動”。這種觀點源于“控制論”,強調模擬人在控制過程中的智能行為和動作。但是限于時代和科技發展,行為主義直到上世紀末,隨著智能控制與機器人逐漸興起才引起重視。截至目前的AI發展,幾乎都是三種流派的結合運用。專家系統結構示意圖2.1、機器學習的概念在1950年,圖靈的論文《計算機器與智能》中提出了“學習機器”的概念,現在已經發展成AI科學中的一個獨立分支。機器學習主要是設計和分析一些讓電腦可以“自動學習”的算法,是一類從數據中自動分析和獲得規律,并利用規律對未知數據進行預測的算法。從技術角度說,這一理論關注可以實現的,行之有效的學習算法(要防止錯誤累積)。I機器學習理論示意圖2.2、機器學習算法的分類機器學習中最容易理解與實現的是監督學習與無監督學習,前者就是感知器算法的典型案例之一,它也是人工神經網絡的基礎。簡要說來,監督學習是從給定的訓練數據集中學習出一個函數,再接收到新數據時就可以根據這個函數預測結果。監督學習的訓練集要求包括輸入和輸出,也可以說是特征和目標,訓練集中的各項目標都是人為標注的。與之原理類似的,無監督學習就是目標沒有人為標注,但還保有訓練集且同樣要求輸入和輸出。不同形態的機器學習對比這種算法可以視為多層感知器,除了輸入輸出層外,它還加入了若干隱藏層。隱藏層中的神經元節點可以與輸入輸出節點相連,每條鏈接上都有各自的權重系數,最終形成一個網絡結構。之所以要加入隱藏層,是因為現實中很多情況都不是簡單的二元對立,總有這樣那樣的變化需要考慮。I單層人工神經網絡示意圖與監督和無監督學習更重視學習數據不同,強化學習是在給定的數據環境下,讓機器學習如何通過選擇一系列行動來達成長期累計收益最大化的目標。從本質上說,這種算法學習的是一套決策系統而非數據,它在很多游戲中都有運用。著名的阿爾法狗(AlphaGo)就結合了強化學習與專家系統,能連續擊敗多位人類圍棋高手,名噪一時。強化學習構成元素及其關系通過前面的介紹可以發現,不論哪種機器學習算法,對特征的選取和處理在模型訓練中是很重要的,但在很多情況下要直接提取合適且有效的特征是很困難的,如提取海量圖片和句子的特征。此時的機器學習就不能只局限于圖片或句子的某一特征,而是它們背后隱含的復雜關系。因此需要結合深度模型進行自動計算,而模型主要是深度。神經網絡,這是一種更復雜的神經網絡。深度學習算法就是采用類似的深層次結構進行機器學習的算法,目前大火的ChatGPT就運用了這種算法。I不同形態的機器學習關系示意圖3、怎樣理解ChatGPT技術先進性?3.1ChatGPT的技術是怎樣進化來的?ChatGPT所能實現的人類意圖,來自于機器學習、神經網絡以及Transformer模型的多種技術模型積累。轉移學習(TransferLearning)使基礎模型成為可能。技術層面上,基礎模型通過轉移學習(TransferLearningThrun1998)和規模(scale)得以實現。轉移學習的思想是將從一項任務中學習到的“知識”(例如,圖像中的對象識別)應用于另一項任轉移學習(TransferLearning)使基礎模型成為可能。技術層面上,基礎模型通過轉移學習(TransferLearningThrun1998)和規模(scale)得以實現。轉移學習的思想是將從一項任務中學習到的“知識”(例如,圖像中的對象識別)應用于另一項任務(例如,視頻中的活動識別)。在深度學習中,預訓練又是轉移學習的主要方法在替代任務上訓練模型(通常只是達到目的的一種手段),然后通過微調來活應感興趣的下游任務。轉移學習(TransferLearning)使基礎模型成為可能。大規?;╯cale)使基礎模型更強大,因而GPT模型得以形成。大規模需要三個要素:I(i)計算機硬件的改進——例如,GPU吞吐量和內存在過去四年中增加了10倍ii)Transformer模型架構的開發(Vaswanietal.2017該架構利用硬件的并行性來訓練比以前更具表現力的模型;以及(iii)更多訓練數據的可用性。基于Transformer的序列建模方法現在應用于文本、圖像、語音、表格數據、蛋白質序列、有機分子和強化學習等,這些例子的逐步形成使得使用一套統一的工具來開發各種模態的基礎模型這種理念得以成熟。例如,GPT-3(Brownetal.2020)與GPT-2的15億參數相比,GPT-3具有1750億個參數,允許上下文學習,在上下文學習中,只需向下游任務提供提示(任務的自然語言描述),語言模型就可以適應下游任務,這是產生的一種新興屬性。3.3Transformer針對不同場景的技術原理有哪些?Transformer實現的不同技術場景對應的不同技術原理。Transformer架構可分為自回歸系列(例如GPT-3,偏好生成性任務)、雙向Transformer+Mask的自編碼系列(例如BERT偏好自然語言理解)、Encoder-decoder架構(例如T5,使用雙向/單向attention,偏好條件文本生成)3.4GPT-1能做什么?進行無監督訓練和有監督微調。借助預訓練,進行無監督訓練和有監督微調。GPT-1模型基于Transformer解除了順序關聯和依賴性的前提,采用生成式模型方式,重點考慮了從原始文本中有效學習的能力,這對于減輕自然語言處理(NLP)中對監督學習的依賴至關重要。GPT(GenerativePre-trainingTransformer)于2018年6月由OpenAl首次提出。GPT模型考慮到在自然語言理解中有大量不同的任務,盡管大量的未標記文本語料庫非常豐富,但用于學習這些特定任務的標記數據卻很少,這使得經過區分訓練的模型很難充分執行。同時,大多數深度學習方法需要大量手動標記的數據,這限制了它們在許多缺少注釋資源的領域的適用性;在考慮以上局限性的前提下,GPT論文中證明,通過對未標記文本的不同語料庫進行語言模型的生成性預訓練,然后對每個特定任務進行區分性微調,可以實現這些任務上的巨大收益。和之前方法不同,GPTIIIGPT-2仍未解決應用中的諸多瓶頸。GPT-2聚焦在無監督、zero-shot(零次學習)上,然而GPT-2訓練結果也有不達預期之處,所存在的問題也亟待優化。在GPT-2階段,盡管體系結構是任務無關的,但仍然需要任務特定的數據集和任務特定的微調;要在所需任務上實現強大的性能,通常需要對特定于該任務的數干到數十萬個示例的數據集進行微調。在微調期間使用任務感知輸入轉換,以實現有效的傳輸同時對模型架構的更改最小。模型更簡化、計算加速,更適合自然語言生成任務(NLG)。GPT相比于Transformer等模型進行了顯著簡化。相比于Transformer,GPT訓練了一個12層僅decoder的解碼器(原Transformer模型中包含Encoder和Decoder兩部分)。相比于Google的BERT(BidirectionalEncoderRepresentationsfromTransformers,雙向編碼生成TransformerGPT僅采用上文預測單詞(BERT采用了基于上下文雙向的預測手段)。GPT-2:采用多任務系統,基于GPT-1進行優化。GPT-2在GPT-1的基礎上進行諸多改進,實現執行任務多樣性,開始學習在不需要明確監督的情況下執行數量驚人的任務。在GPT-2階段,OpenAl去掉了GPT-1階段的有監督微調(fine-tuning成為無監督模型。大模型GPT-2是一個1.5B參數的Transformer,在其相關論文中它在8個測試語言建模數據集中的7個數據集上實現了當時最先進的結果。模型中,Transfomer堆疊至48層。GPT-2的數據集增加到8million的網頁、大小40GB的文本。I3.6GPT-3有了哪些突破?GPT-3取得突破性進展,任務結果難以與人類作品區分開來。GPT-3對GPT-2追求無監督與零次學習的特征進行了改進GPT-3利用了過濾前45TB的壓縮文本,在諸多NLP數據集中實現了強大性能。GPT-3是一個具有1750億個參數的自回歸語言模型,比之前的任何非稀疏語言模型多10倍。對于所有任務(在few-shot設置下測試其性能),GPT-3都是在沒有任何梯度更新或微調的情況下應用的,僅通過與模型的文本交互來指定任務和few-shot演示。GPT-3在許多NLP數據集上都有很強的性能(包括翻譯、問題解答和完形填空任務),以及一些需要動態推理或領域適應的任務(如解譯單詞、在句子中使用一個新單詞或執行三位數算術)。GPT-3可以生成新聞文章樣本(已很難將其與人類撰寫的文章區分開來)。InstructGPT又是什么?與GPT-3有什么區別?InstructGPT模型在GPT-3基礎上進一步強化。InstructGPT使用來自人類反饋的強化學習方案RLHF(reinforcementlearningfromhumanfeedback),通過對大語言模型進行微調,從而能夠在參數減少的情況下,實現優于GPT-3的功能InstructGPT提出的背景:使語言模型更大并不意味著它們能夠更好地遵循用戶的意圖,例如大型語言模型可以生成不真實、有毒或對用戶毫無幫助的輸出,即這些模型與其用戶不一致。另外,GPT-3雖然選擇了少樣本學習(few-shot)和繼續堅持了GPT-2的無監督學習,但基于few-shot的效果,其稍遜于監督微調(fine-tuning)的方式?;谝陨媳尘?,OpenAl在GPT-3基礎上根據人類反饋的強化學習方案RHLF,訓練出獎勵模型(rewardmodel)去訓練學習模型(即:用Al訓練Al的思路)。InstructGPT的訓練步驟為:對GPT-3監督微調——訓練獎勵模型(rewardmodel)——增強學習優化SFT(第二、第三步可以迭代循環多次)3.7ChatGPT核心優勢是什么?ChatGPT核心技術優勢是提升了理解人類思維的準確性。InstructGPT與ChatGPT屬于相同代際的模型,ChatGPT只是在InstructGPT的基礎上增加了Chat屬性,且開放了公眾測試ChatGPT提升了理解人類思維的準確性的原因在于利用了基于人類反饋數據的系統進行模型訓練3.8ChatGPT采用的什么樣的范式?ChatGPT得益于通用(基礎)模型所構建Al系統的新范式。基礎模型(FoundationModel)在廣泛的應用中整合構建機器學習系統的方法,它為許多任務提供了強大的杠桿作用;基礎模型是在深度神經網絡和自我監督學習的基礎上演化而來。基礎模型基于廣泛數據(通常使用大規模自我監督)訓練的任何模型,可以適應(例如微調)廣泛的下游任務,目前例子包括BERT(Devlinetal.)、GPT-3(Brownetal.2020)和CLIP(Radfordetal.2021);機器學習使學習算法同質化(例如,邏輯回歸),深度學習使模型架構同質化(如卷積神經網絡),而基礎模型使模型本身同質化(比如GPT-3)。3.9ChatGPT會在哪些領域中進行應用?ChatGPT以基礎模型為杠桿,可適用多類下游任務。ChatGPT采用了GPT3.5(InstructGPT)大規模預訓練模型,在自然語言理解和作品生成上取得極大性能提升。鑒于傳統NLP技術的局限問題,基于大語言模型(LLM)有助于充分利。用海量無標注I文本預訓練,從而文本大模型在較小的數據集和零數據集場景下可以有較好的理解和生成能力?;诖竽P偷臒o標準文本書收集,ChatGPT得以在情感分析、信息鉆取、理解閱讀等文本場景中優勢突出。隨著訓練模型數據量的增加,數據種類逐步豐富,模型規模以及參數量的增加,會進一步促進模型語義理解能力以及抽象學習能力的極大提升,實現ChatGPT的數據飛輪效應(用更多數據可以訓練出更好的模型,吸引更多用戶,從而產生更多用戶數據用于訓練,形成良性循環)。研究發現,每增加參數都帶來了文本合成和/或下游NLP任務的改進有證據表明,日志丟失與許多下游任務密切相關,隨著規模的增長,日志丟失呈現平穩的改善趨勢。3.10大模型架構產生的根本原因是什么?ChatGPT大模型架構也是ML發展到第三階段的必然產物。ML中的計算歷史分為三個時代:前深度學習時代、深度學習時代和大規模時代。在大規模時代,訓練高級ML系統的需求快速增長√計算、數據和算法的進步是指導現代機器學習(ML)進步的三個基本因素。在2010年之前,訓練計算的增長符合摩爾定律,大約每20個月翻一番,自2010年代早期深度學習(DeepLearning)問世以來,訓練計算的規模已經加快,大約每6個月翻一番。2015年末,隨著公司開發大規模ML模型,訓練計算需求增加10至100倍,出現了一種新趨勢——訓練高級ML系統的需求快速增長?!?015-2016年左右,出現了大規模模型的新趨勢。這一新趨勢始于2015年末的AlphaGo,并持續至今(GPT-3于2020年出現)。I七、產業全景圖1、AIGC:人工智能生成內容,Web3時代的生產工具。AIGC(AIGeneratedContent),即通過人工智能自動生成內容,具體指基于大型語言模型LLM、生成對抗網絡GAN等深度學習技術,輸入數據后由人工智能生成相關內容。目前AIGC已進入成長期,AI生成圖像、文字、代碼、音樂等領域均已有相關應用落地,我們認為隨著B、C兩端的快速普及,AI創作生產內容將成為下一階段的重要內容生產方式。2、當下為何關注AIGC:落地前的技術積累已經基本完成。I3、當下為何關注AIGC:ChatGPT誕生,催化AIGC商業化價值。ChatGPT實現了從技術提升到技術突破的轉變。此前殘差網絡及Transformer的出現使得模型的深度和參數量指數級增加,大模型成為可能,AIGC應用飛速發展;太語言模型出現后,大模型的使用方式從預訓練的單一任務模型迭代到多模態模型,微調時所需的標注數據量顯著減少,從而降低了業務的使用成本。在此基礎上、2022年11月,ObenAI上線了機器人對話模型ChutGPT(GPT-3.5),新模型參數量為1750億(人腦神經元數量為120-140億),遠超此前模型的參數量。Cha(GPT引入了RL/HF(基于人類反饋的強化學習),能夠在大部分領域與人類進行持續的語言交互,實現了歷史性的突破。ChatGPT標志著AIGC規?;?、商業化應用的開始,人類的內容生產習慣將被改變。盡管此前StableDiffusion、Midjoumey等AI繪畫應用已經落地,但注冊及使用門檻仍相對較高。ChutGPT的對話機器人屬性及免費試用窗口期使其能夠廣泛觸達用戶,瑞銀數據顯示上線兩月用戶數已突破一億,系目前用戶增長最快的消費應用,2023年1月推出付費訂閱版,每月價格20美元。我們認為,ChatGPT開啟了AIGC認知普及的一大步,是AIGC內容批量規?;a的起點。4、行業將會以什么樣的進程向前發展呢?AIGC多模態交互功奠定多場景商用基能持續演化。5II八、ChatGPT應用場景1、ChatGPT試點訂閱計劃--ChatGPTPlus發布,商業化序幕已經拉開2023年2月2日,OpenAl發布ChatGPT試點訂閱計劃——ChatGPTPlus,每月20美元。ChatGPTPlus訂閱者可獲得比免費版本更穩定、更快的服務,及嘗試新功能和優化的優先權。2、ChatGPT+傳媒:實現智能新聞寫作,提升新聞的時效性ChatGPT可以幫助新聞媒體工作者智能生成報道,將部分勞動性的采編工作自動化,更快、更準、更智能地生成內容。II3、ChatGPT+影視:拓寬創作素材,提升作品質量ChatGPT可以根據大眾的興趣身定制影視內容,從而更有可能吸引大眾的注意力,獲得更好的收視率、票房和口碑;ChatGPT可以為劇本創作提供新思路,創作者可根據ChatGPT的生成內容再進行篩選和二次加工,從而激發創作者的靈感,開拓創作思路,縮短創作周期。ChatGPT有著降本增效的優勢,可以有效幫助影視制作團隊降低在內容創作上的成本,提高內容創作的效率,在更短的時間內制作出更高質量的影視內容。5、ChatGPT+營銷:打造虛擬客服,賦能產品銷售ChatGPT可以打造虛擬客服,助力產品營銷。6、ChatGPT+娛樂:人機互動加強,激發用戶參與熱情ChatGPT可以成為線上的實時聊天對象,增加互動的趣味性和娛樂性。I7、ChatGPT+其他:促進數實共生,助力產業升級ChatGPT+教育:賦予教育教材新活力,讓教育方式更個性化、更智能ChatGPT+金融:幫助金融機構降本增效,讓金融服務更有溫度ChatGPT+醫療:賦能醫療機構診療全過程I九、行業的發展趨勢1、AIGC:利用人工智能產生內容,提升生產力曲線AlGC:ArtificialIntelligenceGeneratedContext,即可以利用人工智能技術自動產生內容,常見如代碼生成,文本問答等。2、ChatGPT已成為AIGC功能矩陣中的重要板塊ChatGPT是AIGC“數字內容智能編輯”功能中的重要組成部分,ChatGPT模型的出現對于文字/語音模態的AlGC應用具有重要意義。隨著深度學習技術的快速突破以及數字內容的海量增長,AIGC領域相關技術打破了預定義規則的局限性,使得快速便捷且智慧地輸出多模態的數字內容成為可能。在技術創新以及多模態模型的持續突破下,AIGC根據功能和對象的不同,按順序可包括三種主要實用功能:數字內容孿生、數字內容的智能編輯、數字內容的智能創作。這三種功能相互嵌套與結合,可以讓AIGC產品具備超越人類的創作潛力。而ChatGPT正是AlGC的數字內容智能編輯這一大功能領域中的重要組成部分。I3、AIGC相關技術包含了三大前沿能力數字內容李生能力構建現實世界-虛擬世界映射。孿生能力包括智能增強與轉譯技術,其中增強技術彌補內容數字化過程中的信息損失,轉譯技術在理解基礎上對內容進行多種形式呈現;數字編輯能力打通現實世界虛擬世界交互通道。編輯能力包括智能語義理解與屬性控制、語義理解除助實現數字內容各屬性的分離解耦,屬性控制則在理解基礎上對屬性進行精確修改、編輯與二次生成,最終反饋于現實世界,形成孿生-反饋閉環;數字創作能力從數據理解走向數據創作。創作能力可分為基于模仿的創作與基于概念的創作,前者基于對某一類作品數據分布進行創作,而后者從海量數據中學習抽象概念,并基于概念創作出現實世界不存在的內容。4、AIGC行業發展經歷了三個主要時期AIGC發展經歷了早期萌芽、沉淀積累和2014年之后的快速發展階段。I創新力生成式Al起源于分析式Al,分析式AI發展過程中的技術積累為生成式AI的產生奠定基礎。分析式AI其學習的知識局限于數據本身;生成式AI在總結歸納數據知識的基礎上可生成數據中不存在的樣本;最新生成式AI技術如GAN,Diffusion等,催生多款AlGC產品如:OpenAl系列、DALL-E2(Diffusion),StarryA.I.(基于GAN)等66、AIGC:學習范式更新奠定基礎,模型結構升級助力騰飛人工智能技術推動AIGC行業不斷發展,其中學習范式的更新賦予AI模型主動學習能力,模型結構升級提升AI模型學習、歸納與創新能力。I7、AIGC產業鏈涵蓋了從硬件到多類終端應用的廣泛領域AlGC關聯產業可分為應用層、模型層、云計算平臺與計算硬件層。計算硬件層結合云計算平臺為AIGC提供機器學習訓練與推理算力,其中GPU與TPU為硬件核心,主要參與廠商包括英偉達(GPU)與谷歌(TPU);云平臺參與廠商則包含AWS,GCP,Azure以及Coreweave;計算硬件層中云計算平臺廠商分布穩定,競爭出現于模型層面與應用層面。模型層面,閉源基礎模型提供商如OpenAl通過API向用戶提供服務,而開源基礎模型則通過在托管平臺如HuggingFace、Replica公開模型權重。模型訓練其高計算力需求推動了模型層廠商與云計算廠商建立合作關系(如OpenAl+Azure,GCP+DeepMind。模型層面閉源模型較為普遍,各廠商依靠模型建立技術壁壘在應用層面,MidJourney,Runway等自主研發、持有模型;而Jasper,GithubCopilot則通過調用閉源模型商提供的APl或采用托管平臺共享的模型。I8、AIGC產業鏈上下游玩家百花齊放AlGC上游主要包括數據供給方、算法機構、創作者生態以及底層配合工具等,中游主要是文字、圖像、音頻和視頻處理廠商,其中玩家眾多;下游主要是各類內容創作及分發平臺以及內容服務機構等。I9、AIGC廠商之間的競爭在于模型層面競爭追根溯源,AlGC依賴于底層機器學習模型產生內容,因此模型為AIGC行業廠商真正競爭力所在。文本生成產品多依賴GPT系列模型,自己訓練的模型在圖像/視頻模態產品中較為普遍(圖像/視頻模態產品通常擁有自己訓練的模型,而不是如文本模態調用OpenAl提供的模型服務);比較而言,OpenAl依靠模型建立先發競爭優勢,技術到產品轉化相對亮眼。10、AIGC取長補短,有望成為主流內容生產模式AlGC所屬內容生產生態的發展經歷了專家生產內容(PGC)、用戶生成內容(UGC)、Al輔助生產內容、Al生產內容(AIGC)四個階段,目前處于一、二階段為主,第三階段為輔的境況。AlGC克服PGC與UGC存在的質量、產量無法兼具的缺點,其有望成為未來主流的內容生產模式。11、AIGC生成技術可按模態進行分類AIGC根據其內容模態不同可分為文本、視頻、圖像,音頻與跨模態生成。I12、AIGC不同模態對應著各種生成技術及應用場景AIGC不同模態對應的技術應用場景也有著各自的細分品類。13、AIGC文本生成技術場景可分為交互式和非交互式AlGC非交互式文本生成技術中,結構化寫作其形式相對固定,生成難度較小,商業化應用較為廣泛;而創作型寫作開放性較大,在長文本生成中難度較大,仍需技術進一步發展。隨著通信互聯網技術發展,線上社交需求快速增長,如閑聊機器人等交互式文本產品將迎來快速發展I14、AIGC文本生成技術商業化落地有望優勢先發文本領域預訓練大模型技術成熟,文本領域細分垂類較多,產品數量居首位,模型數量發展超過其他模態技術。數字內容中,文字模態數據遠大于圖片/視頻/音頻等,發展前景相對較大基于GPT-3的文字生成功能已嵌入如Writesonic、Conversion.ai、Copysmith等軟件中,商業化前景相對清晰。15、AIGC圖像生成技術隨著模型結構的優化而明顯提升模型結構不斷進化提高了AlGC生產圖像的多樣性,但要求較高的功能實現還有待于技術的進一步提升。“圖像縮輯”難度低于“圖像生成”與“2D”轉換,目前已存在多款產品支持“圖像編輯”,而對于“圖像生成”任務,由于圖片相較包含更多元素,其生成效果仍存在不穩定性,對于要求較高的功能類圖像生成仍需要技術上的提升。I16、AIGC音頻生成技術正朝更富情感等人類特征演化文本到語音任務已比較成熟,語音質量已達到自然的標準,未來將朝更富情感、富韻律的語音合成以及小樣本語音學習方向發展。音樂生成任務中仍需解決音樂數據難以標注的問題,數據標注其顆粒度大小影響音樂生成任務的可控性。若可控性得以解決,則可指定風格情緒等因素的音樂生成任務有希望在影視、游戲等場景下的到大量應用。17、視頻生成為AIGC應用生態中的高潛力場景視頻生成本質上與圖片生成類似,通過對視頻進行幀數級別的切割,實現對每一幀的處理。視頻生成過程包括三個階段數據的提取、訓練和轉換,當前技術正在著重提升視頻修改精準度和實時性兩個維度。鑒于視頻本身的文本、圖像和音頻的綜合屬性,視頻生成也是跨模態生成領域的重要應用場景。18、跨模態生成技術是真正實現認知和決策智能的轉折點現實世界的信息是文本、音頻、視覺、傳感器以及人類各種觸覺的綜合體系,要更為精準地模擬現實世界,就需要將各種模態能力之間打通,例如文字-圖像、文字-視頻等跨模態生成能力。大型預訓練模型的發展使得跨模態逐步成熟,“文本·圖像”生成正在快速落地,I19、AIGC改變數字內容生產模式AlGC作為新的內容生產模式,其具有內容多樣,可控性強與生產效率高的優點,符合傳媒,電商,影視,娛樂等行業對內容數字化程度高、內容多樣以及內容更新快的要求,AIGC在以上行業逐漸替代傳統內容生產模式的趨勢十分顯著。20、AIGC滲透傳媒領域各個環節AlGC技術逐漸滲透傳媒領域包括采集、編輯、傳播等環節,有助于加快內容生產效率,提高內容質量,擴寬內容影響力。I21、AIGC化2D為3D,拓展電商展示維度AIGC2D圖像生成3D模型技術為傳統電商提供多維度的展示空間虛擬合成主播為客戶提供更及時、可靠、親和的服務體驗。22、AIGC打破傳統娛樂體驗邊界AIGC技術打破物理邊界,使粉絲可與偶像親密互動,并形成新的發展點AIGC為用戶打開虛擬世界入口,通過趣味方式體驗虛擬世界。23、AlGC拓寬影視行業創意邊際AlGC技術以其內容多樣性為作品內容帶來更多靈感,AlGC技術幫助拍攝突破物理限制,還原劇本效果,提高作品質量。I24、AIGC促進各行業轉型升級AIGC技術在各行業數字內容相關領域均有發揮空間。I1、AIGC+資訊行業在信息化時代,社會中充斥著各種資訊,同時這些資訊也有高標準、需求大、時效強等特點。自2014年起,AIGC已開始用于新聞資訊領域,因此資訊行業是AIGC商業化相對成熟的賽道。新華社寫稿機器人“快筆小新”1.1、AIGC輔助信息收集,打造堅實基礎優質的新聞產出必定需要全面、高效、準確的信息收集與整理的基礎上。按照傳統的I作業模式,工作人員需要親臨現場,通過各種手段才能獲得足夠且扎實的信息。現在的AI已經能對該環節高效賦能,例如科大訊飛的AI轉寫工具可以幫助記者實時生成文稿,自動撰寫提綱、精簡語句等,進而提高工作效率,保證最終產出的時效性。除幫助獲取一手信息外,AI也可以幫助精確檢索二手信息,收集素材。在高性能的AIGC工具如ChatGPT出現后,就可以像常人對話一樣直接提問并獲得答案。雖然難免還是會有這樣那樣的問題,但作為工具而言,AIGC的意義已經非常明顯了。1.2、AIGC支持資
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國數顯量具產銷需求分析及投資發展前景預測研究報告
- 湖北省襄陽三中2025年高考英語二模試卷含解析
- 職業技術學院2024級計算機網絡技術專業人才培養方案
- 廣東省廣州市2025屆高三下學期綜合測試(二)(二模)數學試題 含解析
- 上海市金山區2024-2025學年八年級下學期中化學試題(原卷版+解析版)
- 生態環境監測中的遙感與GIS技術考核試卷
- 電氣安裝石油與開采設備考核試卷
- 管道配件生產的自動化技術考核試卷
- 船舶改裝施工過程中的質量安全管理協同考核試卷
- 納米材料在海水淡化處理中的應用考核試卷
- 2025年山東鐵投集團招聘筆試參考題庫含答案解析
- 煙草行業信息化總體技術架構設計與實施方案
- 2025年國家電投公開招聘管理單位筆試遴選500模擬題附帶答案詳解
- 陜西省商洛市新高考綜合改革政策培訓課件
- 鐵礦石采購合同三篇
- 電工電子學知到智慧樹章節測試課后答案2024年秋湖南大學
- 國開數據庫運維網考復習題及答案
- 【MOOC】能源與氣候變化應對法-西南政法大學 中國大學慕課MOOC答案
- 陜西延長石油集團有限責任公司行測筆試題庫2024
- 【MOOC】計算機網絡-南京農業大學 中國大學慕課MOOC答案
- 《出口單證實務》課件
評論
0/150
提交評論