




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
西藏大學信息化工作專題講座西藏大學信息化工作專題講座新一代人工智能技術發展及其應用新一代人工智能技術發展及其應用信息科學技術學院藏語智能全國重點實驗室尼瑪扎西目錄第一部分人工智能n人工智能的定義n人工智能與算力第二部分新一代人工智能n大語言模型第三部分人工智能+n人工智能的動力n人工智能與算法n自監督學習n自然語言處理n人工智能與數據n我國的人工智能n強化學習n人工智能的定義n人工智能與算力n人工智能的動力n人工智能與算法n人工智能與數據n我國的人工智能AI的定義-圖靈測試由英國科學家阿蘭·一名測試者寫下自己的問題,隨后將問題以純文本的形式(如計算機屏幕和鍵盤)發送給另一個房間中的一個人與一臺機器測試者根據他們的回答來判斷哪一個是真人,哪一個是機器A.M.Turing,ComputingMachineryandIntelligence,OxfordUniversityPressonbehalfoftheMindAssociation,1950.AI的定義-7個研究問題1955年達特茅斯人工智能暑期研討會建議書中所提的7個研究問題提出了“人工智能”這一名詞McCarthyJ,MinskyM,RochesterN,etal.Aproposalforthedartmouthsummerresearchprojectonartificialintelligence,August,31,1955.AIMagazine,2006,27(4):12-14McCarthyJ,MinskyM,RochesterN,etal.Aproposalforthedartmouthsummerresearchprojectonartificialintelligence,August,31,1955.AIMagazine,2006,27(4):12-14AI的定義-達特茅斯會議會議圍繞“如何讓機器模仿人類學習及其他智能行為”展開,探討了通過計算機實現推理、語言理解、模式識別等能力的可能性標志著“人工智能”學科的正式確立會議為AI奠定了基礎理論框架,包括符號推理、機器學習、自然語言處理等核心方向,并激發了后續算法研究人工智能深蘊于計算機科學、腦科學、類腦科學、認知科學、控制論等基礎科學之中,直接表現為機器學習、計算機視覺、自然語言處理、智能語音、知識圖譜、大模型、智能體、群體智能、具身智能等技術形態,外化為人形機器人、數字人、智能終端、智能運載工具、智能軟件等產品形態人工智能通過類腦計算增強腦力勞動的新能級,通過“機器換人”培育體力勞動的新動能,帶動農業、工業和服務業中的腦力勞動與體力勞動的第四次變革,形成新興的人工智能產業AI的定義-三大學派AI發展以“知識推理”為重點(手工知識)、到以“數據統計”為重點(統計學習)、再到以“計算學習”為重點(數據智能)徐宗本,姚新,數據智能研究前沿,上海交通大學出版社,2021.AI的動力-計算的4個時代 >>網絡計算時代>>智能計算時代>算盤——中國發明最早的計算工具步進計算器——德國人萊布尼茨發明第一臺自動完成四則運算的裝置(1673年,乘法器)雅卡爾提花織機——法國人雅卡爾發明“編程”的概念,通過打孔卡片控制印花圖案(1801年)AI的動力-計算的4個時代>>電子計算時代>>網絡計算時代>描述程序和硬件的底層邏輯將復雜任務轉化為自動化過程描述程序和硬件的底層邏輯將復雜任務轉化為自動化過程構成基本的邏輯電路和存儲電路的半導體器件2.程序存儲執行3.由運算器、控制器、存儲器、I/O設備組成現代計算技術基礎布爾代數馮·諾伊曼架構AI的動力-計算的4個時代計算機跨越的第一個分水嶺1970年代開始的第四代計算機:以大規模、超大規模集成電路為主要器件;運算速度達每秒幾百萬次至上億次基本運算。軟件方面出現數據庫管理AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代TCP/IP協議讓所有上網設備(手機/電腦/服務器)都遵守相同的通信規則,保證跨設備通信的暢通。定義了開放的通信標準,讓不同公司可以開發各種網絡應用,而不用擔心底層通信問題TCP/IP協議通過協議分層架構、可靠傳輸機制和開放標準,構建了互聯網的神經中樞提出者羅伯特·卡恩榮獲2004年圖靈獎AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代互聯網以“人”為中心將人使用的計算機與終端與后臺數據中心連接,互聯網的應用通過計算機和智能終端與人進行交互互聯網深刻徹底地改變了人類社會,我們的工作、生活和學習幾乎離不開它AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>物理世界的端側設備被數字化、網絡化和智能化,實現“人、機、物”三元融合除互聯網外,還有數據基礎設施支持各類終端通過端邊云實現萬物互聯,終端、物端、邊緣、云都嵌入AI,提供大模型智能服務,實現有計算的地方就有AI智能計算帶來了巨量數據、人工智能算法的突破和對算力的爆發性需求!AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>n傳統AI局限于數字世界的符號推理,而具身智能通過機器人實體與環境實時交互,實現感知、認知、決策和行動一體化揭示了智能的本質:必須通過身體與環境的動態互動來塑造和體現n機器人在工廠與工人協作時,通過強化學習不斷優化動作序列,人類AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>計算機跨越了第二個分水嶺n從“有意識思維”過程到“無意識思維”過程的轉變這一過程的轉變涉及到“莫拉維克悖論”這一過程的轉變涉及到“莫拉維克悖論”(Moravec'sParadox)AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>n“莫拉維克悖論”(Moravec'sParadox)計算機善于處理人類覺得困難的問題,而不擅長處理對于人類而言很容易的問題或者說:不同于傳統假設,計算機實現邏輯推理等人類高級智慧只需相對很少的計算能力,而實現感知、運動等低級智慧卻需要巨大的計算資源AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>n人工智能先驅漢斯·):“讓計算機在智力測試或下棋上中展現出一個成年人的水平是相對容易的,但是要讓計算機擁有如同一個一歲小孩般的感知和行動能力卻是相當困難甚至是不可能的。”莫拉維克揭示的這些現象與我們生活AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>“困難的問題是簡單的,簡單的問題是困難的”n語言學家和認知科學家史迪芬·平克(StevenPinker)認為這是人工智能研究者的最重要發現,在他1995年出版的專著“TheLanguageInstinct”(《語言本能》)中,他寫道:經過35年人工智能的研究,人們學到的主要內容是“困難的問題是簡單的,簡單的問題是困難的”AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>這反映了人類思維特征:兩種截然不同的思維方式:n有意識的、謹慎的、有邏輯的語言思維n無意識的、快速的、本能的非言語思維有意識的:當你在超市用心算計算所買物品的價格時,使用的是磕絆努力保持身體平衡時,使用的是本能的思維方式,這與邏輯無關AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>一個例子:我坐在咖啡館里邊看書邊喝咖啡n我坐在咖啡館里,在專心地看著書的同時拿起咖啡杯喝了一口。這可不是件簡單的事,在機器人研發領域,人們至今仍在絞盡腦汁想讓機器人順利無阻地完成此類任務n簡單地說這涉及我的視覺系統(可能是靠余光)先掃描整個場景,鎖定杯子,運動皮質準確地協調整個軀干、胳膊、前臂和手部的肌肉收縮,當手觸碰到杯子時,我的神經系統就傳回了有關杯子重量、空間位置、溫度、手柄光滑度等大量的信息。這些信息通過大腦的海量計算和反饋調整。最終在幾分之一秒里,使我拿起杯子送到嘴邊并喝下咖啡AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>我們能夠理解人類自身是如何做算數、代數和下棋的,但我們不是太了解我們是如何認出一只貓的,也不太清楚當我們跑過山路時是如何保持身體平衡的AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>機器學習通過改變計算機編程方式解決了悖論2020至今通過機器學習(深度學習人類使計算機對一個龐大的模型進行推理計算,最后得出某個特定問題的可能的解AI的動力-計算的4個時代/電子計算時代>>網絡計算時代>>智能計算時代>計算機從“服從”到“認知”的轉變2020至今n直到不久前,我們還在用計算機編程的方法教計算機完成特定任務(事情)這些程序一步一步地設計計算機在可能遇到的各種情況下應該做什么?怎么做。但是這就意味著我們自己必須在教計算機處理問題之前,首先清楚地理解我們自己處理問題時的思考方式?數據是訓練AI模型的原材料,包括結構化(表格)、非結構化(文本、圖?算力是運行算法所需的計算能力,依?算法是AI實現智能的邏輯規則和數學模型,如機器學習、深度學習、強化案例:AlphaFold(算法)通過海量蛋白質序列數據(數據)/articles/s41586-024-07487-wAI與數據n使AI發展神速的其中一個原因是大數據的收集、存儲、傳輸和分析成為可能一種規模大到在獲取、存儲、管理、分析方面大大超出傳統數據庫軟件工具能力范圍的數據集合,具有海量數據規模、高速數據流轉、多樣數據類型和高價值及低價值密度四大特征AI與數據nTB、PB級的結構化、非結構化和半結構化數據。預計到今年,全球數據使用量將達到175ZB(1ZB=270Byte)n以前利用統計學的原理、抽樣的方法分析問題。但是,這顯然沒有全部數據更能說明問題n全量數據的采集、存儲、處理與分析的需求,推動產生了系列大數據技術,其中的重點在基于分布式技術的數據存儲與處理AI與數據AI與大數據技術二者聯系密切深度學習n通過大量的樣本數據進行模型訓練,需要應用大數據技術存儲與計算、分析這些數據n大數據技術支撐了人工智能算法的實現n人工智能更像是大數據技術中數據分析技術的高級階段。曾經的數據倉庫、數據挖掘技術AI與數據數據的重要性怎么強調都不為過!n如果將機器學習算法比作一架機器,那么數據就是驅動這架機器的燃料,沒有燃料驅動,機器設計得再精巧也只能是擺設。而事實上,數據確實被譽為未來的“石油”n當前,典型個人計算機硬盤的容量為TB量級,而一些大企業的數據量已經接近EB量級數據估計值、全球不同語種的數據不平衡人類目前所有印刷品的數據量約為200PB(1PB=250Byte)人類所說過的話的數據量約為4ZB(1ZB=270Byte)人類大腦存儲容量相當人類大腦存儲容量相當于7.6億TB英語數據占互聯網內容的50%以上,中文數據雖占15%,但方言數據稀缺,小語種數據更是占比不到0.1%Villalobos,Pablo,etal."Willwerunoutofdata?LimitsofLLMscalingbasedonhuman-generateddata."arXivprepVillalobos,Pablo,etal."Willwerunoutofdata?LimitsofLLMscalingbasedonhuman-generateddata."arXivprepNature在頭版敲響警鐘——AI革命正“吸干”互聯網數據的海洋n研究機構EpochAI近日公布的研究預測,到2028年,用于訓練AI模型的典型數據集的規模將達到公共在線文本總量的估計規模這意味著,未來幾年內,AI大模型可能會耗盡可用于訓練的高質量數據資源AI與數據深度學習需要大量的訓練數據,目前的AI技術還是數據驅動的n當數據量較小時,傳統機器學習模型的性能與神經網絡模型的差別不大n當數據規模越來越大時,神經網絡結構更加復雜的深度學習模型更能夠從大數據中提?。▽W習)到有效的特征,模型性能也隨之非常明顯地上升PreetumNakkiran,GalKaplun,YamAI與數據n我們今天正在使用的巨大的數據集,在幾年前是想得而不能的。現在,大數據無處不在且大得驚人nBigData的單位一般以TB、PB衡量。1PB=1024TBAI與數據n若算力是深度學習的噴氣式發動機,數據則是燃料。吉爾德定律(Gilder’sLaw)保證了燃料供應Gilder’sLaw:主干網帶寬的增長速度至少是運算性能增長速度的三倍,而主干網的網絡帶寬的不斷增長意味著各種新的網絡應用方式的出現和網絡用戶的使用費用的不斷下降(CERNET主干網總帶寬3.15T以上,中國電信主干網總帶寬458T)AI與算力算力:就是單位時間內硬件能夠完成的某種運算的量。比如浮點計算、整數計算等):):):FLOPS(floating-pointoperations):哈希率:比特幣網絡處理能力的度量單位,即CPU計算哈希函數輸出的速度。比特幣網絡必須為了安全目的進行密集的數學和加密操作。例如,AI與算力訓練神經網絡模型,使它像人一樣識別圖片或理解人類語言所需的算力是十分驚人的。深度學習中的模型權重值調整涉及大規模的“矩陣反演”數學運算模型訓練訓練一個大模型,甚至需要1024次的浮點數運算。這就要求計算機的算力足夠強大AI與算力為什么現在AI發展的如此神速?曾經的摩爾定律(Moore'slaw)Moore'slaw:稱為計算機第一定律,指IC上可容納的晶體管數目,約每隔18/24個月便會增加一倍,性能也將提升一倍神經網絡的基礎——感知機是上世紀50年代提出的AI與算力n今天,摩爾定律的樂觀已不復存在,CPU性能的提升降至每年不足3%,實現性能翻倍需20年現在芯片線路可達2~3納米級別,相n量變引起質變,產生諸如分子臺積電3納米工藝:每平方毫米集成2.5億晶體管(指甲蓋大約1平方n散熱問題AI與算力nCPU性能提升速度大幅放緩,出現八核、十六核、三十二核CPU。通過多核提高CPU性能的方式并沒有從根本上解決問題n功耗問題n散熱問題n軟件支持問題AI與算力AI加速發展和黃氏定律n以英偉達(NVIDIA)公司創始人黃仁勛名字命名的定律——黃氏定律(Huang’sLaw)對AI性能的提升作出預測Huang’sLaw:GPU將推動AI性能實現逐年翻倍AI與算力CPU與GPU的區別nCPU:數學教授需要對圖像中的每個像素進行相同的運算。圖像一般都會有上百萬個像素。CPU的串行運算效率CPU內部cache以及控制部分占據了很大面積,計算單元占比很少;GPU控制單元很簡單,大部分空間被計算單元占據,因此CPU的核數有限,而GPU則輕松堆出上千核AI與算力CPU與GPU的區別nCPU:不同的核可以執行不同的機器指令,如CoreA在運行Word線程的同時CoreB可以運行Browser線程,所謂nGPU:所有核必須整齊劃一地運行相同的機器指令,只是可以操作不同的數據nGPU:絕不是用來取代CPU的,CPU只是把一些GPU非常擅長的事情交給它,GPU僅僅是充當分擔CPU工作的配角AI與算力無論CPU還是GPU,其生產過程中都需要最重要的設備——光刻機目前最先進的光刻機是荷蘭ASML公司生產的High-NAEUV光刻機,支持2nm制程量產,通過多重曝光技術可進一步延伸至1nm甚至0.5nm“卡脖子”問題n荷蘭ASML的EUV光刻機自2019年起,被禁止向中國出口,該設備用于7nm及以下先進制程芯片制造n美國通過《出口管理條例》要求對涉及3nm及以下打破枷鎖上海微電子的SSX600系列已實現90nm制程量產,28nm光刻機進入產線驗證階段AI與算力n過去只有超級計算機才能完成的計算、幾年前還無法企及的計算速度在今天已成為家常便飯n由國防科技大學和國家超級計算天津中心聯合研制的“天河”新一代超算系統,搭載自研飛騰CPU、天河高速互聯通信技術和麒麟操作系統,持續穩定算力超1018FLOPS“天河二號”超級計算機“天河二號”超級計算機算力曾達30.65PFlops一般的GPU服務器算力在1000GFLOPS左右AI與算力nCPUvsGPUvsTPUvsNPUvsQPU……在AI的算力中,有哪些計算的處理器?低高中中高低低AI訓練、圖形NVIDIAXu,Y.,Wang,Q.,An,Z.,Wang,F.,Zhang,L.,Wu,Y.,Dong,F.,Qiu,C.-W.,Liu,X.,Qiu,J.,Hua,K.,Su,W.,Xu,H.,Han,Y.,Cao,X.,Liu,E.,Fu,C.,Yin,Z.,Liu,M.,Roepman,R.,Dietmann,S.,Virta,M.,Kengara,F.,Huang,C.,Zhang,Z.,Zhang,L.,Zhao,T.,Dai,J.,Yang,J.,Lan,L.,Luo,M.,Huang,T.,Liu,Z.,Qian,S.,An,T.,Liu,X.,Zhang,B.,He,X.,Cong,S.,Liu,X.,Zhang,W.,Wang,F.,Lu,C.,Cai,Z.,Lewis,J.P.,Tiedje,J.M.,Zhang,J.,ArtificialIntelligence:APowerfulParadigmforScientificResearch,TheInnovation(2021),doi:/10.1016/j.xinn.2021.100179.人工智能技術萌芽階段1985年,Judea1985年,JudeaPearl提出了了通過誤差反向傳播(BP)來訓練人工智能技術沉淀積累階段人工智能技術快速發展階段2022年11月,OpenAI發布2023年2月,Meta開源大語言2022年11月,OpenAI發布2023年2月,Meta開源大語言2023年3ChatGPT模型AI與算法:神經網絡-追根溯源大腦讓人類成為萬物之靈,而人類對大腦的深層次探索AI與算法:神經網絡-發展簡史n神經網絡起源于上個世紀四十年代。1943年時神經科學家麥卡洛克(McCulloch)和數學家皮茲(Pitts)發表論文《神經活動中內在思想的邏輯演算》,提出了MCP模型McCulloch,WarrenS.,andWalterPitts."AlogicalcalculusoftheAI與算法:神經網絡-發展簡史MCP模型架構雖然相對簡單,但是具有里程碑意義ΣΣ接受多個輸入(x1,x2,x3,...)AI與算法:神經網絡-發展簡史n1958年,計算機科學家弗蘭克·羅森布拉特提出由兩層神經元構建的網絡,并將之命名為感知機(perceptron)基本擁有現今神經網絡主要構件與思想。包括自動學習權重、梯度下降算法、優化器、損失函數等,一定程度上推動神經網絡發展Rosenblatt,Frank."Theperceptron:aprobabilisticmodelforinforAI與算法:神經網絡-發展簡史·作中證明了感知機本質上是一個線性模型,其連最基本的異或問題都無法解決yy=kx+bx1x1XOR00000010111001111110Minsky,Marvin,andSeymourPapert."AnintroductionAI與算法:神經網絡-發展簡史··BP算法Rumelhart,DavidE.,GeoffreyAI與算法:神經網絡-發展簡史n在層與層之間的傳播過程中引入了Sigmoid激活函數,為神經網絡引入了非線性能力,改良了感知機無法解決異或問題的缺陷為神經網絡引入了非為神經網絡引入了非了建模能力。事實上,額外的隱藏層并不能提升輸入和輸出之間復雜關系的建模能力左圖是一個以Sigmoid作為隱藏層激活函數的兩層神經網不斷地改變目標函數的形狀。AI與算法:淺層學習與深度學習神經元神經元->感知機淺層學習->深度學習AI與算法:深度神經網絡模型-3位奠基人n2018年的圖靈獎頒給三位AI巨頭GeoffreyHinton(杰弗里●辛頓)、YannLeCun(楊●立昆)以及YoshuaBengio(約書亞●本吉奧深度神經網絡DNN)·霍普菲爾德(JohnJ.Hopfield)與杰弗里·頓(GeoffreyE.Hinton)因“使用物理學訓練人工智能神經網絡”獲諾貝爾物理學獎AI與算法:深度神經網絡模型-3位奠基人“卷積神經網絡(CNN)之父”,提出了首個正自然語言處理領域的先驅,提出了基于神經網絡的語言模型(如神經概率語言模型),并推動了AI與算法:深度神經網絡模型-CNN卷積神經網絡(CNN)是一種專門為處理具有網格結構數據(如圖像)而設計的深度學習模型n卷積層:利用卷積核提取輸入數據中的特定特征n池化層:主要功能是對特征圖進行下采樣,以減少數據量和計算量n全連接層:將提取到的特征進行整合,以完成分類或回歸任務卷積層池化層卷積層池化層全連接層輸出層卷積層池化層卷積層池化層全連接層輸出層AI與算法:深度神經網絡模型-RNN循環神經網絡(RNN)是一種專門處理序列數據的深度學習模型,其核心特點是通過循環連接保留歷史信息,從而捕捉數據中的長期依賴關系n隱藏層的輸出不僅傳遞給輸出層,還反饋回自身,形成時間維度n理論上,RNN可以記住任意長時間的信息,但實際中受梯度消失IanGoodfellow,YoshuaBengioAI與算法:深度神經網絡模型-LSTM長短時記憶網絡(LSTM)是一種特殊的RNN,主要應用于序列任務,解決了RNN在處理長序列時的梯度消失或梯度爆炸問題輸出門IanGoodfellow,YoshuaBengioPyTorch是由Facebook的AIPyTorch是由Facebook的AI研究團隊開發的開源深度學習其簡潔易用的API和動態計算圖的特性受到了廣大研究TensorFlowTensorFlow是由Google開發和維護的布。它最初是為了滿足Google內部很快就成為了全球范圍內最受歡迎的API復雜度有強大的可視化工具可通過第三方庫實現可視化理論研究萌芽:早期聚焦機理論研究萌芽:早期聚焦機“863”計劃首次將AI納入互聯網驅動:百度、阿里、騰訊布局人工智能,推出語技術突破:2010年后深度學別、騰訊優圖人臉識別技術生態擴張:開源鴻蒙、開源歐拉等開源社區推動技術普《2025年中國人工智能計算力發展評估報告》《2025年中國人工智能計算力發展評估報告》n核心技術與創新突破AIforScience:藥物研發(如晶泰科技量子AI:本源量子與中科大合作開發量子機器學習算法,適配量子硬件機器視覺:??低暟卜老到y、醫療影像診斷(如聯影AI)實現毫米多模態融合:華為鴻蒙分布式能力支持跨設備協同,阿里云ET實現綠色計算:液冷技術、異構計算降低能耗,算力效率提困境一:中國在AI高端人才數量、AI基礎算法創新、AI基座大模型能力、基座大模型困境二:高端算力產品禁售、高端芯片工藝長期被卡。國內可滿足量產的工藝節點困境四:AI應用于行業時成本、門檻居高不下。從互聯網行業遷移至非互聯網行業n中國人工智能發展的道路選擇選擇一:統一技術體系走閉源封閉,還是開源開放的道路?追趕兼容美國主導的A體系:大多數互聯網企業走GPU/CUDA兼容道路,很多芯片領域的創業企業在生態構建上也是盡量與CUDA兼容,該道路較易實現構建專用封閉的B體系:在專用領域構建企業封閉生態,基于國產成熟工藝生產芯片,關注特定領域的垂直大模型,采用領域專有高質量數據。缺點:封閉,無法凝聚國內大多數力量,難以實現全球化構建全球共建開源開放的C體系:用開源打破生態壟斷,降低企業擁有核心技術的門檻。用開放形成統一的技術體系,我國企業與全球化力量聯合構建基于國際標準的統一智能計算軟件棧。共享高質量數據庫,共享開源基座大模型n中國人工智能發展的道路選擇選擇二:拼算法模型,還是拼新型基礎設施?我國80%的中小微企業需要低門檻、低價格的智數據已成為國家戰略信息資源。數據數據已成為國家戰略信息資源。數據具有資源要素與價值加工兩重屬性,我國應繼續加大力度建設國家數據樞紐與數據流通基礎設施。AI大模型就是數據空間的一類算法基礎設施。以通用大模型為基座,AI大模型就是數據空間的一類算法基礎設施。以通用大模型為基座,構建大模型研發與應用的基礎設施,支撐廣大企業研發領域專用大模型一體化算力網建設在推動算力的基礎設施化上發揮了先導作用。中國方案的算力基礎設施化需實現“兩低一高”:降低使用成本和門檻,提供普適的高通量、高品質智能服務。在供給側降低成本,讓中小企業能消費、愿開發;消費側降低門檻,公共服務要易獲取、易使用。服務效率要低熵高通量,高并發時系統也能高效運行,“算得多”對中國意義重大。n中國人工智能發展的道路選擇選擇三:AI+著重賦能虛擬經濟,還是發力實體經濟?實體經濟(制造業占比27%)虛擬經濟(制造業GDP占比11%)AI應用領域智能制造、工業機器人、新能源虛擬現實、元宇宙、區塊鏈、大模型代表性行業裝備制造、醫藥中國要走適合自己的AI賦能實體經濟高質量發展之路nChatGPT與DeepSeek——維特根斯坦《邏輯哲學論》大語言模型(LLM)是指通過海量數據訓練、具有超大規模參數的預訓練人工智能模型,其核心在于通過深度神經網絡學習數據中的通用規律,實現跨任務、跨領域的智能處理能力大語言模型的核心技術根植于自監督學習、強化學習和Transformer架構中n自監督學習為起點:通過無標注數據預訓練,賦予模型基礎智能,如n強化學習為終點:通過人類反饋微調,將基礎智能轉化為符合人類需自監督學習是一種利用無標注數據,通過設計代理任務自動生成監督信號進行訓練的機器學習方法,無需人工標注數據自監督學習可以緩解數據標注成本,提升模型泛化性,更加適應開放場景而監督學習依賴人工標注數據,模型直接通過標注信號優化強化學習(ReinforcementLearning)是一種機器學習方法,智能體(Agent)通過與環境的交互,基于獎勵(Reward)和懲罰n環境(Environment):智能體所處的動態n策略(Policy智能體從狀態到動作的映射n價值函數(ValueFunction):評估狀態或Sutton,R.S.;andBarto,A.G.2018.Reinforcementlearning:Anintroduction.MITpress基于人類反饋的強化學習(RLHF)ZhaoWX,ZhouK,LiJ,etal.Asurveyoflargelanguagemodels[J].arXivpreprintarXiv:2303.18223,2023.特卡洛樹與價值/Mnih,Volodymyr,etal."Asynchronousmethodsfordeepreinforcementlearning."IMnih,Volodymyr,etal."Playingatariwithdeepreinforcementlearning."arXivpreprintarXiv:1312.5602Schulman,John,etal."Proximalpolicyoptimizationalgorithms."arXivpreprintarXiv:1707.06347(2017).Transformer最初用于機器翻譯任務,成為自然語言處理領域的里程碑式突破,并推動了大模型時代的到來Transformer=編碼器(encoder)+解碼器(decoder)編碼器:處理輸入序列(如源語言句子解碼器:生成目標序列(如目標語言句子),注意力機制:使神經網絡在每個時間步只聚焦于某些重要/相關元素從統計語言模型到大語言模型泛化目標任務解決任務解決擴展語言模型依據提示完成解決豐富基于真實世界的任務任務解決特定任務輔助無偏任務特征學習特定任務輔助無偏任務特征學習神經語境建模語境感知表征語音大模型語音大模型統計學方法在特定任務中輔助大語言模型大語言模型預訓練語言模型神經語言模型統計語言模型1990s201320182020目前OpenAIGPT4目前OpenAIGPT4主要支持20余種DeepSeeknDeepSeek-V3基本原理DeepSeek依托算法創新和算力優化,在開源數據上實現多項頂尖能力n訓練成本550萬$nDeepSeek進化路徑!!!!DeepSeekDeepSeek-R1重要意義再次迎來“ChatGPT”時刻為什么DeepSeek會引起全球性的科技震撼?“有限算力+算法創新”的發展模式是突破算力卡脖子的關鍵未來應聚焦“高效”:圍繞高效模型架構、高效強化學習、高?高效訓練-提升數據利用效率?高效思考-提升思考信息密度?低位寬高效并行框架?訓推一體的強化學習框架人腦約有1000億個神經元、1000萬億個突觸。而DeepSeek-V3的模型參數量為6710億,GPT4的模型參數量為1萬億,數量級上與人腦有很大的差距。讓人工智能像人一樣思考,還有很長的路要走,擁有人一樣的智能更是路漫漫!n據估算,GPT4的訓練成本約為1億美元,訓練耗電相當于1000戶家庭5至6年的用電量。如此巨大的開銷,加上日益枯竭的訓練數據,是否說明“數據驅動,算力堆砌”的人工智能開發路徑是不可持續的?n人工智能未來的發展方向是什么呢?具身智能?量子AI?世界模型?nAI4EducationnAI4SciencenAI+新質生產力nAI正在接替部分職業AI4Education識識教學教學以上問題,傳統課堂難以有效解決AI4Education工具層面AI4Education如何適應AI發展?如何實現AI賦能教育教學?如何改?技術上數智化教學AI+AI+實驗40AI+實驗40教學評價教學環境教學AI+課程教學設計教學設計教學AI賦能教學手段過程教學AI賦能教學手段教學管理教學教學管理教學方法引導教師合理使用AI,鼓勵開展探索研究AI4Education角色關系:AI構建三維互動網絡AI4Education深度利用:三大場景突破?思維鏈可視化工具:教師可通過AI拆解學生解題邏輯,針對性設?元認知訓練系統:AI通過對話日志分析,指出學生認知偏差(如過度依賴記憶而?職業模擬實驗室:結合大語言模型與虛擬現實,模擬企業真AI4Education協同創新:AI驅動的教育生態重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 互聯網企業數據隱私保護協議(GDPRCCPA合規)
- 建設工程項目全程法律服務合同
- 機電安全培訓體系構建
- 寵物用品品牌特許經營與專業物流配送服務合同
- 人工智能企業核心團隊股權綁定與技術創新協議
- 國際學生行李保險與全球托運質量監控合同
- 咯血與便血護理學
- 脊椎治療原則
- 動脈神經損傷護理
- 護理創新實踐感悟與思考
- 布草間管理制度(3篇)
- 物流管理專業 蘇果超市南京地區配送路徑優化研究
- GB∕T 12719-2021 礦區水文地質工程地質勘查規范
- 法商小課堂傳承保險法商課婚姻保險法商課32張幻燈片
- 《品牌策劃與管理(第4版)》知識點與關鍵詞解釋
- 《劉姥姥進大觀園》課本劇劇本3篇
- 房屋買賣合同解除協議書
- 司法局PPT模板
- 干部選拔任用工作全部系列表格12張
- 五年級奧數《盈虧問題》(課堂PPT)
- 建設工程質量安全管理獎罰制度匯編
評論
0/150
提交評論