人工智能應用基礎 課件全套 周朕 項目1-16 人工智能概述 -讓歷史文物活靈活現_第1頁
人工智能應用基礎 課件全套 周朕 項目1-16 人工智能概述 -讓歷史文物活靈活現_第2頁
人工智能應用基礎 課件全套 周朕 項目1-16 人工智能概述 -讓歷史文物活靈活現_第3頁
人工智能應用基礎 課件全套 周朕 項目1-16 人工智能概述 -讓歷史文物活靈活現_第4頁
人工智能應用基礎 課件全套 周朕 項目1-16 人工智能概述 -讓歷史文物活靈活現_第5頁
已閱讀5頁,還剩562頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

人工智能應用基礎授課人:*老師

基礎篇項目1?人工智能概述01項目描述05項目拓展02項目分析06項目小結03相關知識07項目練習04項目實施目錄項目描述011.1項目描述小紅是一名活躍的社交媒體用戶,她每天都會在手機上瀏覽各種新聞、視頻和社交媒體帖子。最近,她注意到社交媒體平臺上的內容推薦變得越來越“懂她”了,無論是娛樂八卦、時尚穿搭還是健康養生,都能精準地推送給她感興趣的內容。原來,這背后是人工智能算法在根據小紅的瀏覽歷史、點贊、評論等行為數據,進行個性化內容推薦。小紅享受著這種個性化推薦帶來的便利,但同時也開始擔心起背后的倫理問題。她意識到,這種推薦機制雖然提高了用戶體驗,但也可能導致她陷入“信息繭房”,即只接觸到與自己觀點相符或興趣相投的信息,而忽略了其他多元的聲音和觀點。此外,她還擔心人工智能算法可能存在的偏見問題,比如是否會因為某些社會群體的數據不足或偏見,導致他們的聲音被忽視或邊緣化?13.1項目描述02項目分析

小紅在社交媒體上的瀏覽喜好,其背后所依托的個性化推薦技術,正是人工智能領域中的一個核心應用。這項技術通過深度分析小紅的瀏覽歷史、點贊與評論等大數據,精準捕捉其興趣偏好,從而為她量身定制推送內容,讓用戶體驗得到了顯著提升。然而,這也引發了關于“信息繭房”及算法偏見的倫理思考,提醒我們在享受人工智能帶來的便利時,需警惕其潛在的負面影響。因此,小紅的面臨的問題不僅是技術應用的個案,更是對新時代青年如何在技術發展中保持清醒頭腦,堅守底線,促進網絡空間健康、公正、和諧發展的深刻啟示。通過學習人工智能較好解答小紅的疑惑。為確保項目的成功,需要進行一些前期的準備工作:1.

人工智能簡介與發展2.

人工智能的主要研究領域3.人工智能的未來趨勢1.2項目分析03相關知識人工智能簡介1956年夏季的美國達特茅斯,以麥卡賽、明斯基、羅切斯特和申農等為首的一批有遠見卓識的年輕學者舉行了一次會議,共同研究和探討用機器模擬智能的一系列相關問題,并首次提出了“人工智能”(ArtificialIntelligence,AI)這一術語,它標志著“人工智能”這門新興學科的正式誕生。人工智能是研究、開發用于模型、延伸和擴展人類智能的理論、方法、技術及應用系統的一門新型技術科學。1.3相關知識2.人工智能歷史上共出現過三次重要的發展浪潮:第一次浪潮(1956-1974年):AI思潮賦予機器邏輯推理能力。第二次浪潮(1980-1987年):專家系統使得人工智能實用化。第三次浪潮(1993年至今):深度學習助力感知智能步入成熟。1.3相關知識3.人工智能的主要研究領域:

(1)感知能力

感知能力是人工智能的基礎,主要包括視覺和聽覺兩大方面。盡管理論上還應包括觸覺、嗅覺等,但由于技術限制和實際應用場景,這些方面的研究相對較少。1.3相關知識3.人工智能的主要研究領域:

(2)自然語言處理(NaturalLanguageProcessing,NLP)

自然語言處理是人工智能領域的一個重要分支,它研究的是如何讓計算機理解和生成人類自然語言。自然語言處理(NLP)的研究范圍廣泛,包括語音轉文字、文字轉語音、文本語義抽取、文本情感分析、文本分類、語法分析等。1.3相關知識3.人工智能的主要研究領域:

(3)推理與決策

自動推理是基于知識的推理過程,它利用已有的知識庫和推理規則,通過邏輯推理得到新的結論或解決方案。自動推理在專家系統、醫療智能診斷等領域有著廣泛的應用。

規劃能力是指機器在給定目標和約束條件下,通過規劃算法找到實現目標的最佳路徑或策略。這一能力在機器人導航、自動駕駛等領域至關重要。1.3相關知識3.人工智能的主要研究領域:

(4)多智能體系統

多智能體系統是指由多個智能體(如機器人、智能軟件等)組成的系統,這些智能體之間可以相互通信、協作以完成共同的任務。例如,無人機編隊表演等。1.3相關知識

(5)機器學習

機器學習是人工智能的一個重要分支,它研究的是如何讓計算機從數據中自動學習并改進其性能。機器學習包括監督學習、無監督學習、半監督學習等多種學習方式。通過機器學習,計算機可以自動發現數據中的規律和模式,并據此進行預測和決策。機器學習在圖像識別、語音識別、自然語言處理等領域取得了顯著的成果。。3.人工智能的主要研究領域:

(6)深度學習

深度學習是機器學習的一種重要方法,它通過構建深層神經網絡來模擬人腦的學習過程。深度學習在圖像識別、語音識別、自然語言處理等領域取得了突破性的進展。1.3相關知識

(7)生成式人工智能

近年來,生成式人工智能(如文心一言、訊飛星火等)引發了廣泛關注。生成式人工智能通過預訓練大模型和生成式對抗網絡(GenerativeAdversarialNetworks,GAN)等技術,能夠生成逼真的文本、圖像、音頻等內容。3.人工智能的主要研究領域:

(8)人工智能社會與安全人工智能倫理關注AI技術公平、透明及可解釋性等。人工智能安全關注如何防止AI系統被惡意攻擊和濫用。1.3相關知識

(9)具身智能

具身智能是人工智能的一個發展領域,指一種智能系統或機器能夠通過感知和交互與環境進行實時互動的能力。可以簡單理解為各種不同形態的機器人,讓它們在真實的物理環境下執行各種各樣的任務,來完成人工智能的進化過程。4.人工智能的未來趨勢:

(1)量子計算與AI的結合

量子AI通過利用量子計算機的特殊性質,可以加速數據處理和模型訓練過程,實現更高效、更準確的AI應用。例如,量子AI可以在藥物發現、材料科學等領域實現更快速的模擬和預測,推動科學研究的進步。1.3相關知識4.人工智能的未來趨勢:

(2)生物啟發式計算與AI結合

如基于遺傳算法的AI藥物研發,模擬自然進化過程優化分子結構,加速新藥發現,提高藥物療效與安全性,展現生物計算與AI深度融合的創新潛力。1.3相關知識

(3)可解釋性AI與強化學習例如,電商推薦系統利用可解釋性技術,解釋強化學習模型的商品推薦邏輯,提高用戶信任度與滿意度,同時優化庫存管理和銷售策略,實現個性化與效益的雙重提升。4.人工智能的未來趨勢:

(4)聯邦學習(FederatedLearning)與數據隱私

聯邦學習允許在不共享數據的情況下訓練機器學習模型,從而保護用戶數據的隱私和安全。例如,在金融行業,多家銀行通過聯邦學習聯合訓練模型,共享模型參數而非直接共享客戶數據,有效保護了數據隱私,同時提升了信貸風險評估的準確性。1.3相關知識

(5)元學習與自適應AI

元學習是一種讓智能體學會如何學習的方法,通過元學習,智能體可以更快地適應新的任務和環境。例如,智能客服系統利用用戶反饋自動調整應答策略,實現更高效、個性化的客戶服務。4.人工智能的未來趨勢:

(6)教育改革與AI融合例如,智能教學系統根據學生個性化需求定制學習路徑,利用AI技術輔助教學,提升教學質量與效率,推動教育公平與個性化發展,引領教育現代化進程。1.3相關知識

(7)環境保護與資源優化AI例如,智能電網利用AI技術實現能源的高效分配和調度,提高能源利用效率并減少碳排放。。4.人工智能的未來趨勢:

(8)可持續交通與智慧城市AI

例如,利用AI技術進行城市人口流動分析和預測,可以為城市規劃者提供科學的決策依據。1.3相關知識

(9)大語言模型(LargeLanguageModel,LLM))和小語言模型(SmallLanguageModel,SLM)共存

大語言模型(LLM)其參數規模可達數千億至數萬億級別,主要部署于云端,支持機器翻譯、問答系統及文本生成等通用與復雜推理任務。

小語言模型SLM不僅能夠處理簡單的任務,如語音助手的基本交互,還能夠勝任更高級別的決策支持、個性化推薦等場景。同時,隨著邊緣計算技術的快速發展,終端設備的計算能力將進一步提升,SLM提供更加堅實的運行基礎,推動其在更多領域實現落地應用。

。5.人工智能社會影響:

(1)人工智能對社會發展的影響(2)數據隱私與安全(3)人工智能與就業(4)人機共存的未來展望1.3相關知識04項目實施123了解人工智能的發展歷史步驟一:步驟三:13.4項目實施了解人工智能的工作原理步驟二:了解人工智能的應用05項目拓展在掌握了個性化推薦原理后,同學們可以嘗試將社交媒體個性化推薦進一步劃分,并分級進行更加深入的研究。13.5項目拓展06項目小結

本項目以個性化推薦為例介紹了人工智能的產生背景、基本概念、發展歷程、研究領域、發展趨勢、人工智能倫理與社會影響等。

人工智能是定義。

人工智能歷史上共出現過AI思潮賦予機器邏輯推理能力、專家系統使得人工智能實用化、深度學習助力感知智能步入成熟共三次重要的發展浪潮。

人工智能研究領域包括感知能力、自然語言處理、推理與決策、多智能體系統、機器學習、深度學習、生成式人工智能、人工智能社會與安全、具身智能等。

人工智能未來趨勢包括量子計算與AI的結合、生物啟發式計算與AI結合、可解釋性AI與強化學習、聯邦學習與數據隱私、元學習與自適應AI、教育改革與AI融合、環境保護與資源優化AI、可持續交通與智慧城市AI、大語言模型(LargeLanguageModel,LLM))和小語言模型(SmallLanguageModel,SLM)共存等。

人工智能倫理與社會影響包括人工智能倫理的算法偏見、人工智能倫理的責任歸屬、數據保護法律、數據保護技術、人工智能與就業、人機共存的未來展望等。13.6項目小結07項目練習一、選擇題

1.在人工智能的發展史上,哪一事件標志著人工智能這一新興學科的正式誕生?(

)。A.1943年,神經科學家沃倫·麥卡洛克和沃爾特·皮茨提出第一個神經元數學模型。B.1950年,英國數學家艾倫·圖靈提出“圖靈測試”,作為判斷機器是否具有智能的標準。C.1956年夏季,在美國達特茅斯,以麥卡賽、明斯基、羅切斯特和申農等為首的學者首次提出了“人工智能”這一術語,并召開了相關研討會。D.1966年,斯坦福研究院的約瑟夫·魏澤鮑姆開發了ELIZA,一個能夠模仿心理治療師進行對話的計算機程序。

2.人工智能不包括(

)。A.自動駕駛

B.PhotoshopC.語音識別D.自然語言處理13.7項目練習一、選擇題

3.人工智能的感知能力是其基礎,其中哪個領域專注于研究如何讓機器“看”,并廣泛應用于自動駕駛、醫療影像分析和安防監控等領域?(

)A.語音識別

B.自然語言處理C.計算機視覺

D.機器人學

4.在人工智能的眾多應用中,哪一個領域通過模擬人類對話和交互,極大地提升了人機交互的自然性和便捷性?(

)A.自然語言處理B.語音識別與合成C.計算機視覺

13.7項目練習一、選擇題5.深度學習在以下哪個領域取得了突破性的進展,通過構建深層神經網絡來模擬人腦的學習過程?(

)A.邏輯電路設計

B.傳統統計分析

C.心理學研究

D.圖像識別與自然語言處理13.7項目練習二、填空題1.?“______”這一術語首次被在達特茅斯會議被提出。2.人工智能發展的三次浪潮,包括______、______、______步入成熟。3.在人工智能中,______技術利用已有的知識庫和推理規則,通過邏輯推理得到新的結論或解決方案。三、操作題請簡述深度學習技術在人工智能發展中的重要性及其主要應用領域。13.7項目練習授課結束謝謝觀看授課人:*老師

人工智能應用基礎授課人:周老師

技術篇項目2?機器學習與深度學習01項目描述05項目拓展02項目分析06項目小結03相關知識07項目練習04項目實施目錄項目描述01早上一縷陽光照進臥室,小明聽到一個熟悉的聲音:“現在是早上7點,新的一天開始了”。小明對這個聲音很熟悉,是臥室的智能音響發出的,小明還可以問它今天的天氣,并且自己打開窗簾。小明來到餐廳開始吃早餐,剛拿出手機想瀏覽今天的新聞,手機就自動解鎖了。當打開手機里的電商網站,第一時間就看到了自己喜歡的商品。幾年前仍是科幻小說里的場景,不僅成為小明每天的日常,也已經成為我們大部分人真實的生活經歷。2.1項目描述這背后是人工智能算法在驅動。

它們是怎么執行的?為什么會表現出像人一樣的智能?

小時也想學習人工智能技術,利用這項技術造福更多的人。因此,小明想了人工智能算法的相關知識。2.1項目描述02項目分析人工智能算法無時無刻不在影響我們的生活。目前人工智能算法中,機器學習與深度學習已成為主流,正是它們藏在我們身旁,才讓上面這一切以前不敢想的生活如今成為現實。要了解人工智能算法是怎么讓設備具有智能的,需要學習以下內容:1.

人工智能算法的分類2.

數據在計算機的表示方法3.算法的學習過程2.2項目分析03相關知識人類的智能我們可以根據三角形的定義,很容易區分出哪些是直角三角形2.3相關知識人類的智能也可以很容易區分出貓和狗的圖片,但此時規則變得很復雜,很難將規則寫成計算機程序。2.3相關知識貓

?頭型耳朵毛發五官五官長圓立折平突............狗

?定義規則人工智能的子類-機器學習讓計算機從數據中自動尋找規律,并利用學習到的規律對未知或無法觀測的數據進行預測,這樣的方法就被稱為機器學習,并可以用來完成各種識別任務。2.3相關知識人工智能的子類-深度學習深度學習是機器學習下的一個分支,它的核心是人工神經網絡(ArtificialNeuralNetwork,ANN)。它使用多層人工神經網絡來模擬人腦的神經元工作方式,數據輸入到神經網絡時會經過多次處理,相比于傳統機器學習而言會比較深,因而叫做深度學習。2.3相關知識人工智能的分類任何模仿人類或其它生物體智力或行為的方法都叫人工智能。而機器學習是人工智能領域中專指利用數據進行學習的技術,它無需依靠人來定義規則,深度學習則是機器學習領域中受人類神經系統啟發的一種技術。2.3相關知識數據的表示方法在面對聲音、圖像、文本等輸入數據時,語音識別任務可以根據人說話的音頻信號,判斷說話的內容;圖像識別根據輸入的圖片來判斷圖中的內容;機器翻譯則可以將輸入的某一種語言文字轉換成一種語言。學習的目的就是要掌握這些數據的規律,將他們轉換為對應的輸出。2.3相關知識文本表示在計算機中,每個字符都用一個數字表示,比如有字符串“helloworld”,會將每個字母用一個數字替代。如果是中文字符,會用十六進制來表示,因為英文字母總共只有26個,但漢字的數量有很多。2.3相關知識文本的分詞為了理解單詞的含義,需要將句子劃分為單詞,以單詞為基本單位來編碼,這個過程稱為分詞2.3相關知識圖像的表示一張黑白圖片,當我們將其中一塊區域放大后,就可以明顯的看到一個個的像素,它們通過一定的順序(矩陣形式)進行排列,像素是組成圖像的基本單位,每個像素用一個數字表示,叫做灰度值。比如0代表黑色,1代表白色,中間不同的灰度就用0到1之間的小數來代表2.3相關知識聲音的表示聲音是通過聲波進行傳播,聲波由物體的振動產生,再經介質傳播,最后到達人耳被人感知。計算機沒有耳朵,這時候我們就需要把聲波轉換成便于計算機存儲的數字信號。2.3相關知識聲波的數字化經過采樣-量化-編碼三個步驟將聲波轉換為能在計算機中存儲的數字編碼。2.3相關知識機器學習的過程預處理步驟把原始數據轉換成適合機器學習的數據格式,再通過特征提取與轉換步驟來獲得其中有用的特征,即數據中包含的可利用規律,最后根據這些提取的特征來預測數據內容。2.3相關知識機器學習到的特征特征是識別圖片內容所需要的關鍵信息,比如貓與狗的識別,機器實際上是在學習提取五官、紋理、輪廓等,然后將這些提取的特征進行比較來進行預測(貓或狗)2.3相關知識監督學習讓計算機“看”大量的手寫體數字樣本,并利用某種算法對計算機進行訓練,使其自動學習到這些數字隱含的特征信息。不過在將數字樣本給計算機“看”之前,需要先對每個樣本進行標注(也叫標簽)。將每個類別的數字圖片標注出來,相當于告訴計算機這些數字是什么,讓它們自己去學習(提取)其中的特征,這個過程稱為訓練。2.3相關知識監督學習在識別貓狗圖片時,用數字0代表貓,數字1代表狗,然后將標注后的數據進行訓練,當計算機識別出貓時就會輸出0,識別出狗時則會輸出1。2.3相關知識監督學習訓練用的數據和待預測的數據必須具有相似的規律。我們可以輸入不同水果的圖片訓練一個能識別水果的模型,水果的類別也僅限于模型已經見過的類別,但并不能用來識別手寫體數字。2.3相關知識無監督學習無監督學習模型的輸入數據集是不同類型的動物圖片,并且這些圖片是沒有任何標簽信息的,也就是說模型并不知道圖片中的動物是什么。此時,無監督學習的任務是自行識別動物的特征,根據不同動物之間的相似性將具有相同特征的動物聚集到同一組中,這個過程也稱為聚類。2.3相關知識04項目實施數據集展示30張用于垃圾分類的圖像,這此圖像此時是沒有任何標簽的,需要我們自己根據圖像中物體的材質將這些垃圾分為金屬、玻璃、塑料3類。——“垃圾分類數據”標注2.4項目實施打開EasyDL平臺進入EasyDL平臺:/easydl/,我們是要為圖像數據增加標簽信息,用于后續的分類任務,所以這里選擇“圖像分類”。——“垃圾分類數據”標注2.4項目實施創建數據集點擊右側的“數據總覽”,可以看到還沒有任何數據集,于是點擊“創建數據集”按鈕。——“垃圾分類數據”標注2.4項目實施填寫數據集信息在數據集名稱一欄填寫“垃圾分類”,其它信息可選擇默認值。——“垃圾分類數據”標注2.4項目實施上傳數據集點擊“創建并導入”按鈕,來到導入圖片頁面,導入方式一欄選擇“本地導入”和“上傳圖片”,然后選擇30張垃圾圖片,完成后開始導入,此時根據數據集的大小,會等待一段時間對數據進行導入。——“垃圾分類數據”標注2.4項目實施標注圖片導入成功后,我們點擊右側的“在線標注”來給圖片添加標簽信息。此時我們可以瀏覽每張導入的圖片,然后根據自己的判斷,在頁面左邊給圖片添加你認為正確的標簽信息。——“垃圾分類數據”標注2.4項目實施選擇擴充方法對圖片的擴充有多種方法,通過選擇各種不同的增強算子來實現,在增強算子一欄選擇“FlipLR”,該算子可以將數據集中的圖片進行左右翻轉來擴展原有的圖片數量。——“垃圾分類數據”標注2.4項目實施查看效果擴充完成后,查看數據集V2版本的內容,我們發現數據集的數量由原來的30張變成了60張,因為每張圖片都進行了一次左右翻轉,數量變成了原來的2倍。——“垃圾分類數據”標注2.4項目實施05項目拓展(1)如果部分數據標簽出現了錯誤,機器學習還能正常工作嗎?(2)給圖像做標簽時,用1來標簽貓,用0來標簽狗,如果反過來,用0標簽貓,用1標簽狗,機器還能正常學習嗎?2.5項目拓展06項目小結機器學習就是利用算法,使得機器能夠從大量數據中學習并自動改進其預測和決策能力,包括多種不同類型的學習方法,如監督學習、無監督學習等,而深度學習更加專注于使用深度神經網絡。在機器學習中,數據是至關重要的,通過大量的數據訓練,機器能夠逐漸掌握某種規律或模式,進而對新的數據進行預測和分類。2.6項目小結07項目練習一、選擇題

1.?深度學習中的核心概念是什么?(

)。

A.?機器學習B.?神經網絡C.?人工智能D.?計算機

2.?用機器學習來解決實際任務時,會面對多種多樣的數據形式,這些數據不包括(

)。A.?語音B.?文本C.?圖像D.?算法3.?機器學習在進行手寫體數字識別時,輸入的數據類型是哪種?(

)A.?文字B.?數字C.?圖像D.?聲音2.7項目練習一、選擇題

4.?在機器學習流程中,數據在進行特征提取之前,要先經過哪個步驟?(

A.?預處理B.?特征轉換C.?預測D.?學習

5.?監督學習與無監督學習的差別,主要表現在什么方面?(

)A.?數據是否相似B.?是否需要訓練C.?是否為深度學習D.?數據是否有標簽2.7項目練習二、填空題1.

是人工智能領域中專指利用數據進行學習的技術。2.

任務根據輸入的圖片來判斷圖中的內容。三、問答題監督學習是目前人工智能領域中最常用的方法,這種方法和人類的學習過程也比較類似。假設現在要訓練機器來識別蘋果和梨的圖像,請簡述一下監督學習的過程。2.7項目練習授課結束謝謝觀看授課人:周老師

人工智能應用基礎授課人:周老師

技術篇項目3?人工神經網絡01項目描述05項目拓展02項目分析06項目小結03相關知識07項目練習04項目實施目錄項目描述01小明去郊游,偶到一處突然被深深吸引:好一片山花爛漫!他再也不想多走一步,他拿出手機,想用識別軟件分辨這些花的名字。這些花有不同的顏色,大小,花瓣的形狀也不一樣,小明感到好奇,自己手機里的軟件到底是怎么辨別這些花朵的呢?這里面有些花連自己都看不出有什么區別,但識別軟件卻能將它們分辨出來。3.1項目描述這背后是深度學習和神經網絡的技術。神經網絡是怎么做到對一張圖片的內容進行識別的呢?深度學習和神經網絡又是什么關系呢?這是小明非常想了解的內容。3.1項目描述02項目分析科學家也模仿生物神經網絡來設計機器學習模型,希望它具備甚至超過人類的智能。我們把這種為機器設計的神經網絡,叫做人工神經網絡,它可以像人類一樣對各種數據進行感知、分析,并推理出結果,幫助我們進行決策。要利用人工神經網絡幫我們決策,需要學習以下內容:1.

神經網絡結構2.

單層神經網絡3.深層神經網絡3.2項目分析03相關知識生物神經網絡樹突(輸入機制)——接受輸入的樹狀結構。輸入可能是來自感覺神經細胞的感覺輸入,也可能是來自其他神經細胞的“計算”輸入。細胞體(計算機制)——匯合所有樹突的輸入,并基于這些信號決定是否激活輸出。軸突(輸出機制)——由細胞體向外沖出的最長的一條分支,一旦胞體決定激活輸出信號,軸突負責傳輸信號,通過末端的樹狀結構將信號傳遞給下一層神經元。3.3相關知識單層人工神經網絡-感知機結構美國心理學家FrankRosenblatt于1957年提出的一種具有單層計算單元的人工神經網絡,稱為感知機,這也是最簡單的人工神經網絡模型。3.3相關知識單層人工神經網絡-感知機結構輸入單元:圖2中的x1,x2,x3,對應圖1中生物神經元的樹突(輸入機制),接受輸入信號并傳遞給感知單元。感知單元:圖2中的黃色單元,對應圖1中生物神經元的細胞體(計算機制),通過求和的方式匯總所有輸入信號。輸出單元:圖2中的輸出,對應圖1中生物神經元的軸突(輸出機制),根據感知單元的值判斷是否激活細胞體,感知機的輸出就是激活的結果,可以傳遞到下一層的感知機。3.3相關知識感知機的預測過程某個周末,小明同學正在考慮是否出門去公園游玩,他考慮的條件有以下三個:1.天氣好嗎?2.小明的朋友會不會陪他去?3.公園離他家的距離是否很遠?3.3相關知識用數字1和0代表小明的選擇,取值的范圍如下:x1代表今天的天氣,x1=1(好),0(不好)x2代表朋友是否陪他去,x2=1(去),0(不去)x3代表他家離公司的距離,x3=1(近),0(遠)輸出值為1(小明會出門),或者為0(小明不出門)感知機的預測過程如果以上條件滿足:天氣好(x1=1),有朋友陪他去(x2=1),公園離家遠(x3=0),那么把這些信息輸入到神經網絡中。可以看到,輸入數值乘以對應鏈接的權值參數后,傳遞到感知單元匯總的值為5(大于0),因此,神經元被激活輸出1,得出小明會出門去公園游玩。3.3相關知識學習的過程小明以往出行記錄中的大部分用做訓練樣本,剩下的用于測試樣本,且這些數據都是有標注的,讓模型根據這些數據學習規律,而測試樣本則用來在訓練完成后幫助評估模型的學習效果3.3相關知識學習的算法學習的過程遵循數據輸入、輸出預測值、修正參數的反復循環迭代的過程。人工神經網絡模型初始時的參數隨機產生,所以預測值不正確,算法會計算出預測值與真實值的誤差,反饋給模型來對參數進行調整,而模型并不會一次將參數調整好,而是每次修改一點點,直到預測值與真實值的誤差足夠小,因此這個過程會持續很多次,根據參數的數量而有所不同。3.3相關知識深層神經網絡單個感知器并不是很強大,只能完成簡單的任務。為了讓我們的人工神經網絡學習諸如識別手寫體數字的復雜任務,我們會把數量更多的感知器連接在一起從而組成更高級的網絡,稱為深層人工神經網絡。3.3相關知識識別鳶尾花鳶尾花數據集,該數據集總共150個數據樣本,分為3類,每類50個數據,統計了花萼長度,花萼寬度,花瓣長度,花瓣寬度4個屬性,我們希望通過這四個屬性來預測鳶尾花屬于哪一類。3.3相關知識識別鳶尾花創建一個人工神經網絡,除了輸入層和輸出層之外,包含兩個隱藏層。因為數據集中每個樣本有四個屬性,所以輸入層的神經元必須是四個,用來分別接收鳶尾花的四個特征數據。輸出層有三個神經元,對應的是數據集中鳶尾花的三個類別。3.3相關知識識別手寫體數字假設有一個手寫數字的數據集,一共有7萬張手寫數字圖片,把其中6萬張用于訓練模型,剩下1萬張用于測試效果。3.3相關知識識別手寫體數字構造出的深層神經網絡有784個輸入單元和10個輸出單元。我們會把每張圖片按列拼接成一條直線(784個元素的一維數組),剛好可以輸入到這個神經網絡中,輸出單元數量對應預測數字的類別,數字為幾,相應的輸出單元就被激活(輸出1),其它單元都被抑制(輸出0)3.3相關知識04項目實施數據集展示30張用于垃圾分類的圖像,這此圖像此時是沒有任何標簽的,需要我們自己根據圖像中物體的材質將這些垃圾分為金屬、玻璃、塑料3類。——“車輛類型識別”3.4項目實施打開EasyDL平臺進入EasyDL平臺:/easydl/,選擇“圖像分類”,然后在左側選擇模型訓練,此時還沒有任務模型,我們點擊“訓練模型”按鈕。——“車輛類型識別”3.4項目實施模型準備在模型準備階段,我們選擇新建一個模型,并為其填寫上相關信息。——“車輛類型識別”3.4項目實施數據準備在數據準備階段,因為我們沒有自己的汽車數據集,所以選擇平臺為我們準備的公開數據集,選擇汽車類型分類V1數據,可以看到,這個數據集中共有6個類別的汽車圖片840張,并且都已經標記好了,可以直接使用,選擇完成后點擊“下一步”按鈕。——“車輛類型識別”3.4項目實施配置信息在訓練配置階段,我們選擇圖中相應的配置信息,然后開始訓練。訓練完成后,我們可以看到最終模型的預測效果。——“車輛類型識別”3.4項目實施05項目拓展越是復雜的神經網絡,想要訓練好它就需要更多的數據樣本。不過這些是值得的,如今我們有很多方法來獲取數據,相比起數據獲取,更難的反而是給每個數據樣打上標記。大家想一想,如果數據沒有標記,我們的神經網絡還能不能工作呢?3.5項目拓展06項目小結神經網絡是機器學習領域中的一種重要算法,通過模擬人腦神經系統的組織架構,以高度靈活的方式處理復雜數據模式。神經網絡的訓練是一個迭代優化過程,涵蓋從隨機初始化參數,向前傳播獲得預測,計算誤差,反饋誤差修改模型參數,然后不斷循環往復直至最終算法更新參數到理想狀態。每兩個神經元之間的連接都有一個與之相關的權重值,表示前一個神經元對后一個神經元的影響程度,也就是網絡的參數。網絡輸出:網絡的輸出會根據網絡的連接方式、權重值的不同而變化。通過調整這些參數,人工神經網絡能夠學習和適應不同的輸入模式,產生預期的輸出結果。3.6項目小結07項目練習一、選擇題

1.?人工神經網絡的基本組成單元是什么?(

A.?樹B.?節點C.?矩陣D.?神經元

2.?在神經網絡中,權重參數剛開始是多少?(

)A.?1

B.?0

C.?隨機產生D.?103.?最簡單的神經網絡又稱為什么?(

)A.?感知機B.?機器C.?深度模型D.?神經元3.7項目練習一、選擇題

4.?人工神經網絡的參數存儲在哪里?(

A.?軸突B.?樹突C.?神經元

D.?神經元之間的連接

5.?深層神經網絡在輸入層與輸出層之間的層稱為?(

)A.?中間層B.?隱藏層C.?神經元D.?深層3.7項目練習二、填空題1.通過對人腦的神經網絡進行模擬而設計的模型稱為

。2.構成神經網絡的基本單元是

。三、問答題簡述為什么需要深層的神經網絡。3.7項目練習授課結束謝謝觀看授課人:周老師

人工智能應用基礎授課人:周老師

技術篇項目4?計算機視覺01項目描述05項目拓展02項目分析06項目小結03相關知識07項目練習04項目實施目錄項目描述01小明的手機相冊中不僅有許多小貓、小狗的照片,也有大量人物、汽車、飛機等照片,它們有些同時出現在一張照片里面。雖然小明已經知道,識別照片是什么類別屬于一個圖像分類任務,但是當照片里面有多個物體時,比如即有小貓又有小狗,那么神經網絡要怎么對這張照片進行分類呢?小明非常想了解這背后的技術。4.1項目描述02項目分析我們經常拍攝或者看到的圖像往往都是具有多個類別的物體,當一張圖像中包含多個類別的很多物體時問題就變得復雜了,小明的任務可以看作是目標檢測,找出圖像中不同物體的位置并判斷其類別。要掌握以上各種圖像識別的知識,需要學習以下內容:1.

卷積神經網絡2.

圖像分類3.目標檢測4.2項目分析03相關知識識別動物類別假設有一個做好標記的動物圖像數據集,目的是要訓練一個神經網絡來識別出不同動物的類別。經過前面的學習,我們可以設計一個深層神經網絡。數據集中圖片的像素是100×100,為了能輸入到神經網絡中,將圖片中的每列像素依次頭尾拼接成一個1×10000的一維數組,剛好對應輸入層的10000個神經元。4.3相關知識模式檢測對于這個模型中的神經元而言,它要做的就是檢測圖像里面有沒有出現一些特別重要的模式(特征),這些模式代表了某種動物的特征。4.3相關知識特征提取人類在判斷一個物體的時候,往往也是抓最重要的特征,看到這些特征以后,就會直覺地看到了某種物體。對于機器而言,這是一個有效的判斷圖像中物體的方法,這個過程就是前面章節所說的特征提取。4.3相關知識深層特征提取各個層檢測的特征并不是一次就能識別出鳥嘴這樣具有抽象意義的高級特征的,而是隨著網絡的深度逐漸從簡單的邊緣和顏色信息過渡到更復雜的形狀和物體特征。4.3相關知識人工神經網絡的缺陷在神經網絡中,我們用每一層的一個神經元來判斷某種特定模式是否出現,也許并不需要每個神經元都去看一張完整的圖像。4.3相關知識人工神經網絡的缺陷神經元接受的輸入是整個圖像,但它自己的感受范圍是有限的,只能檢測出一定區域的鳥嘴。因此,出現在不同區域的同一個模式,可能需要多個神經元。而且,圖像輸入到神經網絡中卻需要被拉成一條直線,這也破壞了圖像本身的平面結構,可能會造成信息損失。4.3相關知識卷積神經網絡一個新的神經網絡結構,叫做卷積神經網絡(ConvolutionalNeuralNetwork,CNN),是一種現在非常典型的網絡架構,常用于圖像識別任務中。4.3相關知識卷積神經網絡整個網絡分為兩部分,前面由多個卷積層組成,用于接收輸入的圖像,并對圖像中的特征進行提取與轉換,后面一部分是由全連接層組成,跟我們前文介紹的神經網絡結構相同,用于接收卷積層提取的特征,并輸出分類的結果4.3相關知識卷積神經網絡內部組成在輸入層,神經元組成的平面必須與輸入的圖像大小保持一致才能完整的接收圖像的每個像素。在層與層的連接部分,神經元沒有與上一層的所有神經元保持連接,而是采用了部分連接,這就是我們分析的,圖像中并不是所有區域都存在我們要提取的特征,不需要將所有神經元都進行連接,這樣可以減少模型的參數。4.3相關知識卷積操作輸入一張彩色圖片,在卷積層,由于只有部分連接,因此該層上的一個神經元只能檢測到輸入圖片的一個有限區域,并通過一個叫做卷積的操作來計算這個區域有沒有相關的特征,如果有的話這個神經元就會被激活,并傳遞到下一層的神經元繼續檢測4.3相關知識滑動掃描神經元會按從左到右、從上到下的順序依次檢測對應的區域,直到圖片中所有區域都檢測完畢,這種檢測的方式叫做滑動掃描。掃描過程中,如果某個神經元的掃描區域內存在待檢測的特征,該神經元就會被激活。4.3相關知識垃圾分類我們的生活垃圾種類繁多,自己在分類時經常遇到不易分類的垃圾,很多人會產生選擇困難,于是可以讓卷積神經網絡來對垃圾圖片自動分類。數據集總共5萬張圖片的垃圾分類數據集,給這些圖片標記出5個類別,分別是硬紙、玻璃、金屬、報紙和塑料,每個類別有1萬張圖片。4.3相關知識垃圾分類模型首先用訓練集進行訓練,訓練完成后利用測試集評價模型效果。整體結構依然是先用卷積層提取特征,然后將提取的特征輸入到全連接神經網絡進行分類,最后的輸出層有5個神經元,分別對應垃圾的5個類別。4.3相關知識螺母對比除了對單張圖片分類,我們還可以使用孿生網絡,同時對兩張圖片進行對比。孿生網絡包含了兩個在結構上一模一樣的卷積模塊,它們是卷積神經網絡去掉最后的全連接層后留下的卷積層4.3相關知識目標檢測利用卷積神經網絡的分類能力,將輸入的圖像劃分出多個窗口,針對每個窗口進行特征提取,識別出窗口中內容的類別。在輸出端增加一個全連接層分類器,用于輸出目標的位置信息,位置可以表示為框住物體的矩形窗口的坐標,這樣我們的模型就能同時找出圖像中某一區域物體的類別和位置了。4.3相關知識目標檢測我們不知道圖像中哪些位置會有物體,也不知道物體的大小,所以必須在圖像中用不同大小、不同長寬比的候選框在整幅圖像上進行窮盡式的掃描,有時候多個窗口會重疊找出同一個物體,每個窗口都會被卷積神經網絡進行分類并輸出坐標,這種情況需要將輸出的多個窗口根據坐標合并成一個窗口。4.3相關知識缺陷檢測在工業自動化和質量控制領域,物體表面缺陷檢測技術扮演著至關重要的角色。我們可以利用卷積神經網絡分類和定位各種器件的表面缺陷,如劃痕、凹陷、裂紋等。4.3相關知識缺陷檢測先是收集數據并做標記,目標檢測的數據需要做兩個標記,一個是將圖像中待檢測的物體用矩形窗口框出來,并記錄坐標值。另一個是要標記該窗口內的物體類別,圖中共標記了缺色、凹陷、污漬、劃痕、裂紋5個類別。4.3相關知識缺陷檢測訓練模型時,輸入層接收標記好的表面缺陷數據,卷積層通過滑動窗口在數上掃描各種大小長寬不同的區域,對其進行特征提取,然后在全連接層預測類別與位置坐標,并與標記值進行比較,根據誤差修正模型參數,直到訓練完成。4.3相關知識車牌識別用神經網絡來進行車牌識別,需要將這個任務看作兩個階段的目標檢測,第一個階段檢測出車牌,第二階段在已檢測出的車牌上,再次檢測出車牌號。4.3相關知識具體有以下幾個步驟:1)收集車輛照片并標記出其中的車牌和車牌號信息;2)利用標記的數據訓練兩個神經網絡,分別用來檢測車牌與車牌上的號碼;3)將訓練好的模型進行車牌識別任務。車牌識別因為有兩個目標檢測任務,所以數據的標記也有兩類,首先要在汽車圖片中標記出車牌,包括類別和定位信息,這類數據只針對整個車牌,不包括車牌上的字符。然后對車牌圖片中的字符進行標記,同樣包括字符的類別和定位信息。4.3相關知識車牌識別得到標記數據后,先用車牌數據訓練第一個模型A,使其學會從汽車圖像中檢測出車牌,然后用車牌號數據訓練第二個模型B,使其學會從車牌圖像中檢測出車牌號碼。4.3相關知識車牌識別訓練完成后即可用測試樣本對其進行測試,將汽車圖片輸入第一個模型檢測出車牌,根據預測車牌位置坐標從原始輸入圖片中截取出車牌部分,輸入到第二個模型進行車牌號的檢測。4.3相關知識04項目實施打開EasyDL平臺進入百度智能云平臺的動物識別頁面:/product/imagerecognition/animal,里面有一個動物識別的體驗功能。——“動物識別”4.4項目實施上傳圖片數據準備一些動物圖片進行識別,測試一下能不能正確識別。——“動物識別”4.4項目實施查看結果可以看到各個圖片的識別效果,無論是一張圖里有多個動物還是有人類,模型都能準備的預測出正確的類別,但對于卡通類型的動物圖片卻不能很好的識別,大家想一想這是為什么呢?——“動物識別”4.4項目實施進入百度智能云平臺進入百度智能云平臺的人體關鍵點檢測頁面:/product/body/pose,里面同樣有一個人體關鍵點檢測的體驗功能。不僅能檢測出圖像中的所有人體,還能精準定位人體的21個主要關鍵點,包含頭頂、五官、頸部、四肢主要關節部位等。可以進入這個頁面,點擊本地上傳按鈕,試著上傳一張自己和朋友的照片,查看一下能否檢測出人體的各個關鍵部位。——“人臉關鍵點檢測”4.4項目實施05項目拓展目標檢測任務中,在尋找圖像中的目標是,采用的是滑動窗口的方法,滑動窗口是一個個大小不一的矩形框,用這個框去遍歷所有的位置以及所有可能的大小。遍歷得越精確,檢測器的精度就越高。但這也就帶來一個問題就是:檢測的耗時非常大。比如輸入圖片大小是800×1000,也就意味著有800000個位置。窗口大小最小是1×1,最大800×1000,所以這個遍歷的次數幾乎是無限次的。我們還有一種方法就是,將輸入圖像分為S×S個網格,每個網格檢測自己范圍內的一個物體和他們的邊界框,這樣可以節省很掃描時間。你還能想出其它檢測掃描時間的方法嗎?4.5項目拓展06項目小結在卷積神經網絡中,卷積操作是指將一個可移動的小窗口在圖像上進行滑動尋找特征,然后一層層傳遞下去,直到全連接層進行分類。利用卷積神經網絡,我們最終完成了目標檢測任務,可以在一張圖像中找出多個物體并預測該物體的坐標。在進行目標檢測任務之前,我們首先得學會圖像分類任務,這個任務的特點是輸入一張圖片,輸出是它的類別。因為目標檢測本質上就是對多個物體的分類,另外多了一個預測邊界框的任務。最后我們了解了利用卷積神經網絡進行車牌識別的案例。4.6項目小結07項目練習一、選擇題

1.?在圖像識別任務中,卷積神經網絡的哪一層主要負責特征提取?(

A.?輸入層B.?卷積層C.?輸出層D.?全連接層

2.?圖像識別任務中,哪個步驟通常涉及將圖像調整為固定大小?(

)A.?數據預處理B.?特征提取C.?分類D.?測試3.?哪種神經網絡結構特別適用于處理具有矩形結構的圖像數據?(

)A.?感知機B.?全連接神經網絡C.?卷積神經網絡D.?神經元4.7項目練習一、選擇題

4.?識別一張圖像中有多少個物體及其所處位置,稱為什么任務?(

A.?圖像識別B.?圖像分類

C.?目標定位D.?目標檢測

5.?在用CNN進行圖像分類時,全連接層的主要作用是什么?(

)A.?特征提取

B.?激活C.?分類

D.?預處理4.7項目練習二、填空題1.卷積神經網絡結構包含輸入層、

、全連接層。2.卷積層采用

的方法,大大減少了模型參數。三、問答題在圖片分類中,卷積神經網絡相比于全連接層的神經網絡有什么優勢?4.7項目練習授課結束謝謝觀看授課人:周老師

人工智能應用基礎授課人:周老師

技術篇項目6?生成式人工智能01項目描述05項目拓展02項目分析06項目小結03相關知識07項目練習04項目實施目錄項目描述01小明在網上商城購物,如果看中了自己喜歡的衣服,可以隨時在商城一個叫做在線試衣間的頁面給自己的虛擬人物換衣服,這樣他就可以更方便的找到適合自己的衣服了。他還發現自己手機里很多智能軟件可以生成自己不同風格的照片。這背后一定又是人工智能在發揮作用。但同時他也發現,給虛擬人物更換衣服,或者給自己的照片更換不同的風格好像跟以前學到的圖像識別、目標檢測都不一樣,自己在學習人工智能的道路上似乎又遇到了瓶頸,小明現在急許解開這些謎團。6.1項目描述02項目分析人臉識別、車牌識別屬于利用深度學習能完成的最基本的事情,這些任務要求人工智能識別出某些事物,包括圖像、聲音、文本等,然后給他們進行分類,判斷這些事情分別是什么。但還有一類任務,他們不再是做簡單的分類,而可以自己生成一些你沒見過的事物,小明看到的在線試衣間就屬于此類。了解在線試衣間的相關技術,需要學習以下內容:1.

生成式模型2.

圖像生成3.圖像描述6.2項目分析03相關知識生成式模型生成式人工智能利用某個數據集中的樣本來訓練機器學習模型。然后,由用戶輸入某些提示,讓模型為我們成生與訓練數據類似的輸出。6.3相關知識自動編碼器自動編碼器是一種生成模型,由編碼器和解碼器組成,它們通常情況下是結構相同的兩個神經網絡,可以由全連接層組成,也可以是由卷積層組成的。編碼器的任務將輸入數據轉換為一個特征向量,解碼器將該特征向量進行解碼重建,轉換為輸入數據的樣子,從而使其具備了生成數據的能力。6.3相關知識自動編碼器進行圖像降噪對于一個訓練好的自動編碼器模型,只要隨機采樣一些像素值輸入到模型進行編碼、解碼之后,可以得到與訓練集圖像類似的新圖像,這可以幫我們創建一些新的數字圖片。6.3相關知識自動編碼器生成新圖像也可以隨機的改變特征向量中部分值,解碼器部分就可以用來從修改過的特征向量創建新的圖像,得到與訓練集圖像類似但不同于訓練集中任何一張圖像的新圖像。6.3相關知識生成對抗模型專業工廠與普通工廠之間生產零件的對抗6.3相關知識生成對抗模型用生成對抗模型訓練圖像生成器6.3相關知識生成對抗模型核心部件:生成器與對抗器生成器和判別器采取交替訓練先訓練生成器,然后訓練判別器,不斷往復,使生成器和判別器的對抗關系形成了一種動態平衡。生成器試圖最大化判別器犯錯的概率判別器則努力減小這種誤判。這種對抗訓練機制使得生成器能夠生成越來越高質量的數據,同時也提高了判別器的鑒別能力。6.3相關知識生成對抗模型生成圖片樣例6.3相關知識生成對抗模型生成出手寫數字圖片6.3相關知識生成對抗模型面對多種手寫體時的缺陷,生成器只會生成其一種或幾種,就足以通過鑒別器的鑒別6.3相關知識生成對抗模型解決方法:多個生成器組成的生成對抗模型6.3相關知識風格遷移用自動編碼器實現6.3相關知識風格遷移用生成對抗模型實現。根據輸入的隨機噪聲來生成數據的,輸入不同的噪聲就會生成不一樣的圖像,新圖像跟訓練數據集相似。6.3相關知識但無法去控制這種隨機性。不能控制生成器具體的輸出內容,僅僅能保證新生成的圖像是逼近訓練數據集中出現過的帶條件的生成對抗模型將某種條件,如圖像、文本或屬性標簽值添加到隨機噪聲圖像中一起輸入到生成器里,通常條件與噪聲圖像直接拼接在一起即可。生成器的輸出就不僅依賴于隨機噪聲,還要加上條件,而這個條件是我們可以控制的。6.3相關知識帶條件的生成對抗模型風格遷移:將一些風格圖像作為條件與隨機噪聲拼接在一起輸入到生成器,用來控制生成器輸出的圖像風格。6.3相關知識帶條件的生成對抗模型訓練一個手繪風格遷移的模型,在訓練生成器生成貓的圖片時,將手繪的草圖作為條件與噪聲一起輸入,來控制生成圖像的輪廓6.3相關知識文本描述生成圖像基于文本描述來生成圖像內容6.3相關知識文本描述生成圖像將文字作與噪聲圖像一起作為條件輸入生成對抗模型進行訓練。訓練生成器的圖像數據集需要很大,盡可能多的包含文字可能描述的內容。如果文字中提到眼鏡,但圖像數據集中沒有眼鏡的圖像,那說明生成器從來沒有接受過眼鏡圖像的訓練,自然無法生成。6.3相關知識圖像描述將圖像概括成文本,通過一段文字來描述,從而實現輔助理解一些常人難以理解的圖像,又稱圖像字幕生成。6.3相關知識圖像描述常用的流程包括:圖像特征提取和將圖像翻譯為文字。1、使用卷積神經網絡提取圖像的特征向,特征包括圖像中的對象、場景和它們之間的關系。2、將提取的圖像特征看作一種文本,輸入到某種翻譯模型中,根據圖像特征中的信息生成符合語法和語義的文本描述,整個過程類似于將圖像翻譯為文字。6.3相關知識圖像描述圖像描述任務所需要的數據集是很大的,并且每張圖像都有對應人工標記,這些標記內容就是圖像的描述文本。標記的內容決定了在遇到類似圖片時,會優先生成與標記風格類似的文本。6.3相關知識圖像描述樣例圖像描述基于單詞的圖像描述方法:先從圖像中提取單詞,然后由單詞組成多個候選句子,最后對這些候選句子進行篩選或合并,形成最終的描述文本。需要一個目標檢測模型來提取一副圖像中所包含的可識別物體,該物體的類別即可對應要生成的單詞,而單詞之間的關系可通過物體邊界框的位置來確定6.3相關知識04項目實施1、打開EasyDL平臺進入頁面:/product/face/merge,在該頁面中點擊“本地上傳”按鈕來指定目標圖和模版圖,目標圖將與模板圖進行融合,輸出一張融合后的人臉。——“人臉融合”6.4項目實施2、上傳圖片自己上傳兩張圖片,分別作為模板圖和目標圖,并查看最終效果。05項目拓展如果我們要把自己的樣子變成喜歡的動漫人物,也可以用條件生成對抗模型來完成。類比風格遷移的話,動漫人物就是一種風格,我們要做的是把動漫中的人物風格遷移到自己的照片中。這種模型要怎么訓練你能說出來嗎?6.5項目拓展06項目小結自動編碼器網絡和生成對抗網絡,這兩個模型都屬于自監督學習,在訓練時不需要給數據做上標記,而是以數據本身作為學習的目標,這可以節省大量的工作。利用生成式模型,我們可以創造一些原來沒有的數據,生成一些意想不到的圖像或是文本,比如圖像去噪、風格遷移、利用文本生成對應的圖像和用文本描述圖像內容等。但是為了完成這些任務,模型需要有大量的訓練數據,才能保證結果能接受。6.6項目小結07項目練習一、選擇題

1.?生成式人工智能的目標是什么?(

A.?提高訓練速度B.?提高計算效率C.?模擬人類的創造力D.?實現自動化生產2.?生成式模型能夠生成哪些類型的數據?(

)A.?文本

B.?圖像C.?音頻D.?文本、圖像、音頻和視頻等多種類型的數據3.?生成對抗網絡的作用是什么?(

)A.?生成逼真的圖像、文字、視頻等B.?優化數據存儲C.?圖像識別D.?目標檢測6.7項目練習一、選擇題

4.?生成式人工智能在文本生成方面的應用不包括以下哪一項?(

A.?創作新聞文章B.?生成詩歌C.?編寫程序代碼D.?實現語音識別5.?以下哪項不是生成式人工智能的關鍵技術?(

)A.?深度學習B.?樣本標簽C.?神經網絡D.?生成對抗模型6.7項目練習二、填空題1.自動編碼器由

兩部分組成。2.生成式人工智能的最大區別在于能根據訓練數據生成新數據,如文本、

和音頻等。三、問答題簡述生成對抗網絡的訓練過程與傳統的分類模型有什么不一樣。6.7項目練習授課結束謝謝觀看授課人:周老師

人工智能應用基礎授課人:周老師

技術篇項目5?自然語言處理01項目描述05項目拓展02項目分析06項目小結03相關知識07項目練習04項目實施目錄項目描述01文字是我們傳遞信息的基本媒介,在互聯網高度發達的今天,文字形式的信息也以爆炸式的速度增長著。媒體一刻不停地在網絡上發布著最新的新聞,人們隨時隨地通過手機談論著身邊的事情,每時每刻都有大量的文字從各種渠道生產出來。面對海量的文本數據,我們又該用什么樣的人工智能技術對其進行分析與理解,從而節省人類有限的閱讀時間與精力呢?5.1項目描述02項目分析為了使用人工智能技術理解文本內容以及發掘文本的潛在語義,需要建立龐大的語料庫,將文字編碼為機器能“閱讀”的數據格式。當遇到大量的文本信息,諸如博客,新聞,書籍等大文檔,怎么快速的從中理解關鍵信息就是自然語言處理可以發揮作用的地方。全面了解自然語言處理的關鍵技術,需要學習以下內容:1.

文本表示方法2.

文檔分類3.機器翻譯5.2項目分析03相關知識文本表示自然語言處理中的第一個關鍵步驟是將原始文本轉換為計算機可以有效處理的格式。最基本的處理流程包括預處理、分詞、編碼三個步驟。5.3相關知識編碼的過程①預處理:在處理文本之前,文本需要標準化以確保一致性,如刪除標點符號。對于英文來說還需要統一字母大小寫,或者一些縮寫的形式,比如:“I’m”和“Iam”。②分詞:預處理后的文本需要拆分為單詞,也稱為token。例如,句子“我愛北京天安門”,分詞結果為:“我/愛/北京/天安門”,而英文句子的分詞可以根據單詞之間的空格進行拆分。③編碼:由于計算機以數字為依據進行操作,每個token都會轉換為數字表示。最簡單的方法可以為每個token分配一個唯一的數字標識符。“我/正在/學習/人工智能”分配的數字分別為5,22,16,73。除了這個直接轉換為數字的方法,也可以將token轉換成一個多維向量的形式,叫做獨熱編碼(one-hot)5.3相關知識獨熱編碼基本思想是使用一個跟句子長度一樣的向量來表示一個詞,向量中只在該詞出現的位置設置為1,其余全部為0。比如我們的句子一共有4個詞{我,正在,學習,人工智能},那么向量長度則為4,“我”就表示為[1,0,0,0,],“正在”就表示為[0,1,0,0],“學習”就表示為[0,0,1,0],“人工智能”就表示為[0,0,0,1]。5.3相關知識詞嵌入詞嵌入將文本表示為一個詞向量,是一種將詞匯表中的每個單詞映射到一個高維向量的技術。將獨熱編碼改成詞向量后,男人、女人、國王、皇后四個詞語,映射到一個7維的空間中,每個詞語都對應了一個7維的向量。這樣,每個單詞在這個空間內都有一個唯一的、稠密的實數向量作為表示,稱為詞向量。5.3相關知識詞嵌入詞向量可以發掘出詞與詞的類比關系,我們可以在詞向量上做加法和減法,最后得到一些有趣的結果。比如:國王-男人+女人=皇后,國王-皇后=男人-女人。按照這種方法表示出:中國-北京=法國-巴黎,do-did=go–went等等。5.3相關知識詞向量的應用假設小明要做一個性格測試,要從不同維度上給自己在0到100的范圍打分。5.3相關知識詞向量的應用小明認為自己比較外向,給自己在“外向-內向”的維度上在打了20分。這里0分是極度外向,100分是極度內向。然后標準化一下得分,使其保持在-1和1之間,得到的分數是-0.4,這樣小明在“外向-內向”的維度由一個實數-0.4來表示,該維度可看成是描述性格的一個特征。5.3相關知識詞向量的應用按照同樣的方法在第二個特征上打分,先在0~100之間打分,再標準化后得到0.8。現在小明的性格可以由[-0.4,0.8]的二維向量來表示。5.3相關知識詞向量的應用可以根據這個向量在前兩個特征上的得分看對方是否和自己性格相似,這時候的性格只考慮了二個特征維度。5.3相關知識詞向量的應用對性格特征完整打分后轉換成4維向量,每一個維度上的數字就代表性格中某一特征的得分,計算機很容易能計算出這些向量之間的相似程度。如果將它運用到單詞中,就是詞嵌入。5.3相關知識詞向量的應用選擇一些英文單語如:cat,kitten,dog,houses,利用詞嵌入生成多維的詞向量。然后使用降維算法,將詞向量降維至2維,從而在平面上將詞向量繪制出來。在自然語言處理中,詞嵌入把單詞(word)轉換成實數向量(vector),因此大家都也把詞嵌入稱為word2vec,用到的技術最多的也是神經網絡。5.3相關知識詞向量的應用當嵌入“學習”這個詞,可以把“我”,“正在”,“學習”,“人工智能”這幾個上下文單詞一同輸入神經網絡,這樣能夠更好的表現“學習”在語句中的含義與位置。當然,輸入到神經網絡的是這些單詞的編碼,可以是簡單的數字編碼,也可以是獨熱編碼,最終輸出“學習”這個詞的詞向量。5.3相關知識文檔主題分類對于多個單詞組成的句子,我們利用詞嵌入技術將句子中的單詞生成對應的詞向量后,將這些詞向量拼接起來形成表示整個句子的向量。這個向量會比較長,可以再通過一個神經網絡進行轉換,來生成一個維度比較小的句子向量。5.3相關知識文檔主題分類同樣的原理,我們可以用句向量再組合成文檔向量,然后用最終生成的文檔向量來代表整個文檔的嵌入表達。5.3相關知識情感傾向分析將情感傾向分析看作一個分類任務,將情感分為正面、負面和中性三類。英文句子:“Ilikethisphotoverymuch!”。該句子包含七個“元素”,采用詞嵌入的方法將這個七個元素轉換成詞向量(標點符號也可以看作一個單詞),假設每個“詞向量”的維度被設定為5,那么整個句子可以表示成一個7行5列矩陣。5.3相關知識情感傾向分析形成的矩陣在計算機看來跟一張分辨率為7×5的圖像是差不多的,而卷積神經網絡剛好特別擅長圖像分類,于是可以搭建一個卷積神經網絡模型,并用大量標注過的文本數據將模型訓練好,然后對這個矩陣進行分類,分類的結果設置為情感分析的三個類別:正面、負面、中性5.3相關知識機器翻譯用于實現不同語言之間的自動轉換,常見的模型有循環神經網絡(RecurrentNeuralNetwork,RNN)模型和Transformer模型。常見的RNN模型結構,該模型有兩個隱藏層。RNN是專門設計用來處理序列數據的深度學習模型,與傳統的神經網絡不同,RNN具有循環結構5.3相關知識機器翻譯在翻譯一個句子時,比如“知識就是力量”,這是一個文字序列,用RNN翻譯時,會把輸出結構又連接回輸入,這種結構特別適合用來處理序列。我們把RNN的結構展開,查看它的結構。5.3相關知識機器翻譯機器翻譯前,要將句子進行編碼(one-hot,或者是詞向量),可以將編碼這一步也用一個RNN實現,并統一到整個翻譯架構中,形成RNN翻譯框架。5.3相關知識Transformer注意力模型注意力機制的目標是計算當前單詞與整個句子中其它單詞的相關性,經過計算后,假設“知”與“識”的相關性得分為0.8,但是與“就”的相關性得分只為0.2,說明“知”與“識”更相關,通過這種方式就可以得到整個句子中每兩個單詞之間的關系。5.3相關知識Transformer注意力模型計算出“知”與其它所有詞的相關性得分后,根據分數進行加權求和,生成編碼e0,與“知”相關性得分越大的詞,如“識”、“力”,“量”,在編碼e0中所占的比重就越大。5.3相關知識Transformer注意力模型句子經過多次編碼之后,會再通過解碼器進行解碼。解碼器也是基于同樣的注意力機制,并且是多層的。編碼器負責將輸入序列(源語言句子)轉換為一個向量表示(上下文向量),這個表示包含了輸入序列的所有信息。解碼器則根據這個向量逐步生成輸出序列(目標語言句子),從而實現翻譯。5.3相關知識04項目實施打開EasyDL平臺通過網址進入到百度智能云平臺的文本情感傾向分析的主頁面:/product/nlp_apply/sentiment_classify,里面有一個情感分析的演示功能。——“情感傾向分類”5.4項目實施輸入文本在文本框中輸入一段帶有感情色彩的文字,如“人工智能很難學,但是非常有用,我很想學好”,在你輸入文字的過程中,頁面會實時的分析內容,我們可以在文本框下面查看情感傾向結果。——“情感傾向分類”5.4項目實施05項目拓展通過網址進入到百度智能云平臺的地址信息識別的主頁面:/product/nlp_apply/address,里面有一個地址識別的演示功能,可以幫我們抽取文本中的地址信息。輸入一段地址信息,如“湖南省長沙市岳麓區含浦路139號張,然后點擊“開始分析”按鈕,即可在下方結果欄看到抽取的結果5.5項目拓展06項目小結在自然語言處理中,詞嵌入表示是關鍵部分,可用神經網絡模型生成詞向量。在詞向量中,單詞每個維度用一個實數向量來表示。因此,通過向量來代表單詞,可以將單詞置于高維度的空間中,意義相近的單詞在空間中傾向于聚集在一起,共同表達相似的意思。注意力機制是一種模仿人類視覺和認知系統的方法,它允許神經網絡在處理輸入數據時集中注意力于相關的部分。通過引入注意力機制,神經網絡能夠自動地學習并選擇性地關注輸入中的重要信息,提高模型的性能和泛化能力。5.6項目小結07項目練習一、選擇題

1.?將原始文本轉換為計算機可以有效處理的格式,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論