




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
《自然語言處理》教學大綱課程名稱:自然語言處理(NaturalLanguageProcessing,NLP)課程編碼:1502ZY156課程類別:專業課-限選學分:2.5分總學時:40學時,其中理論學時:28學時,上機學時:12學時適用專業:電子信息工程先修課程:線性代數、概率論與數理統計、Python、人工智能導論、機器學習楊伏洲一、課程性質本課程是電子信息工程專業的專業選修課。學生通過本課程的學習,理解自然語言處理的基本概念、任務及基本分析方法,從數理基礎、方法與應用、前沿專題三個層次培養學生的科學思維方法。鼓勵學生針對某一方向深入思考,引導學生應用所學知識建模解決相關問題,在實踐分析中深化相關問題的理解。二、課程目標(一)育人目標從培養學生的辯證思維方式,愛國教育、社會責任、人生領悟、民族自信等方面入手,將育人要素和自然語言處理專業知識嵌入到課堂中教學,凝聚學生對社會主義核心價值觀的共識。通過科學家故事學習科學精神,通過課程概念原理學習系統論、工程論、科學思維,利用自然語言處理應用研究學習科技自信及愛國主義情懷,師生互動進行“三觀”教育和學習方法指導,培養學生的專業素質和職業道德,全面提高學生緣事析理、明辨是非的能力,培養學生成為德才兼備、全面發展的人才。(二)知識和能力目標1、理解自然語言處理的基本概念、基本理論,將其應用于人工智能中語言模型、句法分析、語義分析、情感分析、詞向量等問題。(畢業要求1.4);2、能夠使用統計概率、機器學習、信息檢索、自然語言處理等理論方法,求解自然語言中實際應用問題,使學生真正做到理論與實際相結合,將所學相關理論知識與真實應用場景結合起來。(畢業要求2.2)。課程目標與畢業要求指標點對應關系課程目標畢業要求指標點課程目標1畢業要求1.4,具有計算機系統、信息處理及機器學習專業知識,并能將其應用于解決復雜人工智能的應用問題。課程目標2畢業要求2.2,能認識到解決人工智能應用問題有多種方案,并能通過文獻研究分析尋求有效解決方案。三、基本要求本課程的教學是以人工智能應用為背景、以自然語言處理的基本原理為主線,講述自然語言處理領域的核心概念、任務和方法,兼顧經典理論和前沿研究方向,重視理解和掌握基本原理和方法,從數理基礎、方法與應用、前沿專題三個層次培養學生的科學思維方法。鼓勵學生針對某一方向深入思考,引導學生應用所學知識建模解決相關問題,在實踐分析中深化相關問題的理解。教學過程中要注意與先修課程基礎知識的聯系,掌握自然語言處理的基本概念、基本原理、主要特性、基本方法。在自然語言處理的講述中,注意培養學生綜合運用所學知識的能力,同時使用統計概率、信息學、數據挖掘、機器學習、信息檢索、自然語言處理等理論方法求解自然語言中實際應用問題,如序列標注學習問題(分詞/詞性標注/命名實體識別/依存語法樹等),文本摘要問題,智能問答系統等。掌握自然語言處理的基本方法,使學生真正做到理論與實際相結合,能夠將所學的相關理論知識與真實應用下的場景落地相結合,通過實踐項目引導學生進一步深入探究,鼓勵積極思考與創新,培養學生實際分析問題、解決問題的能力。四、教學內容分章節說明教學內容,課時安排,并說明教學重點、主要教學模式(包括授課、自學、實驗、課堂討論、作業等)。章節教學內容授課學時思政元素教學模式對應課程目標1自然語言處理綜述4培養學生理解自然語言的基本概念,通過語言的不同特征拓展學生在NLP方面的知識,激勵學生實踐相關內容。課堂授課,課堂討論課程目標12語言模型(N-gram語言模型)6就各種算法的復雜性和實際應用展開思考,培養學生語言模型的發散思維,如何突破語言模型的各種局限。課堂授課,課堂討論課程目標13序列標注問題(Sequencelabellingproblem)6通過一些算法的來歷來激勵學生在特定算法上的優化,尤其以辯證法來思考問題,提高質疑精神。課堂授課,課堂討論課程目標14句法、語義及情感分析6提出語言意識與語言心理學一些基本知識,了解新技術現狀并初步應用。課堂授課,課堂討論課程目標1/25詞向量6借助于科大訊飛、百度等語音識別平臺,讓學生思考如何突破局限、如何實現離線識別等內容。課堂授課,課堂討論課程目標1/2第一章自然語言處理綜述1、人工智能發展歷史綜述2、機器學習知識3、自然語言處理層次架構4、具體任務介紹5、經驗主義方法本章重點:熟悉不同領域自然語言處理應用問題及方法等,自然語言處理基本技術方法。能力:能夠查閱不同領域自然語言處理應用問題及方法相關科技文獻,熟悉自然語言處理基本技術方法第二章語言模型(N-gram語言模型)1、N-Gram語言模型2、鏈式規則ChainRule平滑處理技術本章重點:理解自然語言處理相關語言模型基礎理論;理解相關平滑處理技術能力:能夠運用N-Gram語言模型進行簡單語言分析。第三章序列標注問題(Sequencelabellingproblem)1、離散/連續馬爾科夫模型2、中文分詞3、詞性標注4、命名實體識別本章重點:理解序列標注學習極其相關應用等能力:能夠應用馬爾科夫模型進行相關語言模型的簡單分析。第四章句法、語義及情感分析1、上下文無關文及自上而下句法分析2、概率上下文無關文法及依存語法樹3、語義角色及語義角色標注4、基于句法樹方法5、感情傾向性分析本章重點:理解自然語言中語法分析、語義分析及情感分析等基礎理論知識能力:理解自然語言中語法分析、語義分析及情感分析的基礎理論和相關分析方法,并能夠查閱相關科技文獻。第五章詞向量1、Word2vec詞向量2、基于循環神經網絡語言模型本章重點:掌握Word2vec詞向量的分析方法;掌握基于循環神經網絡語言模型的應用。能力:能夠應用Word2vec詞向量、基于循環神經網絡語言模型開展自然語言處理的實際相關應用。五、上機內容與學時分配上機項目與類型序號上機項目學時上機性質演示驗證綜合設計1基于規則的分詞算法4√2隱馬爾可夫模型在分詞中的應用4√3基于K-means的文本聚類方法4√上機一基于規則的分詞算法1.目的要求掌握完全切分,正向最長匹配,逆向最長匹配,雙向最長匹配,且比較三種匹配效率。2.主要使用儀器計算機、Python。掌握要點掌握正向最長匹配算法,逆向最長匹配算法,雙向最長匹配算法。4.實驗內容基于字典、詞庫匹配的分詞方法(基于規則),將待分的句子與一個大的詞典中的詞語進行匹配。上機二隱馬爾可夫模型在分詞中的應用1、目的要求中文分詞序列標注的BMES,序列標準初始狀態概率向量,狀態轉移概率矩陣,發射概率矩陣如何求出2.主要使用儀器計算機、Python。3.掌握要點了解BMES基本概念,熟悉隱馬爾可夫模型的應用,。4.實驗內容序列標注問題包括自然語言處理中的分詞,詞性標注,命名實體識別,關鍵詞抽取,詞義角色標注等。首先對中文分詞進行標注,根據語料計算初始狀態概率、狀態轉移概率、輸出觀測概率三個概率矩陣,使用維比特算法獲得句子的最大概率分詞標記序列。上機三基于K-means的文本聚類方法目的要求記錄有某音樂網站6位用戶點播的歌曲流派,給定用戶名稱和九種音樂類型的播放數量,通過K-means將6位用戶分成3簇。主要使用儀器計算機、Python。3.掌握要點聚類準則、聚類特征類型、聚類算法、K-means算法。4.實驗內容預將數據分為K組,則隨機選取K個對象作為初始的聚類中心,然后計算每個對象與各個種子聚類中心之間的距離,把每個對象分配給距離它最近的聚類中心。聚類中心以及分配給它們的對象就代表一個聚類。每分配一個樣本,聚類的聚類中心會根據聚類中現有的對象被重新計算。這個過程將不斷重復直到滿足某個終止條件。終止條件可以是沒有(或最小數目)對象被重新分配給不同的聚類,沒有(或最小數目)聚類中心再發生變化,誤差平方和局部最小。六、教學方法本課程以“以學生為中心,以OBE培養目標”為教學理念。為了提高教學質量,增強學生綜合分析能力,采用理論教學、課堂與課堂研討等相結合的教學方式方法,達到使學生掌握自然語言處理基本處理方法的教學目標。主要教學環節包括課堂教學、課堂研討、課堂練習以及課后自學。課堂教學根據教學計劃中的教學內容將教學知識點進行梳理劃分,對于重、難點部分主要以授課為主,對于拓展型知識點包括相關的技術應用主要以學生聯想和討論為主;課堂上對于自然語言處理抽象、深奧的問題與概念,采用圖文并茂的多媒體課件代替板書,以形象、生動、直觀的方式展現從而保證學生的聽課效果。課堂、課后習題和自學課堂上采用多種教學方式吸引學生注意力,包括啟發式教學、適時向學生提問題、引起學生的思考。針對知識點主要設置探究式問題,引導學生分析和解決問題,培養學生的自主思考及創新能力;針對實際應用情況主要采用學生自由討論的方式,加深學生對知識點的理解。下課前對所學內容進行總結,加強學生的自學能力和學習方法。課堂研討隨著教學改革的深入,本課程開始研究型教學的探索,授課過程中采用學生課前自學、課堂討論、教師總結、課后答疑的雙向教學方式。七、考核與成績評定方式及標準考核內容與成績評定平時成績(百分制):50%,包括課后作業、上機實驗等。大作業(百分制):50%,課程結束后布置大作業,針對一個實際問題進行分析和操作。平時成績評價標準基本要求評價標準優秀(0.9-1)良好(0.7-0.89)合格(0.6-0.69)不合格(0-0.59)能夠理解自然語言處概念清晰,分析主要概念清晰,基本概念基本基本概念未掌理的基本概念、基本理得當。能夠解決但部分分析有清晰,符號、單握,作業不完整論;熟悉自然語言處理問題,思路清誤。主要思路、位等基本規范。或未交。的各種基本方法對語晰,計算正確。過程和計算過程言模型、句法分析、語獨立完成作業,正確。獨立完成義分析、情感分析、詞書寫工整、清作業,書寫清晰,向量等問題進行簡單晰,符號、單位主要符號、單位分析。等符合規范。等符合規范。大作業評判標準基本要求評價標準優秀(0.9-1)良好(0.7-0.89)合格(0.6-0.69)不合格(0-0.59)自然語言處理實際分析設計得當。思部分分析設計有基本完成應用應用程序不能問題的分析、設計、路清晰,應用程序誤。應用程序編寫程序。極小部分實現基本功實現,編寫應用程序編寫規范,運行正規范,運行正確小抄襲,符號、等能。大部分抄實現。確。獨立完成作缺陷。獨立完成作基本規范。襲或者作業不業,書寫工整、清業,書寫清晰,主完整或未交。晰,符號符合規要符號符合規范。范。課程目標達成評價《自然語言處理》課程目標達成評價分析報告一、課程基本信息課程名稱自然語言處理課程性質專業限選學時學分40/2.5開課學期專業班級考核方式平時作業大作業任課教師:評價人員:課程組長,命題教師,閱卷教師二、課程目標達成評估課程目標支撐指標點課程目標評價數據源評價依據分值平均分達成度值Ki評價方式畢業要求1.4具有計算機系統、信息處理及機器學習專業知識,并能將其應用于解決復雜人工智能的應用問題。。目標1:理解自然語言處理的基本概念、基本理論,將其應用于人工智能中語言模型、句法分析、語義分析、情感分析、詞向量等問題。大作業自然語言處理部分(60分)T10=60T1=42?1*0.5+?1*0.5?10?10=0.77平時作業A10=100A1=84畢業要求2.2能認識到解決人工智能應用問題有多種方案,并能通過文獻研究分析尋求有效解決方案。目標2:能夠使用統計概率、機器學習、信息檢索、自然語言處理等理論方法,求解自然語言中實際應用問題,使學生真正做到理論與實際相結合,將所學相關理論知識與真實應用場景結合起來。大作業應用程序部分(40
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論