




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
《自然語言處理》教學大綱課程名稱:自然語言處理課程編號:2311英文名稱:NaturalLanguageProcessing學時:32學時(理論授課16+實驗16) 學分:3學分開課學期:第6學期適用專業:數據科學與大數據技術專業課程類別:理論課課程性質:選修課先修課程:高等數學,線性代數,概率論與數理統計,數據結構,算法設計與分析,機器學習一、課程的性質及任務《自然語言處理》課程是數據科學與大數據技術專業學生的專業方向與拓展課,自然語言處理是計算機科學領域以及人工智能領域的一個重要研究方向,是數據科學與大數據技術專業的選修課程。本課程研究用計算機來處理、理解一節運用人類語言(中文),達到人與計算機之間進行有效通訊,是一個包含數學、計算機科學、語言學等多學科交叉的課程。通過本課程的學習,使學生能夠了解自然語言處理技術的發展歷程、技術特點和當前的研究現狀;能夠掌握自然語言處理技術的算法基礎,包括常用的機器學習算法;掌握和應用基于統計學習方法的自然語言處理技術;理解和應用基于深度學習的自然語言處理技術。依據河北工程大學數據科學與大數據技術專業專業培養計劃,本課程需要培養學生的能力是:能夠運用數學和自然科學的基本概念、原理和數據科學與大數據技術的專業知識,識別和判斷復雜工程問題的關鍵環節;(畢業要求指標2-1)能夠基于數據科學相關科學原理和數學模型方法正確表達大數據應用領域的復雜工程問題;(畢業要求指標2-2)掌握大數據工程設計和產品開發全周期、全流程的基本設計/開發方法和技術,了解影響設計目標和技術方案的各種因素;(畢業要求指標3-1)能夠對采集到的實驗數據進行整理、分析和解釋,并能通過信息綜合、算法設計得出有效結論。(畢業要求指標4-3)掌握基本的大數據開發環境的配置和應用,熟練掌握軟件開發語言(如Python、Java語言等),并能夠運用集成開發環境進行復雜程序設計;(畢業要求指標5-1)二、課程目標與要求2.1課程目標1、了解自然語言處理的概念和發展歷程,了解其發展現狀和發展趨勢,掌握自然語言處理必備的知識和技術基礎。2、掌握自然語言處理常見任務的相關理論方法和編程技術,包括中文分詞算法,關鍵詞提取算法,詞向量技術,文本分類算法,文本信息抽取算法,機器閱讀理解算法,文本生成和摘要算法。了解對話系統和當前的相關方法。3、針對復雜工程問題,能夠綜合運用所學的自然語言處理算法和實踐技能進行問題分析、模型選擇與優化,并設計具體方案解決實際問題,對方案進行測試評估。4、在課程講解過程中,引入思政環節,提升學生的思政水平,培養學生正確的馬列主義觀、愛國精神、科學探索精神與工匠精神等。5、在課程實施過程中,充分鍛煉學生的創新精神、創業意識和創新創業能力。
測控電路課程教學大綱PAGE16PAGE3372.2課程目標與畢業要求對應關系課程目標畢業要求二級指標畢業要求12345●●●●2-1能夠運用數學和自然科學的基本概念、原理和數據科學與大數據技術的專業知識,識別和判斷復雜工程問題的關鍵環節。2.問題分析能力:掌握統計與機器學習的基本方法,能夠綜合運用數學、自然科學和數據科學的基本原理,對復雜的工程系統,識別問題、描述問題并通過文獻研究分析與大數據相關的工程問題,以獲得有效結論?!瘛?-2能夠基于數據科學相關科學原理和數學模型方法正確表達大數據應用領域的復雜工程問題。●●●3-1掌握大數據工程設計和產品開發全周期、全流程的基本設計/開發方法和技術,了解影響設計目標和技術方案的各種因素。3.設計/開發解決方案能力:能夠設計出大數據應用領域的復雜工程問題的解決方案,具有數據采集、處理、分析、挖掘的能力,并能夠在設計環節中體現創新意識,考慮社會、健康、安全、法律、文化以及環境等多維度協同發展因素?!瘛?-3能夠對采集到的實驗數據進行整理、分析和解釋,并能通過信息綜合、算法設計得出有效結論。4.工程技術研究能力:能夠基于數據科學與大數據技術原理并采用科學方法對大數據應用領域的復雜工程問題進行研究,包括設計實驗、分析與解釋數據、并通過信息綜合得到合理有效的結論?!瘛?-1掌握基本的大數據開發環境的配置和應用,熟練掌握軟件開發語言(如Python、Java語言等),并能夠運用集成開發環境進行復雜程序設計。5.使用現代工具能力:能夠針對大數據應用領域的復雜工程問題,開發、選擇與使用恰當的技術、資源、現代信息技術工具,包括對大數據應用領域的復雜工程問題的預測與仿真,并能夠理解其局限性。2.3課程目標與培養環節對應矩陣序號課程目標理論教學課內實驗課后作業1了解自然語言處理的概念和發展歷程,了解其發展現狀和發展趨勢,掌握自然語言處理必備的知識和技術基礎。HL2掌握自然語言處理常見任務的相關理論方法和編程技術,包括中文分詞算法,關鍵詞提取算法,詞向量技術,文本分類算法,文本信息抽取算法,機器閱讀理解算法,文本生成和摘要算法。了解對話系統和當前的相關方法。HML3針對復雜工程問題,能夠綜合運用所學的自然語言處理算法和實踐技能進行問題分析、模型選擇與優化,并設計具體方案解決實際問題,對方案進行測試評估。HML4在課程講解過程中,引入思政環節,提升學生的思政水平,培養學生正確的馬列主義觀、愛國精神、科學探索精神與工匠精神等。HL5在課程實施過程中,充分鍛煉學生的創新精神、創業意識和創新創業能力。HML注:H表示該能力的在此環節重點培養;M表示該能力在此環節有應用要求;L表示該能力在此環節有所涉及。時間序列分析課程教學大綱PAGE2PAGE3492.4目標達成度的評價課程目標1主要通過理論教學環節進行培養,在課后作業中有所涉及。主要通過課堂測試、課后作業和期末考查中概念性、原理性題目進行考核。目標達成綜合以上內容進行評價。課程目標2、3、5主要通過理論教學環節、課后作業進行培養,在課內實驗有應用要求。主要通過課堂測試,課后作業和期末考查中對自然語言處理常見任務的相關理論方法和編程技術進行考核,在實驗中體現為能根據實際語料庫實現自然語言的分析和應用。目標達成綜合以上內容進行評價。課程目標4主要通過理論教學環節進行培養,在課后作業有所涉及。主要通過課堂表現、課后作業和期末論文報告中概念性、原理性題目進行考核。目標達成綜合以上內容進行評價。三、教學方法及手段本課程由理論教學和實驗共兩部分組成。1、理論教學:圍繞本門課程的基本概念、基本原理和基本技術,采用案例式教學、情景式教學、互動式教學等教學方法,并輔以網絡教學資源等進行授課。2、實驗:用情境式教學法設計各種實驗資源和項目,學生根據教師給定的實驗指導書、實驗講解視頻以及實操例題等各種學習資源,加強對于各種機器學習算法的理解與掌握,然后通過實操練習項目使學生能夠把所學的知識和技能舉一反三,融會貫通。同時,通過實驗報告的撰寫,培養學生文檔撰寫能力、問題分析與表述能力。四、課程的基本內容與教學要求第1章自然語言處理概述[教學目的與要求]:使學生了解自然語言處理的概念和發展歷程,了解其發展現狀和發展趨勢。[本章主要內容]:1.1自然語言處理的定義(支撐課程目標1)1.2自然語言處理的應用領域(支撐課程目標1)1.3自然語言處理的發展歷程(支撐課程目標1)1.4自然語言處理的研究現狀和發展趨勢(支撐課程目標1)1.5自然語言處理的知識和技術儲備(支撐課程目標1)[本章重點]:對自然語言處理的定義和研究內容的理解自然語言發展歷程中的技術發展綜述[本章難點]:自然語言處理的技術更迭和趨勢[本章思政教學內容]:中文自然語言處理難題與成果介紹中文自然語言處理的特點,遇到的難題,以及在中文自然語言處理研究中涌現出來的杰出人物,啟發學生對母語的熱愛和自豪感,激發學生向前輩學習,積極投身到中文自然語言處理的學習和研究中。第2章Python語言基礎和機器學習常見算法[教學目的與要求]:掌握自然語言處理的編程和算法基礎。[本章主要內容]:2.1Python編程基礎(支撐課程目標2、4)2.2機器學習算法基礎(支撐課程目標2、4)2.3深度學習框架PyTorch(支撐課程目標2、4)[本章重點]:機器學習算法[本章難點]:結合Python語言的機器學習算法編程技術。第3章中文分詞[教學目的與要求]:掌握常見的中文分詞算法。[本章主要內容]:3.1基于詞表的分詞算法(支撐課程目標2、4)3.2基于統計模型的分詞算法(支撐課程目標2、4)3.3基于序列標注的分詞算法(支撐課程目標2、4)3.4中文分詞工具(支撐課程目標2、4)[本章重點]:基于統計模型的分詞算法。基于序列標注的分詞算法。[本章難點]:基于序列標注的分詞算法。[本章思政教學內容]:介紹中文分詞工具并講解國內研究機構在中文分詞研究上的貢獻通過介紹并擴展哈工大LTP、中科院計算所NLPIR、清華大學THULAC和jieba等優秀的中文分詞工具,進一步增強學生的民族語言和文化的自信,激發學生技術報國的熱情。第4章關鍵詞提取[教學目的與要求]:掌握常見的關鍵詞提取算法。[本章主要內容]:4.1TextRank關鍵詞提取算法(支撐課程目標2)4.2TF-IDF關鍵詞提取算法(支撐課程目標2)[本章重點]:TextRank關鍵詞提取算法。TextRank關鍵詞提取算法。[本章難點]:不同關鍵詞提取算法的原理解析第5章詞向量技術[教學目的與要求]:了解詞向量技術的發展歷程,掌握Word2vec、BERT等詞向量模型。[本章主要內容]:5.1詞向量技術發展歷程(支撐課程目標2)5.2Word2vec(支撐課程目標2)5.3注意力機制(支撐課程目標2)5.4深度學習概述(支撐課程目標2)5.5BERT預訓練模型(支撐課程目標2)[本章重點]:Word2vec。BERT預訓練模型。[本章難點]:注意力機制。BERT預訓練模型。第6章文本分類[教學目的與要求]:了解文本分類任務,掌握常見的文本分類算法。[本章主要內容]:6.1基于統計方法的文本分類(支撐課程目標2)6.2基于深度學習的文本分類(支撐課程目標2)6.3開放領域文本分類(支撐課程目標2)[本章重點]:基于統計方法的文本分類?;谏疃葘W習的文本分類。[本章難點]:算法的理論理解。算法的編程實踐。第7章文本信息抽取[教學目的與要求]:了解文本信息抽取任務,掌握命名實體識別、關系抽取和事件抽取的常見模型。[本章主要內容]:7.1命名實體識別(支撐課程目標2)7.2實體關系抽取(支撐課程目標2)7.3事件抽?。ㄖ握n程目標2)[本章重點]:基于BiLSTM+CRF的命名實體識別方法。基于PCNN的關系抽取方法。基于動態多池化卷積神經網絡的事件檢測模型[本章難點]:算法原理理解。算法編程實踐。第8章機器閱讀理解[教學目的與要求]:了解機器閱讀理解任務,掌握機器閱讀理解的常見模型。[本章主要內容]:8.1機器閱讀理解發展歷程(支撐課程目標2)8.2抽取式閱讀理解(支撐課程目標2)8.3選擇式閱讀理解(支撐課程目標2)[本章重點]:抽取式BiDAF模型。選擇題式CoMatch模型。[本章難點]:算法原理理解。算法編程實踐。第9章文本生成與文本摘要[教學目的與要求]:了解文本生成與摘要任務,掌握文本摘要的常見模型。[本章主要內容]:9.1文本生成與文本摘要概述(支撐課程目標2)9.2抽取式文本摘要(支撐課程目標2)9.3生成式文本摘要(支撐課程目標2)9.4文本摘要案例(支撐課程目標2)[本章重點]:抽取式文本摘要相關模型。生成式文本摘要相關模型。[本章難點]:算法原理理解。算法編程實踐。第10章對話系統[教學目的與要求]:了解對話系統任務和常見方法。[本章主要內容]:10.1任務型對話系統原理與方法(支撐課程目標2)10.2閑聊式對話系統原理與方法(支撐課程目標2)10.3基于Pytorch框架的對話系統實戰(支撐課程目標2)[本章重點]:任務型對話系統原理與方法。閑聊式對話系統原理與方法。[本章難點]:算法原理理解。算法編程實踐。五、課內實驗5.1本課程實驗教學的地位和作用自然語言處理實驗是鞏固和擴展課程理論知識的必要環節。5.2教學基本要求通過綜合型實驗,使學生進一步理解并掌握自然語言處理算法;能夠基于具體實例要求,選擇和設計相關自然語言處理算法并編程實現算法,測試評估算法性能。5.3實驗內容及要求綜合型實驗由學生根據實驗要求獨立完成。實驗共8個實踐主題,每個主題2學時,共計16學時。(1)中文分詞實驗(2)關鍵詞提取實驗(3)文本分類實驗(4)命名實體識別實驗(5)關系抽取實驗(6)機器閱讀理解實驗(7)文本摘要實驗(8)對話系統實驗5.4教學文件及教學形式教學文件:教材自帶程序代碼。教學形式主要包括:預習、課堂指導與實驗操作、撰寫實驗報告。實驗報告學生自擬。實驗報告包括:描述實驗目的、實驗用設備及工具,繪詳細敘述實驗步驟,要有完整的實驗數據和用圖表表示的實驗結果,以理論聯系實際為出發點,總結實驗中出現的問題及解決方法。5.5實驗項目及學時分配序號實驗項目實驗學時實驗類型實驗類別實驗性質1中文分詞實驗2驗證專業必修2關鍵詞提取實驗2驗證專業必修3文本分類實驗2驗證專業必修4命名實體識別實驗2驗證專業必修5關系抽取實驗2驗證專業必修6機器閱讀理解實驗2驗證專業必修7文本摘要實驗2驗證專業必修8對話系統實驗2驗證專業必修5.6本課程實驗用到的儀器設備計算機六、課程學時分配教學課次教學內容教學環節與計劃時數教學環節計劃時數1自然語言處理概述理論課22Python語言基礎和機器學習常見算法;中文分詞算法理論課23關鍵詞提取理論課24詞向量技術理論課25文本分類理論課26文本信息抽取理論課27文本信息抽取理論課28文本生成與文本摘要;對話系統理論課29中文分詞實驗實驗課210關鍵詞提取實驗實驗課211文本分類實驗實驗課212命名實體識別實驗實驗課213關系抽取實驗實驗課214機器閱讀理解實驗實驗課215文本摘要實驗實驗課216對話系統實驗實驗課2七、課程考核與成績評定7.1考核方式考核環節包括課程學習過程考核和期末課程總結,其中課程過程考核占總成績的30%,分別由課堂表現、課后作業、實驗情況進行評定;期末課程總結成績占總成績的70%。各環節的比重如下??己谁h節比重合計過程考核(平時成績)課堂表現10%30%作業10%實驗10%期末成績期末測試70%70%總計100%100%7.2考核內容及要求本課程為考試課??己藘热菁胺种捣峙淙缦?。考核方式考核內容分值課程目標總分值期末考核70%自然語言處理概述2~4目標1、4100分Python語言基礎和機器學習常見算法;中文分詞算法2~5目標1、2、4關鍵詞提取5~15目標2詞向量技術5~15目標2文本分類5~10目標2文本信息抽取10~20目標2文本信息抽取5~15目標2文本生成與文本摘要;對話系統15~30目標2過程考核30%課堂表現課堂測試、出勤情況10目標2、3、515分課后作業作業完成情況10目標2、3、515分實驗實驗出勤、實驗表現及實驗報告10目標2、3、510分7.3成績評定1.課堂表現課堂表現總分10分,由課堂測試與課堂出勤情況評定。其中,課堂測試滿分7分,以客觀題(填空、選擇、判斷)為主,每學期隨堂測試15~20次,每次測試1~2道題目,每答錯一道題目扣0.5分(直到扣滿10分為止);課堂出勤滿分7分,缺勤一次扣1分,遲到或請假扣0.5分。2.課后作業課后作業總分10分,由作業完成情況評定。每學期布置作業5次,每次作業占2分,評分標準如下;評分標準分值標準描述課后作業2能夠按時認真完成作業、作業態度認真、書寫清楚、分析計算正確。1能夠按時完成作業、作業態度較好、書寫較清楚、分析計算基本正確0不交作業或作業態度不認真、抄襲他人作業3.實驗成績實驗成績占所學課程的10%,即10分。根據學生的實驗表現及實驗報告結果,進行綜合評定。具體評分標準如下表所示。評分標準分值標準描述實驗表現(5)5無遲到、早退現象,態度端正,與同組同學配合認真完成實驗電路硬件連接及調試,實驗結束后,按要求整理工作臺。4有遲到、早退現象或實驗過程不夠認真。3有遲到、早退現象且實驗過程不認真。1有遲到、早退現象,實驗過程
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 繼承人合同協議書
- 全自動鋪布機項目可行研究報告
- 2025年重組腺病毒P53抗癌因子項目建議書
- 2025年鎢基高比重合金合作協議書
- 高端私人游艇碼頭泊位租賃與船舶租賃代理服務合同
- 抖音短視頻創作者信用評價與激勵措施合作協議
- 知識產權稅費減免效果評估合作協議
- 脊髓骨折的護理
- 生物檢測潔凈室租賃合同及設備維護協議
- 跨境貿易集裝箱GPS追蹤器租賃合同
- 材料科學基礎基礎知識點總結
- 數控銑工圖紙(60份)(共60頁)
- 新時達-奧莎(sigriner)iAStar-S32電梯專用變頻器使用說明書
- 《青年友誼圓舞曲》教案
- 馬清河灌區灌溉系統的規劃設計課程設計
- 惠州市出租車駕駛員從業資格區域科目考試題庫(含答案)
- 加工設備工時單價表
- 高脂血癥藥物治療ppt課件
- 單開、菱形及復式交分道岔的檢查方法帶圖解
- 瀝青拌和站管理制度匯編(正式版)
- 高層建筑等電位聯結安裝技術分析探討
評論
0/150
提交評論