




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
XXX大學數據科學與大數據技術專業課程教學大綱Python金融數據分析與挖掘一、課程基本信息課程編號課程名稱Python金融數據分析與挖掘/FinancialDataAnalysisandMiningusingPython課程基本情況課程類型專業方向課程學分/學時5/80(其中:講課學時:45實踐學時:35)開課時間第3學期先修課程Python程序設計、高等數學、線性代數、機器學習適用專業數據科學與大數據技術考核方式考查使用教材黃恒秋.Python金融數據分析與挖掘(微課版)[M].北京:人民郵電出版社.2024.11課程負責人開課學院二、課程簡介大數據時代,數據成為決策最為重要的參考之一,數據分析行業邁入了一個全新的階段。通過學習本課程,使得學生掌握Python科學計算、數據處理、數據可視化、挖掘建模等基本技能,進一步地擴展應用到較為復雜金融數據處理及挖掘分析任務上,最后進行量化投資實戰檢驗。本課程為Python在金融量化投資領域的具體應用,也是Python在金融行業應用最為廣泛的領域之一,從而使得學生具備一定的行業應用背景及就業技能。三、課程目標(一)課程目標設置課程目標1:掌握Python科學計算、數據處理、數據可視化、挖掘建模等基本技能,培養學生具備較好的數據敏感度、數據建模意識和規范的數據分析流程。課程目標2:掌握金融數據處理及挖掘分析基本技能,具備較好的量化投資實證研究能力,培養學生具備一定的行業應用背景及應用技能。課程目標3:了解量化投資與數量化分析基本概念,培養學生科學投資及價值投資理念,引導學生用好金融科技、恪守職業規范與風險意識。(二)課程目標與畢業要求指標點的對應關系課程目標畢業要求畢業要求指標點支撐程度課程目標13畢業要求3:具有從事專業相關的項目工作所需的數學等基礎知識;具有扎實的大數據技術領域的基本理論和基本知識,熟練掌握數據挖掘技術與應用、神經網絡基礎、數學建模、機器學習、人工智能、多元統計分析、Hadoop大數據技術、網絡爬蟲技術與實戰、圖像識別及其應用、電商數據挖掘及其應用、文本數據挖掘及其應用、金融大數據分析等專業知識。H課程目標24畢業要求4:具有基本的項目實施與管理知識,掌握大數據科學與技術的基本思維方法和研究方法,了解大數據技術的應用前景、以及相關行業最新進展與發展動態,具備從事大數據應用系統設計與實現的能力等方面知識的綜合應用能力,以及相關的科研、設計、調試、維護運行和管理的能力,整合不同數據源,不同結構類型數據的能力和探索數據背后價值的能力H課程目標32畢業要求2:具備較好的人文素養與情懷,具有人文社科、信息交流、法律與環境、社會與公共安全等知識,其中人文社科包括文學、外語、哲學、政治學、社會學、管理學、經濟學、心理學等方面的常識或基本知識。M5畢業要求5:充分理解團隊合作的重要性,具有一定的表達能力、獨立工作能力、人際交往能力和團隊合作能力以及一定的組織管理能力。M注:課程目標對畢業要求指標點的支撐強度分別用“H”(高)、“M”(中)、“L”(弱)表示。四、課程教學內容(一)課程教學內容與學時安排課程內容教學方法學時安排理論講授實踐教學第二章科學計算包Numpy講授法、實驗教學法32第三章數據處理包Pandas講授法、實驗教學法55第四章數據可視化包Matplotlib講授法、實驗教學法23第五章機器學習與實現講授法、實驗教學法55第六章金融數據基礎講授法、實驗教學法41第七章基礎案例講授法、實驗教學法105第八章綜合案例一:上市公司綜合評價講授法、實驗教學法32第九章綜合案例二:股票價格漲跌趨勢預測講授法、實驗教學法55第十章綜合案例三:股票價格形態聚類與收益分析講授法、實驗教學法55第十一章綜合案例四:行業聯動與輪動分析講授法、實驗教學法32合計4535(二)課程目標與教學內容的對應關系矩陣圖章節課程目標1課程目標2課程目標3第二章科學計算包NumpyH第三章數據處理包PandasH第四章數據可視化包MatplotlibH第五章機器學習與實現H第六章金融數據基礎HM第七章基礎案例HM第八章綜合案例一:上市公司綜合評價HH第九章綜合案例二:股票價格漲跌趨勢預測HH第十章綜合案例三:股票價格形態聚類與收益分析HH第十一章綜合案例四:行業聯動與輪動分析HH注:課程章節對課程目標的支撐強度分別用“H”(高)、“M”(中)、“L”(弱)表示;矩陣應覆蓋所有必修環節。(三)課程教學安排第二章科學計算包Numpy【教學目標】1.了解Numpy及導入使用;2.理解數組的創建、切片、連接、存取、排序及搜索相關技能;
3.掌握數組靈活切片的方法及數組連接、排序、搜索相關知識。【教學重點】數組的切片、連接、改變形態。數組的相關方法。【教學難點】數組的切片及改變形態、線性代數運算。【教學時數】3學時【教學方法】講授法【教學內容】1.導入并使用Numpy創建數組;2.數組的運算、切片、連接及存取、排序與搜索;數組相關屬性與方法;3.矩陣及線性代數運算第三章數據處理包Pandas【教學目標】1.了解Pandas導入及創建數據框和序列;2.理解數據框和序列的訪問、切片及方法;
3.掌握數據框和序列相關方法的靈活應用,數據框、序列、數組、列表之間的相關轉換及運用。4.熟練掌握常用時間處理函數、合并函數與關聯函數,以及滾動計算、時間元素提取、映射與離散化、分組統計等相關數據處理與計算任務。【教學重點】數據框、序列相關屬性、方法的應用,數據框和序列數據的訪問、切片及相互之間的轉換。常用外部數據文件的讀取、數據關聯與合并、滾動計算、時間元素提取與分組統計計算。【教學難點】數據框、序列的訪問及切片。數據框、序列、數組、列表相關數據結構之間的相互轉換。數據關聯和分組統計的函數理解與應用。【教學時數】5學時【教學方法】講授法【教學內容】1.導入并使用Pandas創建數據框和序列;2.數據框和序列相關屬性、方法的介紹及使用;3.數據框和序列的訪問、切片及運算;4.外部數據文件的讀取及滾動計算函數的使用;5.時間處理函數、合并函數與關聯函數,以及滾動計算、時間元素提取、映射與離散化、分組統計等相關數據處理與計算任務。第四章數據可視化包Matplotlib【教學目標】1.了解Matplotlib中的pyplot模塊導入及簡單使用方法;2.理解利用Matplotlib中的pyplot模塊繪圖的基本流程及原理;
3.掌握利用Matplotlib中的pyplot模塊繪制散點圖、線性圖、柱狀圖、直方圖、餅圖、箱線圖和子圖的方法,以及中文字符的顯示、橫軸字符刻度和子圖的布局排列。【教學重點】利用Matplotlib中的pyplot模塊進行散點圖、線性圖、柱狀圖、直方圖、餅圖、箱線圖和子圖的繪制。懂得圖形中文字符的顯示及橫軸字符刻度,子圖的布局排列。【教學難點】Matplotlib繪圖的基本流程及原理。【教學時數】2學時【教學方法】講授法【教學內容】1.導入并使用Matplotlib中的pyplot模塊進行簡單繪圖;2.Matplotlib中的pyplot模塊繪圖基本流程及原理;3.利用Matplotlib中的yplot模塊繪制常見的圖形,包括散點圖、線性圖、柱狀圖、直方圖、餅圖、箱線圖和子圖。第五章機器學習與實現【教學目標】1.了解Scikit-learn包及相關模塊導入及簡單使用方法;2.理解均值、中位數、最頻繁值的缺失值填充策略,均值-方差、極差數據規范化或標準化,主成分分析降維及綜合評價,線性回歸、神經網絡非線性回歸預測,邏輯回歸、神經網絡、支持向量機分類,K-mean聚類、關聯規則相關的基本原理與方法;
3.掌握均值、中位數、最頻繁值的缺失值填充策略,均值-方差、極差數據規范化或標準化,主成分分析降維及綜合評價,線性回歸、神經網絡非線性回歸預測,邏輯回歸、神經網絡、支持向量機分類,K-mean聚類、關聯規則的程序實現及案例應用。【教學重點】均值、中位數、最頻繁值的缺失值填充策略,均值-方差、極差數據規范化或標準化,主成分分析降維及綜合評價,線性回歸、神經網絡非線性回歸預測,邏輯回歸、神經網絡、支持向量機分類,K-mean聚類、關聯規則相關原理的理解及程序實現。【教學難點】主成分分析降維及綜合評價,線性回歸、神經網絡非線性回歸預測,邏輯回歸、神經網絡、支持向量機分類,K-mean聚類、關聯規則相關原理的理解。【教學時數】5學時【教學方法】講授法、【教學內容】1.導入Scikit-learn包及相關模塊;2.缺失值填充、數據規范化或標準化、主成分分析降維及綜合評價、線性回歸、邏輯回歸、神經網絡、支持向量機、K-均值聚類、關聯規則相關的模型、算法與原理;3.利用Scikit-learn包相關模塊,完成案例教學,包括均值、中位數、最頻繁值的缺失值填充策略,均值-方差、極差數據規范化或標準化,主成分分析降維及綜合評價,線性回歸、神經網絡非線性回歸預測,邏輯回歸、神經網絡、支持向量機分類,K-mean聚類、關聯規則第六章金融數據基礎【教學目標】1.了解公司治理結構、財務報表、財務分析指標、股票高頻、股票日頻交易和股票價格指數相關數據及產生情景;2.理解上述金融數據的重要指標及數據形態;
3.了解開源數據接口。【教學重點】公司治理結構、財務報表、財務分析指標、股票高頻、股票日頻交易和股票價格指數相關核心指標數據。【教學難點】股票高頻數據的生成加工及理解。【教學時數】4學時【教學方法】講授法【教學內容】1.公司治理結構、財務報表、財務分析指標相關數據及重要指標數據的解讀;2.股票高頻數據生產場景及數據加工、核心指標數據的理解;3.開源數據接口第七章基礎案例【教學目標】1.了解案例實現的基本思路。2.理解案例實現的具體算法及程序實現,各種數據結構的相互轉換并實現程序計算;3.掌握案例實現的具體過程,包括思路、算法、數據處理、程序計算及結果展現。【教學重點】案例的實現思路、算法及程序具體實現。【教學難點】案例的實現算法、程序實現過程中各類數據結構的相互轉換。【教學時數】10學時【教學方法】講授法【教學內容】1.股票價格指數周收益率和月收益率的計算;2.上市公司凈利潤增長率的計算;3.股票價、量走勢圖繪制;4.股票價格移動平均線的繪制;5.滬深300指數走勢預測;6.基于主成分聚類的上市公司盈利能力分析7.國際股票指數關聯分析第八章綜合案例一:上市公司綜合評價【教學目標】1.了解上市公司綜合評價的基本概念及模型。2.理解業務數據、指標數據選取、預處理、量化投資設計的基本原理、原則及流程;3.掌握指標數據選取、預處理、程序實現、量化投資策略設計實現的全部流程。【教學重點】業務數據理解、指標數據的選擇、預處理、程序實現。【教學難點】業務數據理解、數據預處理、模型的理解。【教學時數】3學時【教學方法】講授法【教學內容】1.上市公司綜合評價模型及方法基本介紹;2.基于投資規模與效率指標的綜合評價方法;3.基于成長與價值指標的綜合評價方法;4.指標數據選取及數據預處理;5.主成分分析模型及程序實現;6.量化投資策略設計實現及結果分析第九章綜合案例二:股票價格漲跌趨勢預測【教學目標】1.了解股票價格漲跌趨勢的基本概念。2.理解業務數據、技術分析指標數據計算、模型實現及驗證相關原理、方法及流程;3.掌握技術分析指標數據計算、模型檢驗、量化投資策略設計實現的全部流程。【教學重點】業務數據理解、指標概念及公式理解、程序實現及模型檢驗。【教學難點】業務數據理解、指標公式理解及量化投資策略設計實現。【教學時數】5學時【教學方法】講授法【教學內容】1.了解股票價格漲跌趨勢的基本概念。2.理解業務數據、技術分析指標數據計算、模型實現及驗證相關原理、方法及流程;3.掌握技術分析指標數據計算、模型檢驗、量化投資策略設計實現的全部流程第十章綜合案例三:股票價格形態聚類與收益分析【教學目標】1.了解股票價格形態分析的基本概念、關鍵價格點概念2.理解業務數據、關鍵價格點提取算法、形態特征表示、K-最頻繁值聚類算法;3.掌握關鍵價格點提取算法、形態特征表示方法、K-最頻繁值聚類算法的基本流程及程序實現,以及量化投資策略設計與實現。【教學重點】業務數據理解、關鍵價格點提取算法、K-最頻繁值聚類算法。【教學難點】關鍵價格點提取算法、K-最頻繁值聚類算法、量化投資策略設計實現。【教學時數】5學時【教學方法】講授法【教學內容】1.股票價格形態分析的基本概念;2.股票關鍵價格點的概念及提取算法;3.形態特征的表示及計算4.K-最頻繁值算法及程序實現;5.量化投資策略設計實現及結果分析第十一章綜合案例四:行業聯動與輪動分析【教學目標】1.解行業聯動與輪動的基本概念。2.理解行業聯動與輪動的指標表示、關聯規則挖掘算法及量化投資策略設計原理3.掌握行業聯動與輪動關聯規則挖掘算法及量化投資策略設計實現的全流程。【教學重點】業務數據理解、行業輪動規則挖掘及量化投資策略設計實現。【教學難點】行業輪動關聯規則挖掘及量化投資策略設計實現。【教學時數】3學時【教學方法】講授法【教學內容】1.行業聯動與輪動的基本概念;2.行業聯動與輪動的指標表示與計算;3.日、周、月頻率的行業聯動與輪動關聯規則挖掘;4.量化投資策略設計實現及結果分析點實驗/實踐教學部分實驗一:NumPy數組操作【實驗目的和要求】掌握NumPy數組的定義及操作方法。【實驗內容】賦值定義較復雜數據結構請完成以下問題:將列表L1定義為一維數組l1,將嵌套列表L2定義為二維數組l22.內嵌函數定義較復雜數據結構請完成以下任務:1)定義一個3行3列元素全為1的數組A2)定義一個3行3列元素全為0的數組B3)定義一個初始值為2、末值為9、步長為2的數組C4)定義一個默認初始值0,步長為1的,末值為9的一維數組D3.數組運算現給出數組A和B,請按順序完成以下任務:1)求解A的最大值、最小值、余弦值、正弦值、長度2)求A乘B3)返回計算結果Max_A,Min_A,cos_A,sin_A,le_A,result4.數組切片5.數組鏈接【教學方法】實驗法【教學時數】2實驗二:Pandas數據處理操作【實驗目的和要求】掌握Pandas數據結構的定義及操作方法。【實驗內容】1.序列和數據框請完成以下任務:1)導入pandas包2)定義列表L1、L2,元組T1、T2L1=[1,-2,2.3,'hq']L2=['kl','ht','as','km']T1=(1,8,8,9)T2=(2,4,7,'hp')3)基于定義的列表和元組構造數據框,默認索引,列名依次為a,b,c,d,返回計算結果A4)基于定義的列表和元組構造數據框,索引為a,b,c,d,列名為L1,L2,T1,T2,返回計算結果B2.外部數據文件讀取請完成以下任務:1)導入pandas包2)read_excel()函數讀取“一、車次上車人數統計表.xlsx”數據表,用數據框df1來存儲3)通過read_table()函數讀取"txt1.txt"文件中的數據(不帶表頭),用數據框df2來表示4)通過read_csv()函數分塊讀取的方式讀取“data.csv”文件,每次讀取20000行,并輸出每次讀取的數據集行數和數據集的尺寸,其格式為:“第n次讀取數據規模為:數據集行數(舉例:第1次讀取數據集規模為:20000)”“數據集尺寸(舉例:(20000,13))3.邏輯索引、切片方法,groupby分組計算函數應用請完成以下任務:1)請讀取地鐵站點進出站客流數據表(Data.xlsx),表結構字段如下:站點編號、日期、時刻、進站人數、出站人數2)取出第0列,通過去重的方式獲得地鐵站點編號列表,記為code3)采用數據框中的groupby分組計算函數,統計出每個地鐵站點每天的進站人數和出站人數,計算結果采用一個數據框sat_num來表示,其中列標簽依次為:站點編號、日期、進站人數和出站人數;4)計算出每個站點國慶節期間(10.1~10.7)的進站人數和出站人數,計算結果用一個數據框sat_num2來表示,其中列標簽依次為:A1_站點編號、A2_進站人數、A3_出站人數。4.數據框關聯操作5.數據框合并操作6.序列移動計算方法應用7.數據框切片(iloc、loc)方法請完成以下任務:1)導入pdndas包2)讀取地鐵站點進出站客流數據表(Data.xlsx),字段依次為:站點編號、日期、時刻、進站人數、出站人數3)采用索引(iloc)實現的方式,獲取135站點10月1日-10月2日早上9-11點3個時刻的進站客流量數據(取所有字段),記為A4)采用列標簽(loc)實現方式,獲取135站點10月1日-10月2日早上9-11點3個時刻的進站客流量數據(取所有字段),記為B。8.數據框排序請完成以下任務:1)導入pandas包2)用read_excel()函數讀取“data.xlsx"表,用數據框read表示3)提取600000.SH代碼交易數據,并按交易日期從小到大進行排序,記為data4)對整個數據框read,按代碼、交易日期從小到大進行排序9.數據框綜合應用案例請完成以下任務:讀取地鐵站點進出站客流數據表(Data.xlsx),統計計算獲得每個站點每個時刻(除去國慶期間)的總進站客流量和總出站客流量,用一個數據框來R表示,結果返回R,列名依次為:A1_站點編號、A2_時刻、A3_總進站客流、A4_總出站客流10.序列及簡單隨機抽樣請完成以下任務:1)定義一個列表code,編號為1~302)對code,按30個元素一次隨機抽樣,記為A3)返回結果,為序列s,其中index為編號,值為抽樣結果11.序列及較復雜抽樣題目背景:某題庫有選擇、填空、判斷、計算和應用5種題型,每種題型題號從1開始依次按順序編號,其中選擇題70道,填空題80道,判斷題50道,計算題30道,應用題20道。現有40個同學參加考試,要求每個同學從5種題型中隨機抽取1道題目組成試卷,請編程實現給出每個同學試卷的具體題目編號。請完成以下任務:1)定義一個數據框A,index為默認序號(0~39),代表每一位同學2)數據框A的第0列表示每位同學隨機抽簽的第1種題型的序號,第1、2、3、4列依次類推【教學方法】實驗法【教學時數】5實驗三:數據可視化包Matplotlib應用【實驗目的和要求】掌握數據可視化的基本使用方法。【實驗內容】1.散點圖繪制請完成以下任務:1)讀取“各站點各時刻進出站客流數據.xlsx”,繪制站點155各時刻進站客流散點圖;2)最后,采用plt.savefig函數保存圖片,文件路徑如下:"學員4.1/155各時刻進站客流散點圖.png"。2.線性圖繪制請完成以下任務1)讀取“各站點各時刻進出站客流數據.xlsx”,繪制站點155各時刻進站客流線性圖;2)最后,采用plt.savefig函數保存圖片,文件路徑如下:"學員4.2/155各時刻進站客流線性圖.png"。3.柱狀圖繪制請完成以下任務1)讀取“各站點各時刻進出站客流數據.xlsx”,繪制站點155各時刻進站客流柱狀圖;2)最后,采用plt.savefig函數保存圖片,文件路徑如下:"學員4.3/155各時刻進站客流柱狀圖.png"。4.直方圖繪制請完成以下任務:1)讀取“各站點各時刻進出站客流數據.xlsx”,繪制站點155各時刻進站客流直方圖;2)最后,采用plt.savefig函數保存圖片,文件路徑如下:"學員4.4/155各時刻進站客流直方圖.png"。5.餅圖繪制請完成以下任務:1)讀取“各站點各時刻進出站客流數據.xlsx”,繪制站點157各時刻進站客流餅圖;2)最后,采用plt.savefig函數保存圖片,文件路徑如下:"學員4.5/157各時刻進站客流餅圖.png"。6.箱線圖繪制請完成以下任務:1)讀取“各站點各時刻進出站客流數據.xlsx”,繪制站點9時刻的進站客流箱線圖;2)最后,采用plt.savefig函數保存圖片,文件路徑如下:"學員4.6/9時刻各站點進站客流箱線圖.png"。7.子圖繪制請完成以下任務:1)讀取“各站點各時刻進出站客流數據.xlsx”,獲得155、157、151、123四個站點在各時刻的進站客流,用一個2*2的子圖,繪制其線性圖;2)最后,采用plt.savefig函數保存圖片,文件路徑如下:"學員4.7/4個站點各時刻進站客流子圖.png"。【教學方法】實驗法【教學時數】3實驗四:scikit-learn應用【實驗目的和要求】掌握機器學習包scikit-learn的基本使用方法。【實驗內容】1.缺失值填充請完成以下任務:1)讀取“銀行貸款審批數據.xlsx”表,自變量為x1~x15,決策變量為y(1-同意貸款,0-不同意貸款),其中x1~x6為數值變量,x7~x15為名義變量2)請對x1~x6中存在的缺失值用均值策略填充,x7~x15用最頻繁值策略填充3)最后返回填充處理后的X(即x1~x15),以及決策變量Y(即y)2.數據標準化請完成以下任務:1)在上一個實驗的基礎上,對自變量X中的數值變量(x1~x6)作均值-方差標準化處理,需要注意的是x7~x15名義變量不需要作標準化處理。2)返回結果X1,數據結構為數組形式,X1中含有標準化后的x1~x6和未標準化的x7~x15。3.缺失值填充請完成以下任務:1)在上一個實驗基礎上,對經過缺失值填充、數值變量標準化后的數據集,取前600條記錄作為訓練數據,后90條記錄作為測試數據,構建支持向量機分類模型;2)返回計算結果為模型準確率rv和預測準確率r。4.邏輯回歸模型及其應用請完成以下任務:1)在第2個實驗基礎上,對經過缺失值填充、數值變量標準化后的數據集,取前600條記錄作為訓練數據,后90條記錄作為測試數據,構建邏輯回歸模型;2)返回計算結果為模型準確率rv和預測準確率r。5.神經網絡分類模型及其應用請完成以下任務:1)在第2個實驗基礎上,對經過缺失值填充、數值變量標準化后的數據集,取前600條記錄作為訓練數據,后90條記錄作為測試數據,構建神經網絡分類模型;2)返回計算結果為模型準確率rv和預測準確率r。6.線性回歸模型及其應用在發電場中電力輸出(PE)與AT(溫度)、V(壓力)、AP(濕度)、RH(壓強)有關,相關測試數據見“發電場數據.xlsx”文件,請完成以下任務:1)求出PE與AT、V、AP、RH之間的線性回歸關系式系數向量,用列表b表示,其元素依次為常數項、AT回歸系數、V回歸系數、AP回歸系數、RH回歸系數;2)求出回歸方程的擬合優度(判定系數),用變量r表示;3)今有某次測試數據AT=28.4、V=50.6、AP=1011.9、RH=80.54,試利用構建的線性回歸模型預測其PE值。7.神經網絡回歸模型及其應用請完成以下任務:1)基于上一個實驗數據集,構建神經網絡回歸模型,返回計算結果模型準確率r;2)并針對測試數據AT=28.4、V=50.6、AP=1011.9、RH=80.54,預測其PE值。8.支持向量機回歸模型及其應用請完成以下任務:1)基于上一個實驗數據集,構建支持向量機回歸模型(采用線性核函數),返回計算結果模型的擬合優度r;2)并針對測試數據AT=28.4、V=50.6、AP=1011.9、RH=80.54,預測其PE值。9.基于主成分分析的綜合評價讀取“農村居民人均可支配收入來源2016.xlsx”數據表,其中數據來源于2016年《中國統計年鑒》,首先對指標數據進行均值方差標準化處理;其次對標準化處理后的指標數據做主成分分析,要求提取累計貢獻率在95%以上;再次基于提取的主成分計算綜合得分,綜合得分=提取的各主成分與對應貢獻率之和;最后基于綜合得分獲得各地區的排名,得分按從高到低排序,用一個序列Rs來表示,其中index為地區名稱,值為綜合得分。10.K均值聚類算法及其應用讀取“農村居民人均可支配收入來源2016.xlsx”數據表,數據來源于2016年《中國統計年鑒》,首先對指標數據作均值-方差標準化處理,注意首列為地區名稱,不用標準化;其次對標準化后的指標數據,作K-均值聚類分析(K=4);最后,給出聚類分析結果,用一個序列Fs來表示,其中index為地區名稱,值為所屬類別的標簽值(0、1、2、3)。【教學方法】實驗法【教學時數】4實驗五:關聯規則基礎【實驗目的和要求】掌握一對一和多對一關聯規則的基本使用方法。【實驗內容】1.布爾數據集構建將以下超市的購買記錄(已用一個"超市購買記錄.txt"來存放,讀取該文件即可),文件內容存放與下列展示一致,即頓號分隔,文件編碼為utf-8):I1、西紅柿、排骨、雞蛋、毛巾、水果刀、蘋果I2、西紅柿、茄子、水果刀、香蕉I3、雞蛋、襪子、毛巾、肥皂、蘋果、水果刀I4、西紅柿、排骨、茄子、毛巾、水果刀I5、西紅柿、排骨、酸奶、蘋果I6、雞蛋、茄子、酸奶、肥皂、蘋果、香蕉I7、排骨、雞蛋、茄子、水果刀、蘋果I8、土豆、雞蛋、襪子、香蕉、蘋果、水果刀I9、西紅柿、排骨、鞋子、土豆、香蕉、蘋果將其轉換為布爾數據集,其中數據集用數據框Data來表示,數據框中的字段名稱即為商品名稱,如果商品在某個購買記錄中出現用1來表示,否則為0。2.基于布爾數據集的一對一和多對一關聯規則挖掘針對以下布爾數據集(已用一個“test12.xlsx”表格來存取,直接讀取即可,字段名稱為A、B、C):A B C1 1 00 1 11 0 01 1 11 1 11 0 01 1 10 1 11 0 01 1 11 1 01 1 11 1 0請編程計算規則“A->B”和“A,B->C”的支持度和置信度,分別用sp1和co1,sp2和co2來表示【教學方法】實驗法【教學時數】1實驗六:金融數據基礎【實驗目的和要求】掌握股票高頻數據的加工及分時計算。【實驗內容】今有基本行情(簡稱level-1)部分數據,見配套數據表“SHL1_600000.xlsx”,字段依次為:證券代碼、交易日期、昨收盤價、當前時間、(開、高、低、最新)價、累計成交量、分筆期間成交量、累計成交額、分筆期間成交額、累計成交筆數、分筆期間成交筆數、賣方委托價格5-1,買方委托價格1-5,賣方委托量5-1,買方委托量1-5。根據該基本行情交易數據表,計算獲得1分時交易數據表,其基本字段及計算思路如下:靜態字段:證券代碼、交易日期時間字段:分時點成交字段:分時期間(開、高、低、收)價格、分時期間成交量、分時期間成交金額計算思路:1分時數據是由基本行情(level-1)數據統計計算獲得。分時計算主要有兩種計算方式:一種是時間前置,一種是時間后置。比如后置計算1分時0931這個時間點,其行情統計時間區間為[093000.000,093059.999];前置計算1分時0931這個時間點,其行情統計時間區間為[093100.000,093159.999]。計算的規則主要有4個方式:取區間頭、取區間未、取區間最大、取區間最小。比如計算600000,20130301,0931這個分時點的分時數據,其對應的分筆數據區間范圍為093002-093052(需要按時間排序),則:開盤價為:樣本范圍內的CP的第一個價格11.070最高價為:樣本范圍內的CP的最大的價格11.080最低價為:樣本范圍內的CP的最小的價格11.060收盤價為:樣本范圍內的CP的最后的價格11.070分時期間成交量為:樣本范圍內最后的TQ-上一個樣本范圍內的最后的TQ=sum(樣本范圍內的CQ)=10559900-4190571=6369329。分時期間成交額為:樣本范圍內最后的TM-上一個樣本范圍內的最后的TM=sum(樣本范圍內的CM)=116929015-46389621=70539394。【教學方法】實驗法【教學時數】1實驗七:金融基礎數據分析【實驗目的和要求】掌握基礎的金融數據分析及挖掘方法。【實驗內容】今有2017-2018年每個季度的每股指標數據,共22720條數據記錄,數據全部來源于國泰安CSMAR數據庫,部分數據記錄及表結構如表下所示:2017-2018每個季度的每股指標數據StkcdAccperF090301BF090601BF091001AF091301AF091501AF091801B0000012017-03-310.361911.57722812.098953.2885854.046768-6.69820000012017-06-300.7311593.0986612.315323.2885854.258008-7.465350000012017-09-301.1154924.58782812.703033.2885854.642341-9.201340000012017-12-311.3505536.10768812.932673.2885854.639546-6.917880000012018-03-310.38411.59330213.010543.2885854.6852072.4136280000012018-06-300.77883.2314513.287193.2885854.944030.4341880000012018-09-301.191384.56482213.700123.2885855.35661-0.658710000012018-12-311.4454286.18590613.980323.2885855.535061-3.338560000022017-03-310.0629951.68393614.673770.7570195.606924-0.86274…………其中Stkcd-股票代碼、Accper-截止日期、F090301B-歸屬于母公司每股收益、F090601B-每股營業收入、F091001A-每股凈資產、F091301A-每股資本公積、F091501A-每股未分配利潤、F091801B-每股經營活動產生的現金流量凈額。問題如下:1.對每個股票代碼,計算每個季度每股收益同比增長率,并找出連續4個季度每股收益同比增長率大于20%的股票代碼。2.找出2017、2018年度每股資本公積和每股未分配利潤最大的10只股票代碼,并通過柱狀圖、子圖的方法可視化展現出來。3.取2018年度的數據,對以上6個指標作主成分分析,要求提取信息占比在95%以上,并寫出每個主成分的表達式和說明其主成分的意義。4.基于第3步提取的主成分進行K-均值聚類分析,并獲取其聚類中心。【教學方法】實驗法【教學時數】5實驗八:上市公司綜合評價拓展應用【實驗目的和要求】深化綜合評價方法在金融投資分析中的應用。【實驗內容】第八章中對上市公司進行綜合評價并沒有區分行業,事實上不同行業之間可能存在著較大的差異。請您利用本章中選取的指標和評價方法,以申銀萬國行業一級分類標準,對每個行業的上市公司進行綜合評價,并進行量化投資實證檢驗。【教學方法】實驗法【教學時數】2實驗九:股票價格漲跌趨勢預測拓展應用【實驗目的和要求】深化股票價格漲跌趨勢預測的深度拓展應用。【實驗內容】第9章中作為一個例子,主要采用了2017年的交易數據構建股票價格漲跌趨勢預測模型及量化投資策略的設計。一般地,交易市場中分為上漲行情、盤整行情和下跌行情,請分別對這三種情況下的交易數據,利用本章中的指標和模型構建股票價格漲跌趨勢預測模型,并進行量化投資策略檢驗。【教學方法】實驗法【教學時數】5實驗十:股票價格形態聚類與收益分析拓展應用【實驗目的和要求】深化股票價格形態聚類與收益分析的深度拓展應用。【實驗內容】第10章作為一個綜合例子,介紹了股票形態聚類及類收益率的計算方法,進一步地還介紹了預測模型的構建和量化投資策略的設計與實現。但是本文方法穩定性還有待進一步的檢驗,比如關鍵價格點該取幾個?形態聚類該聚幾個類?訓練樣本中計算形態特征的交易數據周期長度取幾個月?計算持有期收益率中持有期為多久?請您根據這些問題,選擇一個或者多個進行研究,并給出量化投資策略實證檢驗。【教學方法】實驗法【教學時數】5實驗十一:行業聯動與輪動分析拓展應用【實驗目的和要求】深化行業聯動與輪動分析深度拓展應用。【實驗內容】本11章介紹了申銀萬國行業日、周、月三種不同時間維度的聯動與輪動分析,但是在分析聯動與輪動規律的時候只考慮了“上漲與上漲”的關聯情況。事實上,“上漲與下跌”或者“下跌與下跌”也是常見的兩種關聯現象。請您結合本章中的方法,分析“上漲與下跌”、“下跌與下跌”兩種關聯現象,并提取有意義的關聯規則。【教學方法】實驗法【教學時數】2五、課程教學評價及依據項目考核內容考核方式課程目標1科學計算、數據處理、數據可視化、機器學習相關python包的案例應用課堂討論與講解實驗考核期末考核2.期末考試課程目標2金融基礎數據處理分析、上市公司綜合評價、股票價格漲跌趨勢及形態分析、股票或行業聯動與輪動分析1.課堂討論與講解2.實驗考核3.期末考核課程目標3金融量化投資實證研究報告研究報告及心得六、考核方式與評價標準(一)考核方式1.考核方式:平時考核+期末考核。平時考核包括課堂討論與講解、實驗考核、研究報告。期末考核采用開卷上機編程操作及案例分析。2.總成績評定:總成績=平時考核成績*30%+期末成績*70%平時考核成績占30%期末考試占70%課程分目標達成評價方法考核方式課堂討論與講解、實驗考核、調研報告及心得(滿分100分)上機編程操作及案例分析(滿分100分)課程目標120分40分分目標達成度=30%*(平時成績分目
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高效復習公路工程考試試題及答案
- 優化復習的試題及答案指南
- 智能倉儲與物流機器人考核試卷
- 糧食倉儲企業綠色經濟企業內部控制考核試卷
- 計算機二級MySQL常見問題試題及答案
- 快速提升的2025年信息系統監理師試題及答案
- 公共場所安全管理制度
- 嵌入式系統的可靠性分析方法試題及答案
- 賓館機房衛生管理制度
- 地鐵施工衛生管理制度
- 2024年安徽六安市葉集區引進急需緊缺專業人才和高層次人才20人歷年公開引進高層次人才和急需緊缺人才筆試參考題庫(共500題)答案詳解版
- 密封條范文模板(A4打印版)
- 西方文明史導論智慧樹知到期末考試答案2024年
- JBT 11699-2013 高處作業吊籃安裝、拆卸、使用技術規程
- IATF16949質量管理體系過程風險和機遇評估分析表
- 基礎有機化學實驗智慧樹知到期末考試答案2024年
- 項目攻關方案
- 2024年北京控股集團有限公司招聘筆試參考題庫含答案解析
- 勞動創造幸福主題班會
- 2024年移動網格經理(認證考試)備考試題庫大全-下(判斷題匯總)
- 知識星球行業報告
評論
0/150
提交評論