




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
《Python數據分析與實戰(微課版)》教學大綱課程名稱:Python數據分析與實戰課程類別:必修適用專業:大數據技術類相關專業總學時:64學時(其中理論28學時,實驗36學時)總學分:4.0學分課程的性質大數據時代已經到來,在商業、經濟及其他領域中基于數據和分析去發現問題并做出科學、客觀的決策越來越重要。數據分析技術將幫助企業用戶在合理時間內獲取、管理、處理以及整理海量數據,為企業經營決策提供積極的幫助。數據分析作為一門前沿技術,廣泛應用于物聯網、云計算、移動互聯網等戰略新興產業。有實踐經驗的數據分析人才已經成為了各企業爭奪的熱門。為了推動我國大數據,云計算,人工智能行業的發展,滿足日益增長的數據分析人才需求,特開設Python數據分析與實戰課程。課程的基本要求理論上,要求學生掌握數據分析的概念、流程;了解數據分析的應用場景和工具;掌握數據分析常用庫的作用;掌握數值計算、統計分析、數據預處理、數據可視化、模型構建的常用方法。技能上,要求學生掌握使用Python進行數值計算、統計分析、數據預處理、數據可視化、模型構建的操作方法,能將知識點揉入競賽網站、企業所得稅、餐飲企業等真實示例中,實現學以致用;并能基于TipDM大數據挖掘建模平臺,使用拖拽式、流程化、去編程化的新技術,解決實際案例。思政上,將習近平新時代中國特色社會主義思想、數據安全法等思政要素融匯到教學中,引發學生對新技術、新形勢的思考,促進經濟、行業的進一步發展;培養學生的科學探索、獨立思考、全局意識和思辨能力,以及職業素養、信息保護意識等。教學條件Python3.11.7+Anaconda2024.02-1+scikit-learn1.2.2+pyecharts2.0.5課程學時分配序號教學內容理論學時實驗學時其他1第1章Python數據分析概述212第2章NumPy數值計算基礎223第3章pandas統計分析基礎224第4章使用pandas進行數據預處理345第5章Matplotlib、seaborn、pyecharts數據可視化基礎346第6章使用scikit-learn構建模型647第7章競賽網站用戶行為分析358第8章企業所得稅預測分析359第9章餐飲企業客戶流失預測3510第10章基于TipDM大數據挖掘建模平臺實現客戶流失預測14總計2836教學內容及學時安排理論教學序號章節名稱主要內容教學目標學時1Python數據分析概述掌握數據分析的概念掌握數據分析的流程了解數據分析的應用場景了解數據分析的常用工具了解Python在數據分析領域的優勢了解Python數據分析的常用庫了解Python的Anaconda發行版在Windows操作系統上安裝Anaconda掌握JupyterNotebook的基礎功能掌握JupyterNotebook的高級功能掌握數據分析的概念、流程與應用場景了解Python常用的數據分析庫掌握Windows系統下Anaconda的安裝掌握JupyterNotebook的常用功能22NumPy數值計算基礎創建數組對象生成隨機數通過索引訪問數組變換數組的形狀創建NumPy矩陣掌握ufunc函數讀/寫文件使用數組進行簡單的統計分析掌握NumPy創建多維數組與生成隨機數的方法掌握數組的索引與變換掌握NumPy中數組矩陣的運算及通用函數的基本使用方法掌握NumPy讀/寫文件的方法和常用的統計分析的函數23pandas統計分析基礎讀/寫文本文件讀/寫Excel文件讀/寫數據庫數據查看DataFrame的常用屬性查、改、增、刪DataFrame數據描述分析DataFrame數據轉換字符串時間為標準時間提取時間序列數據信息時間數據的算術運算使用groupby()方法拆分數據使用agg()方法聚合數據使用apply()方法聚合數據使用transform()方法聚合數據掌握常見的數據讀取方式掌握DataFrame常用屬性與方法掌握基礎時間數據處理方法掌握分組聚合的原理與方法24使用pandas進行數據預處理堆疊合并數據主鍵合并數據重疊合并數據檢測與處理重復值檢測與處理缺失值檢測與處理異常值離差標準化數據標準差標準化數據小數定標標準化數據啞變量處理類別型數據離散化連續型數據掌握數據合并的原理與方法掌握數據清洗的基本方法掌握基本數據標準化的方法掌握常用的數據轉換方法35Matplotlib、seaborn、pyecharts數據可視化基礎掌握pyplot的基礎語法設置pyplot的動態rc參數使用Matplotlib繪制進階圖形繪制折線圖熟悉seaborn繪圖基礎使用seaborn繪制基礎圖形熟悉pyecharts繪圖基礎使用pyecharts繪制交互式圖形掌握pyplot常用的繪圖參數的調節方法掌握seaborn繪制基礎圖形的方法掌握seaborn繪制基礎圖形的方法掌握pyecharts繪制交互式圖形的方法36使用scikit-learn構建模型加載datasets模塊中的數據集將數據集劃分為訓練集和測試集使用sklearn轉換器進行數據預處理與降維使用sklearn估計器構建聚類模型評價聚類模型使用sklearn估計器構建分類模型評價分類模型使用sklearn估計器構建回歸模型評價回歸模型掌握sklearn轉換器的使用方法掌握sklearn估計器的使用方法掌握聚類模型的構建與評價掌握分類模型的構建與評價掌握回歸模型的構建與評價67競賽網站用戶行為分析了解競賽網站背景認識用戶行為分析熟悉競賽網站用戶行為分析的步驟與流程用戶識別數據清洗網頁分類構造特征了解K-Means聚類算法使用K-Means聚類算法進行用戶分群了解模型的應用熟競賽網站用戶行為分析的步驟和流程預處理競賽網站用戶訪問數據掌握K-Means算法的基本原理與使用方法對競賽網站用戶進行分群38企業所得稅預測分析分析企業所得稅預測背景了解企業所得稅預測的方法熟悉企業所得稅預測的步驟與流程了解相關性分析計算Pearson相關系數了解Lasso回歸方法選取關鍵特征了解灰色預測算法了解SVR算法預測企業所得稅熟悉企業所得稅預測的步驟和流程掌握相關性分析方法與應用掌握使用Lasso模型選取特征的方法掌握灰色預測算法的原理與應用掌握支持向量回歸算法的基本原理與應用39餐飲企業客戶流失預測了解餐飲企業客戶流失預測背景認識餐飲企業客戶流失預測熟悉餐飲企業客戶流失預測的步驟與流程數據探索查看重復值處理異常值處理缺失值構建客戶流失特征了解決策樹算法了解支持向量機算法預測餐飲企業客戶流失熟悉餐飲企業客戶流失預測的步驟與流程了解決策樹算法的基本原理與應用了解支持向量機算法的基本原理與應用310基于TipDM數據挖掘建模平臺實現客戶流失預測了解平臺的界面、訪問方式和特點了解【共享庫】模塊的功能了解【數據連接】模塊的功能了解【數據集】模塊的功能了解【我的工程】模塊的功能了解【個人組件】模塊的功能掌握平臺配置客戶流失預測案例的流程和步驟數據源配置數據預處理構建模型了解平臺的相關概念、特點和功能掌握平臺配置客戶流失預測案例的流程和步驟1學時合計28實驗教學序號實驗項目名稱實驗要求學時1Python數據分析環境搭建在Windows系統上安裝Anaconda掌握JupyterNotebook的常用功能12NumPy數值計算基礎創建NumPy數組對象ndarray使用random生成隨機數通過索引訪問ndarray變換ndarray的形態創建NumPy矩陣并使用;使用常見ufunc使用NumPy讀/寫文件使用NumPy進行簡單的統計分析23pandas統計分析基礎讀/寫文本文件讀/寫Excel文件讀/寫數據庫數據查看DataFrame的常用屬性查、改、增、刪DataFrame數據描述分析DataFrame數據轉換時間字符串為標準時間提取時間序列數據信息時間數據的算術運算使用groupby()方法拆分數據使用agg(),apply(),transform()方法聚合數據24使用pandas進行數據預處理堆疊、主鍵、重疊合并數據檢測與處理重復值,缺失值,異常值離差標準化、標準差標準化小數定標標準化數據啞變量處理類別型數據離散化連續型數據45Matplotlib、seaborn、pyecharts數據可視化基礎掌握pyplot的基本繪圖語法設置pyplot的動態rc參數繪制散點圖繪制折線圖繪制柱形圖繪制餅圖繪制箱線圖熟悉seaborn繪圖基礎繪制熱力圖熟悉pyecharts繪圖基礎繪制3D散點圖繪制漏斗圖繪制詞云圖46使用scikit-learn構建模型加載datasets模塊自帶數據集劃分數據集使用sklearn轉換器進行數據預處理與降維構建與評價聚類模型構建與評價分類模型構建與評價回歸模型47競賽網站用戶行為分析預處理競賽網站用戶訪問數據使用K-Means聚類算法進行用戶分群58企業所得稅預測分析分析企業所得稅數據特征的相關性使用Lasso回歸選取企業所得稅數據特征的關鍵特征使用灰色預測和SVR構建企業所得稅預測模型59餐飲企業客戶流失預測探索數據查看與處理餐飲企業數據中的重復值、異常值、缺失值構建客戶流失特征使用決策樹和支持向量機進行餐飲客戶流失預測510基于TipDM大數據挖掘建模平臺實現客戶流失預測配置客戶流失預測案例的數據源基于TipDM數據挖掘建模平臺對餐飲企業數據進行預處理基于TipDM數據挖掘建模平臺構建餐飲客戶流失預測模型4學時合計36考核方式突出學生解決實際問題的能力,加強過程性考核。課程考核的成績構成=平時作業(10%)+課堂參與(20%)+期末考核(70%),期末考試建議采用開卷形式,試題應包括基本概念、繪圖、分組聚合、數據合并、數據清洗、數據變換、模型構建等部分,題型可采用判斷題、選擇、簡答、應用題等方式。教材與參考資料教材趙男男,張良均.Python數據分析與實戰(微課版)[M].北京:人民郵電出版社.2024.參考資料[1] 黃紅梅,張良均.Python數據分析與應用[M].北京:人民郵電出版社.2018.[2] 張良均,譚立云.Python數據分析與挖掘實戰(第2版)[M].北京:機械工業出版社.2019.[3] 張健,張良均.Python編程基礎[M].北京:人民郵電出版社.2018.[4] 曾文權,張良均.Python數據分析與應用(第2版)(微課版)[M].北京:人民郵電出版社.2022.學院課程教學進度計劃表(20~20學年第二學期) 課程名稱Python數據分析與實戰 授課學時64 參與教學教師 授課班級/人數 專業(教研室) 填表時間教務處編印年月課程教學目的通過本課程的學習,使學生學會使用Python進行科學計算、可視化繪圖、數據處理,分析與建模,并詳細拆解學習聚類、回歸、分類三個企業案例,將理論與實踐相結合,為將來從事數據分析挖掘研究、工作奠定基礎。教學方法及手段本課程將采用理論與實踐相結合的教學方法。在理論上,通過任務引入概念、原理和方法。在實踐上,充分地利用現有的硬件資源,發揮學生主觀能動性,指導學生使用NumPy進行科學計算,使用pandas進行統計分析和數據預處理,使用matplotlib、seaborn、pyecharts進行圖形繪制,使用sklearn進行建模。同時結合三個綜合案例,引導學生將所學知識與企業需求相結合,將知識活學活用。要求學生自己動手分析實例,學習基本理論和方法,結合已有的知識,適當組織一些討論,充分調動學生的主觀能動性,以達到本課程的教學目的。課程考核方法突出學生解決實際問題的能力,加強過程性考核。課程考核的成績構成=平時作業(10%)+課堂參與(20%)+期末考核(70%),期末考試建議采用開卷形式,試題應包括基本概念、分組聚合、數據合并、數據清洗、數據變換、繪圖、模型構建等部分,題型可采用判斷題、選擇、簡答、應用題等方式。
《Python數據分析與實戰》教學日歷周次學時授課內容作業要求備注13第1章Python數據分析概述第1章課后習題25第2章NumPy科學計算基礎第3章pandas統計分析基礎(1)第2章實訓,課后習題33第3章pandas統計分析基礎(2)第3章實訓,課后習題45第4章使用pandas進行數據預處理(1)第4章選擇題,實訓1、253第4章使用pandas進行數據預處理(2)第5章Matplotlib、seaborn、pyecharts數據可視化基礎(1)第4章實訓3,操作題65第5章Matplotlib、seaborn、pyecharts數據可視化基礎(2)第5章課后習題73第5章Matplotlib、seaborn、pyecharts數據可視化基礎(3)第6章使用scikit-learn構建模型(1)第5章實訓85第6章使用scikit-learn構建模型(2)第6章選擇題83第6章使用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論