數據挖掘案例小組作業_第1頁
數據挖掘案例小組作業_第2頁
數據挖掘案例小組作業_第3頁
數據挖掘案例小組作業_第4頁
數據挖掘案例小組作業_第5頁
已閱讀5頁,還剩18頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

企業財務信息挖掘與股票走勢分析IBMSPSSModeler14.12014.06.06數據挖掘案例分析結課報告報告提要年報是反映企業經營狀況的重要信息途徑,對投資者也具有及其重大的參考價值,對企業股價走勢的影響也不可小視。本研究利用IBMSPSSModeler14.1挖掘企業年報財務指標中的信息并對對股票走勢分析預測,主要用到了以下方法:構建神經網絡模型分析預測企業財報發布后股票月度漲跌情況主成分分析后結合神經網絡預測

目錄1234CONTENTS數據理解&準備建模評估&部署商業理解

商業理解

BusinessUnderstanding通過財務報表的財務數據,包括現金流量表、資產負債表、和利潤表,可以定量的認識深層次的了解公司各個層次的運營狀況,無論是管理者還是投資者,財務報表無疑都是快速準確了解公司的重要途徑,對財務報表的分析之后,投資者的期望則間接地體現在對與該公司的股票的操作,看好則會買進,其股價自然會上漲,反之則反。通過對財務分析,進一步預測股票在未來一段時間內的走勢,具有很重要的投資價值,同時對指標的重要性進行分析,也可以為企業管理者提供管理建議,發現不足,促進企業更好的發展。

商業理解BusinessUnderstanding

數據理解&準備

DataUnderstanding&Preparation股價影響因素眾多,經濟形勢、國家宏觀經濟政策,行業,企業自身因素等,若不加篩選的尋找樣本分析,必然造成樣本數據噪聲過大,研究意義不大;選擇數據應盡可能的減少其他噪聲的影響,本文收集整合了傳媒娛樂這一行業29家上市公司作為實證分析樣本,選用2010年-2012年3年財報數據,剔除其中的ST公司、數據不齊全年份,得到55個樣本;其中運用到的財務指標,綜合提取了財報中的數據并進行了歸類,涵蓋了企業的各個方面,包含5類共28個指標。預測變量包括:年報發布后一周股票漲跌情況、一月股票漲跌情況

數據理解&準備DataUnderstanding&Preparation每股指標P償債能力指標C運營能力指標Y盈利能力指標L發揮能力指標F基本每股收益P1流動比率C1應收賬款周轉率Y1營業利潤率L1營業收入增長率F1每股收益-扣除P2速動比率C2存貨周轉率Y2營業凈利率L2總資產增長率F2每股資本公積金P3資產負債比率C3流動資產周轉率Y3營業毛利率L3營業利潤增長率F3每股未分配利潤P4產權比率C4固定資產周轉率Y4成本費用利潤率L4凈利潤增長率F4每股凈資產P5總資產周轉率Y5總資產報酬率L5凈資產增長率F5每股經營現金流量P6凈利潤現金含量Y6加權凈資產收益率L6每股現金流量增長率Y7

數據理解&準備DataUnderstanding&Preparation輸出變量:股票周漲跌、股票月漲跌

建模

ModellingBP神經網絡直接用BP-神經網絡模型分別預測周漲跌和月漲跌情況

建模ModellingBP神經網絡預測結果分析月漲跌作為輸出:模型結構(28,8,1)預測精度:81.0%周漲跌作為輸出:模型結構(28,7,1)預測精度:71.4%月漲跌重要性周漲跌重要性營業毛利率0.0847每股未分配利潤0.0709成本費用利潤率0.0777營業毛利率0.0677加權凈資產收益率0.0581營業利潤率0.0641應收賬款周轉率0.056凈利潤現金含量0.0628營業利潤增長率0.0536基本每股收益0.052每股現金流量增長率0.0533凈利潤增長率0.0519速動比率0.0491存貨周轉率0.0519存貨周轉率0.0476每股經營現金流量0.0503產權比率0.0444營業收入增長率0.0496每股收益扣除0.04凈資產增長率0.0433預測月漲跌精度更高對股票月漲跌(長期)來說

重要的是營業毛利率、成本費用利潤率和應收賬款周轉率等,對企業盈利能力和運營能力指標比較看重影響股票周漲跌(短期)的因素中最重要的是每股未分配利潤,其他有營業毛利率、營業利潤率等,可見短期來說每股指標和盈利能力指標比較重要主成分神經網絡考慮到輸入層指標過多,采用主成分分析提取主要因素在進行神經網絡預測

建模Modelling主成分分析共提取出5個主因子,這與研究中所選用的企業的五類指標相吻合;5個主因子提取了原始數據28個指標近70%的信息;主成分-神經網絡預測結果分析月漲跌作為輸出:模型結構(5,1,1)預測精度:85.7%周漲跌作為輸出:模型結構(5,2,1)預測精度:71.4%預測月漲跌精度更高對股票月漲跌(長期)來說第一個因子和第二個主因子比較重要,基本每股收益和每股收益扣除比重較大影響股票周漲跌(短期)的因素中第四個因子尤其重要,幾乎達到了50%,第四個因子主要是每股未分配利潤指標,投資者應該注意該項指標月漲跌重要性周漲跌重要性$F-Factor-20.3691$F-Factor-40.4913$F-Factor-10.2834$F-Factor-50.2406$F-Factor-30.1845$F-Factor-20.1298$F-Factor-50.0983$F-Factor-10.1167$F-Factor-40.0647$F-Factor-30.0216K均值聚類仍然以傳媒業股票為例,首先利用聚類方法將所有傳媒類股票進行分類:用K均值聚類法將所有股票分為5類

建模ModellingC5.0決策樹再利用C5.0決策樹對這五類變量進行劃分,可以看出聚類的標準:加權凈資產收益率>5.5%;營業凈利率>9.8%;產權比率大于<198%;

資本公積金>5.26這樣盈利能力強而風險低的股票只有第二類股票而在所有時間段都屬于第二類只有一支:時代出版時間序列模型我們再利用時間序列分析方法,對時代出版這支股票進行預測:使用指數平滑模型:使用指數平滑模型:擬合的趨勢和原始序列趨勢圖如下:6月7日的收盤價根據預測為:15.75預測上下區間為(14.69,16.81)

評估&部署

Evaluation&Deployment評估和部署Evaluation&Deploymen

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論