




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
緒論1.1研究背景20世紀90年代,投資理財這一詞語開始出現(xiàn),人們開始對投資理財有了一定的概念。根據(jù)資料記載,個人投資理財最早是在美國興起并且有了質的發(fā)展。到了2012年,我國開始逐漸推行一系列財經政策并逐步實施到位,這為我國股票債券市場的擴容和的發(fā)展提供了很大的幫助,也吸引了更多的投資者參與到投資理財當中。其中,最令投資者追捧的是具有“高送轉”行為的上市公司。為什么會出現(xiàn)這種現(xiàn)象呢?研究表明,“高送轉”行為在公司層面上不能給股東的權益和盈利帶來有效的回報,而且投資者還不能拿到真實現(xiàn)金利益回報。但這種現(xiàn)象卻贏得了各大上市公司和投資者的喜愛。盤和林教授曾表示:“分紅是指分到手的現(xiàn)金,高送轉是指將股票打散”。這其實也是一個互惠互利的過程,各大上市公司都可以通過低價地方式打散自己的股票,低價地出售自己的股份以此方式吸引更多投資者進行投資,而且這些投資者能夠以最少的成本買到自己最低價值的股份[[][]據(jù)去年南方財經網報道,2020年9月左右,“美股高送轉”成為股票市場上的議論紛爭的話題,特斯拉和蘋果兩大企業(yè)是投資者討論的重點對象,都參與到“美股高送轉”中,特斯拉把一支股票拆分為5股,蘋果一支股票拆分為4股,使得股票大漲。事實上,美國并沒有高送轉,而是叫“拆股”,其本質意義和“高送轉”差不多,都是通過拆分股票,降低股票價格,來增強市場上流動性。1976年,法瑪(fama)優(yōu)先地站了出來,他提出了通過股份分割方式來傳遞公司收益的一種信號,他們認為拆股后所傳遞的信息就是收益。到了1988年,布倫南與可普蘭德(Brennan&Copeland)根據(jù)該信號的傳遞建立了分割模型(BC模型)。這些理論為我國學者研究上市公司“高送轉”的準確率提供了有力的支撐。據(jù)了解國外證券市場是一個半強式有效的市場,而我國的證券市場是一個弱式有效的市場[[]],我國研究者對國外股市總結得出關于上市公司“高送轉”的結論對我國股市的適用度不高。而且對于我國上市公司“高送轉”預測,logistic、svm、BP神經網絡模型和Probit這些模型都比較受研究者的喜愛,并且通過這些模他們找到了影響上市公司“高送轉行為”的指標。2005年,楊一文等人基于支持向量機對上證綜指序列趨勢展開了研究[[][][]1.2研究意義從歷史數(shù)據(jù)看,我國股市也發(fā)展了有30年了,在1990年12月,我國滬深股市才正式有了生意業(yè)務,而且規(guī)模還很小,當時上市的股票數(shù)量還少得可憐,并且市道上流通的股票還很少。但卻很受股民的喜愛,由于我國股市的市民較多,曾經還出現(xiàn)求過于供的現(xiàn)象。現(xiàn)如今,我國股市也有了質的發(fā)展,上市的公司也有3000多家,不再出現(xiàn)供不應求的現(xiàn)象,而是開始流行上市公司實施“高送轉”的行為。那么,為什么許多家企業(yè)都熱衷于實施“高送轉”行為呢?從實際意義上來講,不能夠為公司的股東權益和盈利帶來有效的回報,但是它能夠促進公司股價上漲,并且可以提高公司在市面的價值、形象和影響力,同時也給企業(yè)在未來的發(fā)展帶來了更多的信心。進而能夠帶來更多投資者的關注,吸引更多的投資者參與到投資中來[[]]。而股民則可以以最優(yōu)的價錢買到心儀的股票,“高送轉”不管是對企業(yè)還是投資者來說,都是一個兩全其美的事情。又因為股民缺乏相應的專業(yè)知識,對便宜的股票沒有抵制力,股票操作技術和知識等能力不夠豐富,存在許多不夠理性的投資行為[[[][]1.3指標相關內容根據(jù)歷史數(shù)據(jù),本文總結了影響了上市公司“高送轉”行為的6個指標,包括總市值total_mv、每股公積金capital_rese_ps、基本每股收益eps、流通股本float_share、每股未分配利潤undist_profit_ps、每股凈資產bps。表1.1指標說明字段名稱字段中文名稱字段說明total_mv總市值總股本數(shù)/當時股價得出的股票總價值capital_rese_ps每股公積金公積金/股票總股數(shù)。eps每股收益凈利潤本期值/實收資本期末值float_share流通股本在交易所有權利進行場內流通的股票undist_profit_ps每股未分配利潤企業(yè)當前未分配利潤總額/總股本,也就是具備每10股送10股bps每股凈資產代表公司凈資產價值2案例目標即實現(xiàn)思路2.1實現(xiàn)思路本案例的主要目標是基于年度財務數(shù)據(jù)及其每日指標數(shù)據(jù),對上市公司進行“高送轉”預測。基于支持向量機模型預測上市公司是否有“高送轉行為”。選擇的總體規(guī)模指標包括上市公司的總市值total_mv、每股公積金capital_rese_ps、基本每股收益eps、流通股本float_share、每股未分配利潤undist_profit_ps、每股凈資產bps,設置指標總市值total_mv<300億、每股公積金capital_rese_ps>5、每股收益eps>0.5、流通股本float_share<3億、每股未分配利潤undist_profit_ps>、每股凈資產bp>2來預判高送轉公司,如果指標同時滿足以上條件,則記為1,否則記為0,最后將處理好的數(shù)據(jù)和原始數(shù)據(jù)合并保存到excel中。利用篩選出具有高送轉可能性的上市公司的各年度數(shù)據(jù)作為訓練集數(shù)據(jù),2014-2020每一年度數(shù)據(jù)作為預測數(shù)據(jù),利用支持向量機、BP神經網絡和邏輯回歸三種模型分析方法預測上市公司是否有“高送轉行為”,如果有“高送轉行為”則記為1,否則記為0。當預判的結果與訓練的結果都等于1時,則將具有高送轉行為的上市公司的股票代碼和名稱都展示在tableview中。2.2流程圖上市公司高送轉預測系統(tǒng)上市公司高送轉預測系統(tǒng)指標選擇,包括總市值、每股公積金、每股收益、流通股本、每股未分配利潤、每股凈資產。查找資料,尋找影響上市公司高送轉的因素。根據(jù)預測結果和準確率進行分析。指標數(shù)據(jù)處理,設定指標標準預判具有高送轉行為的上市公司。劃分訓練集和測試集,將預判后的數(shù)據(jù)作為訓練集,2014-2020每一年度的數(shù)據(jù)作為預測數(shù)據(jù)。基于支持向量機、神經網絡和邏輯回歸模型分析方法預測上市公司是否有高送轉行為,有則記為1,無則記為0。3研究方法3.1分類模型3.1.1支持向量機支持向量機(也稱svm)模型,它是一種二分類模型的機器學習算法,也就是預測訓練集和類型之間的對應關系[[][]3.1.2BP神經網絡BP神經網絡算法是當今機器學習領域中頗為受歡迎的學習算法,1989年,有學者表示BP神經網絡在輸入層、隱藏層以及輸出層這三層可以擬合任意連續(xù)的有界函數(shù)[[][]3.1.1邏輯回歸邏輯回歸LR是一種比較常用的分類算法[[][]3.2模型的應用3.2.1訓練集和測試集的劃分3.2.11支持向量機樣本訓練集:M={(x1,y1),(x2,y2),...,(xn,yn)}\in(X\timesY)^n其中x1,x2,...xn均表示向量,xi∈X=Rn,yi?(+1,-1),且i表示第i個樣本,n表示容量。其最終目的是尋找到最優(yōu)超平面。根據(jù)以往的歷史經驗,使用支持向量機進行分類預測時,需要調節(jié)有關的參數(shù),特別是懲罰參數(shù)和核函數(shù)參數(shù),這樣才可以獲得比較滿意的預測分類結果[[]]。[]3.2.12BP神經網絡在機器學習算法中,一個神經網絡一般分為三層(即輸入層、隱含層和輸出層),在構建BP神經網絡的過程中,假設有n個輸入樣本x(n)=(x1(n),x2(n),...,xn(n)),有對應的期望輸出為y(n)=(y1(n),y2(n),...,yn(n)),需要計算每個神經元的輸入和輸出,并且能夠利用期望輸出和實際輸出計算出誤差函數(shù)結果,修正權值之后得到最終的權值。該模型在本文中采取了人為方式劃分訓練集和測試集。3.2.13邏輯回歸樣本訓練集:即特征數(shù)據(jù)為x={x1,x2,…,xm},分類數(shù)據(jù)為y={y1,y2,…,ym}。該模型也是獲取2014-2020年度數(shù)據(jù),使用機器學習算法(Sklearn)中的邏輯回歸模型人為劃分訓練集和測試集。最終實現(xiàn)y={0,1}為分類結果。3.3模型的評估本文根據(jù)影響上市公司高送轉的特征因子,即總市值total_mv、每股公積金capital_rese_ps、基本每股收益eps、流通股本float_share、每股未分配利潤undist_profit_ps、每股凈資產bps,預測因變量本年度上市公司是否高送轉,基于2014-2020年度數(shù)據(jù),對于訓練集和測試人為來劃分。根據(jù)預測結果,本文利用AUC方法來衡量本次的預測結果。AUC常用于衡量機器學習分類結果的有效程度,主要是將訓練集中的label分為{0,1}這兩類,意思是當隨機選擇一個分類結果為1的樣本數(shù)據(jù)和隨機挑選一個分類結果為0的樣本數(shù)據(jù),出現(xiàn)1的概率要大于0的概率,即AUC=0.8,AUC值越大表明,預測的結果越好。公式為Z=R-y,Rs=len(Z[Z==0])/len(Z),R表示模型分類的結果,也表示測試數(shù)據(jù),RS則為最終的得分結果。4數(shù)據(jù)分析4.1數(shù)據(jù)來源數(shù)據(jù)來源于tushare金融大數(shù)據(jù)社區(qū)提供免費開源的各類金融數(shù)據(jù),通過注冊社區(qū)會員及獲得積分,在個人中心找到Tushare金融大數(shù)據(jù)社區(qū)提供的PythonAPI即可獲取所需的數(shù)據(jù),提取權限與積分有關,本案例是基于學生權限(積分值大于2000)獲取2014--2020的年度數(shù)據(jù)。4.2指標選擇本案例預選的上市公司指標有總市值total_mv、每股公積金capital_rese_ps、基本每股收益eps、流通股本float_share、每股未分配利潤undist_profit_ps、每股凈資產bps,,一共6個指標。4.3數(shù)據(jù)獲取過程安裝Tushare,Tushare現(xiàn)如今已經是Python的一個擴展包,利用Python安裝擴展包的方法:在清華鏡像網直接下載安裝,即pipinstall-i/simpleTushare,如圖4.1所示:圖4.1安裝Tushare擴展包將Tushare安裝完成之后,登錄tushare,與管理員聯(lián)系獲得相應的積分,積分是用來獲取數(shù)據(jù)的權限,在個人中心即可查詢自己的接口token。如圖4.2所示:圖4.2獲取tushare接口token利用_api(token)接口,通過for循環(huán)獲取數(shù)據(jù);獲取2014年至2020年上市公司的股票基本信息,并保存為年份+年度股票代碼.xlsx文件,從每日指標數(shù)據(jù)表和財務指標表中獲取每一年的總市值total_mv、每股公積金capital_rese_ps、基本每股收益eps、每股未分配利潤undist_profit_ps、流通股本float_share、每股凈資產bps指標數(shù)據(jù),一共獲取6年的數(shù)據(jù),并保持為年份+年度.xlsx文件。代碼示例如圖4.3所示:圖4-3數(shù)據(jù)獲取過程代碼截圖4.4數(shù)據(jù)獲取結果在Tushare獲取了2014年至2020年的數(shù)據(jù),已2018年度指標數(shù)據(jù)的為例,獲取了3505個股票代碼數(shù)據(jù),結果如表4.2:表3-2股票代碼數(shù)據(jù)ts_codefloat_sharetotal_mvepscapital_rese_psundist_profit_psbps000001.SZ1717024.67716105845.861.393.28865.535112.8182000002.SZ971517.004326295260.073.060.72528.30914.1102000004.SZ8301.3184134614.6245-0.24140.01110.15971.3008000005.SZ95122.246283687.87370.14060.6502-0.28061.4069000006.SZ134830.7972699297.43380.64760.35882.1334.5909000007.SZ30894.8044279237.1235-0.570.4532-0.92870.5505000008.SZ254319.03751096330.2960.1160.99680.60032.6298000009.SZ211978.9066926367.68250.10.38410.91912.4522000010.SZ52217.1348267272.6364-0.89221.8239-2.3230.5115獲取的上市公司的股票基本信息也是已2018年度的數(shù)據(jù)為例,本次獲取了3856上市公司的基本信息,部分結果如表4.3:表4.3上市公司基本信息ts_codesymbolnameareaindustry0000001.SZ000001平安銀行深圳銀行1000002.SZ000002萬科A深圳全國地產2000004.SZ000004國農科技深圳生物制藥3000005.SZ000005世紀星源深圳環(huán)境保護4000006.SZ000006深振業(yè)A深圳區(qū)域地產5000007.SZ000007全新好深圳酒店餐飲6000008.SZ000008神州高鐵北京運輸設備4.5數(shù)據(jù)處理訓練集中缺失值與異常值往往會導致模型準確率低或訓練效果不明顯。這會導致預測的結果不準確。所以要先去掉NAN空值,即將存在指標取值缺失的公司排除在外。利用dropna()去掉空值的行,利用dropna(inplace=True)查看是否還有空值。結果為True,表示沒空值,說明去空值完成。利用iloc切除對應列,做單位轉換,將萬元單位轉化成億元單位。設定指標總市值total_mv<300億、每股公積金capital_rese_ps>5、每股收益eps>0.5、流通股本float_share<3億、每股未分配利潤undist_profit_ps>2元、每股凈資產bps>2元,如果指標同時滿足以上條件,則記為1,表示該公司有高送轉行為,否則記為0,則沒有高送轉行為,將處理好的指標數(shù)據(jù)和是否高送轉的結果合并到原始數(shù)據(jù)中并保存為excel文件。部分代碼如圖4.4所示,結果如圖4.5所示:圖4.4數(shù)據(jù)處理圖4.5數(shù)據(jù)處理4.6結果分析本文通過Tushare獲取上市公司的6個指標數(shù)據(jù)作為研究對象,將每一年年度預判的數(shù)據(jù)作為訓練集,2014年至2020年的數(shù)據(jù)作為預測數(shù)集,將支持向量機模型劃分為主要模型,神經網絡和邏輯回歸模型為輔來做對比,計算模型的準確率。以2018年年度數(shù)據(jù)為例,模型的準確率如圖4-6所示圖4.6預測結果得到的結果,三個模型的預測準確率都高達0.8以上,說明三個模型預測的結果可靠率都比較高。5GUI可視化系統(tǒng)設計與實現(xiàn)5.1需求分析20世紀開始,我國股票市場有了質的飛躍,國內股票市場有了很好的條件環(huán)境,人們開始學習如何去投資理財,這也就是為什么證券投資成為了人們日常生活中理財?shù)囊环N方式。也逐漸演變成為了上市公司的一種炒作手段,而每年年初上市公司“高送轉”的股利分配受到了股民的追捧。本文基于支持向量機(svm)、BP神經網絡和邏輯回歸機器學習算法,建立回歸模型。本文預測系統(tǒng)基于PyCharm和配置QtDesigner和PyUCI代碼生成工具開發(fā)環(huán)境,通過設計GUI可視化界面,,將其保存為.ui,再用PyUCI代碼.py文件,最后生成.exe文件,運行.exe文件即完現(xiàn)GUI可視化系統(tǒng)。開發(fā)具有預測我國的上市公司高送轉的功能系統(tǒng),幫助投資者最大化預先了解要進行高送轉的上市公司,本次預測結果僅供參考。5.2系統(tǒng)設計首先在pycharm中配置界面設計師(QtDesigner)和PyUCI代碼生成工具,點擊File選擇Settings如圖5.1所示:圖5.1代碼生成工具配置在菜單欄單擊File選擇“Tools/ExternalTools”選項,點擊“+”號,在彈出的外部工具CreateTool配置窗口中,輸入外部工具名稱(可自定義),一般用QtDesigner表示,再Program配置PyQt界面設計師可執(zhí)行文件完整路徑以及工作路徑,點擊“ok”按鈕,即可完成QtDesigner外部工具的配置。“Tools/ExternalTools”欄中增加了QtDesigner。如圖5.2所示:圖5.2代碼生成工具配置和配置QtDesigner外部工具操作一致,在“Tools/ExternalTools”中繼續(xù)單擊“+”按鈕,名稱為PyUCI,配置好路徑即可點擊“ok”按鈕,便可發(fā)現(xiàn)“Tools/ExternalTools”欄中會新增選項PyUCI,最后點擊“ok”即可完成如圖5.3所示:圖5.3代碼生成工具配置QtDesigner是一個輔助開發(fā)工具,能夠快速地設計程序界面,它能夠有效地提高開發(fā)效率和降低開發(fā)過程中的難度。本文中的上市公司高送轉預測案例可視化演示系統(tǒng)是展示每一年份的原始數(shù)據(jù)和預測的結果,根據(jù)自己的想法,參考他人的界面設計,獨立完成程序的GUI界面,最后把我們設計好的演示系統(tǒng)yan.ui文件轉化為Python程序可讀的代碼,便可完成設計好相關功能的開發(fā)。我們可以根據(jù)已經配置好的界面代碼生成工具,在Pycharm環(huán)境下,選擇設計好的yan.ui界面文件,右擊找到“Tools/ExternalTools/Py”即可自動生成Python程序代碼。如圖5.4所示:圖5.4系統(tǒng)ui界面樣式5.3系統(tǒng)的實現(xiàn)本系統(tǒng)實現(xiàn)的功能是“combobox”和“treewidget”控件,點擊樹結構控件“treewidget”和下拉框“combobox”中的任何一個目錄,在控件“tableview”中都會展示其相關的數(shù)據(jù)。年度和模型都在界面設計中提前部分代碼如圖55所示:圖5.5界面設計代碼這是控件互相關聯(lián)的代碼,通過定義函數(shù)傳入參數(shù),如圖5.6所示:圖5.6界面設計代碼5.4生成EXE文件在AnacondaPrompt下使用命令安裝pyinstaller編譯包,,命令為“pipinstall–userpyinstaller”。等待pyinstaller編譯包安裝完成,再安裝其它三個依賴包(即pywin32-ctypes、altgraph和pefile)。安裝好幾個依賴包之后,在AnacondaPrompt下通過命令cd切換至項目文件夾下的路徑“C:\Users\lenovo\Desktop\高送轉”(放置.ui和.py文件的位置)。如圖5.7所示圖5.7生成EXE文件過程使用命令:“pyinstaller-F+編譯文件”即可進行編譯,注意程序文件根據(jù)自己的文件名而定,本文項目編譯的程序文件名為main.py”,如圖5.8所示:圖5.8生成EXE文件過程若項目文件編譯顯示成功,并且編譯過程時,沒有出現(xiàn)報錯,但是當我們運行編譯成功的EXE文件時會提示以下錯誤,如圖5.9所示:圖5.9生成EXE文件過程這個報錯提示原因為編譯過程中部分開發(fā)包不兼容,不能夠自動導入。解決辦法是只需要對編譯時產生的main.spec文件中的hiddenimports這一模塊進行修改即可。參考:hiddenimports=['cython','sklearn','sklearn.ensemble','sklearn.neighbors.typedefs','sklearn.neighbors.quad_tree','sklearn.tree._utils','scipy._lib.messagestream'],修改完成之后,再次運行命令編譯main.spec文件即可,如圖5.10所示:圖5.10生成EXE文件過程等待編譯完成,即可把項目的數(shù)據(jù)文件和運行需要的開發(fā)環(huán)境文件拷貝到該目錄下就可以完成所有的編譯了,如圖5.11和5.12所示,文件main.exe即為可獨立運行的程序。圖5.11生成EXE文件過程圖5.12生成EXE文件過程5.5系統(tǒng)演示運行代碼文件,會出現(xiàn)第一個窗口,點擊按鈕跳轉到第二個窗口,窗口顯示有年份目錄、模型選擇下拉框和退出系統(tǒng)按鈕,如圖5.3和5.14所示:圖5.13系統(tǒng)演示圖5.14系統(tǒng)演示只要點擊樹結構目錄中的任意一年份,原始數(shù)據(jù)將會在tableview中展示出來,本次演示選擇的2014年度的數(shù)據(jù),結果如圖5.15所示:圖5.15年度數(shù)據(jù)顯示結果當選擇下拉框中的任意一個模型,預測的高送轉上市公司也將會在tableview中展示出來,本次選取2014年度邏輯回歸模型的結果,如圖5-16所示:圖5.16預測結果顯示6分析與總結近年來,國家發(fā)展迅速,人們的生活水平也逐漸上升,也多出了很多散錢。投資理財也成為了人們生活中的一部分,“錢生錢”這種不需要出力就能夠獲得許多收入的好事,這對市民有很大的誘惑力,而年初的“高送轉”股利分配方式是眾多投資者最為關注的話題之一,畢竟進行能買到低價股票可以省好多的資本,人們開始收集數(shù)據(jù),作報告分析,互相討論哪些上市公司股票有可能是高送轉,是否會成為潛力股等等,而這樣的現(xiàn)象,也逐漸演變成了上市公司的一種炒作方式[[]
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 互聯(lián)網農業(yè)產業(yè)鏈合作運營協(xié)議書
- 生物降解材料工程師研發(fā)項目風險評估與管理合同
- 裝修公司設備采購與建筑垃圾處理合同
- 《空壓機節(jié)能技術及應用》課件
- 臘八節(jié)童謠文化啟蒙
- 爭當打字小能手教學課程設計
- 《數(shù)字信號處理》課件:調諧器的高頻特性研究
- 飛呀飛音樂課件
- 《腎癌微波消融術》課件
- 《企業(yè)價值最大化》課件
- 立磨操作員崗位考核標準
- 邊坡勘察報告
- 國家級高技能人才培訓基地建設項目申請書
- 地產項目質量問題整改通知單
- 高校在完善國防動員機制中的作用與實現(xiàn)路徑
- DB31∕696-2020 蒸壓加氣混凝土砌塊(板)單位產品綜合能源消耗限額
- 聚酯合成的酯化與縮聚課件
- 認識分式 課件
- 發(fā)還清單(公安機關刑事法律文書式樣(2012版))
- EHS監(jiān)測測量控制程序
- 應急預案演練記錄表范例
評論
0/150
提交評論