深度學習如何利用公募持倉網絡優化選股效果_第1頁
深度學習如何利用公募持倉網絡優化選股效果_第2頁
深度學習如何利用公募持倉網絡優化選股效果_第3頁
深度學習如何利用公募持倉網絡優化選股效果_第4頁
深度學習如何利用公募持倉網絡優化選股效果_第5頁
已閱讀5頁,還剩14頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

目錄日頻深度學習模型初探 3從CNN到LSTM 3神經網絡股票周頻收益率模型表現 5股票靜態內在屬性及應用 7股票內在屬性的探究 7基于基金選股網絡的嵌入層計算 9股票靜態內在屬性的應用 10股票內在屬性動態化應用 13動態市場狀態 13股票內在屬性動態特征的應用 14總結與思考 17風險提示 18插圖目錄 19日頻深度學習模型初探從CNNLSTM深度神經網絡是一種基于多層神經元的無監督算法,它被廣泛應用于計算機視覺、自然語言處理等領域。深度學習的主要神經網絡模型包括:卷積神經網絡(CooonalNeralNeworksNNtNeualNeworkNNgrmmryNework,(GdtUnits,GRUNCNN圖1:CNN結構示意圖 資料來源:Alometal.[1],CNNCNNRNNRNNA圖2:RNN結構示意圖資料來源:Alometal.[1],RNNLSTM可以解決訓練過程中的梯度消失和梯度爆炸問題,簡單來說就是在更長序列中有更好的表現。LSTM可以被簡單理解為是一種神經元更加復雜的常比RNN效果好。相較于構造簡單的RNN每個神經元(Cell(Forgetht-101ct-11(Input:對應下圖中t和??用于決定將哪些信息存儲在這個時刻的元胞狀態t中,以及輸出門(OuttGe圖3:LSTM結構示意圖資料來源:Alometal.[1],神經網絡股票周頻收益率模型表現Nelsonetal[2]嘗試了利用LSTM模型和一系列量價特征預測股票收益并取得了不錯的效果。傳統LSTM模型的最后一層是一個全連接神經網絡,來將隱藏層的輸出轉為最后的預LSTM(MLP)來作為股票收益預測的模型框架。并且我們嘗試調整LSTM模型為雙向來提升模型表現。預測股票周度收益率的模型細節如下:數據輸入:2013年至今中證1000成分股個股行情6個量價指標:開盤(A7個指13數據窗口及預測對象:用過去80個交易日的量價及資金流數據預測五個交易日后的個股超額收益(開盤至開盤。模型結構及細節:LSTM(128128MLP(25664641),每半年對過去825個交易日數據進行滾動訓練,訓練集與驗證集8.5:1.5(打亂E。5020R210次,則訓練早停,并取驗證集表現最佳的一次訓練作為最終模型。益率預測模型結構示意圖 資料來源:繪制最近一次模型采用了截至2023年4月1日的中證1000個股行情數據,模loss和RR圖5:LSTM+MLP模型訓練loss變化 圖6:LSTM+MLP模型訓練R2變化資料來源:wind, 資料來源:wind,DL7年的因子IC0.038,ICIR0.5124.2%IR為2.25。僅用個股日度行情和資金流等指標,已經可以初步訓練出具有一定選股能力的因子。圖7:DL因子IC表現 圖8:DL因子多空收益及凈值 資料來源:wind, 資料來源:wind,股票靜態內在屬性及應用股票內在屬性的探究??傳統的多因子模型認為同一種因子的因子暴露對于所有的股票的影響是一樣LSTM+MLP??圖9:股票A收盤價(元)與某一技術因子值 圖10:股票B收盤價(元)與某一技術因子值 資料來源:wind, 資料來源:wind,如何把股票分成不同種類,并發現影響因子表現的內在屬性呢?其實只要給每只股票生成一個嵌入(mbedig,包含足夠的信息即可。什么是嵌入?其本質上是利用目標所處的環境對其進行定義的一種方式,類似找到目標的各種應Lietal[3]就曾嘗試利用skip-gram算法計算股票的嵌入特征并應用到深度神經網絡中。在目前的股票市場上,基金的選股網絡Factorization)方法,矩陣分解是協同過濾算法的改進,分解的示意 資料來源:Corenetal.[4],??矩陣分解在基金選股網絡中也可以發揮相同的作用。矩陣分解算法本質上通(真實值(預測值??,矩陣中的元素????,??代表基金??對股票??的投資行為,即??和??票j的表示????,這個????包括????和????,即股票??的隱向量和bias。分解的目標函數為:??min∑

?(??+????+????+??????))2+??‖??‖?? ??,??

??

????其中,??,????是基金??的隱向量和bias,??表示模型中的其他偏差,‖??‖是為了?? ??防止過擬合而引入的模型正則項。下圖示意了當我們取embedding特征數為5時的矩陣分解算法:網絡的矩陣分解 資料來源:繪制[4]Y.Koren,R.BellandC.Volinsky,"MatrixFactorizationTechniquesforRecommenderSystems,"inComputer,vol.42,no.8,pp.30-37,Aug.2009,doi:10.1109/MC.2009.263.基于基金選股網絡的嵌入層計算32embeddingbiasMSE,訓640.12022loss64軸)隨訓練輪數(橫軸)變化 資料來源:wind,從矩陣分解的結果來看,基于基金選股網絡的嵌入層可能代表了某種未知的市場風格。我們用k-means算法用訓練得到股票的內在屬性進行聚類并分為20類,選擇數量最少的一類,列出其中涵蓋的所有股票及截至2023年4月1日的所屬行業及流通市值。圖14:k-means聚類后某類涵蓋的所有股票 股票代碼 股票簡稱中信一級行業流通市值 股票代碼 股票簡稱 中信一級行業 (億元) 000001.SZ平安銀行銀行2458.7600036.SH招商銀行銀行7068.2000002.SZ萬科A房地產1497.3600309.SH萬華化學基礎化工3008.5000423.SZ東阿阿膠醫藥345.1600438.SH通威股份電力設備及新能源1771.1000895.SZ雙匯發展食品飲料900.0600563.SH法拉電子電子326.8002100.SZ天康生物農林牧漁131.4600570.SH恒生電子計算機1093.8002142.SZ寧波銀行銀行1775.7600862.SH中航高科國防軍工311.8002179.SZ中航光電國防軍工850.9600886.SH國投電力能源750.2002291.SZ遙望科技傳媒131.4600887.SH伊利股份傳媒1828.7002352.SZ順豐控股交通運輸2620.6601166.SH興業銀行銀行3508.8002410.SZ廣聯達計算機766.2603882.SH金域醫學醫藥392.3002475.SZ立訊精密電子2176.8603987.SH康德萊醫藥68.4002572.SZ索菲亞輕工制造131.3688188.SH柏楚電子計算機279.0002594.SZ比亞迪汽車2980.9688598.SH金博股份基礎化工146.8002841.SZ視源股份消費者服務363.4688596.SH正帆科技機械84.7300054.SZ鼎龍股份基礎化工189.0688408.SH中信博機械59.9300203.SZ聚光科技能源117.2605111.SH新潔能電子132.7688235.SH百濟神州-U醫藥145.2600905.SH三峽能源能源747.9資料來源:wind,我們計算這類中個股的平均風格暴露。風格因子取值在-330.48,且大多數因子取值都0風格暴露與行業分布 風格因子 因子暴露中信一級行業個股數量 中信一級行業 個股數量貝塔-0.07醫藥4汽車1盈利-0.26銀行3電力設備及新能源1成長0.23基礎化工3消費者服務1杠桿-0.21計算機3輕工制造1流動性0.23電子3房地產1動量-0.34能源3交通運輸1非線性市值0.06國防軍工2其他行業0市值0.17食品飲料2價值-0.48機械2波動率0.24農林牧漁1資料來源:wind,股票靜態內在屬性的應用我們在LSTM模型生成多個因子后,與基金選股網絡嵌入層拼接后并輸入MLP,以將股票內在屬性加入到深度學習中。這樣就能在計算因子權重時,考慮到股票的內在屬性信息。即?????=??????([????,????])。??+5 ??我們從2016年開始,在每年的4月1日與9月1日進行訓練,分別取過去825180內在屬性的應用 資料來源:繪制202341lossR2R2上升較為單調,在50次訓練后仍未見頂,R2接近0.5,且訓練集與驗證集趨勢一致,效果好于第一節提到的LSTM+MLP圖17:靜態內在屬性神經網絡模型訓練loss隨訓練輪數變化圖18:靜態內在屬性神經網絡模型訓練R2隨訓練輪數變化資料來源:wind, 資料來源:wind,2016-04-08至2023-05-05,采用每周最后一個交易日的因子IC圖19:DL_EM因子IC表現 圖20:DL_EM因子分10組凈值 資料來源:wind, 資料來源:wind,DL_EM1000年平均年化72.9%益主要來源于空頭端。圖21:DL_EM因子分年度表現 資料來源:wind,股票內在屬性動態化應用動態市場狀態但市場是所以我們需要將股票靜態的內在屬性轉為動態內在屬性。??時刻市場的偏好狀態????,之后利用獲得的市場偏好對股票??內在屬性動態特征????,即:??1??=

??=????∑??(????1>????2>?>????????>?)??

??=1

??

?? ??????=???????? ??這一操作的本質目標是刻畫各股票與當下市場偏好股票的相似性。態市場狀態的捕捉 資料來源:繪制????若將股票的動態內在屬性動態特征????本身作為一個因子,并沒有顯著的選股Kr=20????因子表現,后續的研究中,我們繼續取????Kr=20。圖23:????因子IC表現 圖24:????因子多空收益?? ??資料來源:wind, 資料來源:wind,股票內在屬性動態特征的應用??同樣的,我們將上一節中計算的股票內在屬性動態特征????應用到深度學習模型中??? =????,??,??]將????計算5日后拼接原型中其模????+?? ?? ?? ??型細節與2.3中相同,模型結構如圖:內在屬性的應用 資料來源:繪制將上述訓練過程訓練得到的因子命名為DL_EM_Dynamic,進行周度回測,1000,2016-04-042023-06-09Ran12.3%,ICIR1.55,分十組凈值的單調性較強。圖26:DL_EM_Dynamic因子IC表現 圖27:DL_EM_Dynamic因子分10組凈值 資料來源:wind, 資料來源:wind,DL_EM_Dynamic100083.7203.4%,34%3.58。圖28:DL_EM_Dynamic因子分年表現 年份 扣費后多 多頭組合多頭組合 多空收益 扣費后純因子純因子組合純因子組合周度勝率頭收益 超額收益信息比率 組合收益 單邊換手率 信息比率2016年4月起19.1%15.4%2.8287.5%14.9%16.46.0886.8%2017-2.9%19.2%3.17120.0%17.2%21.45.8275.0%2018-36.5%5.7%0.7596.0%8.1%20.62.3260.8%201946.0%18.8%3.42175.9%25.9%21.68.9092.2%202082.3%50.5%6.49253.8%32.7%21.510.2092.2%202190.3%59.5%6.87347.3%41.3%20.511.9586.3%202237.3%74.5%6.34419.3%41.0%18.910.2294.1%2023/6/520.6%11.7%1.5651.3%8.5%9.12.1378.3%平均年化29.0%34.0%3.58203.4%26.2%20.87.4183.7%資料來源:wind,DL_EM_Dynamic1000指數增強組合5%,行業主動暴露±0.1,風格暴露±0.5,個股約束3%,單邊換手約束50%,得4.3,超5.5%,表現穩定。圖29:DL_EM_Dynamic因子主動增強組合表現 資料來源:wind,7392支股票10%作10.1億左右。圖30:主動增強組合持倉個數 策略容量估算(億) 資料來源:wind, 資料來源:wind,總結與思考LSTM+MLP1000衡量因子在不同時期對于股價影響的變化。將這些內在屬性與LSTM生成的因子MLP深度學習策略可解釋性相對較弱,今年來策略已經出現過一次明顯波動,若風險提示量化模型基于歷史數據,市場未來可能發生變化,策略模型有失效可能。插圖目錄圖1:CNN結構示意圖 3圖2:RNN結構示意圖 4圖3:LS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論