數據挖掘案例利用數據挖掘發掘金融市場交易規則_第1頁
數據挖掘案例利用數據挖掘發掘金融市場交易規則_第2頁
數據挖掘案例利用數據挖掘發掘金融市場交易規則_第3頁
數據挖掘案例利用數據挖掘發掘金融市場交易規則_第4頁
數據挖掘案例利用數據挖掘發掘金融市場交易規則_第5頁
已閱讀5頁,還剩3頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、PAGE PAGE 8數據挖掘案例:利用數據挖掘發掘金融市場交易規則許多投資者在金融市場交易中大量采用技術分析,用于技術分析的道氏理論早在1884年就已經出現,1997年Edwards寫了本新的技術分析方面的專著。技術分析包括k線、技術圖形識別等,利用數據挖掘技術可以給技術分析賦予全新的生命。技術圖形識別是技術分析中經常采用的一種技術。無論是國內還是國外股市,無論是何種股票(或者是其他的金融交易資產),只要交易時間一長,就會在由其市場價格和交易量的歷史數據所構成的走勢圖上形成各種不同的圖形,人們開始對這些圖形并不在意,后來發現一旦形成這些圖形,價格往后的走勢往往如出一轍,比如股價形成某種圖形后

2、就一路下跌,10只股票有9只如此,所以投資者只要看到這種圖形就紛紛賣出,這是技術圖形識別的一個運用,有些機構用此建立股票的自動交易系統。比如,利用技術圖形識別技術可以建立這樣的交易規則:* 如果前N個交易日的數據構成了X圖形,則買進,并在m日后賣出;*如果前N個交易日的數據構成了z圖形,則賣出。我們考慮的是如何利用數據挖掘方法來建立這樣的交易規則,使得投資者可以利用這些交易規則獲利?顯然問題的難點在于什么樣的圖形是有預測價值的、如何判斷最近n日的交易數據正在形成這樣的圖形。以往的學術文獻對此的研究很少,如果根據有效市場假設,是不可能利用技術分析方法來資本市場中獲取超額收益的。如在1966年,P

3、aul Samuelson 在提到:在股票市場上是不可能通過對過去的交易數據的推斷分析技術,如圖形識別技術、或其他數學的、或魔術般的技術來對未來價格變化進行預測,獲得超額收益的,因為市場價格中已經包含了所有的公開信息。但是從業者往往認為可以利用圖形識別技術來取得交易的成功。實際上現在結合數據挖掘的技術分析文獻在學術刊物上已經可以經常遇到,采用的數據方法有:從過去的數據中進行學習的人工神經網絡、模糊專家系統、決策支持系統、粗糙集方法挖掘交易規則、采用信號過程技術的數據挖掘方法,等等。這樣實際上為我們檢驗資本市場是否為有效的提供了一種檢驗方法:原假設:股票市場是有效的,因此通過技術分析方法,特別是

4、圖形識別技術方法不可能獲得超額收益,如果我們用數據挖掘的方法可以設計出一種交易規則,采用這種交易規則可以獲得顯著的超額收益,則原假設就應該被拒絕,從而說明股票市場并不是有效的(如對美國的股票市場進行實證分析)。圖形識別技術首先是圖形的確定、即確定哪些技術圖形是具有預測價值的,如第一冊中介紹了23種圖形,認為這些圖形是否預測價值的,圖形是依據過去的價格變化、或者還有成交量的變化而形成的。實際上,這些技術圖形可以不斷地去挖掘。確定這些有意義的技術圖形后,就可以通過技術圖形識別的來建立股票交易規則,而技術圖形不識別是通過數據挖掘方法來實現。以下為利用數據挖掘發掘金融市場交易規則的一個具體案例。這種技

5、術圖形稱為bull flag,現在還沒有專門的中文名稱。Flag:股票價格在一段時間內窄幅調整,形成一個類似于平行四邊行的圖形,兩頭或者急劇上升、或者急劇下降,表示一種較強的向上或者向下的趨勢,如果兩頭都是急劇向上,這樣的Flag就稱為bull flag。下面為兩個圖形,這兩個均為bull flag圖形的一種,圖形由10*10的表格所形成,每個格子中給出的是“權重”數,每列的“權重”數之和為零。如果某段時期的交易數據可以和這個圖形相擬合,則就顯示了某種預測功能。那么如何來判斷這段時間的股票走勢(實際上是股指走勢)正在構成一個bull flag,怎樣利用數據挖掘方法建立一個可以獲得超額收益的自動

6、交易規則?有機構采用了這樣的方法。用120個近期交易數據作為窗口(去除離開均值超過二倍標準差的噪音數據)判斷走勢是否正在形成某種bull flag,每次判斷給出一個擬合值,計算方法如下:依次將每12個數據分成一組共10組,對每一組進行交叉相關計算(cross-correlation computation),從而形成一個新的10*10的表格,第一列數據填寫如下:計算第一組數據中落在120個數據中的前10%的價格的交易日所占12個數據的比率,乘以對應列的格子中的“權重”數就可以相應格子中的數,再將第一列10個格子中的全部數相加,就得到第一列的擬合值,這樣對分成10組的120個交易日的數據,我們也

7、可以得到10個擬合值,再將這10個擬合值相加就得到某個交易日的擬合值,擬合值越大,則走勢正在形成bull flag圖形的可能性也就越大。有學者利用從1980年8月6日-1999年2月8日(整個時期是一個大牛市)共4748個交易日的紐約股票交易所綜合指數的收盤價數據來研究能否利用數據挖掘和技術圖形分析方法來建立自動交易規則、并獲得超額收益。(實際數據還包括時期前119天,和時期后99天)在這段時期對表1的最大擬合數出現在1982年10月5日。數據挖掘方法:以最初500個擬合數據作為數據挖掘訓練樣本,將所有的500個擬合數據從小到大排成一列,并取5%、10%、20%、30%等對應的一些擬合值,計算

8、具有這些擬合值的交易日在接下來100個交易日的平均收益率,并將這些平均收益率與訓練期的平均收益率相比較,并采用t檢驗法檢驗(單側檢驗)兩者之間是否存在顯著差異。檢驗結果顯示,對圖形1,如果采用95%的值作為確定值,則平均收益與訓練組的平均收益有顯著差異,平均收益提高了6.7%;對圖形2, 如果采用95%的值作為確定值,則平均收益與訓練組的平均收益有顯著差異,平均收益提高了5.12%。為此從訓練組可以建立這樣的交易規則:規則一:如果對圖形1的擬合值(用120個交易日數據構建)大于95%的值(利用先前的全部數據計算),則買進證券,并在100日后賣出;規則二:如果對圖形二的擬合值大于95%的值(同樣

9、利用先前的全部數據計算),則買進證券、并在100日后賣出。檢驗結果:對檢驗樣本組,平均收益率為5.5%,利用規則一完成的交易數為124次,平均收益率為115%;利用規則二完成的交易數為220次,平均收益率為7.8%,規則1和不使用規則的平均收益率存在顯著差異(t檢驗結果)。進一步的檢驗是將成交量納入規則中,結果得到的規則可以獲得平均14%的收益率。0.5-1-1-1-1-1-1-110.5-0.5-1-1-1-1-0.5110.5-0.5-0.5-0.5-0.50.50.5110.5-0.5-0.5-0.510.5110.50.510.5110.511-0.50.5110.50.511-0.5

10、-10.51111-1-1-1-0.50.511-2-1-1-1-1-0.50.50.5-2-2.5-1-1-1-1-1-1-10.250.82-1-1-1-1-1-1-10.250.820.250.80.25-1-0.75-11111111-0.5-0.75-10.50.50.50.50.50.50.5-0.5-0.75-1交易規則挖掘案例二:形態分析理論與交易規則挖掘市場是有趨勢可循的,歷史往往會重演。股票價格的歷史軌跡形態(股票價格序列的形態)對未來價格趨勢、特別是短期價格趨勢具有重要的預測價值。利用數據挖掘方法自動識別股票價格序列形態、及時發出交易信息的自動交易系統。有利的股票價格序列形態由投資者的經驗給出,形態相似的度量的方法有:距離法、傅利葉或小波變換法、規范變換法、神經網絡法等等。有一種模型是這樣度量股票價格序列形態的相似性:水平偏移幅度伸縮相關性相似性的度量指標:其中為待定參數,它們與一起分別代表了投資者對水平偏移、和幅度伸縮的容忍程度。 交易規則挖掘:假設投資者與有一個買進序列模式、一個賣出序列模式。相似度的取值在0,1之間,當相似度的小于0.5時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論