用MATLAB實現大數據挖掘地一種算法_第1頁
用MATLAB實現大數據挖掘地一種算法_第2頁
用MATLAB實現大數據挖掘地一種算法_第3頁
用MATLAB實現大數據挖掘地一種算法_第4頁
用MATLAB實現大數據挖掘地一種算法_第5頁
已閱讀5頁,還剩28頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數據挖掘的目的數據挖掘(Data Mining)階段首先要確定挖掘的任務或目的。數據挖掘的目的就是得出隱藏在數據中的有價值的信息。數據挖掘是一門涉及面很廣的交叉學 科,包括器學習、數理統計、神經網絡、數據庫、模式識別、粗糙集、模糊數學 等相關技術。它也常被稱為“知識發現”。知識發現(KDD)被認為是從數據中發 現有用知識的整個過程。數據挖掘被認為是KDD過程中的一個特定步驟,它用 專門算法從數據中抽取模式(patter,如數據分類、聚類、關聯規則發現或序列 模式發現等。數據挖掘主要步驟是:數據準備、數據挖掘、結果的解釋評估。據挖掘算法說明確定了挖掘任務后,就要決定使用什么樣的挖掘算法。由于條件

2、屬性在各樣 本的分布特性和所反映的主觀特性的不同,每一個樣本對應于真實情況的局部 映射。建立了粗糙集理論中樣本知識與信息之間的對應表示關系,給出了由屬性 約簡求約簡決策表的方法。基于后離散化策略處理連續屬性,實現離散效率和信 息損失之間的動態折衷。提出相對值條件互信息的概念衡量單一樣本中各條件屬 性的相關性,可以充分利用現有數據處理不完備信息系統。本次數據挖掘的方法是兩種,一是找到若干條特殊樣本,而是找出若干條特 殊條件屬性。最后利用這些樣本和屬性找出關聯規則。(第四部分詳細講解樣本 和屬性的選擇) 三數據預處理過程數據預處理一般包括消除噪聲、推導計算缺值數據、消除重復記錄、完成數 據類型轉換

3、(如把連續值數據轉換為離散型數據,以便于符號歸納,或是把離散 型數據轉換為連續)。本文使用的數據來源是名為CardiologyCategorical”的exce l文件中的源 數據”。該數據表共303行,14個屬性。即共有303個樣本。將該數據表的前200 行設為訓練樣本,剩下后的103行作為測試樣本,用基于粗糙集理論的屬性約簡 的方法生成相應的規則,再利用測試樣本對這些規則進行測試。首先對源數據進行預處理,主要包括字符型數據的轉化和數據的歸一化。數據預處理的第一步是整理源數據,為了便于matlab讀取數據,把非數字 數據轉換為離散型數字數據。生成lisanhua.xsl文件。這一部分直接在e

4、xcel 工 作表中直接進行。步驟如下:將屬性“sex”中的“Male”用“1”表示,“Female”用“2”表示;將屬性 “chest pain type” 中的Asymptomatic” 用1” 表示 “AbnormalAngina” 用 “2” 表示,“Angina” 用 “3” 表示,“NoTang” 用 “4” 表示;將屬性 “Fasting blood suga=0.9&ncc=8)|(ncc = 10&nc=0.6)得到決策屬性 healthy、不滿足以上條件的話如果(mc=0.9|mcc=8)|(mcc=9&mc=0.6)得 到決策屬性sick。、不滿足以上條件的話如果nc=(

5、mc+0.3)|ncc=(mcc+2)得到決策屬性 healthy。、不滿足以上條件的話如果mcnc得到決策屬性為sick。、不滿足以上條件的話如果nccmcc得到決策屬性為healthy。、不滿足以上條件的話如果mccncc得到決策屬性為sick。、不滿足以上條件的話得到決策屬性為sick。六、正確率及結果分析正確率為82.5%結果分析:由于采用了兩類約束方法,所以效果還可以。七、程序如下頁所示clear;%數據預處理程序% dm=xlsread(lisanhua);% 載入數據% z1=dm(:,1);%離散化第一列數據for i=1:303if z1(i)=29&z1(i)=48&z1(

6、i)=94&z4(i) = 110&z4(i) = 126&z5(i)=205&z5(i)=71&z8(i) = 120&z8(i)=0&z10(i) = 1.5&z10(i)2.5 z10(i)=2;else z10(i)=3;endendz11=dm(:,11);for i=1:303z11(i)=z11(i) + 1;endz12=dm(:,12);for i=1:303z12(i)=z12(i) + 1;endz13=dm(:,13);PUCDKITDrnEPArnITDLnEP SQ KITDrnEPArnITD寸 EpIRWDrnEPM-oou.!lomK 寸 IooCN)soCD

7、ZHLnUJPK17IooCN)soCDZH17UJP 衣焰 癥長壯照 9K% % % 原和g衣焰PUCD PUCDsiuj+mhmvh+mhmOHArnorneEEM一 M+aMEPgrnEP6rn6rnTH.!L0M CMEPHrnEPKMBEHMVHH-xFnvcncnCNcncnCNcncnwcnoTIE% % % =17IZcnIZCNIZ-rIZoIZ、6zoozlz、9zLnz、17zcnzCNz-rzTZUJPPUCD + e3NHS3NrnomzoMPUCDVH+ernIZADrnIZrnomzoMenda1=zeros(38,1);a2=zeros(38,1);for k=

8、1:38for i=1:13for j=1:200if dm4(j,i) =k&dm4(j,i)=0 a1(k)=a1(k) + 1;endif dm5(j,i) =k&dm5(j,i)=0 a2(k)=a2(k) + 1;endendendenda5=a1;a6=a2;a3=zeros(5,1);a4=zeros(5,1);j=1;while j5break;enda1(i)=0;endendendj=1;while jOHrnAo艮OH M。?一 (Lnq)xcuUJHCNPUCD PUCD TIsADLnqMHADLnqM一。?一KLnsxcuUJHM % 長卅-K-BKMI賬 KK%

9、wqH9-R2HLnq %PUCD PUCD s芋(_) *0 szqADrnqihadbzm-PUCDPUCD Tsona)9q寸祀蕓)9qM一。?一K9q)xcuUJH 寸PUCDPUCD TrnsADLnqrn祀蕓)LnqM一。?一 (Lnq)xcuUJHrnPUCD PUCDTCNsADLnqCN祀蕓)LnqM一(寸 IooCN)soCDZHLnUJPK17IooCN)soCDZH17UJP n 埋K%原和g長壯煮埋K% %PUCD PUCDT95H(D9q9祀蕓)9qM一 oou.!lom K9q)xcuUJH9PUCD PUCDTLn5Ha)9qLnRa)9qM一 oou.!lom

10、 K9q)xcuUJHLnPUCDPUCDVH+SCNCUHSCNCU 。H (sLnE P63M H H (sLnE PM一PUCDVH+SI 常312oh(s17ep63ihh(s17epm-oouhm.!L8攔業 3oorn)soHCN9(Ioorn)so5ZHI2PUCDPUCD KITDrnEPArnITDLnEP SQ KITDrnEPArnITD寸 EpIRWDrnEPM-oou.!lomendenda5=a1;a6=a2;a3=zeros(6,1);a4=zeros(6,1);j=1;while j6 break;enda1(i)=0;endendendj=1;while j6

11、 break;endenda2(i)=0;end end% (LndCNq H (Lnd寸s9CM)Iq H (LndrnqPUCD PUCDPUCD7(02(0寸常蕓)9堂smzoMPUCDPUCD PUCD 7(旨 q (0%r(d%m一8mz 3、9)soCDZHCNcv(9)soCDq(rno+UUHUU6HA(rnITD8q)EnsM一 徐 I TarnE P H H (約 Tq H (rnL-n) 8=PUCD(rno+uusu6HA(rnITD8q)EnsM一 徐 I TsrnE P H H (約 Tq H (rnL-n) 8=OHUUUJOSUUOSUJOHUUrn0LI.!L

12、oM 長卅*煮埋 %PUCD 徐 m+OOCNME p H (約 Tqrn0LI.!LoM oHUtt(寸 Icn0I)soH8-R(17Icn0I)soHzq %SIPUCD .o + uehue 6HA(rnITD8q)EnsM一 徐 i TsrnE p H H (約 Tq H (rnL-n) 8 qPUCD .o+uehue 6HA(rnITD8q)EnsM一 K i TgrnE p H H (約 Tq H (rnITD 8 qPUCD .o+uehue 6HA(rnITD8q)EnsM一 KI TSME P H H (約 Tq H (rnL一)8 qPUCD (rno+UUHUU6HA(rnITD8q)EnsM一 徐 i TsrnE p H H (約 T=0.9&ncc=8)|(ncc = 10&nc=0.6)h7(i,14) = 1;else if (mc=0.9|mcc=8)|(mcc=9&mc=0.6)h7(i,14)=2;else if nc=(mc+0.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論