




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精選優質文檔-傾情為你奉上第四章 判別分析4.1 簡述歐幾里得距離與馬氏距離的區別和聯系。答: 設p維歐幾里得空間中的兩點X=和Y=。則歐幾里得距離為。歐幾里得距離的局限有在多元數據分析中,其度量不合理。會受到實際問題中量綱的影響。設X,Y是來自均值向量為,協方差為的總體G中的p維樣本。則馬氏距離為D(X,Y)=。當即單位陣時,D(X,Y)=即歐幾里得距離。因此,在一定程度上,歐幾里得距離是馬氏距離的特殊情況,馬氏距離是歐幾里得距離的推廣。4.2 試述判別分析的實質。答:判別分析就是希望利用已經測得的變量數據,找出一種判別函數,使得這一函數具有某種最優性質,能把屬于不同類別的樣本點盡可能地區別
2、開來。設R1,R2,Rk是p維空間R p的k個子集,如果它們互不相交,且它們的和集為,則稱為的一個劃分。判別分析問題實質上就是在某種意義上,以最優的性質對p維空間構造一個“劃分”,這個“劃分”就構成了一個判別規則。4.3 簡述距離判別法的基本思想和方法。答:距離判別問題分為兩個總體的距離判別問題和多個總體的判別問題。其基本思想都是分別計算樣本與各個總體的距離(馬氏距離),將距離近的判別為一類。兩個總體的距離判別問題設有協方差矩陣相等的兩個總體G1和G2,其均值分別是m1和m 2,對于一個新的樣品X,要判斷它來自哪個總體。計算新樣品X到兩個總體的馬氏距離D2(X,G1)和D2(X,G2),則 X
3、 ,D2(X,G1)D2(X,G2)X ,D2(X,G1)> D2(X,G2,具體分析, 記 則判別規則為 X ,W(X)X ,W(X)<0多個總體的判別問題。設有個總體,其均值和協方差矩陣分別是和,且。計算樣本到每個總體的馬氏距離,到哪個總體的距離最小就屬于哪個總體。具體分析, 取,。可以取線性判別函數為, 相應的判別規則為 若 4.4 簡述貝葉斯判別法的基本思想和方法。基本思想:設k個總體,其各自的分布密度函數,假設k個總體各自出現的概率分別為,。設將本來屬于總體的樣品錯判到總體時造成的損失為,。設個總體相應的維樣本空間為 。在規則下,將屬于的樣品錯判為的概率為 則這種判別規則
4、下樣品錯判后所造成的平均損失為 則用規則來進行判別所造成的總平均損失為 貝葉斯判別法則,就是要選擇一種劃分,使總平均損失達到極小。基本方法:令,則 若有另一劃分,則在兩種劃分下的總平均損失之差為 因為在上對一切成立,故上式小于或等于零,是貝葉斯判別的解。從而得到的劃分為 4.5 簡述費希爾判別法的基本思想和方法。答:基本思想:從個總體中抽取具有個指標的樣品觀測數據,借助方差分析的思想構造一個線性判別函數 系數可使得總體之間區別最大,而使每個總體內部的離差最小。將新樣品的個指標值代入線性判別函數式中求出值,然后根據判別一定的規則,就可以判別新的樣品屬于哪個總體。4.6 試析距離判別法、貝葉斯判別
5、法和費希爾判別法的異同。答: 費希爾判別與距離判別對判別變量的分布類型無要求。二者只是要求有各類母體的兩階矩存在。而貝葉斯判別必須知道判別變量的分布類型。因此前兩者相對來說較為簡單。 當k=2時,若則費希爾判別與距離判別等價。當判別變量服從正態分布時,二者與貝葉斯判別也等價。 當時,費希爾判別用作為共同協差陣,實際看成等協差陣,此與距離判別、貝葉斯判別不同。 距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規則是 X ,W(X)X ,W(X)<lnd距離判別的判別規則是 X ,W(X)X ,W(X)<0二者的區別在于閾值點。當,時,。二者完全相同。4.7 設有兩個二元總體和
6、,從中分別抽取樣本計算得到 , 假設,試用距離判別法建立判別函數和判別規則。 樣品X=(6,0)應屬于哪個總體?解:= ,= , =即樣品X屬于總體4.8 某超市經銷十種品牌的飲料,其中有四種暢銷,三種滯銷,三種平銷。下表是這十種品牌飲料的銷售價格(元)和顧客對各種飲料的口味評分、信任度評分的平均數。銷售情況產品序號銷售價格口味評分信任度評分暢銷12.25822.56733.03943.286平銷52.87663.58774.898滯銷81.73492.242102.743 根據數據建立貝葉斯判別函數,并根據此判別函數對原樣本進行回判。 現有一新品牌的飲料在該超市試銷,其銷售價格為3.0,顧客
7、對其口味的評分平均為8,信任評分平均為5,試預測該飲料的銷售情況。解:增加group變量,令暢銷、平銷、滯銷分別為group1、2、3;銷售價格為X1,口味評分為X2,信任度評分為X3,用spss 解題的步驟如下:1. 在SPSS窗口中選擇AnalyzeClassifyDiscriminate,調出判別分析主界面,將左邊的變量列表中的“group”變量選入分組變量中,將X1、X2、X3變量選入自變量中,并選擇Enter independents together單選按鈕,即使用所有自變量進行判別分析。2. 點擊Define Range按鈕,定義分組變量的取值范圍。本例中分類變量的范圍為1到3,
8、所以在最小值和最大值中分別輸入1和3。單擊Continue按鈕,返回主界面。如圖4.1 圖4.1 判別分析主界面3. 單擊Statistics按鈕,指定輸出的描述統計量和判別函數系數。選中Function Coefficients欄中的Fishers:給出Bayes判別函數的系數。(注意:這個選項不是要給出Fisher判別函數的系數。這個復選框的名字之所以為Fishers,是因為按判別函數值最大的一組進行歸類這種思想是由Fisher提出來的。這里極易混淆,請讀者注意辨別。)如圖4.2。單擊Continue按鈕,返回主界面。 圖4.2 statistics子對話框4. 單擊Classify按鈕,
9、彈出classification子對話框,選中Display選項欄中的Summary table復選框,即要求輸出錯判矩陣,以便實現題中對原樣本進行回判的要求。如圖4.3。 圖4.3 classification對話框5. 返回判別分析主界面,單擊OK按鈕,運行判別分析過程。1) 根據判別分析的結果建立Bayes判別函數:Bayes判別函數的系數見表4.1。表中每一列表示樣本判入相應類的Bayes判別函數系數。由此可建立判別函數如下:Group1: Group2: Group3: 將各樣品的自變量值代入上述三個Bayes判別函數,得到三個函數值。比較這三個函數值,哪個函數值比較大就可以判斷該樣
10、品判入哪一類。 Classification Function Coefficientsgroup123x1-11.689-10.707-2.194x212.29713.3614.960x316.76117.0866.447(Constant)-81.843-94.536-17.449Fisher's linear discriminant functions 表4.1 Bayes判別函數系數根據此判別函數對樣本進行回判,結果如表4.2。從中可以看出在4種暢銷飲料中,有3種被正確地判定,有1種被錯誤地判定為平銷飲料,正確率為75%。在3種平銷飲料中,有2種被正確判定,有1種被錯誤地判定
11、為暢銷飲料,正確率為66.7%。3種滯銷飲料均正確判定。整體的正確率為80.0%。Classification ResultsagroupPredicted Group MembershipTotal123OriginalCount131042120330033%175.025.0.0100.0233.366.7.0100.03.0.0100.0100.0a. 80.0% of original grouped cases correctly classified. 表4.2 錯判矩陣2) 該新飲料的,將這3個自變量代入上一小題得到的Bayes判別函數,的值最大,該飲料預計平銷。也可通過在原樣
12、本中增加這一新樣本,重復上述的判別過程,并在classification子對話框中同時要求輸出casewise results,運行判別過程,得到相同的結果。4.9 銀行的貸款部門需要判別每個客戶的信用好壞(是否未履行還貸責任),以決定是否給予貸款。可以根據貸款申請人的年齡()、受教育程度()、現在所從事工作的年數()、未變更住址的年數()、收入()、負債收入比例()、信用卡債務()、其它債務()等來判斷其信用情況。下表是從某銀行的客戶資料中抽取的部分數據,根據樣本資料分別用距離判別法、Bayes判別法和Fisher判別法建立判別函數和判別規則。某客戶的如上情況資料為(53,1,9,18,50
13、,11.20,2.02,3.58),對其進行信用好壞的判別。目前信用好壞客戶序號已履行還貸責任123172316.600.341.712341173598.001.812.913422723414.600.94.9443911954813.101.934.36535191345.000.401.30未履行還貸責任6371132415.101.801.827291131427.401.461.6583221167523.307.769.72928223236.400.191.2910261432710.502.47.36解:令已履行還貸責任為group0,未履行還貸責任為group1。令(53,
14、1,9,18,50,11.20,2.02,3.58)客戶序號為11,group未知。用spss解題步驟如下:1. 在SPSS窗口中選擇AnalyzeClassifyDiscriminate,調出判別分析主界面,將左邊的變量列表中的“group”變量選入分組變量中,將變量選入自變量中,并選擇Enter independents together單選按鈕,即使用所有自變量進行判別分析。2. 點擊Define Range按鈕,定義分組變量的取值范圍。本例中分類變量的范圍為0到1,所以在最小值和最大值中分別輸入0和1。單擊Continue按鈕,返回主界面。3. 單擊Statistics按鈕,指定輸出的
15、描述統計量和判別函數系數。選中Function Coefficients欄中的Fishers和Unstandardized。單擊Continue按鈕,返回主界面。4. 單擊Classify按鈕,定義判別分組參數和選擇輸出結果。選擇Display欄中的Casewise results,以輸出一個判別結果表。其余的均保留系統默認選項。單擊Continue按鈕。5. 返回判別分析主界面,單擊OK按鈕,運行判別分析過程。1) 用費希爾判別法建立判別函數和判別規則:未標準化的典型判別函數系數由于可以將實測的樣品觀測值直接代入求出判別得分,所以該系數使用起來比標準化的系數要方便一些。具體見表4.3 。 表
16、4.3 未標準化的典型判別函數系數由此表可知, Fisher判別函數為:用計算出各觀測值的具體坐標位置后,再比較它們與各類重心的距離,就可以得知分類,如若與group0的重心距離較近則屬于group0,反之亦然。各類重心在空間中的坐標位置如表4.4所示。 表4.4 各類重心處的費希爾判別函數值 用bayes判別法建立判別函數與判別規則,由于此題中假設各類出現的先驗概率相等且誤判造成的損失也相等,所以距離判別法與bayes判別完全一致。如表4.5所示,group欄中的每一列表示樣品判入相應列的Bayes判別函數系數。由此可得,各類的Bayes判別函數如下: 表4.5 Bayes判別函數系數將各樣
17、品的自變量值代入上述兩個Bayes判別函數,得到兩個函數值。比較這兩個函數值,哪個函數值比較大就可以判斷該樣品該判入哪一類。2) 在判別結果的Casewise Stastics表中容易查到該客戶屬于group0,信用好。4.10 從胃癌患者、萎縮性胃炎患者和非胃炎患者中分別抽取五個病人進行四項生化指標的化驗:血清銅蛋白、藍色反應、尿吲哚乙酸和中性硫化物,數據見下表。試用距離判別法建立判別函數,并根據此判別函數對原樣本進行回判。類別病人序號胃癌患者12281342011224513410403200167122741701507851001672014胃炎患者萎縮性622512571471301
18、006128150117769120133102610160100510非胃炎患者1118511551912170125641316514253141351082121510011772解:令胃癌患者、萎縮性胃炎患者和非胃炎患者分別為group1、group2、group3,由于此題中假設各類出現的先驗概率相等且誤判造成的損失也相等,所以距離判別法與bayes判別完全一致。用spss的解題步驟如下:1.在SPSS窗口中選擇AnalyzeClassifyDiscriminate,調出判別分析主界面,將左邊的變量列表中的“group”變量選入分組變量中,將X1、X2、X3、X4變量選入自變量中,并選擇Enter independents together單選按鈕,即使用所有自變量進行判別分析。2.點擊Define Range按鈕,定義分組變量的取值范圍。本例中分類變量的范圍為1到3,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蓋房子出租合同協議
- 石家莊供暖合同協議
- 租賃合同問題處理協議
- 租地下室協議書合同協議
- 社區設計合同協議模板
- 礦泉水供水協議合同書
- 社區保潔服務合同協議
- 真石漆質保合同協議
- 豬棚出租轉讓合同協議
- 電纜排管遷移合同協議
- 手術分級管理制度
- 2025年江蘇宿遷經濟技術開發區人力資源有限公司招聘筆試參考題庫附帶答案詳解
- 2025-2030年中國聚氨酯產業市場風險評估規劃研究報告
- 學校食堂每日食品安全檢查記錄臺賬(日管控)
- 2025年四川三新供電服務公司招聘筆試參考題庫含答案解析
- 《ERP總體介紹》課件
- 企業利他培訓
- 2025年職教高考對口升學 護理類 專業綜合模擬卷(4)(四川適用)(原卷版)
- 天然氣液化技術發展-洞察分析
- 酒業銷售有限公司組織架構及崗位職責
- 農村街道電網改造合同范例
評論
0/150
提交評論