




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
多元統計分析——判別分析統計研一蘇旸2007100196判別分析案例判別分析——把對象歸到已知類中人們常說:——“像諸葛亮那么神機妙算”——“像泰山那么穩固”——“像鉆石那么堅硬”一些判別標準都是有原型的,雖然這些判別的標準并不那么精確或嚴格,但大都是根據一些現有的模型得到的。判別分析案例判別分析的方法距離判別法Fisher判別法Bayes判別法逐步判別法判別分析案例距離判別法假設有兩個總體G1和G2,如果能夠定義點x到它們的距離D(x,G1)和D(x,G2),則如果D(x,G1)<D(x,G2),則x∈G1如果D(x,G2)<D(x,G1),則x∈G2如果D(x,G1)=D(x,G2),則待判。距離判別法的不足之處:判別方法與總體各自出現的的概率大小無關;判別方法與錯判之后所造成的損失無關。判別分析案例Fisher判別法所謂Fisher判別法,就是一種先投影的方法,把高維空間中的點向低維空間進行投影。主要思想是通過將多維數據投影到某個合適的方向上。而投影的原則是將總體與總體之間盡可能的分開,然后選擇合適的判別規則,進行分類判別。判別分析案例Bayes判別法當每個分類的觀察值不同時,最好用Bayes判別。因為每個分類的觀察值不同時,每類出現的機會是不同的,而Fisher判別法忽視了這個問題。具體方法是:對每一個樣品先計算出判別分數D,然后根據先驗概率和D的條件概率,計算出該樣品被判為每一類的后驗概率,哪
類的后驗概率最大,則判為哪一類。判別分析案例逐步判別法逐步判別法就是在前面的方法中加入變量選擇功能。有時,一些變量對于判別沒有什么作用,為了得到對判別最合適的變量,可以使用逐步判別。逐步判別的思想是先用少數變量進行判別,然后一邊判別,一邊引進判別能力最強的變量,同時淘汰判別能力不強的的變量。主要利用一些檢驗來判斷變量的判別能力。判別分析案例
大綱數據介紹SPSS實現結果分析R語言實現disc.sav,disc.txt判別分析案例數據介紹——disc.sav數據來源:吳喜之——《統計學:從數據到結論》。數據介紹:某專家編出一套打分體系來描繪企業的狀況。該體系對每個企業的一些指標(變量)進行評分。共有8個指標,如下頁表格所示。有一些企業已經被某雜志劃分為上升企業、穩定企業和下降企業。我們希望根據這些企業的上述變量的打分和它們已知的類別,找出分類標準,并對沒分類的企業進行分類。判別分析案例變量描述變量名稱涵義描述group表示類別。group-1代表上升,group-2代表穩定,group-3代表下降。is表示企業規模。se表示服務。sa表示雇員工資比例。prr表示利潤增長。ms表示市場份額。msr表示市場份額增長。cp表示流動資金比例。cs表示資金周轉速度。判別分析案例數據展示該數據disc.sav共有90個樣本,其中30個屬于上升型,30個屬于穩定性,30屬于下降型。這個已知類別的數據稱為一個“訓練樣本”。group表示類別8個用來建立判別標準的變量判別分析案例SPSS實現——數據讀入File
→
Open→
Data
→
“Disc.sav”判別分析案例SPSS實現——數據編輯VariableView→“Group”變量Decimals:“2”→“0”;
Label:添加變量名稱,便于識別;“Group”變量Value:添加組別。判別分析案例SPSS實現——數據分析Analyze
→
Classify→
Discriminant判別分析案例SPSS實現——模塊介紹Grouping
Variable:選入分類變量“Group”,Define
Range被激活。點擊彈出Range對話框,分別輸入分類變量最小值和最大值,本例為“1”和“3”。Independents:選入自變量。本例選入變量“is—cs”。Enter
independents
together:所有自變量同時進入方程。Use
stepwise
method:逐步判別法。按自變量貢獻大小,逐個引入和剔出變量,直到沒有新的有顯著作用的自變量可以引入,也沒有無顯著作用的自變量可以從方程內刪除為止。選此項后,激活Method按鈕。SelectVariable:挑選觀察單位。框內選入變量后(不能選入分類變量和自變量中已選入的變量),Value按鈕被激活,填入數值。自己符合該數值的的觀察單位才參與判別分析;若不選此項,則所有觀察單位都參與判別分析。判別分析案例SPSS實現——選擇變量的方法兩種變量選擇方法自變量同時進入方程逐步判別法判別分析案例SPSS實現——變量選擇group選入分組變量is-cs選入自變量選擇自變量同時進入方程的方法判別分析案例SPSS實現——Statistics模塊Descriptives:描述性統計量。Means:均數估計。Univariate
ANOVAs:單變量方差分析。Box’s
M:組間協方差齊性檢驗。Matrices:矩陣Within-groups
correlation:合并組內相關陣。Within-groups
covariance:合并組內協方差陣。Separate-groups
covariance:各組協方差陣。Totalcovariance:總協方差陣。Function
Coefficients:函數系數。Fisher’s:Fisher函數系數——Bayes判別函數系數。Unstandardized:非標準化函數系數——Fisher判別函數系數。判別分析案例SPSS實現——Statistics模塊選擇Means進行均數估計選擇Box’s
M進行各組協方差陣相等檢驗生成Bayes判別方程系數和Fisher判別方程系數。選擇ANOVAs進行各組均值相等檢驗判別分析案例SPSS實現——Classify模塊Prior
Probabilities:設定先驗概率。All
groups
equal:各組等概率。Compute
from
group
sizes:各組樣本量的百分比為先驗概率。Display:輸出。Casewise
result:每個觀察單位判別分析后所屬類別。Limit
cases
to
first
[]:前若干觀察單位判別分析后所屬類別。Summary
table:判別符合率表。Leave-one-out
classification:以剔出某觀察單位所建立的判別函數判別該觀察單位所屬類別。Use
Covariance
Matrix:使用協方差陣。Within-groups:組內協方差陣。Separate-groups:各組協方差陣。判別分析案例SPSS實現——Classify模塊Plots:判別圖。Combined-groups:各類共同輸出在一幅散點圖中。Separate-groups:每類單獨輸出一幅散點圖。Territorial
map:分類區域圖。Replace
missing
values
with
mean:用均數替代缺失值。選擇以樣本量百分比為先驗概率顯示每個單位判別分析后所屬類別顯示判別符合率表類別顯示在同一散點圖中以剔出某觀察單位所建立的判別函數判別該觀察單位所屬類別判別分析案例SPSS實現——Save模塊Save:存為新變量。Predicted
group
membership:預測觀察單位所屬類別。Discriminant
scores:判別分。Probabilities
of
group
membership:觀察單位屬于某一類的概率。在數據中保存判別后數據所屬類別在數據中保存數據的判別分判別分析案例結果分析在判別分析主對話框中點擊“OK”,生成輸出output文件。90個變量100%讀入,沒有缺失值判別分析案例結果分析各自變量的方差分析及λ統計量說明在3類企業間,各變量均有顯著差異λ統計量在0-1之間。越接近0組間差異越顯著;越接近1組間差異越不顯著。判別分析案例結果分析各組協方差陣相等的檢驗說明拒絕協方差矩陣相等的假設,即不能認為各組間協方差矩陣相等。從一些統計實踐的結果來看,很少有碰到檢驗不顯著的情況。而在一些實踐中,比如線性判別分析,即使方差-協方差結構不相等,對于結果的影響也不會有非常大的影響。判別分析案例結果分析——Fisher判別法標準化典型判別函數系數得到2個標準化典型判別方程:需要注意的是:這是標準化后的判別函數,若要將變量帶入計算判別分,必須將變量進行標準化處理(即減均值除以標準差)。判別分析案例結果分析——Fisher判別法結構系數矩陣——用來說明判別變量對標準化典型判別方程的相關程度結果說明,前6個變量(*)對方程1貢獻比較大,后兩個變量對方程2貢獻較大。判別分析案例結果分析——Fisher判別法未標準化典型判別函數系數—Fisher判別法得到2個未標準化典型判別方程:可以將原變量值直接代入計算判別分進行分類。判別分析案例結果分析——Fisher判別法生成3個新的變量dis_1表示判別后所屬組別的值dis1_1表示樣本代入第1個判別函數所得的判別分dis2_1表示樣本代入第2個判別函數所得的判別分判別分析案例結果分析——Fisher判別法Fisher判別法得到的分組圖各組重心——描述在判別空間每一組的中心位置判別分析案例結果分析——Fisher判別法判別力指數——兩個判別函數的作用并不是平等的,判別力指數給出了判別函數的重要程度。說明第一個判別函數的貢獻率高達98.8%,第二個判別函數的貢獻率僅為1.1%。判別分析案例結果分析——Fisher判別法殘余判別力指數——殘余判別力的含義是:在以前計算的函數已經提取過原始信息之后,殘余的變量信息對于判別分組的能力。λ值越小表示越高的判別力。說明方程1提取了很大的信息量,而殘余變量信息對于判別分組的能力很小了。判別分析案例結果分析——Fisher判別法分類結果從表上看,我們的分類函數能夠100%的把訓練數據的每一個觀測值分到其本來的類。該表分成兩部分:上面一半是用從全部數據得到的判別函數來判斷每一個點的結果;下面一半是對每一個觀測值,都用僅缺少該觀測值的全部數據得到的判別函數來進行判斷的結果。判別分析案例結果分析——Bayes判別法各分類的先驗概率先驗概率是根據樣本出現概率確定的,本例3類企業各有30個,因此先驗概率相等都為33.3%。判別分析案例結果分析——Bayes判別法Bayes判別法得到的判別函數系數得到3個判別方程:將觀察單位的各個變量分別代入3個判別函數中,可求出3個判別函數值,哪一個最大就屬于哪一類。判別分析案例結果分析——Bayes判別法上述結果會生成一個CasewiseStatistics的表格。顯示實際分類和預測分類,系統會將分錯的樣本單位用*標注出來。本例用Bayes判別法判別的正確率為100%。需要指出的是,根據推導出來的分類函數來分類,即使是對訓練樣本的這些觀測值,也不一定總能保證全都被正確劃分。本例如果只用少數幾個變量進行判別,結果就不一樣了。判別分析案例結果分析使用企業規模(ie)、服務(se)和雇員工資比例(sa)三個變量進行判別,得到的分類圖。與8個變量進行判別相對比,明顯的三類點分的就不那么開了。判別分析案例結果分析基于3個變量的分類結果表結果顯示,對于全部數據的判別,有85個點(94.4%)得到正確劃分,5個點錯判;其中第二類有3個被誤判到第一類;有2個被誤判到第三類。對于交叉驗證的判別,有83個點(92.2%)得到正確劃分,有7個點被錯判;其中第二類有3個被誤判為第一類,4個被誤判為第三類。判別分析案例SPSS實現選擇逐步判別法Method模塊被激活判別分析案例SPSS實現——Method模塊Method:逐步判別分析方法Wilks’lambda:Wilks
λ統計量(組內離差平方和/總離差平方和)最小化法。Unexplained
variance:組間不可解釋方差和最小化。Mahalanobis
distance:鄰近組間馬氏距離最大化法。Smallest
F
ratio:任兩組間最小F值最大化法。Rao’s
V:Rao
V統計量最大化法。
V-to-enter:V值最小增量值。Criteria:剔選標準Use
F
value:以F值為剔選變量準則。Use
probability
of
F:以F值對應的P值為剔選變量準則。判別分析案例SPSS實現——Method模塊Display:輸出Summary
of
steps:輸出每一步的統計量。F
for
pairwise
distance:輸出兩組間判別檢驗的F值及P值。選擇Wilks
λ統計量最小化法選擇輸出每一步統計量當F≧3.84時選入;當F≦2.71時剔出。判別分析案例結果分析經過分析,淘汰了不顯著的資金流動比例(cp)變量,當然判別系數也發生相應變化。判別分析案例結果分析雖然判別系數改變,但結果并未改變。判別分析案例R語言實現>w=read.table("disc.txt");attach(w);wV1代表Group。>V1=factor(V1)
#把分組變量變成定性變量。判別分析案例R語言實現>train=sample(1:90,45)
#隨即抽取一般樣本作訓練樣本。>table(V1[train])
#顯示訓練樣本中各類的比例。>librar
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023國家電投集團重慶電力有限公司招聘11人筆試參考題庫附帶答案詳解
- 深入了解農業經理人考試中的戰略規劃能力試題及答案
- 2023內蒙古通遼市直屬國有企業公開招聘財務人員筆試筆試參考題庫附帶答案詳解
- 2023云南省紅河金平縣優才人力資源有限公司招聘1人筆試參考題庫附帶答案詳解
- 2023中鐵十五局集團公司辦公室(黨委辦公室)工作人員招聘2人筆試參考題庫附帶答案詳解
- 2023中國雄安集團有限公司招聘48人筆試參考題庫附帶答案詳解
- 金融債券抵押擔保合同書
- 合同簽訂授權委托書模板
- 二零二五版工程開關差插座供貨合同書范例
- 二零二五版合伙買房子協議書
- 第2單元 社會服務(整單元教學設計)-2023-2024學年四年級下冊綜合實踐活動蘇教版
- 漢中漢源電力招聘試題及答案
- 《半導體集成電路》課件-半導體集成電路的制造工藝
- 石料場開采施工方案
- 探月精神隊課件
- 2025-2030中國設施農業行業市場發展分析及競爭格局與投資前景研究報告
- 人教版(PEP)2024-2025六年級下冊英語期中測試卷(含答案含聽力原文無聽力音頻)
- 宿舍教育班會
- 超聲支氣管鏡相關知識
- 2025年管理學原理試題及答案
- 2025年信陽職業技術學院單招職業適應性測試題庫帶答案
評論
0/150
提交評論