統計學第12章-列聯表和對應分析課件_第1頁
統計學第12章-列聯表和對應分析課件_第2頁
統計學第12章-列聯表和對應分析課件_第3頁
統計學第12章-列聯表和對應分析課件_第4頁
統計學第12章-列聯表和對應分析課件_第5頁
已閱讀5頁,還剩27頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第12章 列聯表和對應分析列聯表中兩個變量的獨立性檢驗對應分析中央財經大學統計學院第12章 列聯表和對應分析列聯表中兩個變量的獨立性檢驗中學習目標列聯表中兩個變量獨立性檢驗的原理和軟件結果解釋 對應分析的基本原理和軟件結果分析2中央財經大學統計學院 2學習目標列聯表中兩個變量獨立性檢驗的原理和軟件結果解釋 2中【例12.1】美國的General Social Survey幸福狀況合計非常幸福比較幸福不太幸福婚姻狀況已婚574726821382喪偶7014959278離異8329279454分居147330117未計877165934928853中央財經大學統計學院 3

2、【例12.1】美國的General Social Surve統計學第12章-列聯表和對應分析課件統計學第12章-列聯表和對應分析課件檢驗統計量在零假設成立時,該統計量近似服從自由度為 的c2分布。當該統計量的值很大(或p值很小)時,就可以拒絕零假設,認為這兩個變量不相互獨立。6中央財經大學統計學院 6檢驗統計量6中央財經大學統計學院 6SPSS操作“分析”“描述統計”“交叉表”,把“婚姻狀況”設為行變量,把“幸福狀況”設為列變量。接下來單擊“統計量”,在彈出的對話框中選中“卡方”,單擊“繼續”;選擇“單元格”,選中彈出對話框中的“期望值”,單擊“繼續”返回前一個是對話框,單擊“確定”7中央財經

3、大學統計學院 7SPSS操作“分析”“描述統計”“交叉表”,把“婚姻狀況SPSS操作8中央財經大學統計學院 8SPSS操作8中央財經大學統計學院 8結果分析幸福狀況合計非常幸福比較幸福不太幸福婚姻狀況已婚計數574726821382期望的計數420.1794.7167.21382.0喪偶計數7014959278期望的計數84.5159.933.6278.0離異計數8329279454期望的計數138.0261.154.9454.0分居計數147330117期望的計數35.667.314.2117.0未婚計望的計數198.8376.179.1654.0合計計數87716

4、593492885期望的計數877.01659.0349.02885.09中央財經大學統計學院 9結果分析幸福狀況合計非常幸福比較幸福不太幸福婚姻狀況已婚計數結果分析c2統計量的值為225.274,相應的p值為0.000。由于p值遠遠小于通常使用的顯著性水平,因此檢驗的結論是拒絕原假設,不能認為婚姻狀況和幸福狀況相互獨立。值df漸進 Sig. (雙側)Pearson 卡方225.274a8.000似然比230.1668.000線性和線性組合137.4941.000有效案例中的 N2885a. 0單元格(.0%)的期望計數少于5。最小期望計數為14.15。10中央財經大學統計學院 10結果分析c

5、2統計量的值為225.274,相應的p值為0.00精確結果當每個單元格的期望頻數都大于5時檢驗統計量近似服從c2分布。在不滿足這一條件時,需要把部分單元格合并,或者使用精確檢驗。在圖12-1的對話框中選擇“精確”,進行相應的設置后可以得出精確的檢驗結果。這時所涉及的不是c2分布,而是超幾何分布。由于樣本很大時超幾何分布計算比較慢甚至無法計算,因此在大樣本時通常使用c2統計量。11中央財經大學統計學院 11精確結果當每個單元格的期望頻數都大于5時檢驗統計量近似服從c對應分析 對應分析是一種描述性、探索性的數據分析方法,通常用于列聯表的分析,以便用圖形的方法觀察行變量和列變量取值之間的對應關系。對

6、應分析可以按照相同的刻度同時對列聯表中的行變量和列變量進行降維,用較少的維度(一般選用二維或三維)來代表數據表中的行變量和列變量,從而在同一個空間中用圖形方法顯示行變量和列變量類別之間的關系。 12中央財經大學統計學院 12對應分析 對應分析是一種描述性、探索性的數據分析方法,通常用對應分析圖的繪制在表12-1的列聯表中,把3個幸福狀況的取值看作3維空間中的坐標,我們可以把5個婚姻狀況在3維空間中表示出來。如果使用因子分析的方法對3個幸福狀況進行降維(同時最大限度地保留原始信息),則我們能夠在2維甚至1維空間上把5個點表示出來。把表中婚姻狀況的取值看作5維空間的坐標值,使用因子分析的方法進行降

7、維,也可以把3個幸福狀況在低維空間中表示出來。13中央財經大學統計學院 13對應分析圖的繪制在表12-1的列聯表中,把3個幸福狀況的取值對應分析圖的繪制如果能夠保證兩個因子分析中采用相同的刻度,則可以在同一個坐標系中把幸福狀況的3個點和婚姻狀況的5個點繪制出來,通過圖形觀察兩個變量取值之間的關系。按上述方法得到的圖形稱為對應分析圖。14中央財經大學統計學院 14對應分析圖的繪制如果能夠保證兩個因子分析中采用相同的刻度,則對應分析圖的繪制為了保證對行和列進行因子分析的結果之間的對應關系,在進行對應分析時并不是根據列聯表中的頻數直接進行因子分析的而是先計算相應的頻率,再進行必要的變量變換,之后再用

8、與因子分析類似的方法進行降維。15中央財經大學統計學院 15對應分析圖的繪制為了保證對行和列進行因子分析的結果之間的對應對應分析圖的分析在對應分析圖中,如果同一變量的不同類別在某個方向上靠得較近,則說明這些類別在該維度上區別不大;落在圖形中大致相同區域的不同變量的分類點彼此之間有聯系。16中央財經大學統計學院 16對應分析圖的分析在對應分析圖中,如果同一變量的不同類別在某個對應分析的軟件操作 選擇“分析”“降維”“對應分析”,把“婚姻狀況”設為行變量;在彈出的對話框中單擊“定義范圍”,最小值設為1,最大值設為5,單擊“更新”、“繼續”;然后把“幸福狀況”設為列變量,再通過“定義范圍”對話框定義

9、其取值范圍為1-3;最后單擊“確定” 17中央財經大學統計學院 17對應分析的軟件操作 選擇“分析”“降維”“對應分析”,把對應分析的軟件操作18中央財經大學統計學院 18對應分析的軟件操作18中央財經大學統計學院 18對應分析結果的解釋 維數慣量比例置信奇異值相關奇異值慣量卡方Sig.解釋累積標準差21.272.074.944.944.017.0642.066.004.0561.000.021總計.078225.274.000a1.0001.000a. 8 自由度19中央財經大學統計學院 19對應分析結果的解釋 維數慣量比例置信奇異值相關奇異值慣量卡方對應分析結果的解釋“慣量”類似于因子分析

10、中特征值對應的方差;“慣量比例”一欄中,“解釋”的慣量比例類似于因子分析中的方差貢獻率,“累積”的慣量比例類似于因子分析中的累積方差貢獻率,這幾個指標反映了每個維度的因子重要性和解釋能力。表中的“卡方”是關于列聯表行列獨立性檢驗結果,自由度為(5-1)(3-1)=8。p值很小說明列聯表的行與列之間有較強的相關性。 20中央財經大學統計學院 20對應分析結果的解釋“慣量”類似于因子分析中特征值對應的方差; 行變量(婚姻狀況)各水平的坐標 婚姻狀況維中的得分質量12慣量已婚 .479-.531-.016.037喪偶 .096.437-.660.008離異 .157.535.168.013分居 .0

11、41.979-.331.011未婚 .227.389.257.010有效總計1.000.07821中央財經大學統計學院 21 行變量(婚姻狀況)各水平的坐標 婚姻狀況維中的得分質量12行變量(婚姻狀況)各水平的坐標“質量”對應的英文為“Mass”,譯為“密度”更為確切,反映的是每種婚姻狀況的人數比例。表中給出了婚姻狀況5個水平的坐標:已婚 (-0.531, -0.016),喪偶(0.437, -0.660),離異 (0.535, 0.168),喪偶 (0.041, 0.979),未婚 (0.389, 0.257)。 22中央財經大學統計學院 22行變量(婚姻狀況)各水平的坐標“質量”對應的英文

12、為“Mass列變量(幸福狀況)的坐標 婚姻狀況維中的得分質量12慣量非常幸福 .304-.684-.193.039比較幸福 .575.157.207.005不太幸福 .121.975-.498.033有效總計1.000.07823中央財經大學統計學院 23列變量(幸福狀況)的坐標 婚姻狀況維中的得分質量12慣量非常對應分析圖 24中央財經大學統計學院 24對應分析圖 24中央財經大學統計學院 24對應分析圖的解釋“婚姻狀況”和“幸福狀況”取值之間的對應關系:“已婚”和“非常幸福”最接近;“離異”、“未婚”和“比較幸福”比較接近;“喪偶”、“分居”和“不太幸福”比較接近。 25中央財經大學統計學

13、院 25對應分析圖的解釋“婚姻狀況”和“幸福狀況”取值之間的對應關系對應分析的一點說明對應分析是一種探索性的描述統計方法,并不能保證所有的對應分析結果中兩個變量的取值之間都有如此明確的對應關系。 26中央財經大學統計學院 26對應分析的一點說明對應分析是一種探索性的描述統計方法,并不能例2 (課后習題)眼睛顏色頭發顏色藍色棕色綠色淡褐色合計黑色2068515108金色9471610127棕色841192954286紅色1726141471合計215220649359227中央財經大學統計學院 27例2 (課后習題)眼睛顏色頭發顏色藍色棕色綠色淡褐色合計黑色軟件操作在SPSS軟件中錄入數據時,數據文件中應該有三個變量:頭發顏色、眼睛顏色和頻數,并在SPSS中選擇“數據”“加權個案”,把“頻數”變量指定為權數 。28中央財經大學統計學院 28軟件操作在SPSS軟件中錄入數據時,數據文件中應該有三個變量數據表29中央財經大學統計學院 29數據表29中央財經大學統計學院 29對應分析結果從表中卡方檢驗的結果看兩個變量不相互獨立30中央財經大學統計學院 30對應分析結果從表中卡方檢驗的結果看兩個變量不相互獨立30中央對應分析圖31中央財經大學統計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論