統計學第9章列聯分析_第1頁
統計學第9章列聯分析_第2頁
統計學第9章列聯分析_第3頁
已閱讀5頁,還剩9頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第 9章 列聯分析9.1 分類數據與列聯表例:某集團公司下屬四個分公司。 現該集團欲進行一項改革, 由于涉 及到各分公司的利益, 希望對各分公司職工的態度有所了解。 所以從 四個分公司中隨機選取 420 名員工進行調查,結果如下表所示: 關于改革方法的調查結果一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32453331141合計100120901104209.1.1 列聯表的構造列聯表:是由兩個以上的變量進行交叉分類的頻數分布表。每個單元:反應兩方面的信息行 R :態度變量 行合計: RT列C :單位變量 列合計: CTR C 列聯表: 2 4 列聯表9.1.

2、2 列聯表的分布1 觀察值的分布一分公司二分公司三分公司四分公司合計百分比贊成該方案68755779279279/420=0.664反對該方案32453331141141/420=0.336合計10012090110420總合計(樣本容量) : N百分比: RNN2 期望值的分布一分公司二分公司三分公司四分公司合計贊成100 0.664=66120 0.664=8090 0.664=60110 0.664=73279反對100 0.336=34120 0.336=4090 0.336=30110 0.336=37141合計10012090110420RT 期望值: RT CT9.1.3 觀察值

3、與期望值頻數對比分布表一分公司二分公司三分公司四分公司贊成觀察值68755779期望值66806073反對觀察值32453331期望值344030379.2 擬合優度檢驗9.2.1 思路:如果各分公司員工對改革方案的態度一致則各分公司員工贊成或反對該方案的比例應該相同即 1 2 3 4其中 i為第i 個分公司贊成改革方案的比例那么,對比分布表中相應的觀察值與期望值就應該非常接近設 f0 為觀察值頻數f e為期望值頻數( f0 fe)2fe9.2.3 判斷準則當 2 大于某臨界值時,拒絕態度一致的原假設右單側檢驗 即 2 2 時,拒絕原假設自由度 ( R 1)(C 1)完成上面的例題解:H0 :

4、 1 2 3 4 各分公司員工對這項改革的態度一致H1: 上面等式不全相等 各分公司員工對這項改革的態度不一致2 計算表f0fef0fe( f0 fe)22(f0 fe)2/ fe6866240.06063234-240.11767580-5250.312545405250.62505760-390300079736360.49323137-6360.9730自由度 (R 1)(C 1) =30.1 ,查表得: 02.1(3) 6.251由于 3.0319<6.251,所以不能拒絕原假設, 即認為四個分公司員工對 這項改革的態度是一致的。例:從總體中隨機抽取 n

5、 200 的樣本,調查后按不同屬性歸類,得到 如下結果:n1 28, n2 56,n3 48,n4 36, n5 32依據以往經驗,各類別在總體中的比例分別為:1 0.1, 2 0.2, 3 0.3, 4 0.2, 5 0.2請以 0.1 的顯著性水平檢驗, 說明現在的情況與經驗數據相比是否 發生了顯著變化。解:H0 : 1 0.1, 2 0.2, 3 0.3, 4 0.2, 5 0.2 沒有發生顯著變化H1: 上面等式不全相等發生了顯著變化fe1 200 0.1 20 , fe2 200 0.2 40 , fe3 200 0.3 60, fe4 200 0.2 40 , fe5 200 0.

6、2 40,2( f0 fe )fe28 20 2 56 40 2 48 60 2 36 40 2 32 40 22040604040自由度 =5-1=402.1(4) 7.779由于 14>7.779,所以不能接受原假設,即認為現在的情況與經驗數 據相比已經發生了顯著變化。9.3 獨立性檢驗適用:兩個分類變量之間是否存在聯系 例:一種原料來自三個不同的地區,原料質量被分為三個不同等級。從這批原料中隨機抽取 500 件進行檢驗,結果如下表所示一級二級三級合計甲地區526424140乙地區605952171丙地區506574189合計162188150500要求檢驗各個地區與原料的質量之間是

7、否存在依賴關系解:H0 : 地區與原料等級之間是獨立的 (不存在依賴關系)H1: 地區與原料等級之間是不獨立的 (存在依賴關系)期望值的計算:以 52 為例設 A=樣本來自于甲地區 則 P(A) 140/ 500B=樣本屬于一級原料 則P(B ) 1 6 2 / 5 0即來自于甲地區又屬于一級品的原料頻數應為500 140 162500 500一般化:e N RT CT RT CTN N N檢驗統計量: 2 (f0 fefe)代入數據得:74189 150500189 15019.82140 16222171 162 25260500500140 162171 1622 ( f0 fe )2

8、fe5002500500自由度 (R 1)(C 1) =40.05 ,查表得: 02.05(4) 9.448由于 19.82>9.448,所以拒絕原假設,即認為這些原料的產地與等級 之間存在依賴關系。比較:獨立性檢驗與一致性檢驗 抽取樣本的方法不同 一致性檢驗:在各類別中分別抽取 獨立性檢驗:先抽取,再分類計算期望值的理論不同9.4 2 檢驗的期望值準則例:下表是某個應用 2 檢驗問題的觀察值與期望值情況,0.05,請檢驗原假設是否成立類別f0feA3032B110113C8687D2324E52F54G41合計263263解:H0 :擬合的好H1 :擬合的不好2 計算表類別f0fef0

9、f e( f0 fe)22(f0 fe)2/ feA3032-240.125B110113-390.080C8687-110.011D2324-110.042E52394.5F54110.25G41399合計2632632 14.008自由度 =7-1=60.05 (6) 12.592因為 14.008>12.592,所以拒絕原假設,認為數據擬合的不好。2檢驗的期望值準則 如果只有兩個單元,每個單元的期望頻數必須是 5 或者 5 以上; 如果有兩個以上單元, 若 20% 的單元期望頻數小于 5,則不能引用 2 檢驗。改進方法:把期望頻數小于 5 的單元進行合并類別f0fef0fe(f0

10、fe)22(f0 fe)2/ feA3032-240.125B110113-390.080C8687-110.011D2324-110.042E1477497合計2632632 7.133自由度 =5-1=402.05(4) 9.448因為 9.448>7.133,所以不能拒絕原假設,認為數據擬合的好。9.5 列聯表中的相關測量檢驗結果不獨立的情況下,兩者的相關程度如何9.5.1 相關系數其中, 2(f0 fe)fen :列聯表中的總頻數,樣本容量想法:兩個變量越獨立,則 f0與fe 越接近, 越接近于 0男女贊成24反對36獨立男女贊成010反對50完全相關男女贊成50反對010完全相

11、關0,相互獨立1,完全相關 2 2一般情況下, (0,1) ,越接近于 1,相關性越強。局限性當列聯表的行或列大于 2 時,隨著行或列的增加, 相關系數會隨之 增加且沒有上限, 對兩個變量相關程度的測量就不夠清晰了。 所以適 用于描述 2 2 列聯表最常用的一種相關系數9.5.2 列聯相關系數 c 相關系數n說明:c 0 ,相互獨立c 0,1c相關系數的可能最大值依賴于列聯表的行數與列數,且隨著行數或 列數的增大而增大。所以行數、列數不相等的列聯表的 c 相關系數不能比較RC兩個變量完全相關時的 c 相關系數220.7071330.8165440.879.5.3 V 相關系數2V n min R 1 , C 1V 0,1V 0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論