




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第 10 章 列聯(lián)分析10.1 分類數(shù)據(jù)與列聯(lián)表分類數(shù)據(jù)與列聯(lián)表 10.2 c2 檢驗(yàn)檢驗(yàn)10.3 列聯(lián)表中的相關(guān)丈量列聯(lián)表中的相關(guān)丈量分類數(shù)據(jù)分類變量的結(jié)果表現(xiàn)為類別例如:性別 (男, 女)各類別用符號(hào)或數(shù)字代碼來(lái)測(cè)度運(yùn)用分類或順序尺度他吸煙嗎? 1.是;2.否他贊成還是反對(duì)這一改革方案?1.贊成;2.反對(duì)對(duì)分類數(shù)據(jù)的描畫(huà)和分析通常運(yùn)用列聯(lián)表可運(yùn)用檢驗(yàn)10.1 分類數(shù)據(jù)與列聯(lián)表10.1.1 分類數(shù)據(jù)分類數(shù)據(jù)10.1.2 列聯(lián)表的構(gòu)造列聯(lián)表的構(gòu)造10.1.3 列聯(lián)表的分布列聯(lián)表的分布列聯(lián)表(contingency table)由兩個(gè)以上的變量交叉分類的頻數(shù)分布表由兩個(gè)以上的變量交叉分類的頻數(shù)分
2、布表行變量的類別用行變量的類別用 r 表示,表示, ri 表示第表示第 i 個(gè)類別個(gè)類別列變量的類別用列變量的類別用 c 表示,表示, cj 表示第表示第 j 個(gè)類個(gè)類別別每種組合的察看頻數(shù)用每種組合的察看頻數(shù)用 fij 表示表示表中列出了行變量和列變量的一切能夠的組表中列出了行變量和列變量的一切能夠的組合,所以稱為列聯(lián)表合,所以稱為列聯(lián)表一個(gè)一個(gè) r 行行 c 列的列聯(lián)表稱為列的列聯(lián)表稱為 r c 列聯(lián)表列聯(lián)表列聯(lián)表的構(gòu)造(2 2 列聯(lián)表)列列( cj )合計(jì)合計(jì)j =1j =1i =1f11f12f11+ f12i =2f21f22f21+ f22合計(jì)合計(jì)f11+ f21f12+ f22n
3、列聯(lián)表的構(gòu)造(r c 列聯(lián)表的普通表示)列列(cj)合計(jì)合計(jì)j =1j = 2i =1f11f12r1i = 2f21f22r2:合計(jì)合計(jì)c1c2n列聯(lián)表(例題分析)一分公司二分公司三分公司四分公司合計(jì)合計(jì)贊成該方案贊成該方案68755779279反對(duì)該方案反對(duì)該方案32753331141合計(jì)合計(jì)10012090110420列聯(lián)表的分布察看值的分布邊緣分布邊緣分布行邊緣分布行邊緣分布行察看值的合計(jì)數(shù)的分布行察看值的合計(jì)數(shù)的分布例如,贊成改革方案的共有例如,贊成改革方案的共有279人,反對(duì)改革方人,反對(duì)改革方案的案的141人人列邊緣分布列邊緣分布列察看值的合計(jì)數(shù)的分布列察看值的合計(jì)數(shù)的分布例如,
4、四個(gè)分公司接受調(diào)查的人數(shù)分別為例如,四個(gè)分公司接受調(diào)查的人數(shù)分別為100人,人,120人,人,90人,人,110人人條件分布與條件頻數(shù)條件分布與條件頻數(shù)變量變量 X 條件下變量條件下變量 Y 的分布,或在變量的分布,或在變量 Y 條件條件下變量下變量 X 的分布的分布每個(gè)詳細(xì)的察看值稱為條件頻數(shù)每個(gè)詳細(xì)的察看值稱為條件頻數(shù)察看值的分布(圖示)一分公司一分公司二分公司二分公司三分公司三分公司四分公司四分公司合計(jì)合計(jì)贊成該方案贊成該方案68755779279反對(duì)該方案反對(duì)該方案32453331141合計(jì)合計(jì)10012090110420百分比分布(概念要點(diǎn))條件頻數(shù)反映了數(shù)據(jù)的分布,但不適宜對(duì)比條件
5、頻數(shù)反映了數(shù)據(jù)的分布,但不適宜對(duì)比為在一樣的基數(shù)上進(jìn)展比較,可以計(jì)算相應(yīng)為在一樣的基數(shù)上進(jìn)展比較,可以計(jì)算相應(yīng)的百分比,稱為百分比分布的百分比,稱為百分比分布行百分比:行的每一個(gè)察看頻數(shù)除以相應(yīng)的行百分比:行的每一個(gè)察看頻數(shù)除以相應(yīng)的行合計(jì)數(shù)行合計(jì)數(shù)(fij / ri)列百分比:列的每一個(gè)察看頻數(shù)除以相應(yīng)的列百分比:列的每一個(gè)察看頻數(shù)除以相應(yīng)的列合計(jì)數(shù)列合計(jì)數(shù)( fij / cj )總百分比:每一個(gè)察看值除以察看值的總個(gè)總百分比:每一個(gè)察看值除以察看值的總個(gè)數(shù)數(shù)( fij / n )百分比分布(圖示)一分公司二分公司三分公司四分公司合計(jì)合計(jì)贊成該方案贊成該方案24.4%26.9%20.4%28
6、.3%66.4%68.0%62.5%63.3571.8%16.2%17.8%13.6%18.8%反對(duì)該方案反對(duì)該方案22.7%31.9%23.4%22.0%33.6%32.0%37.5%36.7%28.2%7.6%10.7%7.9%7.4%合計(jì)合計(jì)23.8%28.6%21.4%26.2%100%期望頻數(shù)的分布什么是期望分布?什么是期望分布?以前例為例。我們?cè)?jīng)知道在全部以前例為例。我們?cè)?jīng)知道在全部420420個(gè)樣本中,贊成個(gè)樣本中,贊成改革方案的有改革方案的有279279人,占總數(shù)的人,占總數(shù)的66.4%66.4%,即從總體上看有,即從總體上看有2/32/3的調(diào)查對(duì)象對(duì)改革方案表示贊同。但我
7、們希望進(jìn)一步的調(diào)查對(duì)象對(duì)改革方案表示贊同。但我們希望進(jìn)一步了解各分公司對(duì)這項(xiàng)改革方案的看法能否存在著差別。了解各分公司對(duì)這項(xiàng)改革方案的看法能否存在著差別。從邏輯上講,假設(shè)個(gè)分公司對(duì)這項(xiàng)改革方案的看法一樣,從邏輯上講,假設(shè)個(gè)分公司對(duì)這項(xiàng)改革方案的看法一樣,那么第一分公司贊成該方案的人數(shù)該當(dāng)為:那么第一分公司贊成該方案的人數(shù)該當(dāng)為: 10010066.4%=6666.4%=66人人第二分公司贊成該方案的人數(shù)該當(dāng)為:第二分公司贊成該方案的人數(shù)該當(dāng)為: 12012066.4%=8066.4%=80人人這這6666人和人和8080人就是本例中的期望值。人就是本例中的期望值。由此可以計(jì)算出期望分布由此可以
8、計(jì)算出期望分布. .期望頻數(shù)的分布 (例題分析)一分公司一分公司二分公司二分公司三分公司三分公司四分公司四分公司贊成該贊成該方案方案實(shí)際頻數(shù)實(shí)際頻數(shù)68755779期望頻數(shù)期望頻數(shù)66806073反對(duì)該反對(duì)該方案方案實(shí)際頻數(shù)實(shí)際頻數(shù)32753331期望頻數(shù)期望頻數(shù)34403037 利用察看值得有關(guān)信息計(jì)算期望值的分利用察看值得有關(guān)信息計(jì)算期望值的分布是進(jìn)展布是進(jìn)展檢驗(yàn)的第一步。檢驗(yàn)的第一步。10.2 c2檢驗(yàn)10.2.1 統(tǒng)計(jì)量統(tǒng)計(jì)量10.2.2 擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)10.2.2 獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn) 統(tǒng)計(jì)量 統(tǒng)計(jì)量用于檢驗(yàn)列聯(lián)表中變量間擬合優(yōu)度和獨(dú)立性用于測(cè)定兩個(gè)分類變量之間的相關(guān)程度
9、計(jì)算公式為eeofff22)( 統(tǒng)計(jì)量(例題分析)實(shí)際頻數(shù)實(shí)際頻數(shù)(fo)期望頻數(shù)期望頻數(shù)(fe)fo - fe(fo - fe )2(fo - fe )2fe687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.97300319. 3)(22eeofff 統(tǒng)計(jì)量的特征:統(tǒng)計(jì)量的特征:值的大小與察看值與期望值的配對(duì)數(shù)有關(guān),因此值的大小與察看值與期望值的配對(duì)數(shù)有關(guān),因此統(tǒng)計(jì)量的分布與自在度有關(guān)。統(tǒng)計(jì)量的分布與自在度有關(guān)。最后最后值描畫(huà)了察看值與期望值的
10、接近程度。值描畫(huà)了察看值與期望值的接近程度。分布的自在度分布的自在度自在度行數(shù)自在度行數(shù)列數(shù)列數(shù)擬合優(yōu)度檢驗(yàn)(goodness of fit test)對(duì)不同總體中某些性質(zhì)具有一樣比例這一假設(shè)進(jìn)展檢驗(yàn);對(duì)不同總體中某些性質(zhì)具有一樣比例這一假設(shè)進(jìn)展檢驗(yàn);檢驗(yàn)多個(gè)比例能否相等檢驗(yàn)多個(gè)比例能否相等檢驗(yàn)的步驟檢驗(yàn)的步驟提出假設(shè)提出假設(shè)H0: 1 = 2 = = j;H1: 1 , 2 , , j 不全相等不全相等 計(jì)算檢驗(yàn)的統(tǒng)計(jì)量計(jì)算檢驗(yàn)的統(tǒng)計(jì)量3 3、進(jìn)展決策、進(jìn)展決策 根據(jù)顯著性程度根據(jù)顯著性程度 和自在度和自在度(r-1)(c-1)(r-1)(c-1)查出臨界值查出臨界值2 2 假設(shè)假設(shè) 222
11、 2,回絕,回絕H0H0;假設(shè);假設(shè) 2222 2,回絕,回絕H0H0;假設(shè);假設(shè) 222 2,接受,接受H0H0獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)(例題分析例題分析)【例】一種原料來(lái)自三個(gè)不同地域,原料質(zhì)量被分成三個(gè)不【例】一種原料來(lái)自三個(gè)不同地域,原料質(zhì)量被分成三個(gè)不同等級(jí)。從這批原料中隨機(jī)抽取同等級(jí)。從這批原料中隨機(jī)抽取500件進(jìn)展檢驗(yàn),結(jié)果如下件進(jìn)展檢驗(yàn),結(jié)果如下表。要求檢驗(yàn)各個(gè)地域和原料質(zhì)量之間能否存在依賴關(guān)系?表。要求檢驗(yàn)各個(gè)地域和原料質(zhì)量之間能否存在依賴關(guān)系?地區(qū)地區(qū)一級(jí)一級(jí)二級(jí)二級(jí)三級(jí)三級(jí)合計(jì)合計(jì)甲地區(qū)甲地區(qū)526424140乙地區(qū)乙地區(qū)605952171丙地區(qū)丙地區(qū)506574189合計(jì)合
12、計(jì)162188150500nCTRTnnCTnRTfe地區(qū)地區(qū)一級(jí)一級(jí)二級(jí)二級(jí)三級(jí)三級(jí)合計(jì)合計(jì)甲地區(qū)甲地區(qū)觀察值觀察值526424140期望值期望值45.3652.6442.00乙地區(qū)乙地區(qū)觀察值觀察值605952171期望值期望值55.4064.3051.30丙地區(qū)丙地區(qū)觀察值觀察值506574189期望值期望值61.2471.0656.70合計(jì)合計(jì)162188150500、計(jì)算檢驗(yàn)的統(tǒng)計(jì)量、計(jì)算檢驗(yàn)的統(tǒng)計(jì)量82.19)(22eeofff3 3、進(jìn)展決策、進(jìn)展決策 根據(jù)顯著性程度根據(jù)顯著性程度 和自在度和自在度(r-1)(c-1)(r-1)(c-1)查出臨界值查出臨界值2 2488.9)4(
13、05.02)4(05.022因此:回絕原假設(shè),即地域和原料等級(jí)之間存在依賴關(guān)系因此:回絕原假設(shè),即地域和原料等級(jí)之間存在依賴關(guān)系10.3 列聯(lián)表中的相關(guān)丈量10.3.1 相關(guān)系數(shù)相關(guān)系數(shù)10.3.2 列聯(lián)相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)10.3.3 V 相關(guān)系數(shù)相關(guān)系數(shù)列聯(lián)表中的相關(guān)丈量列聯(lián)表中的相關(guān)丈量質(zhì)量相關(guān)質(zhì)量相關(guān)對(duì)質(zhì)量數(shù)據(jù)對(duì)質(zhì)量數(shù)據(jù)(分類和順序數(shù)據(jù)分類和順序數(shù)據(jù))之間相關(guān)之間相關(guān)程度的測(cè)度程度的測(cè)度列聯(lián)表變量的相關(guān)屬于質(zhì)量相關(guān)列聯(lián)表變量的相關(guān)屬于質(zhì)量相關(guān)列聯(lián)表相關(guān)丈量的統(tǒng)計(jì)量主要有列聯(lián)表相關(guān)丈量的統(tǒng)計(jì)量主要有 相關(guān)系數(shù)相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)V 相關(guān)系數(shù)相關(guān)系數(shù) 相關(guān)系數(shù)(correlat
14、ion coefficient)測(cè)度測(cè)度2 2列聯(lián)表中數(shù)據(jù)相關(guān)程度列聯(lián)表中數(shù)據(jù)相關(guān)程度對(duì)于對(duì)于2 2 列聯(lián)表,列聯(lián)表, 系數(shù)的值在系數(shù)的值在01之間之間 相關(guān)系數(shù)計(jì)算公式為相關(guān)系數(shù)計(jì)算公式為n2其中:其中:N為列聯(lián)表中的總頻數(shù)為列聯(lián)表中的總頻數(shù)eeofff22)( 相關(guān)系數(shù)(原理分析)一個(gè)簡(jiǎn)化的一個(gè)簡(jiǎn)化的 2 2 列聯(lián)表列聯(lián)表因素因素Y因素因素 X合計(jì)合計(jì)x1x2y1aba + by2cdc + d合計(jì)合計(jì)a + cb + dn 相關(guān)系數(shù) (原理分析)列聯(lián)表中每個(gè)單元格的期望頻數(shù)分別為ndcdbendbbaendccaencabae)()()()(22122111)()()()()()()()
15、(2222222122112212112112dbcadcbabcadneedeeceebeea 相關(guān)系數(shù) (原理分析)將將代入代入 相關(guān)系數(shù)的計(jì)算公式得相關(guān)系數(shù)的計(jì)算公式得)()()(2dbcadcbabcadnad 等于等于 bc , = 0,闡明變量,闡明變量X 與與 Y 之間獨(dú)之間獨(dú)立立假設(shè)假設(shè) b=0 ,c=0,或,或a=0 ,d=0,意味著各察看,意味著各察看頻數(shù)全部落在對(duì)角線上,此時(shí)頻數(shù)全部落在對(duì)角線上,此時(shí)| =1,闡明變量闡明變量X 與與 Y 之間完全相關(guān)之間完全相關(guān)列聯(lián)相關(guān)系數(shù)(coefficient of contingency)nC22用于測(cè)度大于用于測(cè)度大于2 2列聯(lián)
16、表中數(shù)據(jù)的相關(guān)程度列聯(lián)表中數(shù)據(jù)的相關(guān)程度計(jì)算公式為計(jì)算公式為V 相關(guān)系數(shù)(V correlation coefficient)計(jì)算公式為計(jì)算公式為中較小的一個(gè)表示取式中:) 1(),1() 1(),1(min) 1(),1(min2crcrcrnV V 的取值范圍是的取值范圍是 0 V 1 V = 0闡明列聯(lián)表中的兩個(gè)變量獨(dú)立闡明列聯(lián)表中的兩個(gè)變量獨(dú)立 V=1闡明列聯(lián)表中的兩個(gè)變量完全相關(guān)闡明列聯(lián)表中的兩個(gè)變量完全相關(guān)不同行和列的列聯(lián)表計(jì)算的列聯(lián)絡(luò)數(shù)不便于比較不同行和列的列聯(lián)表計(jì)算的列聯(lián)絡(luò)數(shù)不便于比較當(dāng)列聯(lián)表中有一維為當(dāng)列聯(lián)表中有一維為2,min(r-1),(c-1)=1,此時(shí)此時(shí)V= 、C、V 的比較同一個(gè)列聯(lián)表,同一個(gè)列聯(lián)表, 、C、V 的結(jié)果會(huì)不同的結(jié)果會(huì)不同不同的列聯(lián)表,不同的列聯(lián)表, 、C、V 的結(jié)果也不同的結(jié)果也不同在對(duì)不同列聯(lián)表變量之間的相關(guān)程度進(jìn)展在對(duì)不同列聯(lián)表變量之間的相關(guān)程度進(jìn)展比較時(shí),不同列聯(lián)表中的行與行、列與列比較時(shí),不同列聯(lián)表中的行與行、列與列的個(gè)數(shù)要一樣,并且采用同一種系數(shù)的個(gè)數(shù)要一樣,并且采用同一種系數(shù)列聯(lián)表中的相關(guān)丈量(例題分析)【例】一種原料來(lái)自三個(gè)不同地域,原料質(zhì)量被分成三個(gè)【例】一種原料來(lái)自三個(gè)不同地域,原料質(zhì)量被分成三個(gè)不同等級(jí)。從這批原料中隨機(jī)抽取不同等級(jí)。從這批原料中隨機(jī)抽取500件進(jìn)展檢驗(yàn),結(jié)果如件進(jìn)展檢驗(yàn),結(jié)果如下表。分別計(jì)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國(guó)機(jī)客車配件市場(chǎng)調(diào)查研究報(bào)告
- 2025年中國(guó)日裝手袋數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年中國(guó)數(shù)控立式內(nèi)圓珩磨機(jī)市場(chǎng)調(diào)查研究報(bào)告
- 新生兒溶血病健康宣講
- 新疆科技職業(yè)技術(shù)學(xué)院《車輛工程專業(yè)課程設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 肇慶市實(shí)驗(yàn)中學(xué)高中生物三:通過(guò)神經(jīng)系統(tǒng)的調(diào)節(jié)練習(xí)鞏固
- 肇慶市實(shí)驗(yàn)中學(xué)高中歷史一:第課馬克思主義的誕生教案
- 新疆能源職業(yè)技術(shù)學(xué)院《醫(yī)學(xué)統(tǒng)計(jì)學(xué)(C)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025-2030年中國(guó)15家商業(yè)銀行銀行卡業(yè)務(wù)行業(yè)動(dòng)態(tài)分析及投資戰(zhàn)略規(guī)劃研究報(bào)告
- 2025-2030年中國(guó)B超設(shè)備行業(yè)發(fā)展前景展望及投資戰(zhàn)略研究報(bào)告
- 子宮肌瘤病例討論
- 門窗安裝施工方案07785
- 土壤氡檢測(cè)方案
- 2025年寬帶網(wǎng)絡(luò)拓展合作協(xié)議書(shū)
- 氧化鎵雪崩光電探測(cè)器的研究進(jìn)展
- 【9語(yǔ)期末】黃山市歙縣2024-2025學(xué)年九年級(jí)上學(xué)期期末語(yǔ)文試題
- 2024年重慶高考物理卷試題真題解讀及答案詳解(精校打印)
- 居間合同協(xié)議書(shū)范本標(biāo)準(zhǔn)版
- 2024年孝感市(中心)人民醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫(kù)頻考點(diǎn)附帶答案
- VL3000系列高性能矢量型變頻器用戶手冊(cè)上海沃陸電氣有限公司
- 血液安全管理制度
評(píng)論
0/150
提交評(píng)論