




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第9章 分類數據分析 思考題:P2339.1、9.39.1 分類數據與卡方統計量分類數據與卡方統計量9.1.1 分類數據分類數據調查結果雖然用數值表示,但不同數值描述的是調查對象的不同特征。分類數據匯總的結果表現為頻數。卡方檢驗是對分類數據的頻數進行分析的統計方法。9.2 擬合優度檢驗擬合優度檢驗依據總體分布狀況,計算出分類變量中各類別的期望頻數,與分布的觀察頻數進行對比,判斷期望頻數與觀察頻數是否有顯著差異。9.3 列聯分析:獨立性分析9.3.1 列聯表列聯表 由兩個以上的變量進行交叉分類的頻數分布表 行變量的類別用 r 表示, ri 表示第 i 個類別 列變量的類別用 c 表示, cj 表
2、示第 j 個類別 每種組合的觀察頻數用 fij 表示 表中列出了行變量和列變量的所有可能的組合,所以稱為列聯表 一個 r 行 c 列的列聯表稱為 r c 列聯表列聯表的結構列聯表的結構(2 列聯表)列列(cj)行行 (ri)一個一個2 列聯表列聯表列聯表的結構(r c 列聯表的一般表示)列列(cj)行行(ri)r 行行 c 列的列聯表列的列聯表fij 表示第表示第 i 行第行第 j 列的觀察頻數列的觀察頻數【例例】一個集團公司在四個不同的地區設有分公司,現該一個集團公司在四個不同的地區設有分公司,現該集團公司欲進行一項改革,此項改革可能涉及到各分公司集團公司欲進行一項改革,此項改革可能涉及到各
3、分公司的利益,故采用抽樣調查方式,從四個分公司共抽取的利益,故采用抽樣調查方式,從四個分公司共抽取420個個樣本單位樣本單位(人人),了解職工對此項改革的看法,調查結果如下,了解職工對此項改革的看法,調查結果如下表表邊緣分布行邊緣分布行觀察值的合計數的分布例如,贊成改革方案的共有279人,反對改革方案的141人列邊緣分布列觀察值的合計數的分布例如,四個分公司接受調查的人數分別為100人,120人,90人,110人條件分布與條件頻數變量 X 條件下變量 Y 的分布,或在變量 Y 條件下變量 X 的分布每個具體的觀察值稱為條件頻數行邊緣分布行邊緣分布列邊緣分布列邊緣分布條件頻數條件頻數條件頻數反映
4、了數據的分布,但不適合進行對比為在相同的基數上進行比較,可以計算相應的百分比,稱為百分比分布行百分比:行的每一個觀察頻數除以相應的行合計數(fij / ri)列百分比:列的每一個觀察頻數除以相應的列合計數( fij / cj )總百分比:每一個觀察值除以觀察值的總個數( fij / n )總百分比總百分比列百分比列百分比行百分比行百分比假定行變量和列變量是獨立的一個實際頻數 fij 的期望頻數 eij ,是總頻數的個數 n 乘以該實際頻數 fij 落入第 i 行 和第j列的概率,即ncrncnrnejiiiij 由于觀察頻數的總數為n ,所以f11 的期望頻數 e11 應為6643.66420
5、100279111111 ncrncnrnencnr11 例如,第1行和第1列的實際頻數為 f11 ,它落在第1行的概率估計值為該行的頻數之和r1除以總頻數的個數 n ,即:r1/n;它落在第1列的概率的估計值為該列的頻數之和c1除以總頻數的個數 n ,即:c1/n 。根據概率的乘法公式,該頻數落在第1行和第1列的概率應為根據上述公式計算的前例的期望頻數 統計量用于檢驗列聯表中變量之間是否存在顯著性差異,或者用于檢驗變量之間是否獨立計算公式為2211()(1)(1)rcijijijijfijijeijijfeerc列聯表中第 行第 列類別的實際頻數列聯表中第 行第 列類別的期望頻數其自由度為式
6、中:合計:合計:3.031922()3.0319fee擬合優度檢驗檢驗列聯表中目標變量之間是否存在顯著性差異檢驗的步驟為提出假設H0:P1 = P2 = = Pj (目標變量的各個比例一致)H1:P1 , P2 , , Pj 不全相等 (各個比例不一致)計算檢驗的統計量 ricjijijijeef1122)(n進行決策l根據顯著性水平和自由度(r-1)(c-1)查出臨界值2l若22,拒絕H0;若22,接受H0擬合優度檢驗檢驗職工的態度是否與所在單位有關? ( 0.1)提出假設H0:P1 = P2 = P2 = P4 (贊成比例一致)H1:P1 , P2 , P3 , P4不全相等 (贊成比例不
7、一致)計算檢驗的統計量0319. 3)(1122ricjijijijeef根據顯著性水平0.1和自由度(2-1)(4-1)=3查出相應的臨界值2=6.251。由于2=3.03192=6.251,接受H09.3.2 獨立性檢驗 檢驗列聯表中的行變量與列變量之間是否獨立 檢驗的步驟為提出假設H0:行變量與列變量獨立H1:行變量與列變量不獨立1.計算檢驗的統計量 ricjijijijeef1122)(進行決策l根據顯著性水平和自由度(r-1)(c-1)查出臨界值2l若22,拒絕H0;若229.448,拒絕H09.4 列聯表中的相關測量列聯表中的相關測量9.4.1 相關系數相關系數 測度 22列聯表中
8、數據相關程度的一個量 對于22 列聯表, 系數的值在01之間 相關系數計算公式為22211fercijijijeijnn ()式中:為實際頻數的總個數,即樣本容量,一個簡化的一個簡化的 2 2 列聯表列聯表列聯表中每個單元格的期望頻數分別為列聯表中每個單元格的期望頻數分別為ndcdbendbbaendccaencabae)()()()(22122111將各期望頻數代入將各期望頻數代入 的計算公式得的計算公式得)()()()()()()()(2222222122112212112112dbcadcbabcadneedeeceebeea將入 相關系數的計算公式得)()()(2dbcadcbabca
9、dnad 等于等于 bc , = 0,表明變量,表明變量X 與與 Y 之間獨立之間獨立若若 b=0 ,c=0,或,或a=0 ,d=0,意味著各觀察頻,意味著各觀察頻數全部落在對角線上,此時數全部落在對角線上,此時| | =1, ,表明變量表明變量X 與與 Y 之間完全相關之間完全相關列聯表中變量的位置可以互換,列聯表中變量的位置可以互換, 的符號沒有的符號沒有實際意義,故取絕對值即可實際意義,故取絕對值即可9.4.2 列聯相關系數列聯相關系數用于測度大于22列聯表中數據的相關程度,計算公式為 C 的取值范圍是 0C1C = 0表明列聯表中的兩個變量獨立C 的數值大小取決于列聯表的行數和列數,并
10、隨行數和列數的增大而增大。22列聯表完全相關時,c=0.7071;33列聯表完全相關時,c=0.8165;44列聯表完全相關時,c=0.87根據不同行和列的列聯表計算的列聯系數不便于比較22Cn9.4.3 V相關系數相關系數計算公式為 其中 V 的取值范圍是 0V1 V = 0表明列聯表中的兩個變量獨立V=1表明列聯表中的兩個變量完全相關不同行和列的列聯表計算的列聯系數不便于比較當列聯表中有一維為2,min(r-1),(c-1)=1,此時V= 2min (1),(1)Vnrcmin (1),(1)(1),(1)rcrc表示取中較小的一個9.4.4 數值分析數值分析、C、V 的比較同一個列聯表,、C、V 的結果會不同不同的列聯表,、C、V 的結果也不同在對不同列聯表變量之間的相關程度進行比較時,不同列聯表中的行與行、列與列的個數要相同,并且采用同一種系數9.5 列聯分析中應注意的問題9.5.1 條件百分表的方向條件百分表的方向通常將自變量放在列的位置,將因變量放在行的位置。如果因變量在樣本中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國胃康-U市場調查研究報告
- 2025年中國離心鑄管用覆膜砂市場調查研究報告
- 2025年中國電表殼專用阻燃ABS市場調查研究報告
- 2025年中國照度測量光學儀市場調查研究報告
- 培養專家型校長的有效策略與實踐路徑
- 紅樹莓種植投資項目商業計劃書(代可行性研究報告)
- 臨床專科體系建設新階段推進方案
- 工業熨斗總體規模、主要生產商、主要地區、產品和應用細分研究報告
- 抽搐的急救流程及護理方法
- 促進學生身心健康與全面發展的行動計劃
- 解除租賃合同的協議
- 2025-2030中國碳纖維預浸料行業市場現狀供需分析及投資評估規劃分析研究報告
- 2024年中國機械工業集團有限公司國機集團總部招聘筆試真題
- 2025年長春師范高等專科學校單招職業技能考試題庫必考題
- 人工智能對文化產業的創新與發展
- 2025年全屋定制家居市場分析與經營計劃
- 電動汽車結構原理與檢修課件:慢充系統檢修
- 2025年中國旅行車市場調查研究報告
- 專題09 產業區位與產業發展【知識精研】高考地理二輪復習
- 《中小學科學教育工作指南》解讀
- 2024年中考模擬試卷道法(全國卷)
評論
0/150
提交評論