




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1.2獨立性檢驗的根本思想及其初步應用獨立性檢驗的根本思想及其初步應用第一章統計案例學習目標1.了解分類變量的意義.2.了解22列聯表的意義.3.了解隨機變量K2的意義.4.通過對典型案例的分析,了解獨立性檢驗的根本思想與方法.問題導學達標檢測題型探究內容索引問題導學知識點一分類變量及22列聯表思考某城市隨機抽取一年思考某城市隨機抽取一年(365天天)內內100天的空氣質量指數天的空氣質量指數API(Air Pollution Index)的監測數據,結果統計如下:的監測數據,結果統計如下:API0,50) 50,100) 100,150)150,200)200,250)250,300大于30
2、0空氣質量優良輕微污染 輕度污染 中度污染中度重污染重度污染天數101520307612假設本次抽取的樣本數據有30天是在供暖季,其中有7天為重度污染,完成下面表格.非重度污染重度污染總計供暖季非供暖季總計10023730655708812梳理梳理(1)分類變量分類變量變量的不同變量的不同“值表示個體所屬的值表示個體所屬的 ,像這樣的變量稱為分類變量,像這樣的變量稱為分類變量.(2)列聯表列聯表定義:列出的兩個分類變量的定義:列出的兩個分類變量的 ,稱為列聯表,稱為列聯表.22列聯表列聯表一 般 地 , 假 設 有 兩 個 分 類 變 量一 般 地 , 假 設 有 兩 個 分 類 變 量 X
3、和和 Y , 它 們 的 取 值 分 別 為, 它 們 的 取 值 分 別 為 和和 ,其樣本頻數列聯表,其樣本頻數列聯表(也稱為也稱為22列聯表列聯表)為下表為下表.不同類別頻數表x1,x2 y1,y2y1y2總計x1ababx2cdcd總計acbdabcd知識點二等高條形圖1.與表格相比,圖形更能直觀地反映出兩個分類變量間是否,常用等高條形圖展示列聯表數據的特征.2.如果通過計算或等高條形圖發現和相差很大,就判斷兩個分類變量之間.相互影響頻率有關系知識點三獨立性檢驗1.定義:利用隨機變量K2來判斷“兩個分類變量有關系的方法稱為獨立性檢驗.其中nabcd為樣本容量.3.獨立性檢驗的具體做法(
4、1)根據實際問題的需要確定容許推斷“兩個分類變量有關系犯錯誤概率的上界,然后查表確定.臨界值k0(2)利用公式計算隨機變量K2的.(3)如果,就推斷“X與Y有關系,這種推斷犯錯誤的概率不超過;否那么,就認為在不超過的前提下不能推斷“X與Y有關系,或者在樣本數據中支持結論“X與Y有關系.觀測值kkk0犯錯誤的概率沒有發現足夠證據1.利用隨機變量K2來判斷“兩個分類變量有關系的方法稱為獨立性檢驗.()2.在一項打鼾與患心臟病的調查中,共調查了1671人,經過計算K2的觀測值k27.63,根據這一數據進展分析,我們有理由認為打鼾與患心臟病是無關的.()3.在獨立性檢驗中,當K26.635時,我們有9
5、9%的把握認為兩分類變量有關,是指“兩分類變量有關這一結論的可信度為99%,而不是兩分類變量有關系的概率為99%.()思考辨析 判斷正誤4.獨立性檢驗的根本思想類似于反證法.()5.利用K2進展獨立性檢驗,可對推斷犯錯誤的概率作出估計,其估計可靠性與樣本容量n無關.()6.列聯表僅對兩個分類變量匯總統計.()題型探究例例1為調查某生產線上某質量監視員甲在不在場對產品質量的好壞有為調查某生產線上某質量監視員甲在不在場對產品質量的好壞有無影響,現統計數據如下:質量監視員甲在場時,無影響,現統計數據如下:質量監視員甲在場時,990件產品中合格品件產品中合格品有有982件,次品有件,次品有8件;甲不在
6、場時,件;甲不在場時,510件產品中合格品有件產品中合格品有493件,次品件,次品有有17件件.試分別用列聯表和等高條形圖對數據進展分析試分別用列聯表和等高條形圖對數據進展分析.類型一直觀分析兩個分類變量的關聯性解答解根據題目所給數據得如下解根據題目所給數據得如下22列聯表:列聯表:合格品數次品數總計甲在場9828990甲不在場49317510總計1475251500由列聯表看出|adbc|982174938|12750,數較大,所以可在某種程度上認為“質量監視員甲在不在場與產品質量有關.等高條形圖如下圖.所以由等高條形圖可知,在某種程度上,可認為“質量監視員甲在不在場與產品質量有關.反思與感
7、悟反思與感悟(1)利用列聯表直接計算利用列聯表直接計算adbc,如果差的絕對值很大,就,如果差的絕對值很大,就判斷兩個分類變量之間有關系判斷兩個分類變量之間有關系.(2)在等高條形圖中展示列聯表數據的頻率特征,比較圖中兩個深色條的在等高條形圖中展示列聯表數據的頻率特征,比較圖中兩個深色條的高可以發現兩者頻率不一樣而得出結論高可以發現兩者頻率不一樣而得出結論.這種直觀判斷的缺乏之處在于不這種直觀判斷的缺乏之處在于不能給出推斷能給出推斷“兩個分類變量有關系犯錯誤的概率兩個分類變量有關系犯錯誤的概率.跟蹤訓練跟蹤訓練1某學校對高三學生作了一項調查發現:在平時的模擬考試某學校對高三學生作了一項調查發現
8、:在平時的模擬考試中,性格內向的學生中,性格內向的學生426人中有人中有332人在考前心情緊張,性格外向的學生人在考前心情緊張,性格外向的學生594人中有人中有213人在考前心情緊張,試作出等高條形圖,利用圖形判斷考人在考前心情緊張,試作出等高條形圖,利用圖形判斷考前心情緊張與性格類別是否有關系前心情緊張與性格類別是否有關系.解答解考前心情緊張與性格類型列聯表如下:解考前心情緊張與性格類型列聯表如下:性格內向 性格外向 總計考前心情緊張332213545考前心情不緊張94381475總計4265941020adbc33238121394106470,|adbc|比較大,說明考前心情是否緊張與性
9、格類型有關.圖中陰影局部表示考前心情緊張與考前心情不緊張中性格內向占的比例,從圖中可以看出考前心情緊張的樣本中性格內向占的比例比考前心情不緊張樣本中性格內向占的比例高,可以認為考前心情是否緊張與性格類型有關.例例2對對196個承受心臟搭橋手術的病人和個承受心臟搭橋手術的病人和196個承受血管清障手術的病個承受血管清障手術的病人進展人進展3年的跟蹤研究,調查他們是否又發作過心臟病,調查結果如下年的跟蹤研究,調查他們是否又發作過心臟病,調查結果如下表所示表所示.類型二由K2進展獨立性檢驗又發作過心臟病未發作過心臟病總計心臟搭橋手術39157196血管清障手術29167196總計68324392試根
10、據上述數據比較這兩種手術對病人又發作過心臟病的影響有沒有差異.解答解假設病人又發作過心臟病與做過心臟搭橋手術還是血管清障手術沒解假設病人又發作過心臟病與做過心臟搭橋手術還是血管清障手術沒有關系,由表中數據得有關系,由表中數據得a39,b157,c29,d167,ab196,cd196,ac68,bd324,n392,由公式得由公式得K2的觀測值的觀測值因為k1.7792.706,所以不能得出病人又發作過心臟病與做過心臟搭橋手術還是血管清障手術有關系的結論,即這兩種手術對病人又發作過心臟病的影響沒有差異.反思與感悟反思與感悟(1)獨立性檢驗的關注點獨立性檢驗的關注點在在22列聯表中,如果兩個分類
11、變量沒有關系,那么應滿足列聯表中,如果兩個分類變量沒有關系,那么應滿足adbc0,因此因此|adbc|越小,關系越弱;越小,關系越弱;|adbc|越大,關系越強越大,關系越強.(2)獨立性檢驗的具體做法獨立性檢驗的具體做法根據實際問題的需要確定允許推斷根據實際問題的需要確定允許推斷“兩個分類變量有關系犯錯誤的兩個分類變量有關系犯錯誤的概率的上界概率的上界,然后查表確定臨界值,然后查表確定臨界值k0.如果kk0,推斷“X與Y有關系這種推斷犯錯誤的概率不超過;否那么,就認為在犯錯誤的概率不超過的前提下不能推斷“X與Y有關系,或者在樣本數據中沒有發現足夠的證據支持結論“X與Y有關系.跟蹤訓練跟蹤訓練
12、2某工廠有某工廠有25周歲以上周歲以上(含含25周歲周歲)工人工人300名,名,25周歲以下工周歲以下工人人200名名.為研究工人的日平均生產量是否與年齡有關,現采用分層抽樣為研究工人的日平均生產量是否與年齡有關,現采用分層抽樣的方法,從中抽取了的方法,從中抽取了100名工人,先統計了他們某月的日平均生產件數,名工人,先統計了他們某月的日平均生產件數,然后按工人年齡在然后按工人年齡在“25周歲以上周歲以上(含含25周歲周歲)和和“25周歲以下分為兩周歲以下分為兩組,再將兩組工人的日平均生產件數分成組,再將兩組工人的日平均生產件數分成5組:組:50,60),60,70),70,80),80,90
13、),90,100分別加以統計,得到如下圖的頻率分布直方圖分別加以統計,得到如下圖的頻率分布直方圖.(1)從樣本中日平均生產件數缺乏60件的工人中隨機抽取2人,求至少抽到一名“25周歲以下組工人的概率;解答解由得,樣本中有解由得,樣本中有25周歲以上組工人周歲以上組工人60名,名,25周歲以下組工人周歲以下組工人40名名.所以,樣本中日平均生產件數缺乏所以,樣本中日平均生產件數缺乏60件的工人中,件的工人中,25周歲以上組工人有周歲以上組工人有600.053(人人),記為,記為A1,A2,A3;25周歲以下組工人有周歲以下組工人有400.052(人人),記為,記為B1,B2.從中隨機抽取從中隨機
14、抽取2名工人,所有的可能結果共有名工人,所有的可能結果共有10種,它們是種,它們是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有其中,至少有1名名“25周歲以下組工人的可能結果共有周歲以下組工人的可能結果共有7種,它們是種,它們是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).(2)規定日平均生產件數不少于80件者為“生產能手,請你根據條件完成22列聯表,并判斷是否有90%的把握認為“生產能手與工人所在的年齡組有關?解答解由頻率分布直方圖可知,在抽取的解由頻率分布直方圖可知,在抽取的100名工人中,名工人中,“25周歲以上組周歲以上組中的生產能手有中的生產能手有600.2515(人人),“25周歲以下組中的生產能手有周歲以下組中的生產能手有400.37515(人人),據此可得,據此可得22列聯表如下:列聯表如下:生產能手非生產能手總計25周歲以上組15456025周歲以下組152540總計3070100又因為1.78
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 玻璃鋼管材的制造工藝與性能研究考核試卷
- 童車制造企業質量控制與品質提升策略考核試卷
- 會展智能多媒體信息發布考核試卷
- 畜牧業市場渠道拓展考核試卷
- 禮儀用品企業人力資源開發考核試卷
- 電池材料合成與性能調控考核試卷
- 電機在電力安全監控的應用考核試卷
- 篷布企業團隊建設考核試卷
- 四川職業技術學院《企業價值創造實戰》2023-2024學年第二學期期末試卷
- 四川省成都市都江堰市2025屆初三下學期尖子生化學試題含解析
- 2025年一級注冊計量師考試題庫大全及答案
- 衛生院全國預防接種日宣傳活動總結(8篇)
- 2024國家電投集團中國電力招聘(22人)筆試參考題庫附帶答案詳解
- 大數據在展覽中的應用-全面剖析
- 數學和化學融合課件
- 通信汛期安全培訓
- 生產車間計件工資制度方案
- 養殖專業畢業論文
- T-FJZYC 10-2024 金線蓮規范化生產技術規程
- 2025年四川省成都市“蓉漂”人才薈武候區招聘23人歷年自考難、易點模擬試卷(共500題附帶答案詳解)
- 2025新疆交投集團所屬子公司招56人筆試參考題庫附帶答案詳解
評論
0/150
提交評論