選修2-3獨立性檢驗課件_第1頁
選修2-3獨立性檢驗課件_第2頁
選修2-3獨立性檢驗課件_第3頁
選修2-3獨立性檢驗課件_第4頁
選修2-3獨立性檢驗課件_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、3.2獨立性檢驗的基本思想及其初步應用高二數(shù)學 選修2-3 第三章 統(tǒng)計案例授課教師:胡周明獨立性檢驗本節(jié)研究的是兩個分類變量的獨立性檢驗問題。在日常生活中,我們常常關心分類變量之間是否有關系:例如,吸煙是否與患肺癌有關系? 性別是否對于喜歡數(shù)學課程有影響?等等。吸煙有害健康!正常人的肺吸煙者的肺 吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965為了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所隨機地調(diào)查了9965人,得到如下結(jié)果(單位:人)列聯(lián)表在不吸煙者中患肺癌的比重是 在吸煙者中患肺癌的比重是 說明:吸煙者和不吸煙者患肺癌的可能性存在差

2、異,吸煙者患肺癌的可能性大。0.54%2.28%探究不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計98749199651、列聯(lián)表2、三維柱形圖3、二維條形圖不患肺癌患肺癌吸煙不吸煙不患肺癌患肺癌吸煙不吸煙080007000600050004000300020001000從三維柱形圖能清晰看出各個頻數(shù)的相對大小。從二維條形圖能看出,吸煙者中患肺癌的比例高于不患肺癌的比例。通過圖形直觀判斷兩個分類變量是否相關: 上面我們通過分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和患肺癌有關,那么事實是否真的如此呢?這需要用統(tǒng)計觀點來考察這個問題。 現(xiàn)在想要知道能夠以多大的把握認為“吸煙與患

3、肺癌有關”,為此先假設 H0:吸煙與患肺癌沒有關系.不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d把表中的數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表 用A表示不吸煙,B表示不患肺癌,則“吸煙與患肺癌沒有關系”等價于“吸煙與患肺癌獨立”,即假設H0等價于 P(AB)=P(A)P(B).因此|ad-bc|越小,說明吸煙與患肺癌之間關系越弱; |ad-bc|越大,說明吸煙與患肺癌之間關系越強。不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d在表中,a恰好為事件AB發(fā)生的頻數(shù);a+b和a+c恰好分別為事件A和B發(fā)生的頻數(shù)。由于頻率接近于概率

4、,所以在H0成立的條件下應該有在H0成立的情況下,統(tǒng)計學家估算出如下的概率 即在H0成立的情況下,K2的值大于6.635的概率非常小,近似于0.01。 也就是說,在H0成立的情況下,對隨機變量K2進行多次觀測,觀測值超過6.635的頻率約為0.01。思考 答:判斷出錯的概率為0.01。判斷 是否成立的規(guī)則如果 ,就判斷 不成立,即認為吸煙與患肺癌有關系;否則,就判斷 成立,即認為吸煙與患肺癌有關系。獨立性檢驗的定義 上面這種利用隨機變量K2來確定在多大程度上可以認為“兩個分類變量有關系”的方法,稱為兩個分類變量的獨立性檢驗。在該規(guī)則下,把結(jié)論“ 成立”錯判成“ 不成立”的概率不會差過即有99%

5、的把握認為 不成立。獨立性檢驗的基本思想(類似反證法)(1)假設結(jié)論不成立,即 “兩個分類變量沒有關系”.(2)在此假設下我們所構(gòu)造的隨機變量 K2 應該很小,如果由觀測數(shù)據(jù)計算得到K2的觀測值k很大,則在一定可信程度上說明 不成立.即在一定可信程度上認為“兩個分類變量有關系”;如果k的值很小,則說明由樣本觀測數(shù)據(jù)沒有發(fā)現(xiàn)反對 的充分證據(jù)。(3)根據(jù)隨機變量K2的含義,可以通過評價該假設不合理的程度,由實際計算出的,說明假設不合理的程度為1%,即“兩個分類變量有關系”這一結(jié)論成立的可信度為約為99%.思考: 利用上面的結(jié)論,你能從列聯(lián)表的等高條形圖中看出兩個分類變量是否相關呢?表1-11 2x

6、2聯(lián)表 一般地,假設有兩個分類變量X和Y,它們的取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)表)為:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d 若要判斷的結(jié)論為:H1:“X與Y有關系”,可以按如下步驟判斷H1成立的可能性:2、可以利用獨立性檢驗來考察兩個分類變量是否有關系,并且能較精確地給出這種判斷的可靠程度。1、通過等高條形圖,可以粗略地判斷兩個變量是否有關系,但是這種判斷無法精確地給出所得結(jié)論的可靠程度。 在等高條形圖中, 主對角線上兩個柱形高度的乘積ad與副對角線上兩個柱形高度的乘積bc相差越大,H1成立的可能性就越大。 隨機變量-卡方統(tǒng)

7、計量獨立性檢驗0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828臨界值表0.1%把握認為A與B無關1%把握認為A與B無關99.9%把握認A與B有關99%把握認為A與B有關90%把握認為A與B有關10%把握認為A與B無關沒有充分的依據(jù)顯示A與B有關,但也不能顯示A與B無關第一步:設H0: 吸煙和患病之間沒有關系 患病不患病總計吸煙aba+b不吸煙cdc+d總計a+cb+da+b+c+d第二步:列出22列聯(lián)表 獨立性檢驗的步驟第三步:計算第四步:查對臨界值表,

8、作出判斷。P(kk0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828反證法原理與假設檢驗原理反證法原理: 在一個已知假設下,如果推出一個矛盾,就證明了這個假設不成立。假設檢驗原理:在一個已知假設下,如果一個與該假設矛盾的小概率事件發(fā)生,就推斷這個假設不成立。 小試牛刀1、在吸煙與患肺病這兩個分類變量的計算中,下列說法正確的是 ( ) A. 若k2=6.635,則有99%的把握認為吸煙與患肺病有關,那么100名吸煙 者中,有99個患肺病. B. 從獨

9、立性檢驗可知,有99%的把握認為吸煙與患肺病有關時,可以說某人吸煙,那么他有99%的可能性患肺病. C. 若從統(tǒng)計量中求出有95%的把握認為吸煙與患肺病有關,是指有5%的可能性使推斷出現(xiàn)錯誤. D. 以上三種說法都不對.2、在獨立性檢驗時計算的的觀測值 =3.99,那么我們有( )的把握認為這兩個分類變量有關系 ( ) A90% B95% C99% D以上都不對3、在一項打鼾與患心臟病的調(diào)查中,共調(diào)查1768人,經(jīng)計算的k2=27.63,根據(jù)這一數(shù)據(jù)分析,我們有理由認為打鼾與患心臟病是_ 的.(填“有關”“無關”)DD有關例1.在500人身上試驗某種血清預防感冒作用,把他們一年中的感冒記錄與另

10、外500名未用血清的人的感冒記錄作比較,結(jié)果如表所示。未感冒感冒合計使用血清252248500未使用血清224276500合計4765241000試畫出列聯(lián)表的條形圖,并通過圖形判斷這種血清能否起到預防感冒的作用?并進行獨立性檢驗。解:設H0:感冒與是否使用該血清沒有關系。因當H0成立時,K26.635的概率約為0.01,故有99%的把握認為該血清能起到預防感冒的作用。P(kk0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828P(kk0)0.500

11、.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828有效無效合計口服584098注射643195合計12271193解:設H0:藥的效果與給藥方式?jīng)]有關系。因當H0成立時,K21.3896的概率大于15%,故不能否定假設H0,即不能作出藥的效果與給藥方式有關的結(jié)論。例2:為研究不同的給藥方式(口服與注射)和藥的效果(有效與無效)是否有關,進行了相應的抽樣調(diào)查,調(diào)查的結(jié)果列在表中,根據(jù)所選擇的193個病人的數(shù)據(jù),能否作出藥的效果和給藥方式有關的結(jié)論?例4 為考察高中

12、生的性別與是否喜歡數(shù)學課程之間的關系,在某城市的某校高中生中隨機抽取300名學生,得到如下聯(lián)表:喜歡數(shù)學課程不喜歡數(shù)學課程總計男3785122女35143178總計72228300由表中數(shù)據(jù)計算K2的觀測值k 4.514。能夠以95%的把握認為高中生的性別與是否喜歡數(shù)學課程之間有關系嗎?請詳細闡述得出結(jié)論的依據(jù)。因此, 越大, “性別與喜歡數(shù)學課程之間有關系”成立的可能性就越大。另一方面,在假設“性別與喜歡數(shù)學課程之間有關系”的前提下,事件 的概率為因此事件A是一個小概率事件。而由樣本數(shù)據(jù)計算得 的觀測值k=4.514,即小概率事件A發(fā)生。因此應該斷定“性別與喜歡數(shù)學課程之間有關系”成立,并且這種判斷結(jié)果出錯的可能性約為5%。所以,約有95%的把握認為“性別與喜歡數(shù)學課程之間有關系”。例5、某校高三年級在一次全年級的大型考試中,數(shù)學成績優(yōu)秀和非優(yōu)秀的學生中,物理、化學、總分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論