




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、8.38.3列聯表與獨立性檢驗列聯表與獨立性檢驗一、提出問題一、提出問題你認為吸煙與患肺癌有關系嗎?你認為吸煙與患肺癌有關系嗎? 怎樣用數學知識說明呢?怎樣用數學知識說明呢? 獨立性檢驗方法獨立性檢驗方法在現實生活中,人們經常需要回答一定范圍內的兩種現在現實生活中,人們經常需要回答一定范圍內的兩種現象或性質之間是否存在關聯性或互相影響的問題。象或性質之間是否存在關聯性或互相影響的問題。例如:就讀不同學校是否對學生的成績有影響,不同班級例如:就讀不同學校是否對學生的成績有影響,不同班級學生用于體育鍛煉的時間是都存在區別,吸煙是否會增加學生用于體育鍛煉的時間是都存在區別,吸煙是否會增加患肺癌的風險
2、等。患肺癌的風險等。分類變量:一種特殊的隨機變量,以區別不同的現象或性質分類變量的取值可以用實數表示,這些數值只作為編號使用,并沒有通常的大小和運算意義舉例:學生所在的班級可以用1,2,3等表示,男性、女性可以用1,0表示本節我們主要討論取值于0,1的分類變量的關聯性問題.問題問題1:為了有針對性地提高學生體育鍛煉的積極性,某中學:為了有針對性地提高學生體育鍛煉的積極性,某中學需要了解性別因素是否對本校學生體育鍛煉的經常性有影響,需要了解性別因素是否對本校學生體育鍛煉的經常性有影響,為此對學生是否經常鍛煉的情況進行了為此對學生是否經常鍛煉的情況進行了普查普查.全校生的普查數據全校生的普查數據如
3、下:如下:523名女生中有名女生中有331名經常鍛煉;名經常鍛煉;601名男生中有名男生中有473名經名經常鍛。你能利用這些數據,說明該校女生和男生在體育鍛煉的常鍛。你能利用這些數據,說明該校女生和男生在體育鍛煉的經常性方面是否存在差異嗎經常性方面是否存在差異嗎?比較經常鍛煉的學生在女生和男中的比率比較經常鍛煉的學生在女生和男中的比率.01,.ff經常鍛煉的女生數經常鍛煉的男生數女生總數男生總數010.633,0.787.ff331473523601100.7870.6330.154.ff男生經常鍛煉的比率比女生高出男生經常鍛煉的比率比女生高出15.4個百分點,所以該校的女生個百分點,所以該校
4、的女生和男生在體育鍛煉的經常性方面有差異,而且男生更經常鍛煉。和男生在體育鍛煉的經常性方面有差異,而且男生更經常鍛煉。解法一:解法一:問題問題1:為了有針對性地提高學生體育鍛煉的積極性,某中學:為了有針對性地提高學生體育鍛煉的積極性,某中學需要了解性別因素是否對本校學生體育鍛煉的經常性有影響,需要了解性別因素是否對本校學生體育鍛煉的經常性有影響,為此對學生是否經常鍛煉的情況進行了為此對學生是否經常鍛煉的情況進行了普查普查.全校生的普查數據全校生的普查數據如下:如下:523名女生中有名女生中有331名經常鍛煉;名經常鍛煉;601名男生中有名男生中有473名經名經常鍛。你能利用這些數據,說明該校女
5、生和男生在體育鍛煉的常鍛。你能利用這些數據,說明該校女生和男生在體育鍛煉的經常性方面是否存在差異嗎經常性方面是否存在差異嗎?解法二:解法二:0,0,1,1,XY該生為女生,該生不經常鍛煉,該生為男生.該生經常鍛煉.對于對于中的每一名學生,分別令中的每一名學生,分別令性別對體育鍛煉的經常性沒有影響:性別對體育鍛煉的經常性沒有影響:1|01|1P YXP YX1|01|1P YXP YX性別對體育鍛煉的經常性有影響:性別對體育鍛煉的經常性有影響:性別性別鍛煉鍛煉合計合計不經常不經常(Y=0)經常經常(Y=1)女生(女生(X=0)192331523男生(男生(X=1)128473601合計合計320
6、8041124可以做出判斷,在該校的學生中,性別對體育鍛煉有影響,可以做出判斷,在該校的學生中,性別對體育鍛煉有影響,即該校的女生和男生在體育鍛煉的經常性方面存在差異即該校的女生和男生在體育鍛煉的經常性方面存在差異,而且而且男生更經常鍛煉男生更經常鍛煉.1,01,03311|00.633,005231,11,14731|10.787.11601P YXn YXP YXP Xn XP YXn YXP YXP Xn X二、二、22列聯表的概念列聯表的概念XY合計合計Y=0Y=1X=0aba+bX=1cdc+d合計合計a+cb+dn=a+b+c+d分類變量分類變量X和和Y的抽樣數據的的抽樣數據的22
7、列聯表:列聯表:用途:可以清晰的給出成對分類變量數據的交叉分類頻數。用途:可以清晰的給出成對分類變量數據的交叉分類頻數。 在上面問題的兩種解答中,使用了學校在上面問題的兩種解答中,使用了學校全部學生全部學生的調查的調查數據,利用這些數據能夠完全確定解答問題所需的比率和條數據,利用這些數據能夠完全確定解答問題所需的比率和條件概率件概率. 然而,對于然而,對于大多數實際問題大多數實際問題,我們,我們無法無法獲得所關心的獲得所關心的全全部對象的數據部對象的數據,因此無法準確計算出有關的比率或條件概率,因此無法準確計算出有關的比率或條件概率.利用隨機抽樣獲得一定數量的樣本數據,再利用隨機事利用隨機抽樣
8、獲得一定數量的樣本數據,再利用隨機事件發生的頻率穩定于概率的原理對問題答案作出推斷件發生的頻率穩定于概率的原理對問題答案作出推斷。反思反思例例1:為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取88名學生名學生.通過測驗得到了如下數據:甲校通過測驗得到了如下數據:甲校43名學生中有名學生中有10名數學成績優秀;名數學成績優秀;乙校乙校45名學生中有名學生中有7名數學成績優秀名數學成績優秀.試分析兩校學生中數學成績優秀率之間試分析兩校學生中數學成績優秀率之間是否存在差異是否存在差異.學校學校數學成績數學成績合計合計不優秀
9、(不優秀(Y=0)優秀(優秀(Y=1)甲校(甲校(X=0)331043乙乙校(校(X=1)38745合計合計711788我們可以用我們可以用等高堆積條形圖等高堆積條形圖直觀地展示上述計算結果直觀地展示上述計算結果:0.0 0.2 0.4 0.6 0.8 1.0 12不優秀優秀甲校甲校 乙校乙校例例1:為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取88名學生名學生.通過測驗得到了如下數據:甲校通過測驗得到了如下數據:甲校43名學生中有名學生中有10名數學成績優秀;名數學成績優秀;乙校乙校45名學生中有名學生中有7名數學
10、成績優秀名數學成績優秀.試分析兩校學生中數學成績優秀率之間試分析兩校學生中數學成績優秀率之間是否存在差異是否存在差異.三、兩個分類變量之間關聯關系的定性分析的方法三、兩個分類變量之間關聯關系的定性分析的方法問題問題2:你認為:你認為“兩校學生的數學成績優秀率存在差異兩校學生的數學成績優秀率存在差異”這一結這一結論是否有可能是錯誤的?論是否有可能是錯誤的?答:有可能。答:有可能。“兩校學生的數學成績優秀率存在差異兩校學生的數學成績優秀率存在差異”這個結論是根據兩個頻率間存在差異這個結論是根據兩個頻率間存在差異推斷出來的推斷出來的.有可能出現這種情況:在隨機抽取的這個樣本中,兩個頻率間有可能出現這
11、種情況:在隨機抽取的這個樣本中,兩個頻率間確實存在差異,但兩校學生的數學成績優秀率實際上是沒有差別的確實存在差異,但兩校學生的數學成績優秀率實際上是沒有差別的.對于隨對于隨機樣本而言,因為機樣本而言,因為頻率具有隨機性,頻率與概率之間存在誤差頻率具有隨機性,頻率與概率之間存在誤差,所以我們的,所以我們的推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大.因此,因此,需要找到一種更為合理的推斷方法,同時也希望能對出現錯誤推斷的概率有需要找到一種更為合理的推斷方法,同時也希望能對出現錯誤推斷的概率有一定的控制或估算一定的控制或估算.
12、獨立性檢驗方法獨立性檢驗方法練習練習1. 在對人們飲食習慣的一次調查中,從某一居民小區中共調查了124位居民,其中六十歲及六十歲以上的70人,六十歲以下的54人.六十歲及六十歲以上的人中有43人的飲食以蔬菜為主,另外27人以肉類為主;六十歲以下的人中有21人的飲食以蔬菜為主,另外33人以肉類為主.請根據以上數據作出飲食習慣與年齡的列聯表,并利用P(Y=1|X=0)與P(Y=1|X=1)判斷二者是否有關系.飲食習慣年齡合計六十歲及六十歲以上(Y=0)六十歲以下(Y=1)以蔬菜為主(X=0)432164以肉類為主(X=1)273360合計7054124XY合計Y=0 Y=1X=0101828X=1
13、m26 m+26合計 10+m 44 m+54 C練習練習3.為了解鉛中毒病人與尿棕色素為陽性是否有關系,分別對病人組和對照組的尿液進行尿棕色素定性檢查,結果如下:試畫出等高堆積條形圖,分析鉛中毒病人與尿棕色素為陽性是否有關系.分組尿液定性合計陽性(Y=0)陰性(Y=1)病人組(X=0)29736對照組(X=1)92837合計383573練習練習8.38.3列聯表與獨立性檢驗列聯表與獨立性檢驗提出零假設提出零假設(原假設原假設)H0:分類變量:分類變量X和和Y獨立獨立.四、獨立性檢驗公式及定義四、獨立性檢驗公式及定義0.10.050.010.0050.0012.7063.8416.6357.8
14、7910.828五、臨界值的定義五、臨界值的定義例例1:為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取88名學生名學生.通過測驗得到了如下數據:甲校通過測驗得到了如下數據:甲校43名學生中有名學生中有10名數學成績優秀;名數學成績優秀;乙校乙校45名學生中有名學生中有7名數學成績優秀名數學成績優秀.試分析兩校學生中數學成績優秀率之間試分析兩校學生中數學成績優秀率之間是否存在差異是否存在差異.解:零假設為解:零假設為H0:分類變量:分類變量X與與Y相互獨立,即兩校學生的數學成績優秀率無差異相互獨立,即兩校學生的數學成績
15、優秀率無差異.學校學校數學成績數學成績合計合計不優秀(不優秀(Y=0)優秀(優秀(Y=1)甲校(甲校(X=0)331043乙乙校(校(X=1)38745合計合計711788所以所以思考:思考:例例1和例和例2都是基于同一組數據的分析都是基于同一組數據的分析,但卻得出了不但卻得出了不同的結論同的結論,你能說明其中的原因嗎你能說明其中的原因嗎?當我們接受零假設H0時,也可能犯錯誤。我們不知道犯這類錯誤的概率p的大小,但是知道,若越大,則p越小解:零假設為解:零假設為H0:療法與療效獨立,即兩種療法效果沒有差異:療法與療效獨立,即兩種療法效果沒有差異.將所給數據進行整理,得到兩種療法治療數據的列聯表
16、,將所給數據進行整理,得到兩種療法治療數據的列聯表,療法療法療效療效合計合計未治愈未治愈治愈治愈甲甲155267乙乙66369合計合計21115136不影響不影響療法療法療效療效合計合計未治愈未治愈治愈治愈甲甲155267乙乙66369合計合計21115136療法療法療效療效合計合計未治愈未治愈治愈治愈乙乙66369甲甲155267合計合計21115136療法療法療效療效合計合計治愈治愈未治愈未治愈甲甲521567乙乙63669合計合計11521136解:零假設為解:零假設為H0:療法與療效獨立,即兩種療法效果沒有差異:療法與療效獨立,即兩種療法效果沒有差異.將所給數據進行整理,得到兩種療法治
17、療數據的列聯表,將所給數據進行整理,得到兩種療法治療數據的列聯表,療法療法療效療效合計合計未治愈未治愈治愈治愈甲甲155267乙乙66369合計合計21115136解:解: 因此可以推斷乙種療法的效果比甲種療法好因此可以推斷乙種療法的效果比甲種療法好。例例4.為了調查吸煙是否對肺癌有影響,某腫瘤研究所采取有放回簡單隨機抽樣,為了調查吸煙是否對肺癌有影響,某腫瘤研究所采取有放回簡單隨機抽樣,調查了調查了9965人,得到如下結果(單位:人)依據小概率值人,得到如下結果(單位:人)依據小概率值=0.001的獨立性檢驗,的獨立性檢驗,分析吸煙是否會增加患肺癌的風險。分析吸煙是否會增加患肺癌的風險。解:
18、零假設為解:零假設為H0: 吸煙和患肺癌之間沒有關系吸煙和患肺癌之間沒有關系 根據列聯表中的數據,經計算根據列聯表中的數據,經計算得到得到2 =20.0019965 (7775 4942 2099)56.63210.828=7817 2148 9874 91x根據小概率值根據小概率值=0.001的獨立性檢驗,推斷的獨立性檢驗,推斷H0不成立,即認為吸不成立,即認為吸 煙與患肺癌有煙與患肺癌有關聯,此推斷犯錯誤的概率不大于關聯,此推斷犯錯誤的概率不大于0.001,即我們有,即我們有99.9的把握認為的把握認為“吸煙與患吸煙與患肺癌有關系肺癌有關系”.吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775
19、427817吸煙者2099492148合計9874919965根據表中的數據計算不吸煙者中不患肺癌和患肺癌的頻率分別為根據表中的數據計算不吸煙者中不患肺癌和患肺癌的頻率分別為吸煙者中不患肺癌和患肺癌的吸煙者中不患肺癌和患肺癌的頻率頻率分別為分別為由由 可見,在被調查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌頻率的可見,在被調查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌頻率的4倍倍以上。于是,根據頻率穩定于概率的原理,我們可以認為吸煙者患肺癌的概率以上。于是,根據頻率穩定于概率的原理,我們可以認為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌概率,即吸煙更容易引發肺癌。明顯大于不吸煙者患肺癌概率,即吸煙更容易引發肺癌。427817781777750.9946,0.0054492148214820990.9772,0.02284.20.00540.0228應用獨立性檢驗解決實際問題大致應包括以下幾個主要環節:應用獨立性檢驗解決實際問題大致應包括以下幾個主要環節:注意注意:上述幾個環節的內容可以根據不同情況進行調整,例上述幾個環節的內容可以根據不同情況進行調整,例如,在有些時候,分類變量的抽樣數據列聯表是問題中給定如,在有些時
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- (高清版)DB3301∕T 0213-2017 城市道路防沉降檢查井蓋和雨水口技術管理規范
- 檢驗科輸血科課件
- 2025兼職勞動合同模板
- 《庫存核對操作手冊》課件
- 提升能源安全保障能力的策略與實施路徑
- 探索中小學跨學科教學的創新實踐路徑
- 教師安全教育培訓
- 城市更新項目可行性分析與前景展望
- 定期評估與反饋機制計劃
- 員工心理健康關懷計劃
- DBJ51T 108-2018 四川省建筑巖土工程測量標準
- 2024年四川省成都市武侯區中考化學二模試卷附解析
- 工程檢測計劃
- 《數據結構》課件(完整版)
- JJG 2-1999 木直尺檢定規程-(高清現行)
- 描寫音樂治愈心靈的英文句子
- (整理)變頻器電力電纜標準
- 《西方音樂史》課件柴可夫斯基
- 人力資源部崗位廉潔風險點及防范措施
- PRS-778S500-100-090721技術使用說明書
- 求一個數比另一個數多幾少幾應用題
評論
0/150
提交評論