2024年高中數學第4章點數統計案例4.3列聯表獨立性分析案例講義含解析湘教版選修1-2_第1頁
2024年高中數學第4章點數統計案例4.3列聯表獨立性分析案例講義含解析湘教版選修1-2_第2頁
2024年高中數學第4章點數統計案例4.3列聯表獨立性分析案例講義含解析湘教版選修1-2_第3頁
2024年高中數學第4章點數統計案例4.3列聯表獨立性分析案例講義含解析湘教版選修1-2_第4頁
2024年高中數學第4章點數統計案例4.3列聯表獨立性分析案例講義含解析湘教版選修1-2_第5頁
已閱讀5頁,還剩9頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGEPAGE144.3列聯表獨立性分析案例[讀教材·填要點]1.列聯表一般地,對于兩個因素X和Y,X的兩個水平取值:A和eq\x\to(A)(如吸煙和不吸煙),Y也有兩個水平取值:B和eq\x\to(B)(如患肺癌和不患肺癌),我們得到下表中的抽樣數據,這個表格稱為2×2列聯表.YXBeq\x\to(B)總計Aaba+beq\x\to(A)cdc+d總計a+cb+dn其中n=a+b+c+d.2.獨立性分析事務A與B獨立,這時應當有P(AB)=P(A)P(B)成立.我們用字母H0來表示上式,即H0:P(AB)=P(A)·P(B),稱之為統計假設.我們引入統計中一個特別有用的χ2統計量,它的表達式是χ2=eq\f(nad-bc2,a+bc+da+cb+d).用它的大小可以確定是否拒絕原來的統計假設H0.假如算出的χ2值較大,就拒絕H0,也就是拒絕“事務A與B無關”,從而就認為它們是有關的了.[小問題·大思維]1.利用χ2進行獨立性分析,估計值的精確度與樣本容量有關嗎?提示:利用χ2進行獨立性分析,可以對推斷的正確性的概率作出估計,樣本容量n越大,這個估計值越精確.假如抽取的樣本容量很小,那么利用χ2進行獨立性檢驗的結果就不具有牢靠性.2.在χ2運算后,得到χ2的值為29.78,在推斷因素相關時,P(χ2≥6.635)≈0.01和P(χ2≥7.88)≈0.005,哪種說法是正確的?提示:兩種說法均正確.P(χ2≥6.635)≈0.01的含義是在犯錯誤的概率不超過0.01的前提下認為兩因素相關;而P(χ2≥7.88)≈0.005的含義是在犯錯誤的概率不超過0.005的前提下認為兩因素相關.獨立性分析的原理某生產線上,質量監督員甲在生產現場時,990件產品中有合格品982件,次品8件;不在生產現場時,510件產品中有合格品493件,次品17件.能否在犯錯誤的概率不超過0.001的前提下認為質量監督員甲在不在生產現場與產品質量好壞有關系?[自主解答]依據題目所給數據得如下2×2列聯表:合格品次品總計甲在生產現場9828990甲不在生產現場49317510總計1475251500由列聯表中的數據,得χ2=eq\f(1500×982×17-8×4932,990×510×1475×25)≈13.097>10.828.因此,在犯錯誤的概率不超過0.001的前提下認為質量監督員甲在不在生產現場與產品質量好壞有關系.1.解決一般的獨立性分析問題,首先由所給2×2列聯表確定a,b,c,d,n的值,然后代入隨機變量的計算公式求出觀測值χ2,將χ2與臨界值x0進行對比,確定有多大的把握認為兩個分類變量有關系.2.反證法原理與獨立性檢驗原理的比較反證法原理——在假設H0下,假如推出一個沖突,就證明白H0不成立.獨立性檢驗原理——在假設H0下,假如出現一個與H0相沖突的小概率事務,就推斷H0不成立,且該推斷犯錯誤的概率不超過小概率.1.某大型企業人力資源部為了探討企業員工工作主動性和對待企業改革看法的關系,經過調查得到如下列聯表:主動支持企業改革不太支持企業改革總計工作主動544094工作一般326395總計86103189依據列聯表的獨立性分析,能否在犯錯誤的概率不超過0.01的前提下認為工作看法與支持企業改革之間有關系?解:由列聯表中的數據,得χ2=eq\f(189×54×63-40×322,94×95×86×103)≈10.759>6.635,∴在犯錯誤的概率不超過0.01的前提下,認為工作看法與支持企業改革之間有關系.獨立性分析的應用某校對學生課外活動進行調查,結果整理如下表:體育文娛總計男生212344女生62935總計275279依據列聯表的獨立性分析,能否在犯錯誤的概率不超過0.01的前提下認為寵愛體育還是文娛與性別有關?[自主解答]由列聯表中的數據,得χ2=eq\f(79×21×29-23×62,21+23×6+29×21+6×23+29)≈8.106>6.635.∴在犯錯誤的概率不超過0.01的前提下認為“寵愛體育還是寵愛文娛與性別有關.”獨立性分析的步驟(1)提出統計假設H0:X與Y無關;(2)依據2×2列聯表與χ2計算公式計算出χ2的值;(3)依據兩個臨界值,作出推斷.2.同時拋擲兩顆勻稱的骰子,請回答以下問題:(1)求兩顆骰子都出現2點的概率;(2)若同時拋擲兩顆骰子180次,其中甲骰子出現20次2點,乙骰子出現30次2點,問兩顆骰子在犯錯誤的概率不超過0.05的前提下均出現2點是否相關?解:(1)每顆骰子出現2點的概率都為eq\f(1,6),由相互獨立事務同時發生的概率公式得兩顆骰子都出現2點的概率為eq\f(1,6)×eq\f(1,6)=eq\f(1,36).(2)依題意,列2×2列聯表如下:出現2點出現其他點合計甲骰子20160180乙骰子30150180合計50310360假設H0:兩顆骰子在犯錯誤的概率不超過0.05的前提下均出現2點無關.由公式計算得χ2=eq\f(360×20×150-160×302,50×310×180×180)≈2.323.因為2.323<3.841,所以我們不拒絕H0,因此我們沒有理由說兩顆骰子在犯錯誤的概率不超過0.05的前提下均出現2點相關.獨立性分析的綜合應用為了比較注射A,B兩種藥物后產生的皮膚皰疹的面積,選200只家兔做試驗,將這200只家兔隨機地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.下表1和表2分別是注射藥物A和藥物B后的試驗結果.(皰疹面積單位:mm2)表1:注射藥物A后皮膚皰疹面積的頻數分布表皰疹面積[60,65)[65,70)[70,75)[75,80)頻數30402010表2:注射藥物B后皮膚皰疹面積的頻數分布表皰疹面積[60,65)[65,70)[70,75)[75,80)[80,85)頻數1025203015完成下面2×2列聯表,并回答能否在犯錯誤的概率不超過0.01的前提下認為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”.表3:皰疹面積小于70mm2皰疹面積不小于70mm2總計注射藥物Aa=b=注射藥物Bc=d=總計n=[自主解答]依據題目數據得如下2×2列聯表:皰疹面積小于70mm2皰疹面積不小于70mm2總計注射藥物Aa=70b=30100注射藥物Bc=35d=65100總計10595n=200由列聯表中的數據,得χ2=eq\f(200×70×65-35×302,100×100×105×95)≈24.56>6.635.因此,我們有99%的把握,即在犯錯誤的概率不超過0.01的前提下認為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”.在繪制列聯表時,應對問題中的不同數據分成不同的類別,然后列表.要留意列聯表中各行、各列中數據的意義及書寫格式.3.某地區甲校高二年級有1100人,乙校高二年級有900人,為了統計兩個學校高二年級在學業水平考試中的數學學科成果,采納分層抽樣的方法在兩校共抽取了200名學生的數學成果,如表.(已知本次測試合格線是50分,兩校合格率均為100%)甲校高二年級數學成果:分組[50,60)[60,70)[70,80)[80,90)[90,100]頻數10253530x乙校高二年級數學成果:分組[50,60)[60,70)[70,80)[80,90)[90,100]頻數153025y5(1)計算x,y的值,并分別估計以上兩所學校數學成果的平均分(精確到1分);(2)若數學成果不低于80分為優秀,低于80分為非優秀,依據以上統計數據填寫下面2×2列聯表,并回答能否在犯錯誤的概率不超過0.05的前提下認為“兩個學校的數學成果有差異”?分類甲校乙校總計優秀非優秀總計解:(1)依題意,知甲校應抽取110人,乙應抽取90人,所以x=10,y=15.甲校的平均分為eq\f(1,110)×(55×10+65×25+75×35+85×30+95×10)≈75.乙校的平均分為eq\f(1,90)×(55×15+65×30+75×25+85×15+95×5)≈71.(2)數學成果不低于80分為優秀,低于80分為非優秀,得到列聯表如下:分類甲校乙校總計優秀402060非優秀7070140總計11090200所以χ2=eq\f(200×40×70-20×702,110×90×60×140)≈4.714,又因為4.714>3.841,故能在犯錯誤的概率不超過0.05的前提下認為“兩個學校的數學成果有差異”.在調查的480名男人中,有38名患色盲,520名女人中,有6名患色盲.試推斷在犯錯誤的概率不超過0.01的前提下認為人的性別與患色盲有關?你所得到的結論在什么范圍內有效?[解]由題意作2×2列聯表如下:色盲非色盲總計男38442480女6514520總計449561000法一:由列聯表中數據可知,在調查的男人中,患色盲的比例是eq\f(38,480)≈7.917%,女人中患色盲的比例為eq\f(6,520)≈1.154%,由于兩者差距較大,因而我們可以認為性別與患色盲是有關系的.法二:由列聯表中所給的數據可知,a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1000,代入公式得χ2=eq\f(1000×38×514-6×4422,480×520×44×956)≈27.1.由于χ2≈27.1>6.635,所以我們有99%的把握,即在犯錯誤不超過0.01的前提下認為性別與患色盲有關系.這個結論只對所調查的480名男人和520名女人有效.1.下面是2×2列聯表:y1y2總計x1a2173x222527總計b46則表中a,b的值分別為()A.94,96 B.52,50C.52,54 D.54,52解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54.答案:C2.下列關于χ2的說法中正確的是()A.χ2在任何相互獨立問題中都可以用于檢驗是否相關B.χ2的值越大,兩個事務的相關性越大C.χ2是用來推斷兩個相互獨立事務相關與否的一個統計量,它可以用來推斷兩個事務是否相關這一類問題D.χ2=eq\f(nad-bc,a+bc+da+cb+d)答案:C3.對于因素X與Y的隨機變量χ2的值,下列說法正確的是()A.χ2越大,“X與Y有關系”的可信程度越小B.χ2越小,“X與Y有關系”的可信程度越小C.χ2越接近于0,“X與Y沒有關系”的可信程度越小D.χ2越大,“X與Y沒有關系”的可信程度越大解析:χ2越大,“X與Y沒有關系”的可信程度越小,則“X與Y有關系”的可信程度越大.χ2越小,“X與Y有關系”的可信程度越小.答案:B4.若由一個2×2列聯表中的數據計算得χ2的觀測值k≈4.013,那么在犯錯誤的概率不超過________的前提下,認為兩個變量之間有關系.解析:因為4.013>3.841,所以在犯錯誤的概率不超過0.05的前提下,認為兩個變量之間有關系.答案:0.055.當某礦石粉廠生產一種礦石粉時,在數天內即有部分工人患職業性皮膚炎,在生產季節起先,隨機抽取75名車間工人穿上新防護服,其余仍穿原用的防護服,生產進行一個月后,檢查兩組工人的皮膚炎患病人數如下:陽性例數陰性例數總計新防護服57075舊防護服101828總計1588103通過數據分析,說明有________的把握認為新防護服對預防工人職業性皮炎有效.解析:χ2=eq\f(103×5×18-70×102,75×28×15×88)≈13.826>6.635.故有99%的把握說,新防護服比舊防護服對預防工人職業性皮炎有效.答案:99%6.為了解某班學生寵愛打籃球是否與性別有關,對本班50人進行了問卷調查得到了如下的列聯表:寵愛打籃球不寵愛打籃球總計男生ab=5女生c=10d總計50已知在全部50人中隨機抽取1人抽到愛打籃球的學生的概率為eq\f(3,5).(1)請將上面的列聯表補充完整;(2)是否有99%的把握認為寵愛打籃球與性別有關?請說明理由.解:(1)列聯表補充如下:寵愛打籃球不寵愛打籃球總計男生20525女生101525總計302050(2)∵χ2=eq\f(50×20×15-10×52,30×20×25×25)≈8.333>6.635,∴有99%的把握認為寵愛打籃球與性別有關.一、選擇題1.在第29屆北京奧運會上,中國健兒取得了51金、21銀、28銅的好成果,穩居金牌榜榜首,由此很多人認為中國進入了世界體育強國之列,也有很多人持反對看法,有網友為此進行了調查,在參與調查的2548名男性中有1560名持反對看法,2452名女性中有1200名持反對看法,在運用這些數據說明性別對推斷“中國進入了世界體育強國之列”是否有關系時,用什么方法最有勸服力()A.平均數與方差 B.回來直線方程C.獨立性檢驗 D.概率解析:由于參與調查的人按性別被分成了兩組,而且每一組又被分成了兩種狀況,推斷有關與無關,符合2×2列聯表的要求,故用獨立性檢驗最有勸服力.答案:C2.春節期間,“厲行節約,反對奢侈”之風悄然吹開,某市通過隨機詢問100名性別不同的居民是否能做到“光盤”行動,得到如下的列聯表:做不到“光盤”能做到“光盤”男4510女3015則下面的正確結論是()附表及公式:P(χ2≥x0)0.1000.0500.0100.001x02.7063.8416.63510.828χ2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.A.有90%以上的把握認為“該市居民能否做到‘光盤’與性別有關”B.在犯錯誤的概率不超過1%的前提下,認為“該市居民能否做到‘光盤’與性別無關”C.在犯錯誤的概率不超過1%的前提下,認為“該市居民能否做到‘光盤’與性別有關”D.有90%以上的把握認為“該市居民能否做到‘光盤’與性別無關”解析:由列聯表得到a=45,b=10,c=30,d=15,則a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,計算得χ2=eq\f(nad-bc2,a+bc+da+cb+d)=eq\f(100×675-3002,55×45×75×25)≈3.030.因為2.706<3.030<3.841,所以有90%以上的把握認為“該市居民能否做到‘光盤’與性別有關”.答案:A3.某高校“統計初步”課程的老師隨機調查了選該課的一些學生狀況,詳細數據如下表:非統計專業統計專業男1310女720為了分析主修統計專業是否與性別有關,依據表中的數據,得到χ2=eq\f(5013×20-10×72,23×27×20×30)≈4.84,所以斷定主修統計專業與性別有關系,這種推斷出錯的可能性為()A.0.025 B.0.05C.0.975 D.0.95解析:∵χ2≈4.84>3.841,所以我們有95%的把握認為主修統計專業與性別無關,即推斷出錯的可能性為0.05.答案:B4.已知P(χ2≥2.706)=0.10,兩個因素X和Y,取值分別為{x1,x2}和{y1,y2},其樣本頻數分別是a=10,b=21,c+d=35.若在犯錯誤的概率不超過0.1的前提下,認為X與Y有關系,則c等于()A.5 B.6C.7 D.8答案:A二、填空題5.班級與成果2×2列聯表:優秀不優秀總計甲班103545乙班738p總計mnq表中數據m,n,p,q的值應分別為________.解析:m=10+7=17,n=35+38=73,p=7+38=45,q=m+n=90.答案:17,73,45,906.在吸煙與患肺病是否相關的推斷中,有下面的說法:①若χ2>6.635,則在犯錯誤的概率不超過0.01的前提下,認為吸煙與患肺病有關系,那么在100個吸煙的人中必有99人患有肺病;②從獨立性分析可知在犯錯誤的概率不超過0.01的前提下,認為吸煙與患肺病有關系時,若某人吸煙,則他有99%的可能患有肺病;③從獨立性分析可知在犯錯誤的概率不超過0.05的前提下,認為吸煙與患肺病有關系時,是指有5%的可能性使得推斷錯誤.其中說法正確的是________.解析:χ2是檢驗吸煙與患肺病相關程度的量,是相關關系,而不是確定關系,是反映有關和無關的概率,故說法①不正確;說法②中對“確定容許推斷犯錯誤概率的上界”理解錯誤;說法③正確.答案:③7.某衛朝氣構對366人進行健康體檢,有陽性家族史者糖尿病發病的有16例,不發病的有93例,有陰性家族史者糖尿病發病的有17例,不發病的有240例,認為糖尿病患者與遺傳有關系的概率為________.解析:列出2×2列聯表:發病不發病總計陽性家族史1693109陰性家族史17240257總計33333366所以隨機變量χ2值為eq\f(366×16×240-17×932,109×257×33×333)≈6.067>3.841,所以在犯錯誤的概率不超過0.05的前提下,認為糖尿病患者與遺傳有關.答案:95%8.某電視臺在一次對收看文藝節目和新聞節目觀眾的抽樣調查中,隨機抽取了100名電視觀眾,相關的數據如下表所示:文藝節目新聞節目總計20至40歲401858大于40歲152742總計5545100由表中數據直觀分析,收看新聞節目的觀眾是否與年齡有關:______(填“是”或“否”).解析:因為在20至40歲的58名觀眾中有18名觀眾收看新聞節目,而大于40歲的42名觀眾中有27名觀眾收看新聞節目,即eq\f(b,a+b)=eq\f(18,58),eq\f(d,c+d)=eq\f(27,42),兩者相差較大,所以,經直觀分析,收看新聞節目的觀眾與年齡是有關的.答案:是三、解答題9.某市對該市一重點中學2024年高考上線狀況進行統計,隨機抽查得到表格:語文數學英語綜合科目上線不上線上線不上線上線不上線上線不上線總分上線201人17427178231762517526總分不上線43人3013232024192617總計20440201432004420143試求各科上線與總分上線之間的關系,并求出哪一科目與總分上線關系最大?解:對于上述四個科目,分別構造四個隨機變量χeq\o\al(2,1),χeq\o\al(2,2),χeq\o\al(2,3),χeq\o\al(2,4).由表中數據可以得到:語文:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論