高中數學《8.3 分類變量與列聯表》課件_第1頁
高中數學《8.3 分類變量與列聯表》課件_第2頁
高中數學《8.3 分類變量與列聯表》課件_第3頁
高中數學《8.3 分類變量與列聯表》課件_第4頁
高中數學《8.3 分類變量與列聯表》課件_第5頁
已閱讀5頁,還剩66頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一課時分類變量與列聯表8.3列聯表與獨立性檢驗課標要求素養要求1.通過實例,理解2×2列聯表的統計意義.2.理解判斷兩個分類變量是否有關系的常用方法.通過學習2×2列聯表,提升數學抽象、直觀想象及數據分析素養.新知探究飲用水的質量是人類普遍關心的問題,根據統計,飲用優質水的518人中,身體狀況優秀的有466人,飲用一般水的312人中,身體狀況優秀的有218人.問題人的身體健康狀況與飲用水的質量之間有關系嗎?提示我們可以根據2×2列聯表找到人的身體健康與飲用水之間的關系,也就是本節課所要學習的內容.1.分類變量這里所說的變量和值不一定是具體的數值,例如:性別變量,其取值為男和女兩種我們經常會使用一種特殊的隨機變量,以區別不同的現象或性質,這類隨機變量稱為__________,分類變量的取值可以用______表示.分類變量實數2.2×2列聯表

在實踐中,由于保存原始數據的成本較高,人們經常按研究問題的需要,將數據分類統計,并做成表格加以保存,我們將這類數據統計表稱為2×2列聯表,2×2列聯表給出了成對分類變量數據的交叉__________.

一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其2×2列聯表為分類頻數

y1y2合計x1aba+bx2cdc+d合計a+cb+da+b+c+d3.等高堆積條形圖

等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖展示列聯表數據的______特征,依據________________的原理,我們可以推斷結果.頻率頻率穩定于概率拓展深化[微判斷]1.分類變量中的變量與函數中的變量是同一概念. (

)

提示分類變量中的變量是指一定范圍內的兩種現象或性質,與函數中的變量不是同一概念.2.列聯表中的數據是兩個分類變量的頻數. (

)3.列聯表、頻率分析法、等高條形圖都可初步分析兩分類變量是否有關系. (

)×√√[微訓練]1.下列不是分類變量的是(

) A.近視

B.成績 C.血壓

D.飲酒

解析

近視變量有近視與不近視兩種類別,血壓變量有異常、正常兩種類別,飲酒變量有飲酒與不飲酒兩種類別.故選B.

答案B2.某校為了檢驗高中數學新課程改革的成果,在兩個班進行教學方式的對比試驗,兩個月后進行了一次檢測,試驗班與對照班成績統計如2×2列聯表所示(單位:人),則其中m=________,n=________.

80分及80分以上80分以下合計試驗班321850對照班24m50合計5644n答案26

100[微思考]1.是否吸煙、是否患肺癌是什么變量?

提示

分類變量.2.吸煙與患肺癌之間的關系還是前面我們研究的線性相關關系嗎?

提示

不是.解2×2列聯表如下:

年齡在六十歲以上年齡在六十歲以下合計飲食以蔬菜為主432164飲食以肉類為主273360合計7054124將表中數據代入公式得【訓練1】假設有兩個分類變量X與Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯表為:

y1y2x11018x2m26則當m取下面何值時,X與Y的關系最弱(

)A.8 B.9 C.14 D.19解析由10×26≈18m,解得m≈14.4,所以當m=14時,X與Y的關系最弱.答案C題型二用等高堆積條形圖分析兩分類變量間的關系【例2】某學校對高三學生作了一項調查發現:在平時的模擬考試中,性格內向的學生426人中有332人在考前心情緊張,性格外向的學生594人中有213人在考前心情緊張,作出等高條形圖,利用圖形判斷考前心情緊張與性格類型是否有關系.

性格內向性格外向合計考前心情緊張332213545考前心情不緊張94381475合計4265941020相應的等高堆積條形圖如圖所示:圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內向的人數的比例,從圖中可以看出考前心情緊張的樣本中性格內向的人數占的比例比考前心情不緊張樣本中性格內向的人數占的比例高,可以認為考前心情緊張與性格類型有關.規律方法利用等高堆積條形圖判斷兩個分類變量是否相關的步驟:【訓練2】在調查的480名男人中有38人患色盲,520名女人中有6名患色盲,試利用圖形來判斷色盲與性別是否有關?解根據題目給出的數據作出如下的列聯表:

色盲不色盲合計男38442480女6514520合計449561000根據列聯表作出相應的等高堆積條形圖:從等高堆積條形圖來看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我們認為患色盲與性別是有關系的.一、素養落地1.通過本節課的學習,進一步提升數學抽象、直觀想象及數據分析素養.2.列聯表與等高堆積條形圖

列聯表由兩個分類變量之間頻率大小的差異說明這兩個變量之間是否有相關關系,而利用等高堆積條形圖能形象直觀地反映它們之間的差異,進而推斷它們之間是否具有相關關系.二、素養訓練1.與表格相比,能更直觀地反映出相關數據總體狀況的是(

) A.列聯表 B.散點圖 C.殘差圖 D.等高堆積條形圖

答案D2.在一項有關醫療保健的社會調查中,發現調查的男性為530人,女性為670人,其中男性中喜歡吃甜食的為117人,女性中喜歡吃甜食的為492人,則性別與喜歡吃甜食的2×2列聯表為________.答案

喜歡吃甜食不喜歡吃甜食合計男117413530女492178670合計60959112003.根據如圖所示的等高堆積條形圖可知吸煙與患肺病________關系(填“有”或“沒有”).解析從等高條形圖上可以明顯地看出吸煙患肺病的頻率遠遠大于不吸煙患肺病的頻率.答案有4.(多空題)下面是一個2×2列聯表:

y1y2合計x1a2173x222527合計b46100則表中a=________,b=__________.答案52

545.為考察某種藥物預防疾病的效果進行動物試驗,得到如下列聯表:

患病未患病合計服用藥104555未服用藥203050合計3075105第二課時獨立性檢驗8.3列聯表與獨立性檢驗課標要求素養要求了解隨機變量χ2的意義,通過對典型案例分析,了解獨立性檢驗的基本思想和方法.通過運用列聯表進行獨立性檢驗,提升數學抽象及數據分析素養.新知探究山東省教育廳大力推行素質教育,增加了高中生的課外活動時間,某校調查了學生的課外活動方式,結果整理成下表:問題如何判定“喜歡體育還是文娛與性別是否有聯系”?提示可通過表格與圖形進行直觀分析,也可通過統計分析定量判斷.1.臨界值χ2

統計量也可以用來作相關性的度量.χ2

越小說明變量之間越獨立,χ2越大說明變量之間越相關2.獨立性檢驗

基于小概率值α的檢驗規則是:

當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;

當χ2<xα時,我們沒有充分證據推斷H0不成立

,可以認為X和Y獨立.

這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗(testofindependence).下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8283.應用獨立性檢驗解決實際問題的大致步驟 (1)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋; (2)根據抽樣數據整理出2×2列聯表,計算χ2的值,并與臨界值xα比較; (3)根據檢驗規則得出推斷結論; (4)在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規律.拓展深化[微判斷]1.概率值α越小,臨界值xα越大. (

)2.獨立性檢驗的思想類似于反證法. (

)3.獨立性檢驗的結論是有多大的把握認為兩個分類變量有關系. (

)√√√

[微訓練]1.如果根據小概率α=0.01的χ2檢測試驗,認為H0成立,那么具體算出的數據滿足(

)

附表:α0.050.0250.0100.0050.001xα3.8415.0246.6357.87910.828A.χ2>6.635 B.χ2>5.024C.χ2>7.879 D.χ2>3.841答案A2.某校為了研究“學生的性別”和“對待某一活動的態度”是否有關,運用2×2列聯表進行獨立性檢驗,經計算χ2=7.069,則認為“學生性別與支持某項活動有關系”的犯錯誤的概率不超過(

) A.0.1% B.1% C.99% D.99.9%解析∵χ2=7.069>6.635=x0.01,∴認為“學生性別與支持某項活動有關系”的犯錯誤的概率不超過1%.答案B[微思考]1.有人說:“在犯錯誤的概率不超過0.01的前提下認為吸煙和患肺病有關,是指每100個吸煙者中就會有99個患肺病的.”你認為這種觀點正確嗎?為什么?

提示

觀點不正確.犯錯誤的概率不超過0.01說明的是吸煙與患肺病有關的程度,不是患肺病的百分數.2.應用獨立性檢驗的基本思想對兩個變量間的關系作出的推斷一定是正確的嗎?

提示

不一定.所有的推斷只代表一種可能性,不代表具體情況.題型一有關“相關的檢驗”【例1】某校對學生課外活動進行調查,結果整理成下表,用你所學過的知識進行分析,能否在犯錯誤的概率不超過0.005的前提下,認為“喜歡體育還是文娛與性別有關系”?

體育文娛合計男生212344女生62935合計275279解零假設為H0:喜歡體育還是喜歡文娛與性別沒有關系∵a=21,b=23,c=6,d=29,n=79,根據小概率值α=0.005的χ2獨立性檢驗,我們推斷H0不成立,即認為喜歡體育還是喜歡文娛與性別有關系,此推斷犯錯誤的概率不大于0.005.【訓練1】打鼾不僅影響別人休息,而且可能與患某種疾病有關.下表是一次調查所得的數據:

患心臟病未患心臟病合計每一晚都打鼾30224254不打鼾2413551379合計5415791633根據獨立性檢驗,能否在犯錯誤的概率不超過0.001的前提下認為每一晚都打鼾與患心臟病有關系?解零假設為H0:打鼾與患心臟病無關系由列聯表中的數據,得≈68.033>10.828=x0.001.根據小概率值α=0.001的χ2獨立性檢驗,我們推斷H0不成立,即認為打鼾與患心臟病有關系,此推斷犯錯誤的概率不大于0.001.題型二有關“無關的檢驗”【例2】為了探究學生選報文、理科是否與對外語的興趣有關,某同學調查了361名高二在校學生,調查結果如下:理科生對外語有興趣的有138人,無興趣的有98人,文科生對外語有興趣的有73人,無興趣的有52人.試分析學生選報文、理科與對外語的興趣是否有關?

解零假設為H0:選報文、理科與對外語的興趣無關.

列出2×2列聯表

理文合計有興趣13873211無興趣9852150合計236125361代入公式得χ2的觀測值∵1.871×10-4<2.706=x0.1,根據小概率值α=0.1的χ2獨立性檢驗,沒有充分證據推斷H0不成立,即選報文、理科與對外語的興趣無關.規律方法獨立性檢驗的關注點在2×2列聯表中,如果兩個分類變量沒有關系,則應滿足ad-bc≈0,因此|ad-bc|越小,關系越弱;|ad-bc|越大,關系越強.【訓練2】某教育機構為了研究成年人具有大學專科以上學歷(包括大學專科)和對待教育改革態度的關系,隨機抽取了392名成年人進行調查,所得數據如下表所示:

積極支持教育改革不太贊成教育改革合計大學專科以上學歷39157196大學專科以下學歷29167196合計68324392解零假設為H0:成年人具有大學專科以上學歷(包括大學專科)和對待教育改革態度無關.根據表中數據,計算得因為1.78<2.706=x0.1,根據小概率值α=0.1的χ2獨立性檢驗,沒有充分證據推斷H0不成立,所以我們沒有理由說成年人具有大學專科以上學歷(包括大學專科)和對待教育改革態度有關.題型三獨立性檢驗的綜合應用【例3】某高校共有學生15000人,其中男生10500人,女生4500人.為調查該校學生每周平均體育運動時間的情況,采用分層隨機抽樣的方法,收集300位學生每周平均體育運動時間(單位:時)的樣本數據. (1)應收集多少位女生的樣本數據? (2)根據這300個樣本數據,得到學生每周平均體育運動時間的頻率分布直方圖(如圖),其中樣本數據的分組區間為[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計該校學生每周平均體育運動時間超過4小時的概率.(3)在樣本數據中,有60位女生的每周平均體育運動時間超過4小時,請完成每周平均體育運動時間與性別的列聯表,并判斷是否認為“該校學生的每周平均體育運動時間與性別有關”.附:α0.1000.0500.0100.005xα2.7063.8416.6357.879(2)由頻率分布直方圖得學生每周平均體育運動時間超過4小時的頻率為1-2×(0.100+0.025)=0.75,所以該校學生每周平均體育運動時間超過4小時的概率的估計值為0.75.(3)由(2)知,300位學生中有300×0.75=225(人)的每周平均體育運動時間超過4小時,75人的每周平均體育運動時間不超過4小時.樣本數據中有210份是關于男生的,90份是關于女生的,可得每周平均體育運動時間與性別的列聯表如下:

男生女生合計每周平均體育運動時間不超過4小時453075每周平均體育運動時間超過4小時16560225合計21090300零假設為H0:該校學生的每周平均體育運動時間與性別無關.結合列聯表可算得根據小概率值α=0.1的χ2獨立性檢驗,我們推斷H0不成立,即認為“該校學生的每周平均體育運動時間與性別有關”,此推斷犯錯誤的概率不大于0.05.【訓練3】某校高三年級在一次全年級的大型考試中,數學成績優秀和非優秀的學生中,物理、化學、總分成績優秀的人數如下表所示,能否在犯錯誤的概率不超過0.001的前提下認為數學成績優秀與物理、化學、總分成績優秀有關系?

物理優秀化學優秀總分優秀數學優秀228225267數學非優秀14315699解零假設為H0:數學成績優秀與物理、化學、總分成績優秀都無關系.列出數學成績與物理成績的2×2列聯表如下:

物理優秀物理非優秀合計數學優秀228132360數學非優秀143737880合計3718691240列出數學成績與化學成績的2×2列聯表如下:

化學優秀化學非優秀合計數學優秀225135360數學非優秀156724880合計3818591240列出數學成績與總分成績的2×2列聯表如下:

總分優秀總分非優秀合計數學優秀26793360數學非優秀99781880合計3668741240根據小概率值α=0.001的χ2獨立性檢驗,我們推斷H0不成立,即認為數學成績優秀與物理、化學、總分成績優秀都有關系,此推斷犯錯誤的概率不大于0.001.一、素養落地1.通過本節課的學習,提升數學抽象及數據分析素養.2.對獨立性檢驗思想的理解

獨立性檢驗的基本思想類似于數學中的反證法.先假設“兩個分類變量沒有關系”成立,計算χ2的值,如果χ2值很大,說明假設不合理,χ2越大,兩個分類變量有關系的可能性越大.二、素養訓練1.對兩個分類變量A,B的下列說法中正確的個數為(

) ①A與B無關,即A與B互不影響; ②A與B關系越密切,則χ2的值就越大; ③χ2的大小是判定A與B是否相關的唯一依據 A.0 B.1 C.2 D.3

解析①正確,A與B無關即A與B相互獨立;②不正確,χ2的值的大小只是用來檢驗A與B是否相互獨立;③不正確,例如借助三維柱形圖、二維條形圖等.故選B.

答案B2.高二第二學期期中考試,按照甲、乙兩個班學生的數學成績優秀和及格統計人數后,得到如下列聯表:

優秀及格合計甲班113445乙班83745合計197190則χ2的觀測值約為(

)A

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論