高中數(shù)學第一章統(tǒng)計案例變量間的相關關系、回歸及獨立性檢驗知識精講素材北師大版選修1-2_第1頁
高中數(shù)學第一章統(tǒng)計案例變量間的相關關系、回歸及獨立性檢驗知識精講素材北師大版選修1-2_第2頁
高中數(shù)學第一章統(tǒng)計案例變量間的相關關系、回歸及獨立性檢驗知識精講素材北師大版選修1-2_第3頁
高中數(shù)學第一章統(tǒng)計案例變量間的相關關系、回歸及獨立性檢驗知識精講素材北師大版選修1-2_第4頁
高中數(shù)學第一章統(tǒng)計案例變量間的相關關系、回歸及獨立性檢驗知識精講素材北師大版選修1-2_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、變量間的相關關系、回歸分析及獨立性檢驗【知識精講】1會作兩個相關變量的數(shù)據(jù)的散點圖,會利用散點圖認識變量的相關關系2了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程3掌握獨立檢驗(只要求2×2列聯(lián)表)的基本思想、方法簡單應用.4. 掌握假設檢驗和聚類分析的基本思想、方法簡單應用.【基礎梳理】1相關關系的量:當自變量一定時,因變量的取值帶有一定的隨機性的兩個變量之間的關系稱為相關關系2回歸分析:對具有相關關系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析3散點圖:表示具有相關關系的兩個變量的一組數(shù)據(jù)的圖形叫做散點圖4正相關與負相關概念:如果散點圖中的點散布在從左下角到右

2、上角的區(qū)域內(nèi),稱為正相關如果散點圖中的點散布在從左上角到右下角的區(qū)域內(nèi),稱為負相關6 相關系數(shù):r叫做變量y與x之間的樣本相關系數(shù),簡稱相關系數(shù),用它來衡量兩個變量之間的線性相關程度7相關系數(shù)的性質(zhì):|r|1,且|r|越接近1,相關程度越大;且|r|越接近0,相關程度越小8獨立性檢驗:一般地,假設有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為: 2×2列聯(lián)表若要推斷的論述為H1:X與Y有關系,可以按如下步驟判斷結論H1成立的可能性:(1)通過三維柱形圖和二維條形圖,可以粗略地判斷兩個分類變量是否有關系,但是這種判斷無

3、法精確地給出所得結論的可靠程度在三維柱形圖中,主對角線上兩個柱形高度的乘積ad與副對角線上的兩個柱形高度的乘積bc相差越大,H1成立的可能性就越大在二維條形圖中,可以估計滿足條件Xx1的個體中具有Yy1的個體所占的比例 ,也可以估計滿足條件Xx2的個體中具有Yy2的個體所占的比例.“兩個比例的值相差越大,H1成立的可能性就越大”(2)可以利用獨立性檢驗來考察兩個分類變量是否有關系,并且能較精確地給出這種判斷的可靠程度具體做法是:根據(jù)實際問題需要的可信程度確定臨界值k0;利用公式K2 ,由觀測數(shù)據(jù)計算得到隨機變量K2的觀測值k;如果kk0,就以(1P(K2k0)×100%的把握認為“X

4、與Y有關系”;否則就說樣本觀測數(shù)據(jù)沒有提供“X與Y有關系”的充分證據(jù)【要點解讀】要點七 相關關系的判斷【例7】山東魯潔棉業(yè)公司的科研人員在7塊并排、形狀大小相同的試驗田上對某棉花新品種進行施化肥量x對產(chǎn)量y影響的試驗,得到如下表所示的一組數(shù)據(jù)(單位:kg)(1)畫出散點圖;(2)判斷是否具有相關關系【命題立意】考查相關關系的分析方法.【標準解析】用施化肥量x作為橫軸,產(chǎn)量y為縱軸可作出散點圖,由散點圖即可分析是否具有線性相關關系【誤區(qū)警示】正確選擇坐標描點,并準確觀察散點的實際分布判斷兩變量的正相關和負相關是常用方法.【答案】(1)散點圖如右圖所示, (2)由散點圖知,各組數(shù)據(jù)對應點大致都在一

5、條直線附近,所以施化肥量x與產(chǎn)量y具有線性相關關系.【變式訓練】(2009·寧夏、海南)對變量x,y有觀測數(shù)據(jù)(xi,yi)(i1,2,10),得散點圖(1);對變量u、v有觀測數(shù)據(jù)(ui,vi)(i1,2,10),得散點圖(2)由這兩個散點圖可以判斷()A變量x與y正相關,u與v正相關B變量x與y正相關,u與v負相關C變量x與y負相關,u與v正相關D變量x與y負相關,u與v負相關【標準解析】由圖(1)可知,各點整體呈遞減趨勢,x與y負相關,由圖(2)可知,各點整體呈遞增趨勢,u與v正相關【技巧點撥】注意正負相關的判斷標準.【答案】C要點八 線性回歸分析【例8】一臺機器使用時間較長,

6、但還可以使用它按不同的轉(zhuǎn)速生產(chǎn)出來的某機械零件有一些會有缺點,每小時生產(chǎn)有缺點零件的多少,隨機器運轉(zhuǎn)的速度而變化,下表為抽樣試驗結果: (1)對變量y與x進行相關性檢驗;(2)如果y與x有線性相關關系,求回歸直線方程;(3)若實際生產(chǎn)中,允許每小時的產(chǎn)品中有缺點的零件最多為10個,那么,機器的運轉(zhuǎn)速度應控制在什么范圍內(nèi)?【命題立意】考查線性回歸分析方法。【標準解析】利用相關系數(shù)r進行線性相關檢驗(也可利用散點圖)如果線性相關,再求回歸直線方程并加以判斷(2) 0.728 6x0.857 1.(3)要使 100.728 6x0.857 110,所以x14.901 3.所以機器的轉(zhuǎn)速應控制在14.

7、901 3轉(zhuǎn)/秒以下【答案】【變式訓練】假設關于某設備的使用年限x和所支出的維修費用y(萬元),有如下的統(tǒng)計資料:(1)y與x間是否有線性相關關系?若有,求出線性回歸方程;(2)估計使用年限為10年時的維修費用【標準解析】先作出散點圖,然后檢驗相關性,再求其回歸直線【技巧點撥】對具有相關關系的兩個變量進行統(tǒng)計分析時,首先要作出散點圖,然后進行相關性檢驗,在確認具有線性相關關系后,再求其回歸直線。【答案】要點九 獨立性檢驗【例9】(2009·遼寧)某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在29.94,30.06)的零件為優(yōu)質(zhì)品從兩個分廠生產(chǎn)的零件中各抽出了500

8、件,量其內(nèi)徑尺寸,得結果如下表:甲廠: 乙廠:(1)試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;(2)由以上統(tǒng)計數(shù)據(jù)填下面2×2列聯(lián)表,并問是否有99%的把握認為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”.【命題立意】考查由采集樣本的數(shù)據(jù)檢驗獨立性.【標準解析】利用公式計算K2的值,比較它與臨界值的大小關系,來判斷事件X與Y是否有關的問題【誤區(qū)警示】圖表數(shù)據(jù)及利用計算數(shù)據(jù)判斷獨立性的步驟必須正確理解.【答案】(1)甲廠抽查的產(chǎn)品中有360件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為72%;乙廠抽查的產(chǎn)品中有320件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為64%.(2) 所以有99%的把握認為“

9、兩個分廠生產(chǎn)的零件的質(zhì)量有差異” 【變式訓練】在對人們休閑方式的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人女性中有43人主要的休閑方式是看電視,另外27人的休閑方式是運動;男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運動(1)根據(jù)以上數(shù)據(jù)建立一個2×2列聯(lián)表;(2)畫出二維條形圖;(3)檢驗休閑方式是否與性別有關,可靠性有多大【標準解析】獨立性檢驗的考查。【技巧點撥】先由已知條件轉(zhuǎn)化聯(lián)表及條形圖,然后由公式計算k2與臨界值的關系。【答案】(1)2×2列聯(lián)表如圖: (2)二維條形圖如圖:(3)假設休閑方式與性別無關,則K26.2015.024

10、,所以有理由認為休閑方式與性別無關是不合理的,即我們有97.5%的把握認為休閑方式與性別有關【原創(chuàng)題探討】【原創(chuàng)精典1】 某企業(yè)三月中旬生產(chǎn)A、B、C三種產(chǎn)品共3 000件,根據(jù)分層抽樣的結果,企業(yè)統(tǒng)計員制作了如下的統(tǒng)計表:產(chǎn)品類別ABC產(chǎn)品數(shù)量(件)1 300樣本容量130由于不小心,表格中A、C產(chǎn)品的有關數(shù)據(jù)已被污染看不清楚了,統(tǒng)計員只記得A產(chǎn)品的樣本容量比C產(chǎn)品的樣本容量多10,根據(jù)以上信息,可得C產(chǎn)品的數(shù)量是_件【解析】設樣本的總?cè)萘繛閤,則×1 300130,x300.A產(chǎn)品和C產(chǎn)品在樣本中共有300130170(件)設C產(chǎn)品的樣本容量為y,則yy10170,y80.C產(chǎn)品

11、的數(shù)量為×80800.【答案】800【原創(chuàng)精典2】如右圖是某電視臺綜藝節(jié)目舉辦的挑戰(zhàn)主持人大賽上,七位評委為某選手打出的分數(shù)的莖葉統(tǒng)計圖,去掉一個最高分和一個最低分后,所剩數(shù)據(jù)的平均數(shù)和方差分別為()A84,4.84 B84,1.6 C85,4 D85,1.6【解析】由莖葉圖可知評委打出的最低分為79,最高分為93,其余得分為84,84,86,84,87,故平均分為85,方差為3×(8485)2(8685)2(8785)21.6.【答案】D【原創(chuàng)精典3】近年來,由于亂砍濫伐,掠奪性使用森林資源,我國長江、黃河流域植被遭到破壞,土地沙化嚴重,洪澇災害時有發(fā)生沿黃某地區(qū)為積極響

12、應和支持“保護母親河”的倡議,建造了長100千米,寬0.5千米的防護林有關部門為掌握這一防護林共約有多少棵樹,從中選出10塊(每塊長1千米,寬0.5千米)進行統(tǒng)計,每塊樹木數(shù)量如下(單位:棵)65 100 63 200 64 600 64 700 67 30063 300 65 100 66 600 62 800 65 500請你根據(jù)以上數(shù)據(jù)計算這一防護林共約有多少棵樹(結果保留3個有效數(shù)字)【解析】要求學生有用樣本估計總體的思想方法,另一方面要求學生有應用數(shù)學的意識,這是今后中考命題發(fā)展的趨勢【答案】先計算出(65 10063 20064 60064 70067 30063 30065 10

13、066 60062 80065 500)64 820于是,可以估計這一防護林平均每塊約有64820株樹又64 820×1006 482 0006.48×106(株),于是可以估計這一防護林大約共有6.48×106株樹新動向前瞻【樣題1】已知總體的各個體的值由小到大依次為2,3,3,7,a,b,12,13.7,18.3,20,且總體的中位數(shù)為10.5,若要使該總體的方差最小,則a、b的取值分別是_【解析】中位數(shù)為10.5,10.5,ab21,x10,s2(102)2(103)2(103)2(107)2(10a)2(10b)2(1012)2(1013.7)2(1018

14、.3)2(1020)2令y(10a)2(10b)22a242a22122,當a10.5時,y取最小值,方差s2也取最小值a10.5,b10.5.【答案】10.510.5【樣題2】某醫(yī)療研究所為了檢驗某種血清預防感冒的作用,把500名使用血清的人與另外500名未用血清的人一年中的感冒記錄作比較,提出假設H0:“這種血清不能起到預防感冒的作用”,利用2×2列聯(lián)表計算得K23.918,經(jīng)查對臨界值表知P(K23.841)0.05.p:有95%的把握認為“這種血清能起到預防感冒的作用”;q:若某人未使用該血清,那么他在一年中有95%的可能性得感冒;r:這種血清預防感冒的有效率為95%;s:這

15、種血清預防感冒的有效率為5%.則下列結論中,正確結論的序號是_(把你認為正確的命題序號都填上)pq;綈pq;(綈p綈q)(rs);(p綈r)(綈qs)【解析】由題意,得K23.918,P(K23.841)0.05,所以只有p正確,即有95%的把握認為“這種血清能起到預防感冒的作用”,由真值表知、為真命題【答案】【樣題3】合情推理是由特殊到一般的推理,得到的結論不一定正確,演繹推理是由一般到特殊的推理,得到的結論一定正確;一般地,當r的絕對值大于0.75時,認為兩個變量之間有很強的線性相關關系,如果變量y與x之間的相關系數(shù)r0.956 8,則變量y與x之間具有線性關系;用獨立性檢驗(2×

16、;2列聯(lián)表法)來考察兩個分類變量是否有關系時,算出的隨機變量K2的值越大,說明“x與y有關系”成立的可能性越大;命題p:xR使得x2x10,則綈p:xR均有x2x10.其中結論正確的序號為_(寫出你認為正確的所有結論的序號)【解析】通過統(tǒng)計假設,查表得結論正確;參考兩個分類變量x和y有關系的可信度表:k2的值越大,說明“x與y有關系”成立的可能性越大;正確,命題p:xR使得p(x),則綈p:xR均有綈p(x)【答案】【樣題4】出下列四個命題:xR,cos xsinsin一定不成立;今年初某醫(yī)療研究所為了檢驗“達菲(藥物)”對甲型H1N1流感病毒是否有抑制作用,把墨西哥的患者數(shù)據(jù)庫中的500名使

17、用達菲的人與另外500名未用達菲的人一段時間內(nèi)患甲型H1N1流感的療效記錄作比較,提出假設H0:“達菲不能起到抑制甲型H1N1流感病毒的作用”,利用2×2列聯(lián)表計算得K23.918,經(jīng)查對臨界值表知P(K23.841)0.05,說明達菲抑制甲型H1N1流感病毒的有效率為95%;|a·b|a|b|是|ab|a|b|成立的充要條件;如右圖的莖葉圖是某班在一次測驗時的成績:可斷定:女生成績比較集中,整體水平稍高于男生其中真命題的序號是_(填上所有真命題的序號)【解析】對于,等式展開后可化簡為asin xbcos x0的形式,可知一定有解;對于,正確解釋是:有95%的把握認為“達菲對甲型H1N1流感病毒有抑制作用”;對于,由向量模的性質(zhì)知不正確【答案】【樣題5】某種產(chǎn)品的廣告費支出x與銷售額y(單位:百萬元)之間有如下對應數(shù)據(jù):x24568y3040605070(1)畫出散點圖;(2)求回歸直線方程;(3)試預測廣告費支出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論