相關性、最小二乘估計、回歸分析與獨立性檢驗_第1頁
相關性、最小二乘估計、回歸分析與獨立性檢驗_第2頁
相關性、最小二乘估計、回歸分析與獨立性檢驗_第3頁
相關性、最小二乘估計、回歸分析與獨立性檢驗_第4頁
相關性、最小二乘估計、回歸分析與獨立性檢驗_第5頁
已閱讀5頁,還剩48頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三節相關性、最小二乘估計、回歸分析與獨立性檢驗三年9考高考指數:★★★1.會作兩個有關聯變量的數據的散點圖,并利用散點圖認識變量間的相關關系.2.了解最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程(不記公式).3.了解獨立性檢驗的基本思想、方法及其初步應用.4.了解回歸分析的基本思想、方法及其簡單應用.1.線性回歸方程的建立及應用和獨立性檢驗的應用是考查重點;2.題型以選擇題和填空題為主,主要是求線性回歸方程的系數或利用線性回歸方程進行預測,在給出臨界值的情況下判斷兩個變量是否有關.1.相關性(1)散點圖:在考慮兩個量的關系時,為了對_____之間的關系有一個大致的了解,人們通常將______________的點描出來,這些點就組成了變量之間的一個圖,通常稱這種圖為變量之間的散點圖.(2)曲線擬合:從散點圖上可以看出,如果變量之間_________________,這些點會有一個_____的大致趨勢,這種趨勢通??梢杂靡粭l___________來近似,這種近似的過程稱為曲線擬合.變量所對應存在著某種關系光滑的曲線變量集中(3)線性相關:若在兩個變量x和y的散點圖中,所有點看上去都在__________附近波動,則稱變量間是線性相關的.此時,我們可以用___________來近似.(4)非線性相關:若散點圖上所有點看上去都在_________________________附近波動,則稱此相關為非線性相關.此時,可以用___________來擬合.(5)不相關:如果所有的點在散點圖中_________________,則稱變量間是不相關的.一條直線一條直線某條曲線(不是一條直線)一條曲線沒有顯示任何關系【即時應用】(1)思考:相關關系與函數關系有什么異同點?提示:相同點:兩者均是指兩個變量的關系.不同點:①函數關系是一種確定的關系,相關關系是一種非確定的關系.②函數關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.(2)判斷下列各關系是否是相關關系.(請在括號內填“是”或“否”)①路程與時間、速度的關系;()②加速度與力的關系;()③產品成本與產量的關系;()④圓周長與圓面積的關系;()⑤廣告費支出與銷售額的關系.()【解析】①②④是確定的函數關系,成本與產量,廣告費支出與銷售額是相關關系.答案:①否②否③是④否⑤是2.回歸直線方程與相關系數(1)最小二乘法如果有n個點(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表達式來刻畫這些點與直線y=a+bx的接近程度:_____________________________________________________使得上式達到_________的直線y=a+bx就是我們所要求的直線,這種方法稱為最小二乘法.[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2.最小值(2)線性回歸方程假設樣本點為(x1,y1),(x2,y2),…,(xn,yn),則直線方程y=a+bx稱為線性回歸方程,a、b是線性回歸方程的________.系數(3)相關系數r①②當r>0時,稱兩個變量___________.當r<0時,稱兩個變量___________.當r=0時,稱兩個變量_____________.r的絕對值越接近于1,表明兩個變量之間的線性相關程度越高;r的絕對值越接近于0,表明兩個變量之間的線性相關程度越低.正相關負相關線性不相關【即時應用】(1)由一組樣本數據(x1,y1),(x2,y2),…,(xn,yn)得到回歸直線方程y=a+bx,判斷下面說法是否正確.(請在括號內打“√”或“×”)①任何一組觀測值都能得到具有代表意義的回歸直線方程;()②直線y=a+bx至少經過點(x1,y1),(x2,y2),…,(xn,yn)中的一個點;()③直線y=a+bx的斜率()④直線y=a+bx和各點(x1,y1),(x2,y2),…,(xn,yn)的偏差是該坐標平面上所有直線與這些點的偏差中最小的.()(2)已知回歸方程y=4.4x+838.19,則可估計x與y的增長速度之比約為_________.【解析】(1)任何一組觀測值都能利用公式得到直線方程,但這個方程可能無意義,①不正確;回歸直線方程y=bx+a經過樣本點的中心可能不經過(x1,y1),(x2,y2),…,(xn,yn)中的任何一點,這些點分布在這條直線附近,②不正確;③正確;④正確.(2)x與y的增長速度之比即約為回歸方程的斜率的倒數答案:(1)①×②×③√④√(2)3.獨立性檢驗(1)2×2列聯表設A,B為兩個變量,每一個變量都可以取兩個值,變量A:A1,A2=;變量B:B1,B2=通過觀察得到如表所示的數據:BAB1B2總計A1A2總計aba+bcdc+da+cb+dn=a+b+c+d(2)獨立性判斷方法選取統計量________________________,用它的大小來檢驗變量之間是否獨立.①當χ2__________時,沒有充分的證據判定變量A,B有關聯,可以認為變量A,B是沒有關聯的;②當χ2__________時,有90%的把握判定變量A,B有關聯;③當χ2__________時,有95%的把握判定變量A,B有關聯;④當χ2__________時,有99%的把握判定變量A,B有關聯.≤2.706>2.706>3.841>6.635【即時應用】(1)下面是一個2×2列聯表則表中a、b處的值分別為_____________.y1y2總計x1a2173x222527總計b46(2)在一項打鼾與患心臟病的調查中,共調查了1671人,經過計算χ2的觀測值為27.63,根據這一數據分析,我們有理由認為打鼾與患心臟病是___________的(填“有關”或“無關”).【解析】(1)∵a+21=73,∴a=52.又∵a+2=b,∴b=54.(2)∵27.63>6.635,∴有99%的把握認為“打鼾與患心臟病有關”.答案:(1)52、54(2)有關 相關關系的判斷【方法點睛】利用散點圖判斷相關關系的技巧利用散點圖判斷兩個變量是否有相關關系是比較簡便的方法:(1)在散點圖中如果所有的樣本點都落在某一函數的曲線上,就用該函數來描述變量之間的關系,即變量之間具有函數關系;(2)如果所有的樣本點都落在某一函數的曲線附近,變量之間就有相關關系;(3)如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系.【例1】關于人體的脂肪含量(百分比)和年齡關系的研究中,得到如下一組數據:判斷它們是否有相關關系.年齡2327394145495051脂肪含量

9.517.821.225.927.526.328.229.6【解題指南】判斷有無相關關系,一種常用的簡便方法就是繪制散點圖.【規范解答】本題涉及兩個變量:年齡與脂肪含量,可以以年齡為自變量,考查脂肪含量的變化趨勢,分析相關關系通常借助散點圖.以年齡作為x軸,脂肪含量作為y軸,可得相應的散點圖如圖所示.由散點圖可知,兩者之間具有相關關系.【反思·感悟】粗略判斷相關性,可以觀察一個變量隨另一個變量變化而變化的情況.畫出散點圖能夠更直觀的判斷是否相關,相關時是正相關還是負相關.【變式訓練】5個學生的數學和物理成績如下表:畫出散點圖,并判斷它們是否有相關關系.學生學科

ABCDE數學8075706560物理7066686462【解析】把數學成績作為橫坐標,把相應的物理成績作為縱坐標,在直角坐標系中描點(xi,yi)(i=1,2,…,5),作出散點圖如圖.從圖中可以直觀地看出數學成績和物理成績具有相關關系,且當數學成績增大時,物理成績也在由小變大,即它們正相關. 線性回歸方程及其應用【方法點睛】求樣本數據的線性回歸方程的步驟第一步,計算平均數第二步,求和第三步,計算第四步,寫出回歸方程y=bx+a.【提醒】對于任意一組樣本數據,利用上述公式都可以求得“回歸方程”,如果這組數據不具有線性相關關系,即不存在回歸直線,那么所得的“回歸方程”是沒有實際意義的.因此,對一組樣本數據,應先作散點圖,在具有線性相關關系的前提下再求回歸方程.【例2】(1)(2011·廣東高考)某數學老師身高176cm,他爺爺、父親和兒子的身高分別是173cm、170cm和182cm.因兒子的身高與父親的身高有關,該老師用線性回歸分析的方法預測他孫子的身高為__________cm.(2)測得某國10對父子身高(單位:英寸)如下:父親身高(x)

60626465666768707274兒子身高(y)

63.6

65.2

6665.566.967.167.468.370.170①畫出散點圖,說明變量y與x的相關性;②如果y與x之間具有線性相關關系,求線性回歸方程.(已知:≈4490.34,=44794,=44941.93,=44842.4)【解題指南】(1)求出回歸方程,代入相關數據求得;(2)①根據散點圖判斷相關性.②根據已知數據和提示的公式數據求解,寫出線性回歸方程.【規范解答】(1)由題設知:設相對的父親的身高為x,相對的兒子的身高為y,它們對應的取值如表所示于是有a=176-173×1=3,得回歸方程為y=x+3,所以當x=182時,y=185.答案:185x173170176y170176182(2)①散點圖如圖所示:觀察散點圖中點的分布可以看出:這些點在一條直線的附近分布,所以變量y與x之間具有線性相關關系.②設回歸方程為y=bx+a.由=67.01-0.4646×66.8≈35.9747.得所求的線性回歸方程為y=0.4646x+35.9747.【互動探究】若本例(2)題干不變,如果父親的身高為73英寸,試估計兒子的身高.【解析】由本例(2)可知回歸方程為y=0.4646x+35.9747.當x=73時,y=0.4646×73+35.9747≈69.9(英寸).所以當父親身高為73英寸時,兒子的身高約為69.9英寸.【反思·感悟】求線性回歸方程,主要是利用公式,求出回歸系數b,a,求解過程中注意計算的準確性和簡便性.利用回歸方程預報,就是求函數值.【變式訓練】一般來說,一個人腳越長,他的身高就越高.現對10名成年人的腳長x與身高y進行測量,得如下數據(單位:cm):x20212223242526272829y141146154160169176181188197203作出散點圖后,發現散點在一條直線附近.經計算得到一些數據:某刑偵人員在某案發現場發現一對裸腳印,量得每個腳印長26.5cm,請你估計案發嫌疑人的身高為_________cm.【解析】由已知故y=7x.當x=26.5時,y=185.5.答案:185.5 獨立性檢驗的基本思想及其應用【方法點睛】利用統計量χ2進行獨立性檢驗的步驟(1)根據數據列出2×2列聯表;(2)根據公式計算χ2的值;(3)比較χ2與臨界值的大小關系,作出統計推斷.【例3】某企業為了更好地了解設備改造前后與生產合格品的關系,隨機抽取了180件產品進行分析,其中設備改造前的合格品有36件,不合格品有49件,設備改造后生產的合格品有65件,不合格品有30件.根據所給數據:(1)寫出2×2列聯表;(2)判斷產品是否合格與設備改造是否有關.【解題指南】列表后利用χ2的值進行檢驗.【規范解答】(1)由已知數據得(2)∵≈12.38.由于12.38>6.635,所以有99%以上的把握認為產品是否合格與設備改造有關.合格品不合格品合計設備改造后653095設備改造前364985合計10179180【反思·感悟】準確計算χ2的值是關鍵.能有多大的把握認為兩個變量有關,應熟悉常用的幾個臨界值.【變式訓練】為研究是否喜歡飲酒與性別之間的關系,在某地區隨機抽取290人,得到如下列聯表:利用列聯表的獨立性檢驗判斷是否喜歡飲酒與性別是否有關?喜歡飲酒不喜歡飲酒總計男10145146女12420144總計22565290【解析】由列聯表中的數據得∵χ2≈11.953>6.635.所以有99%以上的把握認為是否喜歡飲酒與性別有關.【變式備選】有兩個分類變量X與Y,其一組觀測的2×2列聯表如下表.其中a,15-a均為大于5的整數,則a取何值時有90%以上的把握認為X與Y之間有關系?y1y1x1a20-ax115-a30+a【解析】要有90%以上的把握認為X與Y之間有關系,則χ2>2.706,而χ2==解χ2>2.706得a>7.19或a<2.04.又因為a>5且15-a>5,a∈Z,所以a=8,9,故當a取8或9時有90%以上的把握認為X與Y之間有關系.【滿分指導】線性回歸方程解答題的規范解答【典例】(12分)(2011·安徽高考)某地最近十年糧食需求量逐年上升,下表是部分統計數據:年份20022004200620082010需求量(萬噸)236246257276286(1)利用所給數據求年需求量與年份之間的回歸直線方程y=bx+a;(2)利用(1)中所求出的直線方程預測該地2012年的糧食需求量.【解題指南】將數據進行處理,把數據同時減去一個數代入公式計算;利用公式求回歸直線方程,并進行預測.【規范解答】(1)由所給數據看出,年需求量與年份之間是近似直線上升,下面來求回歸直線方程,先將數據預處理如下:…………………2分年份-2006

-4

-20

2

4

需求量-257-21-1101929對預處理的數據,容易算得………………4分………………6分由上述計算結果,知所求回歸直線方程為y-257=b(x-2006)+a=6.5(x-2006)+3.2.……………8分即y=6.5(x-2006)+260.2.……………10分(2)利用所求得的直線方程,可預測2012年的糧食需求量為6.5×(2012-2006)+260.2=6.5×6+260.2=299.2(萬噸).…………12分【閱卷人點撥】通過高考中的閱卷數據分析與總結,我們可以得到以下失分警示和備考建議:失分警示在解答本題時有兩點容易造成失分:(1)不知道回歸直線必過中心點,求不出回歸直線方程;(2)應用回歸直線進行預測時對回歸系數理解錯誤.備考建議

解決回歸分析問題時,還有以下幾點容易造成失分,在備考時要高度關注:(1)沒有對變量間的相關性判斷,求出的回歸方程無意義;(2)公式中的系數計算失誤;另外要注意聯系實際,結合生活中的經驗解決相關問題.1.(2011·江西高考)為了解兒子身高與其父親身高的關系,隨機抽取5對父子身高數據如下則y對x的線性回歸方程為()(A)y=x-1(B)y=x+1(C)y=88+x(D)y=176父親身高x(cm)

174

176176176

178兒子身高y(cm)

175175176177177【解析】選C.由表中數據知回歸直線是上升的,首先排除D.由線性回歸性質知:點=(176,176)一定在回歸直線上,代入各選項檢驗,只有C符合,故選C.2.(2011·陜西高考)設(x1,y1),(x2,y2),…,(xn,yn)是變量x和y的n個樣本點,直線l是由這些樣本點通過最小二乘法得到的線性回歸直線(如圖),以下結論正確的是()(A)直線l過點(B)x和y的相關系數為直線l的斜率(C)x和y的相關系數在0到1之間(D)當n為偶數時,分布在l兩側的樣本點的個數一定相同【解析】選A.選項具體分析結論A回歸直線l一定過樣本點的中心;由回歸直線方程的計算公式可知直線l必過點

正確B相關系數用來衡量兩個變量之間的相關程度,直線的斜率表示直線的傾斜程度;它們的計算公式也不相同不正確選項具體分析結論C

相關系數的值有正有負,還可以是0;當相關系數在0到1之間時,兩個變量為正相關,在-1到0之間時,兩個變量負相關

不正確

D

l兩側的樣本點的個數分布與n的奇偶性無關,也不一定是平均分布

不正確

3.(2011·遼寧高考)調查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬元),調查顯示年收入x與年飲食支出y具有線性相關關系,并由調查數據得到y對x的回歸直線方程:y=0.254x+0.321.由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均增加___________萬元.【解析】由于y=0.254x+0.321,當x增加1萬元時,年飲食支出y增加0.254萬元.答案:0.2549、春去春又回,新桃換舊符。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論