82一元線性回歸分析(原卷版)_第1頁
82一元線性回歸分析(原卷版)_第2頁
82一元線性回歸分析(原卷版)_第3頁
82一元線性回歸分析(原卷版)_第4頁
82一元線性回歸分析(原卷版)_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

【原卷版】8.2一元線性回歸分析選擇性必修第二冊第8章成對數據的統計分析初中學習的平面幾何,研究的是平面上的一些簡單圖形及其幾何性質;從本章開始,我們將把視野從二維的平面拓展到三維的空間;在三維空間中的圖形統稱為空間圖形或立體圖形;立體幾何所研究的就是一些簡單的空間圖形及其幾何性質;從平面幾何到立體幾何,我們要注意借鑒平面幾何中已有的一些概念、方法和結論,更要特別注意立體幾何和平面幾何之間的區別;以本章學習的空間直線與平面為例,我們不僅要研究平面這類典型的空間圖形,而且要對“直線”有更為深刻的認識;我們生活在一個三維世界中,立體幾何的學習有助于我們從幾何的角度更好地理解現實的世界,并且鍛煉我們的幾何直觀想象能力;因此,在學習中,要著重注意幾何的直觀和內涵,不要僅僅停留在表面上的嚴格推導和論證,還要多畫一些示意圖來幫助理解,這樣才能更好地掌握幾何的實質,逐步培養自己的立體感和空間想象能力;在必修課程第13章“統計”中,我們主要研究了來自單一變量數據的一些統計特征,如集中趨勢、離散程度、分布等.但現實世界中許多事物和現象之間都是有聯系的;在本章中,我們將主要學習來自兩個變量的成對數據的相關分析和回歸分析,掌握它們之間的統計規律;本章將要學習的相關分析、回歸分析及檢驗都屬于推斷性統計方法,它們在構建統計模型、預測結果和因果分析等方面有許多應用;在必修課程中學過的散點圖是進行成對數據統計分析的基礎,通過觀察散點圖可以大致了解數據的整體形態和偏離情況,發現兩組數據之間的變化規律,構建適當的統計模型.統計圖表不僅可以直觀地表示數據及其規律,也是建立統計直覺的重要途徑;【本章教材目錄】第8章成對數據的統計分析8.1成對數據的相關分析8.1.1成對數據間的關系;8.1.2相關系數8.2一元線性回歸分析8.2.1一元線性回歸分析的基本思想;8.2.2一元線性回歸分析的應用舉例8.32x2列聯表8.3.12x2列聯表獨立性檢驗;8.3.2獨立性檢驗的具體應用【本章內容提要】相關分析和一元線性回歸分析是研究兩個變量關系的兩個互為補充的方法;相關分析描述了兩個變量的相關程度,而回歸分析則描述了因變量是怎樣受自變量影響的;1、為了得到兩個變量之間是否具有一定關系的直觀印象,可以用散點圖來描述這些數據;2、相關系數可以度量兩個隨機變量之間的線性關系;相關系數的值滿足,且越接近1,兩個隨機變量的線性關系越密切;3、回歸方程代表了兩個變量間的關系,回歸直線經過散點圖中數據點的中心;回歸直線的斜率越大,解釋變量狓的一個單位變化所引起的反應變量狔的波動就越大;4、回歸方程可以通過最小二乘法得到.回歸直線能較好地反映一個變量對另一個變量的依賴情況,具有解釋因果關系和預測的功能.利用回歸方程可以由解釋變量的值來預測反應變量的值,從而給出反應變量真實值的一個估計;5、2×2列聯表描述兩個分類變量所有值的組合數據是如何分布的.判斷2×2列聯表中出現的兩個分類變量是否獨立可采用檢驗;檢驗的一般步驟是:(1)提出原假設;(2)確定顯著性水平;(3)計算統計量的值;(4)統計決斷:當≥時,拒絕原假設,推斷兩個變量相關,否則,接受原假設,推斷兩個變量不相關(即兩個變量是獨立的);在實際情況下,是否完全拒絕原假設,還需要考慮樣本量的大小;【要點方法解讀】解讀點001離差的概念與作用1、離差的概念與作用一般地,設給定一組有線性相關關系的成對數據、、…、和一個線性方程(或稱線性模型);①如何描述數據與此線性方程的貼近度呢?當變量取值(=1,2,…,)時,令,它是變量與對應的理想值;但數據中的與不一定相同,它們的差稱為在處的離差;當時稱為正離差,而當時稱為負離差;顯然,離差直觀地描述了單對數據與線性方程①的貼近度;2、擬合誤差可以像計算方差那樣,用離差的平方和來刻畫直線與點之間的擬合程度;稱為擬合誤差;它是一個很好的描述數據與線性方程①貼近度的指標;例1、色差和色度是衡量毛絨玩具質量優劣的重要指標,現抽檢一批產品測得數據列于表中:已知該產品的色度y和色差x之間滿足線性相關關系,且y=0.8x+eq\o(b,\s\up6(^)),現有一對測量數據為(30,23.6),則該數據的殘差為()色差x21232527色度y15181920A.-0.96B.-0.8C.0.8D.0.96解讀點002回歸分析及其相關概念我們把擬合誤差取得最小值時得到的線性方程(線性模型)記為②并稱之為變量隨波動的回歸方程或回歸模型,其中自變量稱為解釋變量,因變量稱為反應變量;回歸方程所定義的直線稱為回歸直線,回歸方程的系數(或稱回歸模型的參數)與稱為回歸系數;由一組有某種線性關系的成對數據求其回歸方程的方法稱為一元線性回歸分析;回歸系數與的計算方法如下:其中,與分別是數據與(=1,2,…,)的算術平均數;數對稱為樣本點的中心。最小二乘法與最小二乘估計量我們的回歸分析是基于取最小值的假設,即基于所有離差的平方和取最小值的假設進行的;這種回歸分析的方法稱為最小二乘法,由最小二乘法導出的估計量稱為最小二乘估計量,所得到的回歸系數與又稱為模型參數與的最小二乘估計;建立一元線性回歸模型的一般步驟(1)確定研究對象,從一組數據出發,根據實際問題,明確哪個變量是自變量,哪個變量是因變量;(2)對確定的自變量和因變量,繪制相應的散點圖,觀察它們之間的關系(如是否存在線性關系等);(3)若觀察到數據呈線性關系,則選用線性方程;(4)利用最小二乘法估計線性方程中的參數與,得到回歸方程;(5)得出結果后計算離差,采用統計方法檢驗模型是否合適(這一步本書不作要求);(6)利用所求的回歸方程進行預測;題型一、利用回歸方程求回歸系數與例2、已知x,y的取值如下表,從散點圖可以看出y與x具有線性相關關系,且經驗回歸方程為eq\o(y,\s\up6())=0.95x+eq\o(b,\s\up6(^)),則eq\o(b,\s\up6(^))=________.x0134y2.24.34.86.7題型二、利用樣本中心求相關參數例3、某產品的廣告費用x與銷售額y的統計數據如下表:廣告費用x(萬元)4235銷售額y(萬元)49263954根據上表可得回歸方程y=eq\o(a,\s\up6(^))x+eq\o(b,\s\up6(^))中的eq\o(a,\s\up6(^))為9.4,據此模型預測廣告費用為6萬元時銷售額約為________萬元.題型三、求回歸方程例4、某地隨著經濟的發展,居民收入逐年增長,該地一銀行連續五年年底的儲蓄存款情況如下表所示.年份x20182019202020212022儲蓄存款額y/千億元567810為了計算方便,工作人員將上表的數據進行了處理,令t=x-2017,z=y-5,得到下表.t12345z01235(1)作z關于t的散點圖,求z關于t的回歸方程;(2)通過(1)中的方程,求出y關于x的回歸方程;題型四、利用回歸方程進行預測例5、偏差是指個別測定值與測定的平均值之差,在成績統計中,我們把某個同學的某科考試成績與該科平均分的差叫某科偏差(實際成績-平均分=偏差).在某次考試成績統計中,某老師為了對學生數學偏差x(單位:分)與物理偏差y(單位:分)之間的關系進行分析,隨機挑選了8位同學,得到他們的兩科成績偏差數據如下:學生序號12345678數學偏差x20151332-5-10-18物理偏差y6.53.53.51.50.5-0.5-2.5-3.5(1)若x與y之間具有線性相關關系,求y關于x的回歸方程;(2)若該次考試數學平均分為120分,物理平均分為91.5分,試由(1)的結論預測數學成績為128分的同學的物理成績.參考數據和參考公式:eq\i\su(i=1,8,x)iyi=324,eq\i\su(i=1,8,x)eq\o\al(2,i)=1256,經驗回歸方程為y=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(a,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(b,\s\up6(^))=eq\x\to(y)-eq\o(a,\s\up6(^))eq\x\to(x).題型五、真題體驗例6、(2024·天津薊州·高三校考開學考試)為研究某種細菌在特定環境下,隨時間變化的繁殖情況,得到如下實驗數據:天數天

繁殖個數千個

由最小二乘法得與的回歸方程為,則當時,繁殖個數的預測值為(

)A. B. C. D.例7、(2025·河南鄭州模擬)按照《中華人民共和國環境保護法》的規定,每年生態環境部都會會同國家發展改革委等部門共同編制《中國生態環境狀況公報》,并向社會公開發布.下表是2017~2021年五年《中國生態環境狀況公報》中酸雨區面積約占國土面積的百分比(yi%):年份2017年2018年2019年2020年2021年年份代碼xi12345yi6.45.55.04.83.8(1)求2017~2021年年份代碼xi與yi的樣本相關系數(精確到0.01);(2)請用樣本相關系數說明該組數據中y與x之間的關系可用一元線性回歸模型進行描述,并求出y關于x的經驗回歸方程;(3)預測2026年的酸雨區面積占國土面積的百分比.附:回歸直線的斜率和截距的最小二乘估計公式分別為eq\o(a,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2),eq\o(b,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(a,\s\up6(^))eq\o(x,\s\up6(-)).樣本相關系數r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)),eq\r(36.4)≈6.例8、(2016年全國III卷)下圖是我國2008年至2014年生活垃圾無害化處理量(單位:億噸)的折線圖.

(1)由折線圖看出,可用線性回歸模型擬合y與t的關系,請用相關系數加以說明;(2)建立y關于t的回歸方程(系數精確到0.01),預測2016年我國生活垃圾無害化處理量.附注:參考數據:,,,≈2.646.參考公式:相關系數回歸方程中斜率和截距的最小二乘估計公式分別為:【針對性即時練】1、下列結論:①函數關系是一種確定性關系;②相關關系是一種非確定性關系;③圓的面積和半徑是相關關系.其中正確的是(將所有正確的序號都填上);2、命題①任何兩個變量都具有相關關系;②圓的周長與該圓的半徑具有相關關系;③某商品的需求量與該商品的價格是一種非確定性關系;④根據散點圖可以大致判斷兩個相關變量是正相關還是負相關.其中正確的命題是3、5名學生的數學和物理成績(單位:分)如下:ABCDE數學成績8075706560物理成績7066686462判斷數學成績與物理成績是否具有線性相關關系;(填:“有”與“無”)4、兩個變量的相關關系有①正相關、②負相關、③不相關,則下列散點圖從左到右分別反映的變量間的相關關系的序號依次是5、如圖所示,有5組數據:A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),去掉________組數據后剩下的4組數據的線性相關系數最大.6、變量、的散點圖如圖所示,那么、之間的樣本相關系數最接近的值為7、若已知eq\i\su(i=1,n,)(xi-eq\x\to(x))2是eq\i\su(i=1,n,)(yi-eq\x\to(y))2的兩倍,eq\i\su(i=1,n,)(xi-eq\x\to(x))(yi-eq\x\to(y))是eq\i\su(i=1,n,)(yi-eq\x\to(y))2的1.2倍,則樣本相關系數r的值為()A.eq\f(\r(2),1.2)B.eq\f(1.2,\r(2))C.0.92D.0.658、為了比較甲、乙、丙三組數據的線性相關性的強弱,小鄭分別計算了甲、乙、丙三組數據的樣本相關系數,其數值分別為0.939,0.937,0.948,則()A.甲組數據的線性相關性最強,乙組數據的線性相關性最弱B.乙組數據的線性相關性最強,丙組數據的線性相關性最弱C.丙組數據的線性相關性最強,甲組數據的線性相關性最弱D.丙組數據的線性相關性最強,乙組數據的線性相關性最弱9、從某地區12~30歲的居民中隨機抽測了10個人的身高和體重,所得數據如下表所示:身高/cm14315615917216517117

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論