【數學】一元線性回歸模型課件-2023-2024學年高二下人教A版(2019)選擇性必修第三冊_第1頁
【數學】一元線性回歸模型課件-2023-2024學年高二下人教A版(2019)選擇性必修第三冊_第2頁
【數學】一元線性回歸模型課件-2023-2024學年高二下人教A版(2019)選擇性必修第三冊_第3頁
【數學】一元線性回歸模型課件-2023-2024學年高二下人教A版(2019)選擇性必修第三冊_第4頁
【數學】一元線性回歸模型課件-2023-2024學年高二下人教A版(2019)選擇性必修第三冊_第5頁
已閱讀5頁,還剩26頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第八章成對數據的統計分析8.2一元線性回歸模型及應用

通過前面的學習我們已經了解到,根據成對樣本數據的散點圖和樣本相關系數,可以推斷兩個變量是否存在相關關系、是正相關還是負相關,以及線性相關程度的強弱等.思考:是否能像建立函數模型刻畫兩個變量之間的確定性關系那樣,通過建立適當的統計模型來刻畫兩變量之間的相關關系呢?新課引入例:生活經驗告訴我們,兒子的身高與父親的身高相關.一般來說,父親的身高較高時,兒子的身高通常也較高.為了進一步研究兩者之間的關系,有人調查了14名男大學生的身高及其父親的身高,得到的數據如表1所示.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182從圖上看,散點大致分布在一條直線附近根據我們學過的整理數據的方法:相關系數r=0.886.父親身高/cm180175170165160160165170175180185190·······兒子身高/cm·······185問題1:可以得到什么結論?

由散點圖的分布趨勢表明兒子的身高與父親的身高線性相關,通過相關系數可知兒子的身高與父親的身高正線性相關,且相關程度較高.問題3:那么影響兒子身高的其他因素是什么?

影響兒子身高的因素除父親的身外,還有

母親的身高、生活的環境、飲食習慣、營養水平、體育鍛煉等隨機的因素,兒子身高是父親身高的函數的原因是存在這些隨機的因素.問題4:各種隨機因素都是獨立的,有些因素又無法量化.你能否考慮到這些隨機因素的作用,用類似于函數的表達式,表示兒子身高與父親身高的關系嗎?問題2:是否可以用函數模型來刻畫?不能,因為不符合函數的定義.這其中還受其它因素的影響.如果用x表示父親身高,Y表示兒子的身高,用e表示各種其它隨機因素影響之和,稱e為隨機誤差,由于兒子身高與父親身高線性相關,所以Y=bx+a.考慮隨機誤差后,兒子的身高可以表示為:Y=bx+a+e

我們稱①式為Y關于x的一元線性回歸模型,其中,Y稱為因變量或響應變量,x稱為自變量或解釋變量.

a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差.①一元線性回歸模型

如果用x表示父親身高,Y表示兒子的身高,e表示隨機誤差.假定隨機誤差e的均值為0,方差為與父親身高無關的定值,則它們之間的關系可以表示為

由于隨機誤差表示大量已知和未知的各種影響之和,它們會相互抵消,為使問題簡潔,可以假設隨機誤差e的均值為0,方差為與父親身高無關的定值函數模型與回歸模型之間的差別函數模型:回歸模型:

一元線性回歸模型Y=bx+a+e增加了隨機誤差項e,因變量Y的值由自變量x和隨機誤差項e共同確定,即自變量x只能解釋部分Y的變化.解釋變量x(身高)模型誤差e

(其它所有變量)響應變量Y(體重)問題5:你能結合父親與兒子身高的實例,說明回歸模型①的意義?①可以解釋為父親身高為的所有男大學生身高組成一個子總體,該子總體的均值為,即該子總體的均值與父親的身高是線性函數關系.而對于父親身高為的某一名男大學生,他的身高并不一定為,它不僅是該子總體的一個觀測值,這個觀測值與均值有一個誤差項.(1)除父親身高外,其他可能影響兒子身高的因素,比如母親身高、生活環境、飲食習慣和鍛煉時間等.(2)在測量兒子身高時,由于測量工具、測量精度所產生的測量誤差.(3)實際問題中,我們不知道兒子身高和父親身高的相關關系是什么,可以利用一元線性回歸模型來近似這種關系,這種近似關系也是產生隨機誤差e的原因.產生隨機誤差e的原因有:問題6:你能結合具體實例解釋產生模型①中隨機誤差項的原因嗎?解:

(1),(2),(3),(4),(5)回歸模型(6),(7)函數模型.鞏固提升判斷下列變量間哪些能用函數模型刻畫,哪些能用回歸模型刻畫?為什么?函數模型與回歸模型有什么區別?

(1)某公司的銷售收入和廣告支出;(2)某城市寫字樓的出租率和每平米月租金;(3)航空公司的顧客投訴次數和航班正點率;(4)某地區的人均消費水平和人均國內生產總值(GDP);(5)學生期末考試成績和考前用于復習的時間;(6)一輛汽車在某段路程中的行駛速度和行駛時間;(7)正方形的面積與周長.一元線性回歸模型參數的最小二乘估計

在一元線性回歸模型中,表達式Y=bx+a+e刻畫了變量Y與x之間的線性相關關系,其中參數a和b未知,那么我們如何來確定參數a和b的值呢?問題:確定參數a和b的原則是什么?

與函數不同,回歸模型的參數一般是無法精確求出的,只能通過成對樣本數據估計這兩個參數.相當于尋找一條適當的直線,使表示成對樣本數據的這些散點在整體上與這條直線最接近.我們將稱為Y關于x的經驗回歸方程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線,這種求經驗回歸方程的方法叫最小二乘法.1.對于一組具有線性相關關系的數據(x1,y1),(x2,y2),···,(xn,yn),

稱為樣本點的中心.經驗回歸直線必過點

.練習:如果記錄了x,y的幾組數據分別為(0,1),(1,3),(2,5),(3,7),那么y關于x的經驗回歸直線必過點(

)A.(2,2) B.(1.5,2) C.(1,2) D.(1.5,4)例2.某研究機構對高三學生的記憶力x和判斷力y進行統計分析,得下表數據:x681012y2356(1)請畫出上表數據的散點圖;(2)請根據上表提供的數據,建立y關于x的經驗回歸方程;(3)預測記憶力為9的同學的判斷力.問題:當x=9時,

,記憶力為9的同學,他的判斷力一定是4嗎?為什么?判斷力不一定會是4,這是因為還有其他影響的因素判斷力的因素,回歸模型中的隨機誤差清楚地表達了這種影響,不過,我們可以作出推測,當記憶力為9時,判斷力一般在4左右.參數b的含義:解釋變量x對響應變量Y的均值的影響,變量x每增加一個單位,變量Y的均值將增加b個單位。在使用經驗回歸方程進行預測時,需注意以下問題1.回歸方程只適用于我們所研究的樣本的總體;2.我們所建立的回歸方程一般都有時間性;3.樣本采集的范圍會影響回歸方程的適用范圍;4.不能期望回歸方程得到的預報值就是預報

變量的精確值.事實上,它是預報變量的可取值的平均值.

建立經驗回歸方程后,通常需要對模型刻畫數據的效果進行分析---殘差分析

對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的數值稱為預測值.觀測值減去預測值稱為殘差.殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面的工作稱為殘差分析.1.殘差等于觀測值減預測值;2.殘差的平方和越小越好;3.原始數據中的可疑數據往往是殘差絕對值過大的數據;4.對數據刻畫效果比較好的殘差圖特征:殘差點比較均勻的集中在水平帶狀區域內.

【例】已知某成對樣本數據的殘差圖如下,則樣本點數據中可能不準確的是從左到右第()個.6決定系數(1)R2是用來刻畫回歸效果的,由R2=1-

可知R2越大,意味著殘差平方和越小,也就是說模型的擬合效果越好.(2)殘差圖也是用來刻畫回歸效果的,判斷依據是:殘差比較均勻地分布在橫軸的兩邊,說明殘差比較符合一元線性回歸模型的假定.判斷模型擬合效果好壞的方法:例:某研究機構對高三學生的記憶力x和判斷力y進行統計分析,得下表數據:x681012y2356(1)請畫出上表數據的散點圖;(2)請根據上表提供的數據,建立y關于x的經驗回歸方程;(3)試根據求出的經驗回歸方程,預測記憶力為9的同學的判斷力.(4)列出殘差表,做殘差圖(5)求決定指數,說明擬合效果(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是響應變量.(2)畫出解釋變量與響應變量的散點圖,觀察它們之間的關系(如是否存在線性關系等).(3)由經驗確定回歸方程的類型.(4)按一定規則(如最小二乘法)估計經驗回歸方程中的參數.(5)得出結果后需進行線性回歸分析.①殘差平方和越小,模型的擬合效果越好.②決定系數R2取值越大,說明模型的擬合效果越好.注意:若題中給出了檢驗回歸方程是否理想的條件,則根據題意進行分析檢驗即可.建立線性回歸模型的基本步驟非線性經驗回歸方程

當經驗回歸方程并非形如y=bx+a(a

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論