【課件】一元線性回歸模型的應(yīng)用+課件高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第1頁
【課件】一元線性回歸模型的應(yīng)用+課件高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第2頁
【課件】一元線性回歸模型的應(yīng)用+課件高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第3頁
【課件】一元線性回歸模型的應(yīng)用+課件高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第4頁
【課件】一元線性回歸模型的應(yīng)用+課件高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

8.2.2.2一元線性回歸模型的應(yīng)用例:經(jīng)驗表明,一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大,樹就越高.由于測量樹高比測量胸徑困難,因此研究人員希望由胸徑預(yù)測樹高.在研究樹高與胸徑之間的關(guān)系時,某林場收集了某種樹的一些數(shù)據(jù)(如下表),試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗回歸方程.編號123456胸徑/cm18.120.122.224.426.028.3樹高/m18.819.221.021.022.122.1編號789101112胸徑/cm29.632.433.735.738.340.2樹高/m22.422.623.024.323.924.7以胸徑為橫坐標(biāo),樹高為縱坐標(biāo)作散點圖,得到下圖.散點大致分布在一條從左下角到右上角的直線附近,表明兩個變量線性相關(guān),并且是正相關(guān),因此可以用一元線性回歸模型刻畫樹高與胸徑之間的關(guān)系.用d表示胸徑,h表示樹高,根據(jù)最小二乘法,計算可得經(jīng)驗回歸方程為相應(yīng)的經(jīng)驗回歸直線如圖所示.根據(jù)經(jīng)驗回歸方程,由例題中所給表中胸徑的數(shù)據(jù)可以計算出樹高的預(yù)測值(精確到0.1)以及相應(yīng)的殘差,如下表所示.編號胸徑/cm樹高觀測值/m樹高預(yù)測值/m殘差/m118.118.819.4-0.6220.119.219.9-0.7322.221.020.40.6424.421.020.90.1526.022.121.30.8628.322.121.90.2729.622.422.20.2832.422.622.9-0.3933.723.023.2-0.21035.724.323.70.61138.323.924.4-0.51240.224.724.9-0.2以胸徑為橫坐標(biāo),殘差為縱坐標(biāo),作殘差圖,得到下圖.觀察殘差表和殘差圖,可以看到,殘差的絕對值最大是0.8,所有殘差分布在以橫軸為對稱軸,寬度小于2的帶狀區(qū)域內(nèi).可見經(jīng)驗回歸方程較好地刻畫了樹高與胸徑的關(guān)系,我們可以根據(jù)經(jīng)驗回歸方程由胸徑預(yù)測樹高.問題:人們常將男子短跑100m的高水平運動員稱為"百米飛人".表中給出了1968年之前男子短跑100m世界紀(jì)錄產(chǎn)生的年份和世界紀(jì)錄的數(shù)據(jù).試依據(jù)這些成對數(shù)據(jù),建立男子短跑100m世界紀(jì)錄關(guān)于紀(jì)錄產(chǎn)生年份的經(jīng)驗回歸方程.編號12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95以成對數(shù)據(jù)中的世界紀(jì)錄產(chǎn)生年份為橫坐標(biāo),世界紀(jì)錄為縱坐標(biāo)作散點圖散點看上去大致分布在一條直線附近似乎可用一元線性回歸模型建立經(jīng)驗回歸方程.用Y表示男子短跑100m的世界紀(jì)錄,t表示紀(jì)錄產(chǎn)生的年份,利用一元線性回歸模型來刻畫世界紀(jì)錄和世界紀(jì)錄產(chǎn)生年份之間的關(guān)系.將經(jīng)驗回歸直線疊加到散點圖,得到下圖(1)根據(jù)最小二乘法,由表中的數(shù)據(jù)得到經(jīng)驗回歸方程為觀察:從上圖中可以看到,經(jīng)驗回歸方程(1)較好地刻畫了散點的變化趨勢.請再仔細(xì)觀察圖形,你能看出其中存在的問題嗎?以經(jīng)驗回歸直線為參照,可以發(fā)現(xiàn)經(jīng)驗回歸方程的不足之處,以及散點的更為精細(xì)的分布特征.例如,第一個世界紀(jì)錄所對應(yīng)的散點遠(yuǎn)離經(jīng)驗回歸直線,并且前后兩時間段中的散點都在經(jīng)驗回歸直線的上方,中間時間段的散點都在經(jīng)驗回歸直線的下方.這說明散點并不是隨機分布在經(jīng)驗回歸直線的周圍,而是圍繞著經(jīng)驗回歸直線有一定的變化規(guī)律,即成對樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.觀察:從上圖中可以看到,經(jīng)驗回歸方程(1)較好地刻畫了散點的變化趨勢.請再仔細(xì)觀察圖形,你能看出其中存在的問題嗎?思考:你能對模型進(jìn)行修改,以使其更好地反映散點的分布特征嗎?散點更趨向于落在中間下凸且遞減的某條曲線附近.100m短跑的第一個世界紀(jì)錄產(chǎn)生于1896年y=f(t)=c1+c2ln(t-1895)其中c1和c2為未知的參數(shù),且c2

<0.y=-lnx的圖象具有類似的形狀特征y=f(t)=c1+c2ln(t-1895)其中c1和c2為未知的參數(shù),且c2

<0.將年份變量數(shù)據(jù)進(jìn)行變換,得到新的成對數(shù)據(jù)(精確到0.01).編號12345678x0.002.833.263.563.714.114.174.29記錄/s11.8010.6010.4010.3010.2010.1010.009.95引進(jìn)一個中間變量x

,令

x=ln(t-1895)借助一元線性回歸模型和新的成對數(shù)據(jù),對參數(shù)c1和c2作出估計,進(jìn)而可以得到Y(jié)關(guān)于t的非線性經(jīng)驗回歸方程.散點的分布呈現(xiàn)出很強的線性相關(guān)特征.散點圖用一元線性回歸模型得到經(jīng)驗回歸方程

再在上圖中畫出(*)式所對應(yīng)的經(jīng)驗回歸直線,得到右圖.(*)由上圖表明,經(jīng)驗回歸方程(*)對于上表中的成對數(shù)據(jù)具有非常好的擬合精度.將上圖與右圖進(jìn)行對比,可以發(fā)現(xiàn)

x

和Y之間的線性相關(guān)程度比原始樣本數(shù)據(jù)的線性相關(guān)程度強得多.將

x=ln(t-1895)代人(*)式,得到由創(chuàng)紀(jì)錄年份預(yù)報世界紀(jì)錄的經(jīng)驗回歸方程

在同一直角坐標(biāo)系中畫出成對數(shù)據(jù)散點圖,非線性經(jīng)驗回歸方程(2)的圖象以及經(jīng)驗回歸方程(1)的圖象,如下圖所示.(2)散點圖中各散點都非常靠近(2)的圖象,表明非線性經(jīng)驗回歸方程(2)對于原始數(shù)據(jù)的擬合效果遠(yuǎn)遠(yuǎn)好于經(jīng)驗回歸方程(1).①②通過殘差來比較這兩個經(jīng)驗回歸方程對數(shù)據(jù)刻畫的好壞.在表中,用ti表示編號為i的年份數(shù)據(jù),用yi

表示編號為i的紀(jì)錄數(shù)據(jù),則經(jīng)驗回歸方程(1)和(2)的殘差計算公式分別為

編號12345678t189619121921193019361956196019600.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022觀察各項殘差的絕對值,發(fā)現(xiàn)經(jīng)驗回歸方程②遠(yuǎn)遠(yuǎn)小于①,即經(jīng)驗回歸方程②的擬合效果要遠(yuǎn)遠(yuǎn)好于①.在一般情況下,直接比較兩個模型的殘差比較困難,因為在某些散點上一個模型的殘差的絕對值比另一個模型的小,而另一些散點的情況則相反.可以通過比較殘差的平方和來比較兩個模型的效果.由可知Q2

小于

Q1

.的擬合效果要優(yōu)于一元線性回歸模型的擬合效果.因此在殘差平方和最小的標(biāo)準(zhǔn)下,非線性回歸模型刻畫回歸效果的方式——殘差平方和法稱為殘差平方和殘差平方和越小,模型擬合效果越好.其中,稱為總體偏差平方和,為確定的數(shù)值,與經(jīng)驗回歸方程無關(guān)稱為殘差平方和,與經(jīng)驗回歸方程有關(guān)刻畫回歸效果的方式

回歸方程(1)和(2)的

R2

分別約為0.7325和0.9983,因此經(jīng)驗回歸方程(2)的刻畫效果比經(jīng)驗回歸方程(1)的好很多.另外,我們還可以用新的觀測數(shù)據(jù)來檢驗?zāi)P偷臄M合效果.事實上,我們還有1968年之后的男子短跑100m世界紀(jì)錄數(shù)據(jù),如下表.編號91011121314151617181920t198319881991199119941996199920052007200820082009Y/s9.939.929.909.869.859.849.799.779.749.729.699.58在下面的散點圖中,繪制上表中的散點(綠色),再添加經(jīng)驗回歸方程(1)所對應(yīng)的經(jīng)驗回歸直線(紅色),以及經(jīng)驗回歸方程(2)所對應(yīng)的經(jīng)驗回歸曲線(藍(lán)色),得到下圖

.顯然綠色散點分布在藍(lán)色經(jīng)驗回歸曲線的附近,遠(yuǎn)離紅色經(jīng)驗回歸直線,表明經(jīng)驗回歸方程(2)對于新數(shù)據(jù)的預(yù)報效果遠(yuǎn)遠(yuǎn)好于(1).x24568y3040605070練:關(guān)于??與??有如下數(shù)據(jù):x24568y3040605070-0.5-3.510-6.50.5-20-1010020解:根據(jù)模型1可得:根據(jù)模型2可得:-1-58-9-3-20-1010020①回歸方程只適用于我們研究的樣本和總體。②回歸方程一般都有時間性。③樣本取值的范圍會影響回歸方程的適用范圍。④不能期望回歸方程得到的預(yù)報值是預(yù)報變量的精確值。注意問題:1)確定解釋變量和預(yù)報變量;2)畫出散點圖;3)確定回歸方程類型;4)求出回歸方程;5)利用相關(guān)指數(shù)或殘差進(jìn)行分析.建立回歸模型的基本步驟非線性回歸分析對于非線性回歸問題,并且沒有給出經(jīng)驗公式,這時我們可以畫出已知數(shù)據(jù)的散點圖,把它與學(xué)過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等)的圖象作比較,挑選一種跟這些散點擬合得最好的函數(shù),然后采用適當(dāng)?shù)淖兞看鷵Q,把問題轉(zhuǎn)化為線性回歸問題,使其得到解決.練:

一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關(guān),現(xiàn)收集了7組觀測數(shù)據(jù)列于表中:試建立產(chǎn)卵數(shù)y與溫度x之間的回歸方程。

解:作散點圖:從散點圖中可以看出產(chǎn)卵數(shù)和溫度之間的關(guān)系并不能用線性回歸模型來很好地近似。這些散點更像是集中在一條指數(shù)曲線或二次曲線的附近。

此時x和z之間的關(guān)系可以用線性回歸直線z=bx+a來擬合。由計算器得:z關(guān)于x的線性回歸方程:

x212325

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論