




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
8.2.2
非線性關系的回歸模型(3)第八章成對數據的統計分析2024/7/18.2一元線性回歸模型及其應用---思想:變換為線性回歸模型一.求一元線性回歸方程的步驟:(1)以成對樣本數據描出散點圖,通過散點圖觀察成對樣本數據是否線性相關(2)判斷兩個變量之間的線性相關關系
(4)殘差分析:殘差表、殘差圖對回歸模型的擬合效果進行評估。復習引入其中:例1
人們常將男子短跑100m的高水平運動員稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀錄產生的年份和世界紀錄的數據.試依據這些成對數據,建立男子短跑100m世界紀錄關于紀錄產生年份的經驗回歸方程.編號12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.951.畫散點圖
以成對數據中的世界紀錄產生年份為橫坐標,世界紀錄為縱坐標作散點圖,得到右圖在左圖中,散點看上去大致分布在一條直線附近,似乎可用一元線性回歸模型建立經驗回歸方程.探究新知2.求經驗回歸方程將經驗回歸直線疊加到散點圖,得到下圖:
用Y表示男子短跑100m的世界紀錄,t表示紀錄產生的年份,利用一元線性回歸模型來刻畫世界紀錄和世界紀錄產生年份之間的關系.根據最小二乘法,由表中的數據得到經驗回歸方程為①探究新知問題1
從圖中可以看到,經驗回歸方程較好地刻畫了散點的變化趨,請再仔細觀察圖形,你能看出其中存在的問題嗎?例如,第一個世界紀錄所對應的散點遠離經驗回歸直線,并且前后兩時間段中的散點都在經驗回歸直線的上方,中間時間段的散點都在經驗回歸直線的下方.散點并不是隨機分布在經驗回歸直線的周圍,而是圍繞著經驗回歸直線有一定的變化規律,即成對樣本數據呈現出明顯的非線性相關的特征.探究新知問題2你能對模型進行修改,以使其更好地反映散點的分布特征嗎?3.修改模型仔細觀察右圖,可以發現散點更趨向于落在中間下凸且遞減的某條曲線附近.函數y=-lnx的圖象具有類似的形狀特征.
注意到100m短跑的第一個世界紀錄產生于1896年,因此可設非線性回歸方程為:
y=f(t)=c1+c2ln(t-1895)
(其中c1、c2為未知參數,且c2<0).追問
如何利用成對數據估計參數c1和c2?
探究新知為了利用一元線性回歸模型估計參數c1和c2,我們引進一個中間變量x,令x=ln(t-1895),,則Y=c2x+c1通過x=ln(t-1895),將年份變量數據進行變換,得到新的成對數據,如下表.編號12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29記錄/s11.8010.6010.4010.3010.2010.1010.009.95如果上表對應的散點圖呈現出很強的線性相關特征,我們就可以借助一元線性回歸模型和新的成對數據,對參數c1和c2作出估計,進而可以得到Y關于t的非線性經驗回歸方程.畫出上表中成對數據的散點圖,由散點圖可知,現在散點的分布呈現出很強的線性相關特征,故可以一元線性回歸模型建立經驗回歸方程.探究新知根據最小二乘法,并利用表中數據可得新的經驗回歸方程為將經驗回歸直線疊加到散點圖,如圖所示:將x=ln(t-1895)代入
得到由創紀錄年份預報世界紀錄的經驗非線性回歸方程:②探究新知問題3
對于通過創紀錄時間預報世界紀錄的問題,我們建立了兩個回歸模型,得到了兩個回歸方程,你能判斷哪個回歸方程擬合的精度更好嗎?②
(1)直接觀察法.在同一坐標系中畫出成對數據散點圖、經驗回歸方程①的圖象(紅色)以及非線性經驗回歸方程②的圖象(藍色).我們發現,散點圖中各散點都非常靠近②的圖像,表明非線性經驗回歸方程②對于原始數據的擬合效果遠遠好于經驗回歸方程①.探究新知①(2)殘差分析:
殘差平方和越小,模型擬合效果越好.用ti表示編號為i的年份數據,用yi表示編號為i的紀錄數據,則經驗回歸方程①和②的殘差計算公式分別為兩個經驗回歸方程的殘差(精確到0.001)如下表所示.編號12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022觀察各項殘差的絕對值,發現經驗回歸方程②遠遠小于①,即經驗回歸方程②的擬合效果要遠遠好于①.探究新知(2)殘差分析:
殘差平方和越小,模型擬合效果越好.編號12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022在一般情況下,直接比較兩個模型的殘差比較困難,因為在某些散點上一個模型的殘差的絕對值比另一個模型小,而另一些散點的情況則相反.可以通過比較殘差的平方和來比較兩個模型的效果.由可知Q2小于Q1.因此在殘差平方和最小的標準下,非線性回歸模型的擬合效果要優于一元線性回歸模型的擬合效果.探究新知(3)用決定系數R2來比較這兩個模型的擬合效果通過前面的討論我們知道,當殘差的平方和越小,經驗回歸模型的擬合效果就越好,故我們可以用決定系數R2來驗證模型的擬合效果.決定系數R2的計算公式為殘差平方和偏差平方和(與經驗回歸方程有關)(與經驗回歸方程無關)R2越大,表示殘差平方和越小,即模型的擬合效果越好R2越小,表示殘差平方和越大,即模型的擬合效果越差.顯然0≤R2≤1,R2越接近1,則線性回歸刻畫的效果越好.探究新知編號12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022(3)用決定系數R2來比較這兩個模型的擬合效果由上述殘差表可算出經驗回歸方程①和②的決定系數R2分別為由于因此經驗回歸方程②的刻畫效果比經驗回歸方程①的好很多.探究新知
另外,我們還可以用新的觀測數據來檢驗模型的擬合效果.事實上,我們還有1968年之后的男子短跑100m世界紀錄數據,如下表所示.編號91011121314151617181920t198319881991199119941996199920052007200820082009Y/s9.939.929.909.869.859.849.799.779.749.729.699.58
在散點圖中繼續繪制上表中的散點(綠色),再添加經驗回歸方程①所對應的經驗回歸直線,以及經驗回歸方程②所對應的經驗回歸曲線,得到下圖.
顯然綠色散點分布在藍色經驗回歸曲線的附近,遠離紅色經驗回歸直線,表明經驗回歸方程②對于新數據的預報效果遠遠好于①.探究新知問題3
在上述問題情境中,男子短跑100m世界紀錄和紀錄產生年份之間呈現出對數關系,能借助樣本相關系數刻畫這種關系的強弱嗎?在使用經驗回歸方程進行預測時,需注意以下問題1.回歸方程只適用于我們所研究的樣本的總體;2.我們所建立的回歸方程一般都有時間性;3.樣本采集的范圍會影響回歸方程的適用范圍;4.不能期望回歸方程得到的預報值就是預報變量的精確值.事實上,它是預報變量的可能取值的平均值.探究新知問題4本節我們學習了哪些分析模型的回歸效果方法?(2)殘差平方和(1)殘差分析好的回歸方程對應的殘差散點圖應是均勻地分布在橫軸兩側的帶狀區域內.且帶狀區域越窄,說明模型擬合效果越好.列殘差表畫殘差圖(3)決定系數R2法殘差平方和越小,說明模型擬合效果越好.R2越大,說明模型擬合效果越好.探究新知建立非線性經驗回歸模型的基本步驟:1.確定研究對象,明確哪個是解釋變量,哪個是響應變量;2.由經驗確定非線性經驗回歸方程的模型;3.通過變換,將非線性經驗回歸模型轉化為線性經驗回歸模型;4.按照公式計算經驗回歸方程中的參數,得到經驗回歸方程;5.消去新元,得到非線性經驗回歸方程;6.得出結果后分析殘差圖是否有異常.探究新知非線性回歸分析(1)指數型函數y=ebx+a類①函數y=ebx+a
的圖象,如圖所示線性回歸分析②兩邊取對數得lny=lnebx+a,即
lny=bx+a令z=lny,把原始數據(x,y)轉化為(x,z),再根據求解線性回歸模型的方法求出a,b.(2)對數型函數y=blnx+a
類①函數y=blnx+a的圖象,如圖所示②設u=lnx,原方程可轉化為
y=bu+a把原始數據(x,y)轉化為(u,y),再根據求解線性回歸模型的方法求出a,b.探究新知[2020全國卷I-5]某校一個課外學習小組為研究某作物種子的發芽率y和溫度x(單位:°C)的關系,在20個不同的溫度條件下進行種子發芽實驗,由實驗數據(xi,yi)得到下面的散點圖:由此散點圖,在10°C至40°C之間,下面四個回歸方程類型中最適宜作為發芽率y和溫度x的回歸方程類型的是()課堂練習
x2023252730z22.4334.6對數變換z=lny練習2.2020年初,新型冠狀病毒(COVID-19)引起的肺炎疫情爆發以來,各地醫療機構采取了各種針對性的治療方法,取得了不錯的成效,某地開始使用中西醫結合方法后,每周治愈的患者人數如下表所示:由表格可得y
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- WB/T 1141-2024數字化倉庫數據分類與接口要求
- 玻璃企業創新能力提升策略考核試卷
- 組織競爭力分析與提升策略考核試卷
- 空調器壓縮機性能分析考核試卷
- 環境保護與綠色金融發展考核試卷
- 經紀人如何制定藝人長期發展計劃考核試卷
- 物流信息技術與應用考核試卷
- 海洋油氣開發工程技術的可持續發展考核試卷
- 山西省運城市臨猗縣臨晉中學2025年高三下學期第三次(線上)周考數學試題含解析
- 蘭州工商學院《中西文化交流史》2023-2024學年第一學期期末試卷
- 2025年財務管理的前沿動態試題及答案
- 豬場轉讓合同范本
- (二模)石家莊市2025屆高三教學質量檢測(二)生物試卷(含標準答案)
- 有關電除顫的試題及答案
- 腦卒中中西醫結合護理
- 2025北京外國語大學輔導員考試題庫
- 2023年江蘇省高中信息技術青年教師教學基本功大賽試卷
- 2025年保密觀知識測試題及答案
- 開學第一課:學習哪吒精神勇闖難關做陽光少年2024-2025學年初中班會課課件
- 家長講堂:法制主題教育
- 2024年江蘇省南京市中考數學試卷真題(含答案逐題解析)
評論
0/150
提交評論