數學2-3-31回歸分析的基本思想及其初步應用市公開課一等獎省賽課獲獎課件_第1頁
數學2-3-31回歸分析的基本思想及其初步應用市公開課一等獎省賽課獲獎課件_第2頁
數學2-3-31回歸分析的基本思想及其初步應用市公開課一等獎省賽課獲獎課件_第3頁
數學2-3-31回歸分析的基本思想及其初步應用市公開課一等獎省賽課獲獎課件_第4頁
數學2-3-31回歸分析的基本思想及其初步應用市公開課一等獎省賽課獲獎課件_第5頁
已閱讀5頁,還剩22頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

3.1回歸分析基本思想及其初步應用第1頁

比《數學必3》中“回歸”增加內容必修3——統計畫散點圖了解最小二乘法思想求回歸直線方程y=bx+a用回歸直線方程處理應用問題選修2-3——統計案例引入線性回歸模型y=bx+a+e了解模型中隨機誤差項e產生原因了解相關指數R2和模型擬合效果之間關系了解殘差圖作用利用線性回歸模型處理一類非線性回歸問題正確了解分析方法與結果第2頁1、兩個變量關系不相關相關關系函數關系線性相關非線性相關問題1:現實生活中兩個變量間關系有哪些?相關關系:對于兩個變量,當自變量取值一定時,因變量取值帶有一定隨機性兩個變量之間關系。對含有相關關系兩個變量進行統計分析方法叫回歸分析。第3頁思索:相關關系與函數關系有怎樣不一樣?函數關系中兩個變量間是一個確定性關系.相關關系是一個非確定性關系.函數關系是一個理想關系模型.相關關系在現實生活中大量存在,是更普通情況.第4頁問題2:對于線性相關兩個變量用什么方法來刻劃之間關系呢?2、最小二乘預計最小二乘預計下線性回歸方程:第5頁例1從某大學中隨機選出8名女大學生,其身高和體重數據以下表:編號12345678身高165165157170175165155170體重4857505464614359求依據女大學生身高預報體重回歸方程,并預報一名身高為172cm女大學生體重。問題一:結合例1得出線性回歸模型及隨機誤差,而且區分函數模型和回歸模型。第6頁1.散點圖;2.回歸方程:分析:因為問題中要求依據身高預報體重,所以選取身高為自變量,體重為因變量.身高為172cm女大學生體重一定是60.316kg嗎?假如不是,其原因是什么?探究?第7頁(1)由圖形觀察能夠看出,樣本點呈條狀分布,身高和體重有比很好線性相關關系,所以能夠用線性回歸方程刻畫它們之間關系。第8頁(2)從散點圖還能夠看到,樣本點散布在某一條直線附近,而不是一條直線上,所以不能用一次函數y=bx+a來描述它們之間關系。這時我們用下面線性回歸模型來描述身高和體重關系:y=bx+a+e其中a和b為模型未知參數,e是y與=bx+a之間誤差,通常e稱為隨機誤差。第9頁其中a和b為模型未知參數,e稱為隨機誤差。y=bx+a+e,E(e)=0,D(e)=

在線性回歸模型(4)中,隨機誤差e方差越小,經過回歸直線預報真實值y精度越高。隨機誤差是引發預報值與真實值y之間誤差原因之一,其大小取決于隨機誤差方差。另首先,因為計算出來和為截距和斜率預計值,它們與真實值a和b之間也存在誤差,這種誤差是引發預報值與真實值y之間誤差另一個原因。隨機誤差:線性回歸模型:第10頁思索:產生隨機誤差項e原因是什么?隨機誤差e起源(能夠推廣到普通):1、忽略了其它原因影響:影響身高y原因不只是體重x,可能還包含遺傳基因、飲食習慣、生長環境等原因;2、用線性回歸模型近似真實模型所引發誤差;3、身高y觀察誤差。

以上三項誤差越小,說明我們回歸模型擬合效果越好。第11頁函數模型與“回歸模型”差異:函數模型:因變量y完全由自變量x確定回歸模型:預報變量y完全由解釋變量x和隨機誤差e確定函數模型:回歸模型:第12頁問題二:在線性回歸模型中,e是用bx+a預報真實值y隨機誤差,它是一個不可觀察量,那么應怎樣研究隨機誤差呢?

稱為殘差平方和。第13頁表3-2列出了女大學生身高和體重原始數據以及對應殘差數據。在研究兩個變量間關系時,首先要依據散點圖來粗略判斷它們是否線性相關,是否能夠用回歸模型來擬合數據.殘差分析與殘差圖定義:然后,我們能夠經過殘差來判斷模型擬合效果,判斷原始數據中是否存在可疑數據,這方面分析工作稱為殘差分析。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382

我們能夠利用圖形來分析殘差特征,作圖時縱坐標為殘差,橫坐標能夠選為樣本編號,或身高數據,或體重預計值等,這么作出圖形稱為殘差圖。第14頁殘差圖制作及作用。坐標縱軸為殘差變量,橫軸能夠有不一樣選擇;若模型選擇正確,殘差圖中點應該分布在以橫軸為心帶形區域;對于遠離橫軸點,要尤其注意。身高與體重殘差圖異常點錯誤數據模型問題

幾點說明:第一個樣本點和第6個樣本點殘差比較大,需要確認在采集過程中是否有些人為錯誤。假如數據采集有錯誤,就給予糾正,然后再重新利用線性回歸模型擬合數據;假如數據采集沒有錯誤,則需要尋找其它原因。另外,殘差點比較均勻地落在水平帶狀區域中,說明選取模型計較適當,這么帶狀區域寬度越窄,說明模型擬合精度越高,回歸方程預報精度越高。第15頁問題三:怎樣發覺數據中錯誤?怎樣衡量隨機模型擬合效果?(1)我們能夠經過分析發覺原始數據中可疑數據,判斷建立模型擬合效果。第16頁(2)殘差圖制作和作用:制作:坐標縱軸為殘差變量,橫軸能夠有不一樣選擇.橫軸為編號(或身高、體重等):能夠考查殘差與編號次序之間關系

橫軸為解釋變量:能夠考查殘差與解釋變量關系,作用:判斷模型適用性若模型選擇正確,殘差圖中點應該分布在以橫軸為中心帶形區域.第17頁R2值越大,說明殘差平方和越小,模型擬合效果越好。在線性回歸模型中,R2表示解析變量對預報變量改變貢獻率。

R2越靠近1,表示回歸效果越好(因為R2越靠近1,表示解析變量和預報變量線性相關性越強)。

假如某組數據可能采取幾個不一樣回歸方程進行回歸分析,則能夠經過比較R2值來做出選擇,即選取R2較大模型作為這組數據模型。相關指數R2是度量模型擬合效果一個指標。在線性模型中,它代表自變量刻畫預報變量能力。我們用相關指數R2來刻畫回歸效果,其計算公式是第18頁例3在一段時間內,某中商品價格x元和需求量y件之間一組數據為:求出y對x回歸直線方程,并說明擬合效果好壞。價格x1416182022需求量y1210753解:第19頁價格x1416182022需求量y1210753列出殘差表為0.994因而,擬合效果很好。00.3-0.4-0.10.24.62.6-0.4-2.4-4.4第20頁1)確定解釋變量和預報變量;2)畫出散點圖;3)確定回歸方程類型;4)求出回歸方程;5)利用相關指數或殘差進行分析.建立回歸模型基本步驟第21頁問題四:若兩個變量展現非線性關系,怎樣處理?(分析例2)例2

一只紅鈴蟲產卵數y和溫度x相關。現搜集了7組觀察數據列于表中:溫度xoC21232527293235產卵數y/個711212466115325(1)試建立產卵數y與溫度x之間回歸方程;并預測溫度為28oC時產卵數目。(2)你所建立模型中溫度在多大程度上解釋了產卵數改變?第22頁選變量解:選取氣溫為解釋變量x,產卵數為預報變量y。畫散點圖假設線性回歸方程為:?=bx+a選模型分析和預測預計參數由計算器得:線性回歸方程為y=19.87x-463.73,相關指數R2=0.7464所以一次函數模型中溫度解釋了74.64%產卵數改變。050100150200250300350036912151821242730333639當x=28時,y=19.87×28-463.73≈93方法一:一元函數模型合作探究第23頁

y=c1x2+c2

變換y=c1t+c2

非線性關系線性關系問題1選取y=c1x2+c2問題3

產卵數氣溫問題2怎樣求c1、c2?

t=x2方法二,二元函數模型合作探究第24頁平方變換:令t=x2,產卵數y和溫度x之間二次函數模型y=bx2+a就轉化為產卵數y和溫度平方t之間線性回歸模型y=bt+a溫度t21232527293235t244152962572984110241225產卵數y/個711212466115325作散點圖,并由計算器得:y和t之間線性回歸方程為y=0.367t-202.54,相關指數R2=0.802將t=x2代入線性回歸方程得:y=0.367x2

-202.54當x=28時,y=0.367×282-202.54≈85所以,二次函數模型中溫度解釋了80.2%產卵數改變。t第25頁問題1怎樣選取指數函數底?產卵數氣溫方法三指數函數模型合作探究問題2

變換

y=bx+a非線性關系線性關系對數第26頁溫度xoC21232527293235z=lny0.851.041.321.381.822.062.51產卵數y/個711212466115325xz當x=28oC時,y≈44,所以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論