




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、回歸分析的基本思想及其初步應用第二課時復習回顧:相關系數上節課中的題目: 從某大學中隨機選出8名女大學生,其身高和體重數據如下表:編號12345678身高165165157170175165155170體重4857505464614359預報一名身高為172的女大學生的體重。編號12345678身高165165157170175165155170體重4857505464614359身高為172的女學生體重一定是60.316嗎?從散點圖可看到,樣本點散布在某條直線的附近,而不是一條直線上,所以不能用一次函數a 來描述它們之間的關系。理想化的斜率和截距是未知參數在實際中,隨機變量還受其他因素影響我
2、們所選用的模型只是一種近似模型故線性回歸模型的完整表達式為 y=bx+a+e因變量y的值由自變量x和隨機變量e共同確定自變量x只能解釋部分y的變化,稱為解釋變量因變量y稱為預報變量解釋變量x(身高)隨機誤差e預報變量y(體重)注意:注意:對隨機誤差e的研究線性回歸模型的完整表達式 y=bx+a+e編號12345678身高165165157170175165155170體重y4857505464614359殘差54.3754.37-6.292.71編號12345678身高165165157170175165155170體重4857505464614359殘差-6.292.712.50-4.531
3、.226.71-2.810.47殘差圖:縱坐標為殘差,橫坐標如何選取?橫坐標可以選為樣本編號殘差是個隨機變量,如何來研究殘差?如何分析殘差圖?以樣本編號為橫坐標的殘差圖:異常點 是否為錯誤數據? 殘差圖中的殘差點比較均勻地落在水平的帶狀區域,說明選用的模型比較合適。區域的寬度越窄,說明模型擬合精度越高,回歸方程的預報精度越高。為了衡量預報的精度,需要估計的2值故線性回歸模型的完整表達式為 y=bx+a+e為了衡量預報的精度,需要估計的2值為何除的是n-2如果n為或時又如何?編號12345678身高165165157170175165155170體重4857505464614359殘差-6.37
4、32.6272.419-4.6181.1376.627-2.8830.382算大還是算小呢?練:若兩變量的殘差平方和為,總偏差平方和為,則隨機誤差對預報量變化的總效應約貢獻了多少?總偏差平方和殘差平方和回歸平方和編號12345678身高165165157170175165155170體重4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382隨機誤差對預報變量變化約貢獻了多少?則身高對體重差異的貢獻約為? 這表明“身高解釋了64%的體重變化”,或者說“體重的差異有64%是有身高引起的”(而隨機誤差貢獻了剩余的36%,所以,身高對
5、體重的效應比隨機誤差的效應大得多,可以說身高和體重的相互關系較強)某運動員訓練次數與運動成績之間的數據關系如下:編號次數成績試預測運動員訓練次以及次的成績編號次數成績第一步:做散點圖編號次數成績第二步:求回歸方程編號次數成績殘差-1.24-0.370.550.461.380.170.09-1.08第三步:殘差圖殘差圖編號次數成績殘差-1.24-0.370.550.461.380.170.09-1.08第四步:計算相關指數編號次數成績殘差-1.24-0.370.550.461.380.170.09-1.08說明了該運動員的成績的差異有是由訓練次數引起的,說明了兩個變量的相關關系非常強第五步:作出
6、預報由上述分析可知,我們可以用回歸方程一般地,建立回歸模型的基本步驟為:1.確定研究對象2.畫散點圖3.由經驗確定回歸方程的類型4.按一定規則估計回歸方程中的參數5. 分析殘差圖. 下結論. 分析殘差圖小結:作業:課外研究:試以本班期中考試數學物理成績為樣本,研究學生學習數學成績對物理成績的影響例2.一只紅鈴蟲的產卵數y和溫度x有關,現收集了7組觀測數據列于下表中,試建立y與x之間的回歸方程溫度x/oC21232527293235產卵數y/個711212466115325 解:1)作散點圖;例2.一只紅鈴蟲的產卵數y和溫度x有關,現收集了7組觀測數據列于下表中,試建立y與x之間的回歸方程溫度x
7、/oC21232527293235產卵數y/個711212466115325 解:1)作散點圖; 從散點圖中可以看出產卵數和溫度之間的關系并不能用線性回歸模型來很好地近似。這些散點更像是集中在一條指數曲線或二次曲線的附近。利用線性回歸模型來建立y和x之間的非線性回歸方程x21232527293235z1.9462.3983.0453.1784.1904.7455.784例2.一只紅鈴蟲的產卵數y和溫度x有關,現收集了7組觀測數據列于下表中,試建立y與x之間的回歸方程溫度x/oC21232527293235產卵數y/個711212466115325t44152962572984110241225
8、y711212466115325用殘差來比較兩個回歸方程的擬合效果:x21232527293235y7112124661153250.518-0.1671.760-9.1498.889-14.15332.92847.69319.397-5.835-41.003-40.107-58.26877.965前一個模型的擬合效果好在一般情況下,比較兩個模型的殘差比較困難.原因是在某些樣本點上一個模型的殘差的絕對值比另一個模型的小,而另一些樣本點的情況則相反.這時可以通過比較兩個模型的殘差的平方和的大小來判斷模型的擬合效果.殘差平方和越小的模型,擬合的效果越好.中殘差平方和分別為1550.538和15448.431.說明前面那個模型的擬合效果好還可以用R2來比較兩個模型的擬合效果.R2越大,模型的擬合效果也越好.中R2分別為0.98和0.80,說明前面那個模型的擬合效果好小 結 實際問題 樣本分析 回歸模型抽樣回歸分析預報精度預報假設某服裝廠用10萬元引進一批設備的使用年限x和所支出的維修費用y(萬元),有如下的統計資料:x23456y2.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年項目管理考試提升技巧試題及答案
- 礦物加工過程中的物理分離技術考核試卷
- 液力元件的激光加工技術考核試卷
- 漁具設計原理考核試卷
- 目視化管理下的團隊協作與溝通機制考核試卷
- 項目管理專業人士高效復習試題及答案
- 2025年企業會計與審計一體化管理研究試題及答案
- 禮儀用品行業品牌建設與市場競爭力提升考核試卷
- 潛水裝備的水下作業安全管理機制優化考核試卷
- 2023年中國電信股份有限公司灣沚分公司公開招聘筆試參考題庫附帶答案詳解
- 10KV配電室倒閘操作票
- 加油站電氣線路檢查安全操作細則
- 扁桃體切除術與術后并發癥
- 醫院培訓課件:《從藥學角度看靜脈輸液安全性管理》
- 肺結核病人工作管理制度
- 普通高中畢業生綜合素質評價報告表
- GB/T 20138-2023電器設備外殼對外界機械碰撞的防護等級(IK代碼)
- 邱關源《電路》(第6版)筆記和課后習題(含考研真題)詳解
- 通用用電設備配電設計規范
- 工程勘察服務成本要素信息(2022版)
- GB/T 15166.3-2023高壓交流熔斷器第3部分:噴射熔斷器
評論
0/150
提交評論