




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Cp統計量達到最小的準則來權衡回第5章自變量選擇與逐漸回歸思慮與練習參照答案5.1自變量選擇對回歸參數的預計有何影響?答:回歸自變量的選擇是成立回歸模型得一個極為重要的問題。假如模型中丟掉了重要的自變量,出現模型的設定偏誤,這樣模型簡單出現異方差或自有關性,影響回歸的成效;假如模型中增添了不用要的自變量,或許數據質量很差的自變量,不單使得建模計算量增大,自變量之間信息有重疊,并且獲取的模型穩固性較差,影響回歸模型的應用。5.2自變量選擇對回歸展望有何影響?答:當全模型(m元)正確采納選模型(p元)時,我們舍棄了m-p個自變量,回歸系數的最小二乘預計是全模型相應參數的有偏預計,使得用選模型的展望是有偏的,但因為選模型的參數預計、展望殘差和展望均方偏差擁有較小的方差,因此全模型正確而誤用選模型有益有弊。入選模型(p元)正確采納全模型(m元)時,全模型回歸系數的最小二乘預計是相應參數的有偏預計,使得用模型的展望是有偏的,并且全模型的參數預計、展望殘差和展望均方偏差的方差都比選模型的大,因此回歸自變量的選擇應少而精。5.3假如所建模型主要用于展望,應當用哪個準則來權衡回歸方程的好壞?答:假如所建模型主要用于展望,則應使用歸方程的好壞。5.4試述行進法的思想方法。答:行進法的基本思想方法是:第一因變量Y對所有的自變量x1,x2,...,xm成立m個一元線性回歸方程,并計算F查驗值,選擇偏回歸平方和明顯的變量(F值最大且大于臨界值)進入回歸方程。每一步只引入一個變量,同時成立m-1個二元線性回歸方程,計算它們的
F查驗值,選擇偏回歸平方和明顯的兩變量變量F值最大且大于臨界值)進入回歸方程。在確立引入的兩個自變量此后,再引入一個變量,成立m-2個三元線性回歸方程,計算它們的F查驗值,選擇偏回歸平方和明顯的三個變量(F值最大)進入回歸方程。不停重復這一過程,直到沒法再引入新的自變量時,即所有未被引入的自變量的F查驗值均小于F查驗臨界值Fα(1,n-p-1),回歸過程結束。5.5試述退后法的思想方法。答:退后法的基本思想是:第一因變量Y對所有的自變量x1,x2,...,xm成立一個m元線性回歸方程,并計算t查驗值和F查驗值,選擇最不明顯(P值最大且大于臨界值)的偏回歸系數的自變量剔除出回歸方程。每一步只剔除一個變量,再成立m-1元線性回歸方程,計算t查驗值和F查驗值,剔除偏回歸系數的t查驗值最?。≒值最大)的自變量,再成立新的回歸方程。不停重復這一過程,直到沒法剔除自變量時,即所有節余p個自變量的F查驗值均大于F查驗臨界值F(1,n-p-1),回歸過程結束。5.6行進法、退后法各有哪些優弊端?答:行進法的長處是能夠將對因變量有影響的自變量按明顯性一一選入,計算量小。行進法的弊端是不可以反應引進新變量后的變化,并且選入的變量就算不明顯也不可以刪除。退后法的長處是是能夠將對因變量沒有明顯影響的自變量按不明顯性一一剔除,保存的自變量都是明顯的。退后法的弊端是開始計算量大,當減少一個自變量時,它再也沒時機進入了。假如遇到自變量間有有關關系時,行進法和退后法所作的回歸方程均會出現不一樣程度的問題。5.7試述逐漸回歸法的思想方法。答:逐漸回歸的基本思想是有進有出。詳細做法是將變量一個一個的引入,當每引入一個自變量后,對已選入的變量要進行逐一查驗,當原引入變量因為后邊變量的應歸入而變得不再明顯時,要將其剔除。引入一個變量或從回歸防方程中剔除一個變量,為逐漸回歸的一步,每一步都要進行F查驗,以保證每次引入新的變量以前回歸方程中只包括明顯的變量。這個過程頻頻進行,直到無明顯變量引入回歸方程,也無不明顯變量從回歸方程中剔除為止。這樣就防止了行進法和退后法各自的缺點,保證了最后獲取的回歸子集是最優回歸子集。5.8在運用逐漸回歸法時,α進和α出的賦值原則是什么?假如希望回歸方程中多保存一些自變量,α進應怎樣賦值?答:原則是要求引入自變量的明顯水平α進小于剔除自變量的明顯性水平α出,否則可能出現死循環;若想回歸方程多保存自變量,能夠增大α進的值,使得更多自變量的P值在α進的范圍內,但要注意,α進的值不得超出α出的值。5.9在研究國家財政收入時,我們把財政收入按收入形式分為:各項稅收收入、公司收入、債務收入、國家能源交通要點建設收入、基本建設貸款送還收入、國家估算調理基金收入、其余收入等。為了成立國家財政收入回歸模型,我們以財政收入y(億元)為因變量,自變量以下:x1為農業增添值(億元),x2為工業增添值(億元),x3為建筑業增添值(億元),x4為人口數(萬人),x5為社會花費總數(億元),x6為受災面積(萬公頃)。據《中國統計年鑒》獲取1978—1998年共21個年份的統計數據,見表5.4(P167)。由定性剖析知,所有自變量都與y有較強的有關性,分別用退后法和逐漸回歸法作自變量選元。解:退后法SPSS輸出結果:CoefficientsaUnstandardizedStandardizedCoefficientsCoefficientsModelBStd.ErrorBetatSig.1(Constant)1627.5782201.935.739.472x1-.604.163-1.064-3.708.002x2-.379.202-1.565-1.872.082x3-.199.539-.130-.368.718x4-.005.024-.019-.227.824x5.681.1263.7755.394.000x6-.006.008-.017-.801.4362(Constant)1133.739307.8533.683.002x1-.626.125-1.103-4.998.000x2-.344.128-1.422-2.695.017x3-.223.511-.146-.435.669x5.662.0923.6707.219.000x6-.007.007-.019-.984.3413(Constant)1134.615299.9493.783.002x1-.617.120-1.087-5.128.000x2-.383.089-1.582-4.310.001x5.662.0893.6687.405.000x6-.007.007-.018-.955.3544(Constant)865.929103.7258.348.000x1-.601.119-1.059-5.057.000x2-.361.086-1.493-4.216.001x5.639.0863.5417.439.000a.DependentVariable:y逐漸回歸法CoefficientsaUnstandardizedStandardizedCoefficientsCoefficientsModelBStd.ErrorBetatSig.1(Constant)715.30990.5747.898.000x5.179.004.99440.739.0002(Constant)1010.840136.0277.431.000x5.308.0481.7066.367.000x1-.405.152-.714-2.665.0163(Constant)865.929103.7258.348.000x5.639.0863.5417.439.000x1-.601.119-1.059-5.057.000x2-.361.086-1.493-4.216.001a.DependentVariable:y兩者結果同樣,回歸方程為:y=865.929—0.601x1-0.361x2+0.639x5可是回歸系數的解說不合理。5.10表5.5的數據是1968-1983年時期與電話線制造有關的數據,各變量的含義以下:x1——年份;x2——公民生產總值(10億美元);x3——新房動工數(單位:1000);x4——失業率(%);x5——滯后6個月的最惠利率;x6——用戶用線增量(%);y——年電話銷量(百萬尺雙線)。(1)成立y對x2~x6的線性回歸方程。SPSS輸出結果以下:回歸方程為:y=5922.827+4.864x2+2.374x3-817.901x4+14.539x5-846.867x6此中x2、x5的系數未經過查驗。(2)用退后法選擇自變量。退后法剔除P值最大的剔除x5,模型的參數均經過明顯性查驗。(明顯性水平α=0.05),得回歸方程為:y=6007.320+5.068x2+2.308x3-824.261x4-862.699x6模型表示年電話銷量(y)與公民生產總值、新房動工數、失業率、用戶用線增量有明顯的線性關系。(3)用逐漸回歸法選擇自變量逐漸回歸法引入x3,x5,x4進入回歸模型,沒有剔除變量,保存x3,x5,x4作為最后模型。回歸方程為:y=1412.807+3.440x3—415.136x4+348.729x5模型表示年電話銷量(y)與新房動工費、失業率、滯后6個月的最
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 北京市延慶區2025屆高三下學期2月一模試題 物理(含答案)
- 河北省衡中清大教育集團2025年高三第二學期期中考試物理試題試卷含解析
- 建東職業技術學院《專業英語B》2023-2024學年第一學期期末試卷
- 廊坊市廣陽區2025年小升初素養數學檢測卷含解析
- 湖北省黃石市育英高級中學2025屆高三第二學期高考生物試題模擬試卷含解析
- 日喀則地區定日縣2025年三下數學期末教學質量檢測試題含解析
- 沈陽體育學院《水土保持工程學》2023-2024學年第二學期期末試卷
- 四川省達州市重點中學2025屆高三第四次聯合測試卷語文試題文試卷含解析
- 山東省青島市市南區重點達標名校2025屆初三第三次質量預測生物試題試卷含解析
- 云南省麗江市古城中學2024-2025學年第二學期高三第二次模擬考試語文試題含解析
- 第19課《十里長街送總理》 統編版語文(五四學制)六年級上冊
- 【MOOC】航空航天材料概論-南京航空航天大學 中國大學慕課MOOC答案
- 歷屆全國“挑戰杯”課外學術科技作品競賽獲獎作品一覽表 第一屆到第十二屆
- 商業銀行資產負債管理課件
- 詩中的童年課件
- 倉庫發貨清單
- 法理學-(第五版)完整版ppt全套教學教程課件(最新)
- GB∕T 31568-2015 熱噴涂熱障ZrO2涂層晶粒尺寸的測定 謝樂公式法
- 陜西省黃河流域(陜西段)污水綜合排放標準編制說明
- 2022年鄭州信息科技職業學院職業適應性測試模擬試題及答案解析
- 后勤不“后”與“時”俱進——信息技術促幼兒園保育員專業化發展的研究
評論
0/150
提交評論