




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
PAGEPAGE4實驗報告八實驗課程:回歸分析實驗課專業:統計學年級:姓名:學號:指導教師:完成時間:得分:教師評語:學生收獲與思考:26 92 021 175 030 31 022 104 00 277 012 210 019 120 04 290 016 238 028 164 115 272 111 295 138 68 131 85 121 224 120 166 113 305 130 124 114 246 1;run;procregdata=xt103;modely=x1x2;run;研制一種新型玻璃,對其做耐沖實驗。用一個小球從不同的高度h對玻璃做自由落體撞擊,玻璃破碎記為y=1,玻璃未破碎記y=0.數據見表22.是對表中數據建立玻璃耐沖性對高度h的logistic回歸,并解釋回歸方程的含義。模型信息:模型解出的是y=0的概率。由三個檢驗中,統計量的P值都小于0.05,可以認為模型是顯著的。由Wald檢驗的顯著性概率及其P值,可以看出,h變量對方程的影響是顯著的。由極大似然估計,各個參數系數也通過檢驗。因此模型有效。二元logit模型為模型意義為,小球掉落高度為h,則玻璃未破碎的概率為p,而y=0表示玻璃未破碎。也就是說,該種新型的玻璃,用小球對其撞擊,當小球的掉落高度為h時,玻璃未破碎的概率就是,那么,玻璃會破碎的概率就為1-p(y=0),這也可以看成是一種比例,就是大量實驗中,同個高度h,玻璃會被擊破的比例。SAS程序:datawjz;inputhy;/*引入虛擬變量,將公司類型的互助設為0,股份設為1*/cards;1.50 01.52 01.54 01.56 01.58 11.60 01.62 01.64 01.66 01.68 11.70 01.72 01.74 01.76 11.78 01.80 11.82 01.84 01.86 11.88 11.90 01.92 11.94 01.96 11.98 12.00 1;run;proclogisticdata=wjz;modely=h;run;proclogisticdata=wjz;classh;modely=h/link=glogitaggregatescale=none;run;某學校對本科畢業生的去向做了一個調查,分析影響畢業去向的相關因素,結果見表23.其中畢業去向“1”=工作,“2”=讀研,“3”=出國留學。性別“1”=男生,“0”=女生。用多類別的Logisitic回歸分析影響畢業去向的因素。專業課x1英語x2性別x3月生活費x4畢業去向y兩個統計量的P值均大于0.05,說明模型擬合的較好。檢驗全局零假設:BETA=0無效假設檢驗結果(似然比,評分)的結果P值均小于0.01,具有顯著統計學意義。三個變量中,有兩個是不顯著的變量,x3,x2,剔除x3:兩個統計量的P值均大于0.05,說明模型擬合的較好。檢驗全局零假設:BETA=0無效假設檢驗結果(似然比,評分,wald)的結果P值均小于0.01,具有顯著統計學意義。三個變量都是顯著的。以x4=“1”,即參加工作,為參照。由模型可以看出:從參數估計表中,與參加工作的同學相比,讀研的(y=2)的同學相比,讀研的同學其專業課成績更好(x1的P值=0.003),而外語成績(x2的p值=0.356)和經濟狀況(x4的P值=0.184)沒有顯著差異;出國留學的(y=3)學生其專業課成績和參加工作的沒有顯著差異,外語成績和經濟狀況則更好。Sas程序:dataa;inputx1x2x3x4y;cards;95 65.0 1 600 263 62.0 0 850 182 53.0 0 700 260 88.0 0 850 372 65.0 1 750 185 85.0 0 1000 395 95.0 0 1200 292 92.0 1 950 263 63.0 0 850 178 75.0 1 900 190 78.0 0 500 182 83.0 1 750 280 65.0 1 850 383 75.0 0 600 260 90.0 0 650 375 90.0 1 800 263 83.0 1 700 185 75.0 0 750 273 86.0 0 950 286 66.0 1 1500 393 63.0 0 1300 273 72.0 0 850 186 60.0 1 950 276 63.0 0 1100 196 86.0 0 750 271 75.0 1 1000 163 72.0 1 850 260 88.0 0 650 167 95.0 1 500 186 93.0 0 550 163 76.0 0 650 186 86.0 0 750 276 85.0 1 650 182 92.0 1 950 373 60.0 0 800 182 85.0 1 750 275 75.0 0 750 172 63.0 1 650 181 88.0 0 850 392 96.0 1 950 2;run;procprint;run;proclogistic;classx3;modely(ref='3')=x1x2x3x4/link=glogitaggregatescale=none;run;proclogistic;classx3;modely(ref='3')=x1x2x4/link=glogitaggregatescale=none;run;proclogistic;classx3;modely(ref='1')=x1x2x4/link=glogitaggregatescale=none;run;六.收獲與思考七.思考題當自變量是定性變量的時候,我們需要引進虛擬變量進行數量化,當定性變量有n個水平的時候,我們該引進多少的虛擬變量,否則會怎樣?不妨試試在sas中試試會出現什么問題。答:當定性變量有n個水平時應該引進n-1個虛擬變量。否則最后一個虛擬變量無法用最小二乘估計計算出來。例:X1-X3為虛擬變量。Dataa;inputx1x2x3xy@@;cards;1001.26751001.35771001.40781001.58820101.71650101.76660101.80680101.85700011.22680011.35690011.46700011.4472;procregdata=a;modely=x1-x3x;run;X3沒有參數估計結果。因為x1x2x3出現完全共線性,x1x2均為0時即代表了x3為1.表21iyx1公司類型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份表22序號h(m)y序號h(m)y11.500141.76121.520151.78031.540161.80141.560171.82051.581181.84061.600191.86171.620201.88181.640211.90091.660221.921101.681231.940111.700241.961121.720251.981131.740262.001表23序號專業課x1英語x2性別x3月生活費x4畢業去向y19565.01600226362.00850138253.00700246088.00850357265.01750168585.001000379595.001200289292.01950296363.008501107875.019001119078.005001128283.017502138065.018503148375.006002156090.006503167590.018002176383.017001188575.007502197386.009502208666.0115003219363.0013002227372.008501238660.019502247663.0011001259686.00
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論