多元統計方法講義_第1頁
多元統計方法講義_第2頁
多元統計方法講義_第3頁
多元統計方法講義_第4頁
多元統計方法講義_第5頁
已閱讀5頁,還剩76頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、我們要討論的是我們要討論的是多元統計方法多元統計方法建立方程的計算量很大,一般需軟件完成。前人手工計算這兩種回歸(借助科學計算器),精神可嘉80 年代,一個Logistic回歸即使用計算機,計算的時間也以天計。調整或控制調整或控制單因素分析有意義,多因素沒有意義的解釋單因素分析有意義,多因素沒有意義的解釋指標多,難以理解。在計算自動化時代,這是回歸的難點,我們不懂如何判斷我們的模型的好壞回歸的實際應用回歸的實際應用SPSS菜單菜單(1)自變量為連續型變量 :必要時作變換(2)自變量為有序變量:依次賦值,如療效好中差,可分別賦值3、2、1(3)自變量為二分類:如令男1,女0(4)自變量為名義分類

2、:需要采用啞變量(dummy variables)進行編碼 假如職業分類為工、農、商、學、兵5類,則可定義比分類數少1個,即4個啞變量。編碼方法如下:數據格式數據格式回歸的一些定義回歸的一些定義yi=b0+b1x1i+b2x2i+bnxni回歸方程的建立回歸方程的建立將回歸方程中的所有自變量作為一個整體來檢驗他們于應變量之間是否具有線性關系,P0.05,說明所擬合的方程具有統計學意義,但并不說明模型擬合的好壞各自變量的假設檢驗與評價,檢驗各自變量和應變量是否有線性關系,P(可放寬)說明有線性關系,同樣t值不說明線性關系的強弱,這樣,一個回歸方程就建立了,回歸方程的建立就是如此easy。線性與擬

3、合優度線性與擬合優度全局擇優法的模型為最佳接近提出年殘殘殘殘1)p()2()()(1()2()()(MallowsCL1964pmpmppCpnMSMSpnpnMSSSCCp準則的計算公式準則的計算公式準則的計算公式越小越好最小二乘法年由日本學者赤池提出AICpSnpnnAICpy)(2/ )ln(1973212.自變量到底如何選擇自變量到底如何選擇不同準則、方法得出的“最優”方程不同;不同的引入、剔除標準獲得的“最優”方程不同;方程還受數據的正確性、共線性影響強影響點,記錄的選擇強影響點,記錄的選擇變量記錄強影響點,記錄的選擇強影響點,記錄的選擇判斷強影響點的指標判斷強影響點的指標判斷強影響

4、點的指標(判斷強影響點的指標(2)距1越遠,越是強影響點其余指標絕對值越大越是強影響點 自變量間存在著線性關系,使一個或幾個自變量可以由另外的自變量線性表示時,稱為該變量與另外的自變量間存在有共線性(collinearity)。容易出現:回歸系數的符號與由專業知識不符變量的重要性與專業不符整個方程決定系數R2高,但各自變量對應的回歸系數均不顯著。多重共線性的診斷多重共線性的診斷Spss的實現與結果的實現與結果實例實例從第四個特征根看,特征根小,條件指數大,從變量的方差比例來看,SBP和DBP在其中貢獻最大,可以說兩者有近似共線性不過兩者的共線性對方程的影響并不大容許度越近于0共線性越大,等于0

5、,完全共線復制的BMI根本無法進入方程后面討論交互作用的時候我們還要提到共線性影響因素分析,控制混雜因素預測:由自變量值推出應變量Y的值控制:指定應變量Y的值查看自變量的改變量在醫學研究中最為長用,個人認為在醫學研究中最為長用,個人認為對模型擬合要求較低,特別在對模型擬合要求較低,特別在控制混雜的控制模式中控制混雜的控制模式中后兩種用途對模型要求嚴格回歸系數符號反常與主要變量選不進方程回歸系數符號反常與主要變量選不進方程的原因分析的原因分析線性回歸的注意事項線性回歸的注意事項共線性很大回歸的發展回歸的發展Logistic回歸回歸二、 Logistic回歸模型26例冠心病病人和例冠心病病人和28

6、例對照者進行例對照者進行病例病例 對照研究(變量賦值表)對照研究(變量賦值表) 有統計學家持反對意見認為損失信息26例冠心病病人和例冠心病病人和28例對照者進行例對照者進行病例病例 對照研究(數據格式)對照研究(數據格式) Logistic回歸方程的建立回歸方程的建立建立方程就是求解b0,b1bp參數意義參數意義回歸系數的意義iibbus()ibibuse參數估計參數估計似然函數計算方法最大似然法迭代法1. 初始值2. 迭代次數3. 人為精度4. 可能不收斂5. 總體來說,解比6. 較穩定。SPSS的實現的實現analyze-regression-binary logistic-option模

7、型擬合優度指標,2值越小,P值越大表明模型越好迭代過程,可以監察方程計算的過程參數估計的相關矩陣,每步各協變量的零級相關系數(簡單相關系數)均小(,說明 Logistic方程總體有意義,借用線性的 解釋來說將回歸方程中的所有自變量作為一個整體來檢驗他們于應變量之間是否具有關系,P0.05,說明所擬合的方程具有統計學意義,但并不說明模型擬合的好壞:真正的模型擬合一般要把其提高到0.20或0.10而非0.05。結果結果3結果結果4參數估計的相關矩陣,每步各協變量的零級相關系數(簡單相關系數)均小(0.80),提示各協變量間相互獨立至此,一個最簡單logistic方程建立和檢驗告一段落,下面涉及和自

8、變量的篩選自變量的篩選全局擇優指標全局擇優指標逐步選擇法三種向前法,協變量引入檢驗均基于score統計量刪除變量基于條件估計的似然比刪除變量基于最大偏似然估計似然比刪除變量基于Wald統計量似然比檢驗(likehood ratio test)iibbu =siibbus由于軟件的計算相對容易,可以多種方法比較,結果多數一致,如果不一致,也均發生在臨近界值的變量上,這些變量在方程中本身對應變量的影響就不大,在實際中對研究的影響也較小。尋找強影響點,記錄的選擇尋找強影響點,記錄的選擇分類自變量的啞變量編碼 為了便于解釋,對二項分類變量一般按0、1編碼,一般以0表示陰性或較輕情況,而1表示陽性或較嚴

9、重情況。如果對二項分類變量按+1與-1編碼,那么所得的, 容易造成錯誤的解釋。 )2exp(OR西、中西、中三種療法啞變量化西、中西、中三種療法啞變量化其它中西其它西012011XX原資料原資料啞變量化啞變量化00100121中中西西療法XXSpss中亞變量的設置中亞變量的設置亞變量的亞變量的SPSS處理菜單處理菜單亞變量的亞變量的SPSS處理菜單(二)處理菜單(二)亞變量設置(亞變量設置(Spss)參照分類為0,其余為1,即各分類與參照分類比較除第一類分類外,各分類與其之前平均分類效應比較亞變量設置亞變量設置(2)Sas統計軟件所得的結果解釋與spss相似七、條件Logistic回歸i1 12 2logit P=bkkbxb xb x1 12 2logit P=bk k

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論