廣義線性模型_第1頁
廣義線性模型_第2頁
廣義線性模型_第3頁
廣義線性模型_第4頁
廣義線性模型_第5頁
已閱讀5頁,還剩19頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

廣義線性模型第1頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜2明確兩個概念:線性模型(linearmodel),也稱經典線性模型(classicallinearmodel)或一般線性模型(generallinearmodel,GLM)。廣義線性模型(generalizedlinearmodel,GENMOD)是一般線性模型的直接推廣,由Nelder&Wedderburn(1972)首先提出。第2頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜3SAS軟件中的PROCGLM:PROCGLManalyzesdatawithintheframeworkofgenerallinearmodels.PROCGLMhandlesmodelsrelatingoneorseveralcontinuousdependentvariablestooneorseveralindependentvariables.Theindependentvariablesmaybeeitherclassificationvariablesorcontinuousvariables.

Thus,theGLMprocedurecanbeusedformanydifferentanalyses,includingsimpleregressionmultipleregressionanalysisofvariance(ANOVA),especiallyforunbalanceddataanalysisofcovarianceresponse-surfacemodels(響應面模型)weightedregressionpolynomialregression(多項式回歸)partialcorrelationmultivariateanalysisofvariance(MANOVA)repeatedmeasuresanalysisofvariance第3頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜4TheGENMODProcedureTheGENMODprocedurefits

generalizedlinearmodels.Theclassofgeneralizedlinearmodelsisanextensionoftraditionallinearmodelsthatallowsthemeanofapopulationtodependonalinearpredictorthroughanonlinearlinkfunctionandallowstheresponseprobabilitydistributiontobeanymemberofanexponentialfamilyofdistributions.Manywidelyusedstatisticalmodelsaregeneralizedlinearmodels.Theseincludeclassicallinearmodelswithnormalerrors,logisticandprobitmodelsforbinarydata,andlog-linearmodelsformultinomialdata.Manyotherusefulstatisticalmodelscanbeformulatedasgeneralizedlinearmodelsbytheselectionofanappropriatelinkfunctionandresponseprobabilitydistribution.SAS軟件中的PROCGENMOD:第4頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜5一、何為“廣義線性模型”?廣義線性模型(generalizedlinearmodel)由Nelder&Wedderburn(1972)首先提出,是一般線性模型的直接推廣,它使因變量的總體均值通過一個非線性連接函數(linkfunction)而依賴于線性預測值,同時還允許響應概率分布為指數分布族中的任何一員。許多廣泛應用的統計模型均屬于廣義線性模型,如logistic回歸模型、Probit回歸模型、Poisson回歸模型、負二項回歸模型等。第5頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜6指數分布族的概率密度(概率函數)可表示為:其中,和為兩個參數,稱為自然參數,為離散參數;a、b、c為函數。第6頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜7第7頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜8一個廣義線性模型包括以下三個組成部分:(1)線性成分(linearcomponent):(2)隨機成分(randomcomponent):(3)連接函數(linkfunction):連接函數為一單調可微(連續且充分光滑)的函數。何為“廣義線性模型”?(續)第8頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜9第9頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜10SAS9.0GENMOD過程中所整合的響應變量分布類型第10頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜11廣義線性模型在兩個方面對經典線性模型進行了推廣:(1)一般線性模型中要求因變量是連續的且服從正態分布,在廣義線性模型中,因變量的分布可擴展到非連續的資料,如二項分布、Poisson分布、負二項分布等。(2)一般線性模型中,自變量的線性預測值就是因變量的估計值,而廣義線性模型中,自變量的線性預測值是因變量的函數估計值。何為“廣義線性模型”?(續)第11頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜12包括:多元線性回歸模型

logistic回歸模型

Probit回歸模型

Poisson回歸模型負二項回歸模型

廣義線性模型的一般形式:何為“廣義線性模型”?(續)第12頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜13Generalizedlinearmodels(廣義線性模型)FamilyofregressionmodelsOutcomevariabledetermineschoiceofmodel

UsesControlofconfoundingModelbuilding,riskpredictionOutcome ModelContinuous LinearregressionBinomial LogisticregressionSurvival CoxmodelCounts Poissonregression第13頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜14二、廣義線性模型的參數估計廣義線性模型的參數估計一般不能用最小二乘估計,常用加權最小二乘法(weightedleastsquared,WLS)或最大似然法(maximumlikelihood)估計。各回歸系數需用迭代方法求解。求得后,用下式估計:第14頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜15二、廣義線性模型的參數估計(續)第15頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜16Log-likelihoodfunctions第16頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜17Log-likelihoodfunctions第17頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜18Log-likelihoodfunctions第18頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜19Log-likelihoodfunctions第19頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜20三、廣義線性模型的假設檢驗

廣義線性模型的檢驗一般用似然比檢驗、Wald檢驗和記分檢驗。模型的比較用似然比檢驗。(1)似然比檢驗:似然比檢驗是通過比較兩個相嵌套模型(如模型P嵌套于模型K內)的對數似然函數來進行的,其統計量G為:其中,模型P中的自變量是模型K中自變量的一部分,另一部分就是要檢驗的變量。這里G服從自由度為K-P的2分布。模型P的對數似然函數模型K的對數似然函數第20頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜21Likelihoodratiostatistic(似然比統計量)Comparestwonestedmodels

g()=+1x1+2x2+3x3+4x4(model1)g()=+1x1+2x2(model2)LRstatistic-2log(likelihoodmodel2/likelihoodmodel1)=[-2log(likelihoodmodel2)]-

[-2log(likelihoodmodel1)]LRstatisticisa2withDF=numberofextraparametersinmodel三、廣義線性模型的假設檢驗(1)似然比檢驗(續)第21頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜22三、廣義線性模型的假設檢驗(續)(2)回歸系數的Wald檢驗:

Wald檢驗是通過比較估計系數與0的差別來進行的,其檢驗統計量為:或這里,z為標準正態變量。參數的可信區間如下計算:第22頁,共24頁,2023年,2月20日,星期四2010-4-15山東大學公共衛生學院:劉靜23三、廣義線性模型的假設檢驗(續)(3)比分(Score)檢驗:以未包含某個或某幾個變量的模型為基礎,保留模型中參數的估計值,并假設新增加的參數之系數為0,計算似然函數的一階偏導數(又稱有效比分)及信息矩陣,兩者相乘即為比分檢驗統計量S。當樣本含量較大時,S的分布近似服從2分布,自由度為檢驗的參數個數。第23頁,共24頁,2023年,2月20日,星期四2010-4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論