Stata做logistic回歸_第1頁
Stata做logistic回歸_第2頁
Stata做logistic回歸_第3頁
Stata做logistic回歸_第4頁
Stata做logistic回歸_第5頁
已閱讀5頁,還剩31頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、應用應用Stata做做logistic回歸回歸何保昌何保昌 實際生活中經常會遇到因變量只有實際生活中經常會遇到因變量只有0和和1的二分類變量,的二分類變量,不能滿足正態性和方差齊性,故不能直接使用線性模型不能滿足正態性和方差齊性,故不能直接使用線性模型來擬合方程。來擬合方程。 Logistic回歸正是處理因變量是二分類或多分類變量的回歸正是處理因變量是二分類或多分類變量的一種方法?,F已廣泛應用于隊列研究,病例對照研究和一種方法。現已廣泛應用于隊列研究,病例對照研究和試驗性研究,成為分類因變量的首選多變量分析模型。試驗性研究,成為分類因變量的首選多變量分析模型。分類分類 按因變量性質,可分為二分

2、類、無序按因變量性質,可分為二分類、無序多分類、有序多分類。多分類、有序多分類。 按是否匹配可分為非條件和條件按是否匹配可分為非條件和條件logistic回歸?;貧w。 Stata軟件專門有一組命令用于做不同軟件專門有一組命令用于做不同類型的類型的logistic回歸,例如:回歸,例如:logit、blogit、glogit、clogit、mlogit、ologit。1.Logistic 回歸命令:命令:logit 因變量因變量 自變量自變量 ,選擇項選擇項在進行在進行logistic 回歸時要注意資料的形式。通常,回歸時要注意資料的形式。通常,用于用于logistic 回歸的資料有三種形式:回

3、歸的資料有三種形式:(1) 分水平頻數資料,一般自變量較少,且均為分分水平頻數資料,一般自變量較少,且均為分類變量,常以各變量類變量,常以各變量(包括因變量、自變量包括因變量、自變量)各水平各水平的組合的頻數表形式出現。如例的組合的頻數表形式出現。如例1。擬合時仍用上述。擬合時仍用上述命令,只是命令中增加命令,只是命令中增加fw=頻數變量頻數變量選擇項。選擇項。(2) 分組頻數資料,一般自變量較少,且均為分組頻數資料,一般自變量較少,且均為分類變量,常以各自變量分類變量,常以各自變量(不包括因變量不包括因變量)各各水平的組合的頻數表形式出現,因變量常表水平的組合的頻數表形式出現,因變量常表達為

4、分子與分母。如例達為分子與分母。如例2。用下列命令:。用下列命令:blogit 陽性數變量陽性數變量 總觀察數變量總觀察數變量 ,logit 命命令選擇項令選擇項或或 glogit 陽性數變量陽性數變量 總觀察數變量總觀察數變量 ,level(#) or(3) 個體水平資料,即一個觀察對象一條記錄。個體水平資料,即一個觀察對象一條記錄。如例如例3,直接使用,直接使用logit 命令估計即可。命令估計即可。擬合模型后可以用指令擬合模型后可以用指令predict 得到預測概率,得到預測概率,然后進行模型診斷、應用等。然后進行模型診斷、應用等。例例1 本例是探討婦女使用雌激素與患本例是探討婦女使用雌

5、激素與患子宮內膜癌之間關系的病例子宮內膜癌之間關系的病例-對照研對照研究資料,見表究資料,見表1,請計算,請計算OR 及其及其95可信區間。再可信區間。再用用logistic 回歸估計參數,寫出回回歸估計參數,寫出回歸方程,并說明回歸系數與歸方程,并說明回歸系數與OR 的關的關系。系。也可以用也可以用logit命令命令可以利用例可以利用例3做逐步回歸做逐步回歸Stata 用于逐步回歸分析的命令是在要執行的用于逐步回歸分析的命令是在要執行的命令前增加命令前增加sw 。osw 回歸命令回歸命令 因變量因變量自變量自變量, 篩選變量篩選變量的的P 值值 選擇項選擇項o其中,篩選變量的其中,篩選變量的

6、P 值有值有3 種組合種組合opr(#) /* 后退法后退法ope(#) /* 向前法向前法opr(#) pe(#) /* 逐步后退法逐步后退法opr(#) pe(#) forward /* 逐步向前法逐步向前法 pr(#)是剔除變量的P 值,pe(#)是選入變量的P 值,如果只選pr(#),則表示用后退法,如果同時選用pr(#)和pe(#)表示逐步法。應用時,為防止計算進入死循環,pr(#)須略大于pe(#)。例如,pe(0.05),pr(0.051)。1. 用逐步后退法,剔選變量的概率為:用逐步后退法,剔選變量的概率為:pe(0.05),pr(0.06),結果如,結果如下:下: sw lo

7、git y x1 x2 x3, pe(0.05) pr(0.06)2. 用逐步前進法,剔選變量的概率不用逐步前進法,剔選變量的概率不變變,結果如下:結果如下: sw logit y x1 x2 x3, pr(0.06) pe(0.05) forward條件條件logistic 回歸回歸非條件非條件logistic 回歸適用于平行組設計的病例回歸適用于平行組設計的病例-對對照研究,隊列研究,而不適用于配比設計的病例照研究,隊列研究,而不適用于配比設計的病例-對照研究。對于配比的病例對照研究。對于配比的病例-對照研究資料需要對照研究資料需要用條件用條件logistic 回歸。其命令為:回歸。其命令

8、為:oclogit 因變量因變量 自變量自變量 , group(配比變量配比變量) level(#) or o其中其中group()是必選項是必選項,它是用來區分各配比,它是用來區分各配比組的。組的。level(#)及及or 的意義同的意義同logit。例例4 在子宮內膜癌與使用雌激素關系的研究在子宮內膜癌與使用雌激素關系的研究中,運用了中,運用了1:4 的病例的病例-對照研究,配比因對照研究,配比因素為年齡,共調查了素為年齡,共調查了20 對,對,100 例例。各變量定義如下:各變量定義如下:1: match 配比組配比組2: y y=1:病例,:病例, y=0:對照:對照3: ht ht=

9、0:無高血壓,:無高血壓, ht=1:有高血壓:有高血壓4: est est=0 未使用過雌激素,未使用過雌激素, est=1:使用:使用過雌激素過雌激素5: dose 劑量:劑量:dose=0:未使用過,:未使用過, dose=1:0.1-0.299(mg/day)6: drug drug=0:未使用其他藥物,:未使用其他藥物, drug=1:使用了其他藥物:使用了其他藥物首先,使用首先,使用ht、est、drug 三個變量作條件三個變量作條件logistic 回歸。回歸。. clogit y ht est drug, group(match)o結果顯示,患高血壓結果顯示,患高血壓(ht)及

10、使用其他藥物及使用其他藥物(drug)與子宮內膜癌無關,而使用過雌激素與子宮內膜癌無關,而使用過雌激素者患子宮內膜癌的可能性比未使用過雌激素者者患子宮內膜癌的可能性比未使用過雌激素者大。因此,可以進一步考慮劑量大。因此,可以進一步考慮劑量-反應關系。變反應關系。變量劑量量劑量(dose)可以按兩種方法處理,先按線可以按兩種方法處理,先按線性形式進入模型,再以啞變量形式進入模型,性形式進入模型,再以啞變量形式進入模型,并比較兩者的結果。并比較兩者的結果。o clogit y ht dose drug, group(match)o結果顯示,隨著劑量的上升,服用結果顯示,隨著劑量的上升,服用雌激素與

11、患內膜癌間的聯系也明顯雌激素與患內膜癌間的聯系也明顯上升,呈現出明顯的劑量反應關上升,呈現出明顯的劑量反應關系。這種關系是否為線性的?系。這種關系是否為線性的?dose 用啞變量形式是否更好?用啞變量形式是否更好?oxi : clogit y ht i.dose drug, group(match)多類結果的多類結果的logistic回歸回歸在醫學研究中,常常會遇到結果變在醫學研究中,常常會遇到結果變量是多分類的情況,如同一種腫量是多分類的情況,如同一種腫瘤的不同亞型;病例瘤的不同亞型;病例-對照研究對照研究中的一個對照組,兩個或多個病中的一個對照組,兩個或多個病例組;或一個病例組,兩個或多例

12、組;或一個病例組,兩個或多個對照組,如醫院對照和健康人個對照組,如醫院對照和健康人群對照等。群對照等。用于多類結果的用于多類結果的logistic 回歸的命回歸的命令是令是mlogit。mlogit 因變量因變量 自變量自變量 , base (#) constraints(clist) level(#) rrr 例例5 產后大出血分為兩大類:即宮縮乏力性產后大出血分為兩大類:即宮縮乏力性(稱為子宮因素稱為子宮因素)及胎盤因素。在產后大出血及胎盤因素。在產后大出血與有無妊高癥與有無妊高癥x1及有無人流史及有無人流史x2的關系研的關系研究中,將產后出血量究中,將產后出血量400ml的作為病例,并分

13、的作為病例,并分為上述兩類,共調查了為上述兩類,共調查了933人,其中子宮因人,其中子宮因素出血的素出血的155人,胎盤因素出血的人,胎盤因素出血的33人,人,對照對照745人。結果見表人。結果見表5。本例,結果變量為:本例,結果變量為:y=0 為對照為對照(C類類)y=1 為宮縮乏力性產后大出血為宮縮乏力性產后大出血(A類類)y=2 為胎盤因素產后大出血為胎盤因素產后大出血(B類類)。mlogit y x1 x2 fw=count, rrr同一變量在不同的同一變量在不同的logit函數中的效應可函數中的效應可能相同,亦可能不同,這可以通過能相同,亦可能不同,這可以通過test命命令來檢驗。令來檢驗。test 1x1=2x1test 1x2=2x2有序結果的累積比數有序結果的累積比數logistic回歸回歸用于有序結果的用于有序結果的logistic 回歸的命令是回歸的命令是ologit。ologit 因變量因變量 自變量自變量 ,table level(#)o其中選擇項其中選擇項table用于指定打印出各類用于指定打印出各類的概率;的概率;level用于指定顯著性水平用于指定顯著性水平例例6 南通醫學院陳佩珍教授研究了兒童智商南通醫學院陳佩珍教授研究了兒童智商等級與其母親文化程度的關

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論