單因素分析-定性資料2013.3.26_第1頁
單因素分析-定性資料2013.3.26_第2頁
單因素分析-定性資料2013.3.26_第3頁
單因素分析-定性資料2013.3.26_第4頁
單因素分析-定性資料2013.3.26_第5頁
已閱讀5頁,還剩39頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

流行病學系廖巍單因素分析-定性資料第一部分:背景知識復習idagesmokeracelowbwt123030275023611028773261112350419020370052501035006211312200………………………………研究假設:母親的吸煙史是否與嬰兒發生低出生體重有關聯?χ2檢驗如果有關聯:吸煙母親生出低出生體重嬰兒的風險是不吸煙母親的多少倍?計算RR或者OR值及相應的可信區間(95%CI)流行病學資料的四格表形式病例對照合計暴露aba+b非暴露cdc+d合計a+cb+dn=a+b+c+d暴露:研究對象接觸過某種物質、具備某種待研究的特征或行為。擴展->R×C列聯表雙向無序單向有序雙向有序母親的吸煙史是否與嬰兒發生低出生體重有關聯?將資料整理成四格表形式:H0:π1=π2(兩樣本總體的率相等)H1:π1≠π2

(兩樣本總體的率不等)χ2檢驗的基本思想病例對照合計低出生體重率(%)吸煙30(23.10)a44(50.90)b74(a+b)40.54π1=a/(a+b)不吸煙29(35.90)c86(79.10)d115(c+d)25.22π2=c/(c+d)合計59(a+c)130(b+d)189(n=a+b+c+d)31.22π=(a+c)/n四格表χ2統計量的校正R×C列聯表χ2統計量的校正1≤T<5格子數不超過1/5且沒有格子T<1超過1/5格子數1≤T<5,或有格子T<1:增加樣本量;專業允許情況下,將理論頻數過小的行或列與性質相近的鄰行或鄰列合并;刪除理論頻數過小的行/列;無序R×C表用確切概率法。關聯強度的計算隊列研究:相對危險度(RelativeRisk,RR)暴露組發病率與非暴露組發病率之比病例-對照研究:比值比(OddsRatio,OR)病例組的暴露比值=對照組的暴露比值=病例組的暴露比值與對照組的暴露比值之比RR(OR)值的含義RR(OR)=1暴露與疾病無關聯

RR(OR)>1暴露與疾病正向關聯暴露是疾病的危險因素RR(OR)<1暴露與疾病負向關聯

暴露是疾病的保護因素RR(OR)值的95%可信區間(CI)含義若RR(OR)的95%CI包含1該RR(OR)值在α檢驗水平上無顯著性若RR(OR)的95%CI不包含1該RR(OR)值在α檢驗水平上有顯著性第二部分:主要SAS程序介紹過程步介紹數據步介紹SAS過程步介紹FREQ過程:產生一維至多維頻數表計算表中格子的理論頻數、構成比和各種率對分類變量資料作相應的假設檢驗FREQ過程使用的語句PROCFREQ<選擇項>;TABLES

請求式/<選擇項>;WEIGHT

<變量名>;/*分析原始庫不用寫,分析頻數表必須寫*/RUN;TABLES語句TABLES

請求式/<選擇項>;請求式:要求FREQ過程分析處理的一維或多維表的清單一維表:tablesa;

由一個變量名表示;二維表:tablesa*b;由“*”連接兩個變量名表示。a-行變量;b-列變量

三維表:tablesa*b*c;由“*”連接三個變量名表示。a-分層變量;b-行變量;c-列變量……以此類推每個FREQ過程可以有多個TABLES語句每個TABLES語句有多個請求式procfreqdata=bw;tables

low;run;procfreqdata=bw;tables

smokelow;run;TABLES請求式--以lbw.dbf數據庫為例一維表格一維表格-多個請求式procfreqdata=bw;tables

race*smoke*low;run;procfreqdata=bw;tables

smoke*low;run;二維表格三維表格-分層TABLES語句常用選擇項:TABLES請求式…/<選擇項>;CHISQ:Pearsonχ2檢驗似然比χ2檢驗Mantel-

Haenszel

χ2檢驗2×2表計算Fisher精確概率EXACT:對大于2×2的表,計算Fisher精確概率檢驗AGREE:配對資料MEASURES:2×2表,提供OR、RR和相應的可信區間。R×C表,衡量變量間的關系,計算Pearson和Spearman相關系數等CMH:分層分析2×2

表,提供OR、RR和相應的可信區間。R×C列聯表,單向有序R×C列聯表,雙向有序ALL:=CHISQ+MEASURES+CMHEXPECTED:在獨立性假設下,單元格頻數的期望值(T)低出生體重正常體重合計吸煙304474不吸煙2986115合計59130189四格表資料dataa1;inputsmokelowcount@@;cards;1130104401290086;run;dataa2;dosmoke=1to2;dolow=1to2;inputcount@@;output;end;end;cards;30442986;run;smokelow001011000011000001…………數據庫資料行變量(R)、列變量(C)、頻數變量(F)或DO/END循環語句;里層優先循環;循環控制變量大于終值時終止output;SAS數據步介紹數據集形式根據四格表建立數據集需要幾個變量?數據集形式dataa2;dosmoke=1to2;dolow=1to2;inputcount@@;output;end;end;cards;30442986;run;procfreq;weightcount;tablessmoke*low;run;低出生體重正常體重合計吸煙304474不吸煙2986115合計59130189未使用output語句使用output語句Xdataa1;inputsmokelowcount@@;cards;1130104401290086;run;procfreq;weight

count;tablessmoke*low;run;procfreq;tablessmoke*low;run;正確輸出的表格未使用weight語句建立的數據集要在過程步中通過WEIGHT

<變量名>;給頻數變量加權!!!WEIGHT語句dataa1;inputsmokelowcount@@;cards;1130104401290086;run;procfreq;weightcount;tablessmoke*low;run;procfreqorder=data;weightcount;tablessmoke*low;run;低出生體重正常體重合計吸煙304474不吸煙2986115合計59130189第三部分:SAS分析實例常見單因素定性資料類型2×2列聯表配對資料精確概率法分層分析R×C列聯表某個病例對照研究擬探討“母親首次分娩的年齡與母親乳腺癌發病是否存在關聯”。研究中將母親首次分娩的年齡大于或等于30歲設定為暴露組,低于30歲設定為非暴露組。結果如下:探討首次分娩時年齡與乳腺癌是否存在關聯?2×2列聯表建立SAS數據集dataaa1;inputagecasecount;cards;11683

121498

212537

228747;run;dataaa2;doage=1to2;do

case=1to2;inputcount@@;output;end;end;cards;683149825378747;run;SAS過程步procfreqdata=aa1;tablesage*case/chisq;weightcount;run;procfreqdata=aa1;tablesage*case/expected;weightcount;run;procfreqdata=aa1;tablesage*case/measures;weightcount;run;procfreqdata=aa1;tablesage*case/all;weightcount;run;procfreqdata=aa1;tablesage*case;weightcount;run;某研究者隨機選取565名調查對象,其中血壓偏高者80名,血壓正常者485名,經多年追蹤得到下表資料。試分析當初血壓情況對調查對象后來否患冠心病可能造成什么樣的影響?2×2列聯表-練習1冠心病非冠心病血壓偏高1961血壓正常20465隊列研究配對資料公式及應用條件-McNemar檢驗b+c>40b+c<40乙法甲法+-+ab-cd配對資料例2:某醫院對168例痢疾標本同時用SPAIF法和培養法(金標準)進行檢驗,用以分析兩種方法的檢驗結果之間的差別有無顯著性意義,結果如下表。問:兩種方法在檢驗培養痢疾菌結果方面是否有差異?SAS過程步建立SAS數據集databb;doa=1to2;dob=1to2;inputcount@@;output;end;end;cards;64402044;run;procfreqdata=bb;tablesa*b/agree;weightcount;run;用兩種不同方法對53例肺癌患者進行診斷,結果見下表。問:兩種方法的檢測結果有無差別?配對資料-練習2甲法乙法合計+-+25227-111526合計361753SAS過程步建立SAS數據集datalx2;doa=1to2;dob=1to2;inputcount@@;output;end;end;cards;2521115;run;/*b+c<40校正公式*/procfreqdata=lx2;tablesa*b;exactMCNEM;weightcount;run;procfreqdata=lx2;tablesa*b/agree;weightcount;run;應用條件:理論頻數T<1

或者資料總例數n<40

例3:研究三種藥物治療某病的結果,由于是少見疾病,所以例數很少(見下表)問三種藥物治療效果有無差別?精確概率法(R×C表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論