




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1SAS—統計分析系統StatisticalAnalysisSystem寧夏醫科大學公共衛生學院流行病與衛生統計學系李吳萍2第一節SAS軟件簡介1966年美國NorthCarolina州立大學的兩位生物統計學研究生開始研制SAS系統,直至1976年成立了SAS軟件研究所,正式推出了SAS軟件,1985年推出微機版SAS。SAS是用于決策支持的大型集成信息系統,軟件系統最早的功能限于統計分析,逐漸成為一個用來管理、分析數據和編寫報告的大型集成應用軟件系統,具有完備的數據訪問、管理、分析、呈現及應用開發等功能,完全超出了單純統計應用的功能。屬于世界領先,使用最為廣泛的統計軟件之一。3由于SAS系統是從大型機上的系統開展而來,在設計上也是完全針對專業用戶進行設計,因此操作以SAS語言編程為主,另外也有非編程方式的菜單系統,但人機對話的界面不太友好。學習SAS軟件時,需要用戶有根本的統計學知識,對所選用的統計方法有較清楚的了解,沒有統計學根底知識要掌握SAS軟件較為困難。4SAS系統是一個模塊化的組合軟件系統,它提供了約20多個模塊,各個模塊之間既相互獨立又相互交融補充。本課程用得最多的是BaseSAS模塊和SAS/STAT模塊。BaseSAS是SAS系統的根底。它既可以單獨使用,也可以與其他模塊組成一個用戶化的SAS系統,但是其他模塊必須與之結合起來才能使用。BaseSAS主要承擔著數據及用戶使用環境的管理、SAS語言程序的處理,并具有根本的數據分析和報告等統計功能。5SAS/STAT提供了當今流行的主要統計分析方法,是國際上統計分析領域的標準權威軟件。它具有回歸分析、方差分析、屬性數據分析、多元分析、聚類分析、判別分析、非參數分析、生存分析和心理測量分析等統計功能。6第二節SAS軟件的使用根底一、SAS的啟動和退出
啟動SAS雙擊桌面SAS圖標開始菜單程序TheSasSystemTheSasSystemforWindowsV*.*直接雙擊SAS應用程序退出SAS標題欄關閉按鈕菜單欄FileExit7
標題欄、菜單欄、工具欄Editor程序編輯器窗口LOG 運行過程日志窗口 Output結果輸出窗口Explorer資源管理器窗口Results結果索引窗口三個窗口間切換F4Recall(調回程序)F5Editor(程序)F8Submit(發送程序)F6LOG(日志)F1Help(幫助)F7Output(結果)F9Keys(功能鍵列表)二、SAS的工作窗口SAS常用功能鍵8第二節SAS軟件的使用根底9Editor窗口主要用于翻開SAS程序文件〔*.sas〕、編輯和修改SAS程序、并提交全部或局部SAS程序。LOG窗口 顯示有關的SAS會話和提交SAS程序的信息,包括程序的出錯信息等〔*.log)Output窗口主要顯示提交SAS程序后的運行結果〔*.lst〕Explorer窗口主要用于查看和管理所有SAS文件,而且可以對非SAS文件創立快捷方式。Results窗口主要用于操作和管理提交SAS程序后的輸出結果。他的內容與Output窗口的內容一一對應,可以看成是Output窗口內容的名稱。二、SAS的工作窗口10第三節SAS語言的語句和程序一、SAS語句一個SAS語句就是要求SAS系統執行某種操作或給SAS系統提供一些信息的命令。SAS語句通常由SAS關鍵字、SAS名稱、運算符及特殊字符組成。規那么:〔1〕以;結尾〔2〕以SAS關鍵字開始。如:data,proc,input,cards,model,class,if,keep,set,run11第三節SAS語言的語句和程序一、SAS語句〔3〕注釋語句可以用*開始,或者用/*…*/表示中間內容是注釋語句。例Datasas1_1;/*sas1_1是數據集名*/Inputidname$heightweight@@;Bmi=weight/height**2;Cards;/*數據流開始*/1judy1.56452lucy1.67533lili1.5850;/*數據流結束*/Procprintdata=sas1_1;Run;12第三節SAS語言的語句和程序一、SAS語句關鍵字幾乎所有的SAS語句都是由SAS關鍵字開始的,說明SAS語句的類型。data語句,input語句,proc語句,run語句數據集名和變量名〔1〕32個字符之內,〔2〕第一個字母必須為字母或_;第二個以后可以為字母或數字。〔3〕字母不區分大小寫。〔4〕不能使用空格和%¥#$等特殊字符13第三節SAS語言的語句和程序一、SAS語句運算符包括比較運算、算術運算、邏輯運算〔1〕算數運算符+-*/**〔2〕比較運算符=^=>>=<<=〔3〕邏輯運算符and/&邏輯與x>2andy>3or/|邏輯或x>2ory>3Not/^邏輯非<>最大3<>5;結果為5><最小3><5;結果為3||連接A=‘mynameis’;B=‘SAS’;C=A||B;那么C=“mynameisSAS〞14第三節SAS語言的語句和程序一、SAS語句函數函數的一般形式:函數名〔自變量,自變量,…〕(1)SAS常用的概率和密度函數標準正態分布密度函數:probnorm(x)如:y=probnorm(-1.96);結果為t分布密度函數:probt(x,df)如:y1=probt(0.95,100);結果為F分布密度函數:probF(x,df1,df2)χ2分布密度函數:probCHI(x,df)二項分布概率函數:probBNML(p,n,m)泊松分布概率函數:poisson(m,n)15第三節SAS語言的語句和程序正態分布分位數函數:probit(p)0≤p≤1
如:y=probit(0.025),結果為t分布分位數函數:TINV(p,df)F分布分位數函數:FINV(p,df1,df2)χ2分布分位數函數:CINV(p,df)其它常用函數ABS(x)-----取X的絕對值SQRT(x)-----計算X的平方根MOD(x,y)-----求x/y的余數16第三節SAS語言的語句和程序EXP(x)----計算e的x次冪LOG(x)-----對自變量x求以e為底的自然對數LOG10(x)-----對自變量x求以10為底的對數CEIL(x)-----取≥自變量x的最小整數。如CEIL(5.7)=6FLOOR(x)-----取≤自變量x的最大整數。如CEIL(5.7)=5INT(x)-----取X的整數局部ROUND(x,n)----X按n的精度取舍入值17第三節SAS語言的語句和程序datasas1_2;y1=probnorm(-1.96);/*標準正態分布密度函數*/y2=probt(0.95,100);/*t分布密度函數*/y3=probit(0.025);/*正態分布分位數函數*/x1=log10(100);/*對自變量x求以10為底的對數*/x2=exp(2);/*計算e的x次冪*/x3=CEIL(5.7);/*取≥自變量x的最小整數*/x4=ABS(-8);/*取X的絕對值*/x5=SQRT(36);/*計算X的平方根*/x6=MOD(10,3);/*求x/y的余數*/x7=FLOOR(5.7);/*取≤自變量x的最大整數*/x8=INT(5.6874);/*取X的整數局部*/x9=ROUND(5.4874,0.001);/*X按n的精度取舍入值*/A='mynameis';B='SAS';C=A||B;procprintdata=sas1_2;run;18第三節SAS語言的語句和程序二、SAS程序將一系列SAS語句按邏輯順序排列起來,構成SAS程序。通常包括數據步和過程步兩局部。數據步以data語句開頭,以run語句結束。主要作用是建立數據集。過程步以proc開頭,以run語句結束。主要作用是激活SAS過程對數據進行處理和分析。提交SAS程序:〔1〕工具欄提交圖標,〔2〕run/submit,〔3〕使用F3功能鍵19第三節SAS語言的語句和程序二、SAS程序程序的儲存:〔1〕鍵入“file‘路徑+文件名.擴展名〞如:file‘d:\user\sas1-1.sas\’;〔2〕“文件〞菜單—“保存〞程序的調用:〔1〕鍵入infile‘路徑+文件名+擴展名’如:infile‘d:\user\sas1-1.sas\’;〔2〕“文件〞菜單—“翻開〞20第三節SAS語言的語句和程序例1.3SAS程序舉例datasas1_3;/*創立名為sas1_3的SAS數據集*/Inputidnam$heightweight;bmi=weight/height**2;cards;1Judy1.5645/*數據流中每個數據值之間最少有1各空格*/2Lucy1.6753;run;/*數據步結束*/procprintdata=sas1_3;/*顯示輸出sas1_3數據集到output窗口*/run;/*過程步結束*/21第二章建立SAS數據集第一節SAS數據集概述一、SAS數據集根本格式SAS數據集可以看做由假設干行和假設干列組成的表格,一個數據集等價于關系型數據庫中的一個表。idnameheightweight1Judy156452Lucy167533Susan156554tony17870變量觀測變量有兩種類型:數值型變量字符型變量22第二章建立SAS數據集第一節SAS數據集概述一、SAS數據集根本格式例2_1缺失值的例子Datasas2_1;Inputidname$heightweight@@;Ifname='999'thenname=.;Ifweight=999thenweight=.;Cards;1Judy1569992Lucy167583999165554Tomy17862;Procprintdata=sas2_1;run;23第二章建立SAS數據集二、臨時SAS數據集和永久SAS數據集臨時數據集只能在SAS會話過程中創立使用,一旦退出SAS,數據集就不存在了。在Explorer窗口中可以看到一個名為work的SAS數據庫,主要存放SAS臨時數據集。創立時可以用兩水平命名方式:如work.數據集名,也可以用一水平的命名方式:如數據集名。24二、臨時SAS數據集和永久SAS數據集永久性數據集儲存在硬盤里,因此,在以后的每一次SAS會話中都可以在翻開。在創立和使用SAS永久性數據集之前,需要先建立一個SAS數據庫來制定永久數據集存放的路徑。一個SAS數據庫相當于硬盤上的一個文件夾,可以將SAS數據集寫入或讀出。命名永久性數據集時必須用兩水平的命名方式,即數據庫名.數據集名,數據庫名實際是一個SAS數據庫的邏輯名。第二章建立SAS數據集25例2_2SAS程序舉例libnametj‘d:\user\’;/*創立名為tj的sas數據庫*/datatj.sas2_2;/*創立永久性數據集sas2_2,保存在‘d:\user’下*/Inputidname$heightweight;bmi=weight/height**2;cards;1Judy1.56452Lucy1.6753;run;procprintdata=tj.sas2_2;/*將保存在’d:\user’的數據集sas2_2顯示輸出到output窗口*/run;第二章建立SAS數據集26第二章建立SAS數據集第二節SAS數據集的建立一、用數據步創立SAS數據集創立SAS數據集最主要的方式是使用BaseSAS中的數據步。一個SAS數據步由data語句開始,后面接著其他程序語句,通過從原始數據文件中讀入數據或對已存在的SAS數據集進行操作來建立新的SAS數據集。在SAS程序中,用戶可以使用不同的來源輸入數據。常用的數據輸入來源包括:〔1〕原始數據以數據流的方式;〔2〕原始數據以外部文件的方式;〔3〕已經存在的SAS數據集;〔4〕通過程序語句來建立數據集。271、從數據流中讀入數據在SAS程序中,用cards語句定義數據流的開始。Input語句用于從數據流中讀入數據。28例2.3從數據流讀入數據建立數據集datasas2_3;/*創立名為sas2_3的SAS數據集*/Inputidname$heightweight@@;/*從數據流中讀入數據*/cards;1Judy156452Lucy167533Susan165554tony17870;run;/*數據步結束*/procprintdata=sas2_3;/*顯示輸出sas2_3數據集到output窗口*/run;/*過程步結束*/292、從外部文件中讀入數據Infile語句用來指定外部文件,通常外部文件并不是SAS文件。用input語句將外部文件中的數據讀入SAS中建立SAS數據集。外部文件中的記錄可以按一個變量一列的方式排列,也可以沒用格式,不安列方式排列。30例2.4從外部文件讀入數據外部文本文件’k:\user\student.txt’1Judy1.56452Lucy1.67533Susan1.65554tony1.7870SAS程序:Datasas2_4;Infile‘d:\user\student.txt\’;/*指定外部文件*/Inputidname$heightweight;/*從外部文件中讀取記錄*/Run;Procprintdata=sas2_4;Run;313、從SAS數據集中讀入數據用set語句可以從已有的SAS數據集中創立新的數據集。運行set語句,SAS會從已有的SAS數據集中讀入觀測,包括原始數據集中的所有變量,還可以在原數據集變量根底上創立新的變量。32例2.5從已有的SAS數據集中讀入數據Datasas2_5;setsas2_4;/*從已有的數據集sas2_4中讀入數據*/Bmi=weight/height**2;/*生成一個新變量*/Run;Procprintdata=sas2_5;Run;33例2.6利用程序語句建立SAS數據集Datasas2_6;Doi=1to10;/*do與end語句之間的語句被重復執行10次*/Y=rannor(2021);/*產生來自標準正態分布的隨機數*/Output;End;Procprintdata=sas2_6;Run;4、利用程序語句建立SAS數據集34SAS中Import/Export向導可用于將其他類型的文件,如Excel、Access、dBase、文本文件等轉為SAS數據集。在file菜單下點擊import/export,按向導指示操作即可。二、Import/Export向導創立SAS數據集35第三節SAS數據集的修改例2.7按觀測連接SAS數據集IdnameSexheightweight4Tonymale178705Tommale17065IdnameSexheightweight1Judyfemale156452Lucyfemale167533Susanfemale16555femalemale需要連接的SAS數據集一、SAS數據集的合并1、按觀測連接SAS數據集36第三節SAS數據集的修改例2.7連接SAS數據集的例子Datasas2_7;Settj.femaletj.male;Run;Procprintdata=sas2_7;Run;使用set語句可以將兩個或多個數據集按觀測連成一個大的數據集,這也是將新變量追加已有數據集上的一種方式。37第三節SAS數據集的修改例2.8一對一匹配合并SAS數據集Idheightweight115645216753316555IdnameSexAge1Judyfemale212Lucyfemale223Susanfemale19student1student2需要連接的SAS數據集語句merge可以合并兩個或多個數據集中的變量,這些數據集中的觀測是一一對應的。2、按變量合并SAS數據集38第三節SAS數據集的修改例2.8按變量合并SAS數據集Datasas2_8;Mergestudent1student2;Run;Procprintdata=sas2_8;Run;39第三節SAS數據集的修改例2.9利用程序語句建立SAS數據集Idheightweight115645216753417870517765IdnameSexAge1Judyfemale212Lucyfemale223Susanfemale19student3student4需要連接的SAS數據集如果需要合并的數據集中的觀測并不是一一對應的關系,那么需要用by語句指定各數據集中用于匹配觀測的變量。〔使用by語句之前,需要先對關鍵字段進行排序。40第三節SAS語言的語句和程序例2.9按變量合并SAS數據集Procsortdatastudent3;byid;Procsortdatastudent4;byid;Datasas2_9;Mergestudent3student4;Run;Procprintdata=sas2_9;Run;41第三節SAS語言的語句和程序如果只想保存數據集中的局部觀測,有兩種方式建立啞集。第一種可以用if條件語句告訴SAS需要保存符合條件的觀測;另一種用if…thandelete語句告訴SAS將不符合條件的觀測刪除。二、建立SAS數據集的啞集1、刪除觀測42第三節SAS語言的語句和程序例2.10刪除觀測的例子IdnameSexAgeheightweight1Judyfemale21156452Lucyfemale22167533Susanfemale19165554TonyMale23178705Tommale2517765student43第三節SAS語言的語句和程序例2.10程序1Datasas2_10;Setstudent;Ifsex=‘female’;Run;Procprintdata=sas2_10;Run;44第三節SAS語言的語句和程序例2.10程序2Datasas2_10;Setstudent;Ifsex=‘female’thendelete;Run;Procprintdata=sas2_10;Run;45第三節SAS語言的語句和程序有時并不需要數據集中的所有變量,可以用drop或keep語句來刪除或保存數據集中的變量,注意同一個數據步中drop和keep語句不能同時出現。2、刪除變量46第三節SAS語言的語句和程序例2.11程序1Datasas2_11;Setstudent;Keepidnamesexage;Run;Procprintdata=sas2_11;Run;刪除變量的例子,僅保存數據集student中的局部變量〔id,name,sex,age〕。可以用下面兩個SAS程序。47第三節SAS語言的語句和程序例2.11程序2Datasas2_11;Setstudent;Dropheightweight;Run;Procprintdata=sas2_11;Run;48例3.1抽樣調查某地120名18—35歲健康男性居民血清鐵含量〔μmol/L〕,數據如下。試編制此血清鐵資料的頻數分布表并描述該資料。第三章常用統計描述23.0720.388.4017.3229.6419.6921.6923.9017.4519.0817.0818.1226.0211.3413.8110.2515.9415.8318.5424.5221.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7921.6516.3220.7522.1113.1717.5519.2612.6518.4819.8349第三章常用統計描述一、定量資料的統計描述1、定量資料的頻數表先用MEANS過程找出最大值和最小值
確定組距(I=2)和第一組段的下限(L=7)然后建立新變量〔x0〕,將變量X轉化為該數據所在組段的下限值賦值新的變量:x0=INT((X-L)/I)*I+L或:x0=x-mod(x-L,I)或:x0=I*INT(x/I)+I/2用FREQ過程作頻數表:procfreq;tablesx0;Run;50第三章常用統計描述2、簡單描述:MEANS過程輸出樣本含量、均數、標準差、最小值、最大值(N、Mean、StdDev、Minimum、Maximum)3、詳細描述:UNIVARIATE過程輸出更多指標:樣本含量、均數、標準差、最小值、最大值、方差、標準誤、中位數、四分位數間距、常用百分位數、眾數、平方和、離均差平方和等,可以作正態性檢驗另外還顯示原數據中的局部極端值51第三章常用統計描述PROCMEANS;CLASSSEX;VARHEIGHTWEIGHT;RUN;CLASS指定分組變量〔可以不寫〕VAR指定需要分析的變量(不寫即分析全部變量〕MAXDEC=n指定計算結果保存小數位數(默認2位)可加的選項有:標準誤(StdErr)、方差(Var)、總和(Sum)、平方和(USS)、離均差平方和(CSS)、全距(Range)、變異系數(CV)、偏度系數(Skewness)、峰度系數(Kurtosis)、可信區間(CLM)等還可以計算總體均數=0的t檢驗(T、Prt)不加任何選項時,自動輸出5項結果:N、Mean、StdDev、Minimum、Maximum52第三章常用統計描述Datasas3_1;Inputx@@;Gr=2;x0=gr*int(x/gr)+gr/2;/*計算組中值X0*/Cards;;procfreqdata=sas3_1;Tablesx0/out=iron;/*out=iron表示輸出變量為X0的一維頻數分布表*/Procunivariatedata=sas3_1;Varx;Histogramx/midpoints=7to29by2;/*組中值的取值范圍從7—29,組距為2*/Run;Procmeansdata=sas3_1;Varx;Run;53第三章常用統計描述例隨機抽取15名學生,記錄他們的性別〔sex)、年齡〔age〕、體重〔w,kg〕、和身高〔h,cm〕,求:〔1〕按性別分組分別計算學生們身高和體重的均數、標準差、變異系數、中位數和P50。〔2〕計算學生身高95%可信區間。要求結果保存小數點后3位。F1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160f1660165m1765175f186116254Datasas3_2;Inputsex$agewh@@;Cards;f1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160f1660165m1765175f1861162;Procmeansdata=sas3_2meanstdcvmedianp50clmmaxdec=3;/*選項maxdec指小數點后保存的位數*/Varhw;Classsex;Run;55第三章常用統計描述例3.3對40名麻疹易感兒童接種麻疹疫苗一個月后,測得其血凝抑制抗體滴度如下,求其平均滴度。56Datasas3_3;/*計算幾何均數*/Inputfx@@;Y=log10(x);Cards;14586162327641012842565512;Procmeansnoprint;/*選項noprint表示不打印程序運行結果*/Vary;Freqf;Outputout=bmean=my;/*選項out=b和mean=my表示把該過程步運行所得均數叫my,并放入數據集b中*/Datac;Setb;mx=10**my;Procprintdata=c;Varmx;Run;57二、定性資料統計描述FREQ過程可以產生頻數表和n維列聯表PROCFREQ;TABLESA;RUN;TABLES指定要分析的定性變量TABLESA產生一維頻數表TABLESA*B產生二維列聯表(A是行B是列)TABLESA*B*C產生三維列聯表(A是分層,B是行,C是列)TABLESA*〔BC〕產生A*B、A*C兩個二維表TABLESX1-X3產生X1、X2、X3三個一維表TABLES(X1-X4)*Y產生X1*YX2*YX3*YX4*Y四個二維表第三章常用統計描述58如描述以下三個定性變量〔258人〕A文化程度〔1=文盲2=初中以下3=高中4=大學〕B工作強度〔1=輕2=中3=重〕C月收入〔1=<3002=300-3=500-4=1000-)DATASAS3_4;INPUTABC@@;CARDS;323414413……;PROCFREQ;TABLESABC;PROCFREQ;TABLESA*B;PROCFREQ;TABLESA*B*C;PROCFREQ;TABLESA*(BC);RUN;59
一維頻數表
CumulativeCumulativeAFrequencyPercentFrequencyPercent
頻數構成比累計頻數累計構成比
60
二維頻數表
A=4Frequency|Percent|CRowPct|ColPct|1|2|3|4|Total---------+--------+---------+---------+--------+--------+1|0|6|37|26|69|0.00|8.70|53.62|37.68||.|75.00|67.27|81.25|---------+--------+---------+---------+--------+--------+2|0|2|18|6|26|0.00|7.69|69.23|23.08||.|25.00|32.73|18.75|---------+--------+---------+---------+--------+--------+Total08553295
頻數構成比行構成比列構成比61一、單樣本的t檢驗第四章t檢驗例4-1以往新生兒出生體重平均為3000g,某醫院對產婦開展孕期保健指導后,測得15名新生兒出生體重如下,問開展孕期保健指導后對新生兒體重是否有影響?28003400290027503000310046003900235035002600370038002950320062一、單樣本資料的t檢驗第四章t檢驗SAS常用于t檢驗的過程有:PROCUNIVARIATE過程PROCMEANS過程PROCTTEST過程〔本章重點講述〕63一、單樣本資料的t檢驗第四章t檢驗DATASAS4_1;INPUTX@@;cards;280034002900275030003100460039002350350026003700380029503200;RUN;PROCunivariatenormal;VARX;RUN;Procttesth0=3000;VARX;RUN;64第四章t檢驗例4-2本例是有關兒童閱讀能力測試的比較,數據來自Moore(1995,〕的研究。數據包含了44名三年級兒童的閱讀能力評分〔DRP〕,具體見表。請問這些兒童閱讀能力評分是否高于一般兒童的評分〔30分〕?評分40475226192535392641頻數2221224112評分48142242343318152944頻數1211221111評分51432746284931285445頻數112211111144名兒童閱讀能力評分65第四章t檢驗/*對頻數分布資料的分析*/Datasas4_2;Inputxf@@;Cards;402472522261192252354391261481142221421342332181151291412441511431272462281491311281541451;Run;PROCunivariatenormal;VARX;Freqf;RUN;Procttesth0=30;VARX;Freqf;RUN;66二、配對設計t檢驗例4-3為了比較新舊兩個測聲計的測定效果,隨機選定10個場地,在每地同時用新舊兩個測聲計測量數據如下,問新舊兩個測聲計的測量結果是否不同?場地12345678910舊:87657495655563886154新:8666779560536285595567第四章t檢驗Datasas4_3;Inputx1x2@@;D=x1-x2;Cards;8786656674779595656055536362888561595455;Run;PROCunivariatenormal;VARd;RUN;Procttest;Pairedx1*x2;RUN;Procttesth0=0;VARd;RUN;68三、兩獨立樣本資料的t檢驗例4-4試比較克山病人與健康人的血磷值(mmol/L)是否不同?克山病人健康人0.540.640.640.750.760.811.161.201.341.351.481.5669兩樣本均數比較用TTEST過程〔方式一〕DATAsas4_4;INPUTX@@;IF_N_>11THENG=2;ELSEG=1;CARDS;;PROCTTEST;CLASSG;VARX;RUN;70兩樣本均數比較用TTEST過程〔方式二〕DATAsas4_4;INPUTXg@@;CARDS;0.8411.0511.2011.2011.3911.5311.6711.8011.8712.0712.1110.5420.6420.6420.7520.7620.8121.1621.2021.3421.3521.4821.5621.872;PROCTTEST;CLASSg;VARX;RUN;71結果:StatisticsLowerCLUpperCLLowerCLUpperCLVariableGNMeanMeanMeanStdDevStdDevStdDevStdErr12T-TestsVariableMethodVariancesDFtValuePr>|t|EqualityofVariancesVariableMethodNumDFDenDFFValuePr>F72兩大樣本均數比較時,如只有均數標準差,而無原始數據時,無法直接調用SAS軟件中的某個過程進行分析,只能在數據步中按照計算公式編寫程序完成。調查健康人群紅細胞數(1012/L)資料如下:男性360人,均數,標準差;女性255人,均數,標準差。試比較男女紅細胞數有無差異?〔方式三〕73DATABB;INPUTN1X1S1N2X2S2;SE=SQRT(S1*S1/N1+S2*S2/N2);U=ABS(X1-X2)/SE;P1=1-PROBNORM(U);P=2*P1;U=ROUND(U,0.001);P=ROUND(P,0.00001);IFP<0.0001THENP=0.0001;CARDS;;RUN;procprint;varx1x2up;run;〔方式三〕74SAS中常用PORCANOVA過程和PORCGLM過程來完成方差分析。其中,ANOVA過程只能用于平衡設計資料的方差分析;對樣本容量不等〔非均衡〕的數據資料做方差分析時,應采用GLM過程。應當說明的是,對樣本容量相等的數據資料,用ANOVA過程作方差分析的效率和可靠性等方面,都優于GLM過程。對平衡數據用GLM過程處理和用ANOVA過程處理的結論是一致的。第五章方差分析75GLM是數據分析過程中功能最豐富的一個過程她包括:簡單回歸〔一元回歸〕加權回歸多重回歸及多元回歸多項式回歸方差分析偏相關分析協方差分析多元方差分析反響面模型分析重復測量方差分析第五章方差分析76例5-1某醫生為了研究一種降血脂新藥的臨床療效,按統一納入標準選擇120名高血脂患者,采用完全隨機設計方法將患者等分為4組,進行雙盲試驗。6周后測得低密度脂蛋白作為實驗結果,問4個處理組患者的低密度脂蛋白含量總體均數有無差異?第五章方差分析一、完全隨機設計資料的方差分析〔一〕各組例數相等的完全隨機設計資料的方差分析77datasas5_1;/*研究生二版ex4-2例題*/inputxc@@;cards;3.5312.4222.8630.8944.5913.3622.2831.064……;Procunivariatenormal;varx;classc;procglm;classc;modelx=c;meansc/snk;meansc/hovtest;run;第五章方差分析78datasas5_1;/*研究生二版ex4-2例題*/
doc=1to4;doj=1to30;inputx@@;output;end;end;cards;3.53
2.42
4.59
3.36
2.28……;Procunivariatenormal;varx;classc;
procglm;classc;modelx=c;meansc/snk;meansc/hovtest;run;第五章方差分析79〔二〕各組例數不等的完全隨機設計資料的方差分析第五章方差分析例5-2某機構研究嬰兒出生體重與母親生育年齡的關系,所得資料見表,試問嬰兒出生體重是否受母親生育年齡的影響?(設資料服從正態分布且總體方差齊性〕母親生育年齡嬰兒出生體重(kg)20-3.54.03.23.32.92.53.23.325-3.23.42.92.52.83.53.330-3.12.72.92.92.82.4不同母親生育年齡的嬰兒出生體重80datasas5_2;
dog=1to3;inputn;doj=1ton;inputx@@;output;end;end;cards;876;procglm;classg;modelx=g;meansg/snk;meansg/hovtest;run;〔二〕各組例數不等的完全隨機設計資料的方差分析81例5-3某研究者采用隨機區組設計進行實驗,比較三種抗癌藥物對小白鼠肉瘤抑瘤效果,先將15只染有肉瘤小白鼠按體重大小配成5個區組,每個區組內3只小白鼠隨機接受三種抗癌藥物〔具體分配結果見例4-3〕,以肉瘤的重量為指標,試驗結果見表4-9。問三種不同的藥物的抑瘤效果有無差異?第五章方差分析二、隨機區組設計資料的方差分析82datasas5_3;inputxab@@;cards;0.82110.65210.51310.73120.54220.23320.43130.34230.28330.41140.21240.31340.68150.43250.2435;procGLM;classab;modelx=ab;meansa/snk;meansb/snk;run;第五章方差分析二、隨機區組設計資料的方差分析〔方法一〕83datasas5_3;
doa=1to3;dob=1to5;inputx@@;output;end;end;cards;;procGLM;classab;modelx=ab;meansa/snk;meansb/snk;run;第五章方差分析二、隨機區組設計資料的方差分析〔方法二〕84例5-4比較A、B、C、D、E、F6種藥物給家兔注射后產生的皮膚皰疹大小〔mm2〕,研究者選用6只家兔、并在每只家兔的6個不同部位進行注射。試驗結果見表4-11,試做拉丁方設計和方差分析。第五章方差分析三、拉丁方設計資料的方差分析〔方法一〕家兔編號(行區組)注射部位編號(列區組)1234561C(87)B(75)E(81)D(75)A(84)F(66)2B(73)A(81)D(87)C(85)F(64)E(79)3F(73)E(73)B(74)A(78)D(73)C(77)4A(77)F(68)C(69)B(74)E(76)D(73)5D(64)C(64)F(72)E(76)B(70)A(81)6E(75)D(77)A(82)F(61)C(82)B(61)85datasaa5_4;inputrcz$x@@;cards;11C8712B7513E8114D7515A8416F6621B7322A8123D8724C8525F6426E7931F7332E7333B7434A7835D7336C7741A7742F6843C6944B7445E7646D7351D6452C6453F7254E7655B7056A8161E7562D7763A8264F6165C8266B61;procglm;classrcz;modelx=rcz;meansz/snk;run;第五章方差分析三、拉丁方設計資料的方差分析〔方法一〕86datasas5_4;
doc=1to6;dor=1to6;inputz$x;output;end;end;cards;C87B75E 81D 75A 84F 66B73A81D 87C 85F 64E 79F73E73B 74A 78D 73C 77A77F68C 69B 74E 76D 73D64C64F 72E 76B 70A 81E75D77A 82F 61C 82B 61;procglm;classrcz;modelx=rcz;run;第五章方差分析三、拉丁方設計資料的方差分析〔方法二〕87例5-5將20只家兔隨機等分4組,每組5只,進行神經損傷后的縫合試驗。處理由兩個因素組合而成,A因素為縫合方法,有兩個水平,B因素為縫合后的時間,有兩個水平。實驗結果為家兔神經縫合后的軸突通過率%,見表,試比較不同縫合方法及縫合后時間對軸突通過率的影響,及有無交互作用?第五章方差分析四、析因設計資料的方差分析
外膜縫合(ai,i=1)
束膜縫合(ai,i=2)
1個月2個月1個月2個月(bi,j=1)(bi,j=2)(bi,j=1)(bi,j=2)103010501030205040703070506050601030303088datasas5_5;inputxab@@;cards;10111011401150111011301230127012601230121021202130215021302150225022702260223022;procglm;classab;modelx=aba*b;lsmeansa*b/tdiff;run;第五章方差分析四、析因設計資料的方差分析〔方法一〕89datasas5_5;
doa=1to2;dob=1to2;doi=1to5inputx@@;output;end;end;end;cards;1010405010303070603010203050305050706030;procglm;classab;modelx=aba*b;run;第五章方差分析四、析因設計資料的方差分析〔方法二〕90例5-6將手術要求根本相同的15名患者隨機分3組,在手術過程中分別采用A,B,C三種麻醉誘導方法,在T0(誘導前〕T1、T2、T3、T4五個時相測量患者的收縮壓,數據記錄見表,試進行重復測量分析。第五章方差分析五、重復測量資料的方差分析〔方法二〕T0T1T2T3T4g
12010811212011711181091151261231119112119124118112111211912612011271211271331261121120118131137212212111912913321281291261351422117115111123131211811411612313321311191181351293129128121148132312312312014313631231211161451263125124118142130391datasas5_6;inputt0-t4g@@;cards;12010811212011711181091151261231……;procglm;classg;modelt0-t4=g;repeatedtime5/printe;/*選項printe用于對數據進行球形檢驗*/run;第五章方差分析五、重復測量資料的方差分析92常用于兩種不同的用法,一方面,擬合優度檢驗指根據樣本的頻數分布檢驗其總體分布是否吻合于假定的分布,常見的是兩個或多個率或構成比的比較。二方面,χ2關聯性分析是指一份隨機樣本按兩種屬性分類,分析其個體來自第一個變量某類別的概率與來自第二個變量某類別的概率是否有關。第六章χ2檢驗χ2檢驗用FREQ過程加CHISQ選項93第一節兩獨立樣本資料的χ2
檢驗一、二分類情形——2×2列聯表〔四格表〕例6-1某院欲比較異梨醇口服液〔試驗組〕和氫氯噻嗪+地塞米松〔對照組〕降低顱內壓的療效。將200例顱內壓增高癥患者隨機分為兩組,結果見表7-1。問兩組降低顱內壓的總體有效率有無差異?
組別有效無效合計有效率(%)
試驗組99(90.48)5(13.52)10495.20
對照組75(83.52)21(12.48)9678.13
合計1742620087.0094DATAsas6_1;DOr=1TO2;DOc=1TO2;INPUTF@@;OUTPUT;END;END;CARDS;9957521;PROCFREQ;TABLESr*c/CHISQ;WEIGHTF;RUN;95datasas6_1;inputrcf@@;cards;119912521752221;procfreq;weightf;tablesr*c/chisqexpected;run;96WEIGHT
語句指明變量F是頻數選項EXACT可以對>2×2表作Fisher確切概率EXPECTED可以顯示每個格子的理論值CMH可以計算隊列研究和病例對照研究的RR值NOROW、NOCOL、NOPERCENT
不顯示相應百分數NOPRINT
不顯示表格,只顯示計算的統計量97例6-2某醫師為研究乙肝免疫球蛋白預防胎兒宮內感染HBV的效果,將33例HBsAg陽性孕婦隨機分為預防注射組和非預防組,結果見表7-4。問兩組新生兒的HBV總體感染率有無差異?
組別陽性陰性合計感染率(%)
預防注射組4182218.18
非預防組5(3)61145.45
合計9243327.27四格表確切概率法98第六章χ2檢驗datasas6_2;inputrcf@@;cards;1141218215226;procfreq;weightf;tablesr*c/chisqexpected;run;99例6-3某實驗室分別用乳膠凝集法和免疫熒光法對58名可疑系統紅斑狼瘡患者血清中抗核抗體進行測定,結果見表7-3。問兩種方法的檢測結果有無差異?第六章χ2檢驗二、配對四格表的χ2
檢驗免疫熒光法乳膠凝集法合計+-+11(a)12(b)23-2(c)33(d)35合計134558100datasas6_3;inputrcf@@;cards;111112122122233;procfreq;weightf;tablesr*c/chisqagree;run;第六章χ2檢驗二、配對四格表的χ2檢驗〔方法一:適合b+c>40〕Tablesr*c/agree對列聯表作MCNemar檢驗和一致性檢驗101DATAb;INPUTf11f12f21f22;IFf12+f21<40THENchisq=(ABS(f12-f21)-1)**2/(f12+f21);ELSEchisq=ABS(f12-f21)**2/(f12+f21);p=1-PROBCHI(chisq,1);CARDS;1112233;PROCPRINTdata=b;RUN;第六章χ2檢驗二、配對四格表的χ2檢驗〔方法二〕102例6-4某醫師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經麻痹的療效,資料見表7-8。問三種療法的有效率有無差異?三種療法有效率的比較三、R×C列聯表的χ2
檢驗103datasas6_4;inputrcf@@;cards;11199127211642218311183226;procfreq;weightf;tablesr*c/chisqexpectedexact;run;第六章χ2檢驗三、R×C列聯表的χ2
檢驗指定精確概率104例6-5測得某地5801人的ABO血型和MN血型結果如表,問兩種血型系統之間是否有關聯?
某地5801人的血型〔單樣本,做關聯性檢驗〕ABO血型MN血型合計MNMNO4314909021823A3884108001598B4955879502032A計1451166626845801105datasas6_5;inputrcf@@;cards;11431124901390221388224102380031495325873395041137421794332;procfreq;weightf;tablesr*c/chisq;run;106例7-1對12份血清分別用原方法〔檢測時間20分鐘〕和新方法〔檢測時間10分鐘〕測谷-丙轉氨酶,結果見表8-1的〔2〕、〔3〕欄。問兩法所得結果有無差異?第七章基于秩次的非參數統計一、配對樣本比較的符號秩和檢驗原法6014219580242220新法7615224382240220原法190251983823695新法2053824344190100107datasas7_1;inputx1x2@@;d=x1-x2;cards;60 76142 152195 24380 82242 240220 220190 20525 38198 24338 44236 19095 100;procunivariatenormalmuo=0;vard;run;第七章基于秩次的非參數統計108例7-2對10例肺癌病人和12例矽肺0期工人用X光片測量肺門橫徑右側距RD值〔cm〕,結果見表8-5。問肺癌病人的RD值是否高于矽肺0期工人的RD值?第七章基于秩次的非參數統計二、兩獨立樣本比較的Wilcoxon秩和檢驗肺癌病人
2.783.234.204.875.126.21矽肺0期工人
3.233.504.044.154.284.34肺癌病人
7.188.058.569.60矽肺0期工人
4.644.754.824.955.104.47原始數據兩獨立樣本比較109datasas7_2;inputxc@@;cards;2.7813.231……;procnpar1waywilcoxon;varx;classc;run;第七章基于秩次的非參數統計二、兩獨立樣本比較的Wilcoxon秩和檢驗110例7-339名吸煙工人和40名不吸煙工人的碳氧血紅蛋白HbCO(%)含量見表8-6。問吸煙工人的HbCO(%)含量是否高于不吸煙工人的HbCO(%)含量?第七章基于秩次的非參數統計二、兩獨立樣本比較的Wilcoxon秩和檢驗含量吸煙工人不吸煙工人合計秩范圍平均秩秩和吸煙工人不吸煙工人(1)(2)(3)(4)(5)(6)(7)=(2)(6)(8)=(3)(6)很低1231~3224低823314~3419152437中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 員工自助服務合同協議
- 和員工簽合同免責協議
- 商家入駐抽點合同協議
- 母嬰店合作合同協議
- 江蘇省鹽城市東臺鹽都2025屆初三下學期第三次調研考試數學試題含解析
- 2025年公司職員工作總結(17篇)
- 商場銷售道具合同協議
- 快餐股東合同和合伙協議
- 和學校簽約合同協議模板
- 商務還款協議書范本
- GB/T 37027-2025網絡安全技術網絡攻擊和網絡攻擊事件判定準則
- 2025年江蘇南通蘇北七市高三二模高考物理試卷(含答案詳解)
- 2024年藥理學考試真題回顧試題及答案
- 2025年軍隊文職(司機類)核心知識點備考題庫(含答案)
- 2025年深圳二模考試試題及答案
- (一模)臨沂市2025屆高三高考第一次模擬考試生物試卷(含標準答案)
- 老年康體指導職業教育課件
- 微訓練 一文多考 備考高效之詩歌《臨安春雨初霽》陸游 - 教師版
- 新疆烏魯木齊市米東區2024-2025學年九年級上學期期中數學試卷(含答案)
- 課件:《科學社會主義概論(第二版)》第一章
- 國際關系理論知到智慧樹章節測試課后答案2024年秋外交學院
評論
0/150
提交評論