




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
醫用SAS統計分析第二講醫用SAS統計分析第二講1/7/20251一、單變量的統計描述統計分析內容回顧
統計描述:集中趨勢、離散趨勢
統計推斷:參數估計:總體參數估計(可信區間)假設檢驗
資料類型計量資料---數值變量
計數資料---分類變量
資料的分布正態分布和偏態分布
1/7/20252一般統計描述---MEANS過程MEANS過程除了能對數值型變量進行一般的統計描述之外,還可以作配對設計資料的t檢驗。語句格式:Procmeans[操作選項][統計量列表];
[VAR<變量名列>;]/*指定分析的變量名列,缺省為所有數值變量*/
[BY<變量名列>;]/*按變量名列分組統計,要求已按變量名列排序*/
[CLASS<變量名列>;]/*按變量名列分組統計,不要求排序*/
[FREQ<變量名>;]
/*表明該變量為分析變量的頻數*/
[OUTPUT<OUT=數據集名>關鍵字=<新變量名列表>];/*指定統計量的輸出數據集名和統計量對應的新變量名*/
Run;
1/7/20253例1書中例3-1例2某克山病區測得11名克山病患者與13名健康人的血磷值(mmol/L)如下,試求兩組的平均血磷值和標準差。data
L12;inputgx@@;cards;10.8411.0511.2011.2011.3911.5311.6711.8011.8712.0712.1120.5420.6420.6420.7520.7620.8121.1621.2021.3421.3521.4821.5821.87;procmeans;varx;byg;run;1/7/20255AnalysisVariable:X-------------------------G=1------------------------------NMeanStdDevMinimumMaximum----------------------------------------------------------111.52090910.42179270.84000002.1100000---------------------------------------------------------------------------------G=2------------------------------NMeanStdDevMinimumMaximum----------------------------------------------------------131.08615380.42405850.54000001.8700000----------------------------------------------------------1/7/20256例3書中例3-3:幾何均數的計算,SAS程序沒有直接計算幾何均數的模塊。datalogmean;inputxf@@;y=log10(x);cards;20240380616013201;procmeans;vary;freqf;procprintdata=outmean;datageomean;setoutmean;g=10**logmean;procprintdata=geomean;varg;run;outputout=outmeanmean=logmean;1/7/20257TheSASSystemAnalysisVariable:YNMeanStdDevMinimumMaximum--------------------------------------------------------------------------------------131.81046540.33396281.30103002.5051500--------------------------------------------------------------------------------------
TheSASSystemOBS_TYPE__FREQ_LOGMEAN10131.81047
TheSASSystemOBSG164.63461/7/20258詳細統計描述---UNIVARIATE過程Univariate過程可對數值變量進行詳細的統計描述。除了提供means過程所有的統計描述外,還可以給出了變量的峰度、偏度、眾數、中位數及四分位數等更詳盡的統計描述,同時還可進行正態性檢驗,以及幾個描述分布的圖。1/7/20259PROCUNIVARIATE[操作選項]
;
[VAR<變量名列>;]
指定分析的變量名列表,缺省為所有數值變量
[BY<變量名列>;]
按變量名列分組統計,要求排序
[FREQ<變量名>;]
表明該變量為分析變量的頻數[OUTPUT<OUT=數據集名>關鍵字=<新變量名列表>];/*指定統計量的輸出數據集名和統計量對應的新變量名*/Run;procunivariate語句的[操作選項];
data=
指定要分析的數據集名
noprint
禁止統計結果在output窗輸出
freq詳細的頻數表
normal
進行正態性檢驗
plot
生成統計圖:莖葉圖,盒狀圖,正態概率圖
1/7/202510例4程序3-2dataunil;inputx@@;cards;39865573108104;procunivariatenormalplot;run;1/7/202511
Moments
N(樣本含量)12SumWgts(總權重)12
Mean(均數)6.5Sum(合計)78
StdDev(標準差)2.54058Variance(方差)6.454545
Skewness(偏度g1)0Kurtosis(峰度g2)-1.39044
USS(平方和)578CSS(離均差平方和)71
CV(變異系數)39.08584StdMean(標準誤)0.733402
T:Mean=0(均數是否為0的檢驗)8.862804Pr>|T|(t值對應的p值)0.0001
Num^=0(不等于0的樣本數)12Num>0(大于0的樣本數)12
M(Sign)(符號檢驗)6Pr>=|M|(符號檢驗的p值)0.0005
SgnRank(符號秩和檢驗)39Pr>=|S|(符號秩和檢驗的p值).0005
W:Normal(正態性檢驗W檢驗)0.932772Pr<W(正態性檢驗的p值)0.38431/7/202512Quantiles(Def=5)100%Max1099%1075%Q38.595%1050%Med6.590%1025%Q14.510%30%Min35%31%3Range7Q3-Q14Mode31/7/202513ExtremesLowestObsHighestObs3(8)8(3)3(1)8(10)4(12)9(2)5(6)10(9)5(5)10(11)StemLeaf#Boxplot10002|901|8002+-----+701||601*--+--*5002||401+-----+3002|----+----+----+----+1/7/202514NormalProbabilityPlot10.5+*++*+|*++++|**++++|*++++|*++|*+*+|+*++3.5+*++*++----+----+----+----+----+----+----+----+----+----+-2-10+1+21/7/202515頻數分布表數據的輸入例5程序3-5datauni2;inputxf@@;cards;6536756987111732575247710797816830851;procunivariate;varx;freqf;run;1/7/202516頻數表的編制方法1:語句格式:procunivariatefreq;例6王潔貞主編DATASG;INFILE'd:\sas\sas2\psb.txt';INPUTX@@;PROCMEANSmeanstdMINMAX;RUN;DATAFSH;SETSG;IFX<164THENY=163;IFX<166&X>=164THENY=165;IFX<168&X>=166THENY=167;IFX<170&X>=168THENY=169;IFX<172&X>=170THENY=171;IFX<174&X>=172THENY=173;IFX<176&X>=174THENY=175;IFX<178&X>=176THENY=177;IFX<180&X>=178THENY=179;IFX<182&X>=180THENY=181;IFX>=182THENY=183;PROCUNIVARIATEFREQ;VARY;RUN;1/7/202517AnalysisVariable:XMeanStdDevMinimumMaximum-----------------------------------------------------172.67100004.0756308162.9000000183.5000000------------------------------------------------------
univariate過程略
FrequencyTablePercentsPercentsValueCountCellCumValueCountCellCum16311.01.01751515.081.016544.05.017788.089.016777.012.017977.096.01691212.024.018133.099.01711818.042.018311.0100.01732424.066.01/7/202518方法2:語句格式:procfreq;
tables變量名;
說明:該語句是根據定義的變量產生頻數分布表。
例7:上例資料DATApsb1;INFILE'd:\sas\sas2\psb.txt';INPUTX@@;L=162;/*定義第一組的下限值*/i=2;/*定義組距*/z=(x-mod(x-L,i))+(i/2);/*z值就是將原始變量轉化成該數據所在組段的組中值*/procfreq;/*根據z值產生頻數分布表*/tablesz;procunivariatenormalplot;varz;RUN;mod(x,y)為算術函數,求x/y的余數。如mod(10,3)=1,mod(6,2)=01/7/202519CumulativeCumulativeZFrequencyPercentFrequencyPercent----------------------------------------------16311.011.016544.055.016777.01212.01691212.02424.01711818.04242.01732424.06666.01751515.08181.017788.08989.017977.09696.018133.09999.018311.0100100.0
1/7/202520
UnivariateProcedureVariable=ZMomentsQuantiles(Def=5)N100SumWgts100100%Max18399%182Mean172.7Sum1727075%Q317595%179StdDev4.013865Variance16.1111150%Med17390%179Skewness0.102995Kurtosis-0.1005625%Q117110%167USS2984124CSS15950%Min1635%166CV2.324183StdMean0.4013861%164T:Mean=0430.2586Pr>|T|0.0001Range20Num^=0100Num>0100Q3-Q14M(Sign)50Pr>=|M|0.0001Mode173SgnRank2525Pr>=|S|0.0001W:Normal0.9671Pr<W0.0853ExtremesLowestObsHighestObs163(27)179(96)165(84)181(7)165(70)181(14)165(22)181(19)165(2)183(97)1/7/202521
StemLeaf#Boxplot1830101821810003|180178|177000000008|176|17500000000000000015+-----+174||17300000000000000000000000024*-----*172|+|17100000000000000000018+-----+170|16900000000000012|168|16700000007|166|16500004|164163010----+----+----+----+----1/7/202522Variable=ZNormalProbabilityPlot183.5+*|++181.5+***++|++179.5+******+|++177.5+****+|++175.5+******|++173.5+*******|++171.5+******|++169.5+*****|++167.5+*****|++165.5+****|++163.5+*++++----+----+----+----+----+----+----+----+----+----+-2-10+1+21/7/202523二、t檢驗統計回顧:t檢驗是判斷兩個樣本均數或樣本均數和總體均數的差別有無統計學意義的假設檢驗方法。使用條件來自正態總體方差齊
分類:單樣本t檢驗,兩樣本t檢驗(配對t檢驗、成組t檢驗)
1/7/202524配對t檢驗原理:檢驗每對差值d的總體均數是否為0。H0:配對的情況:同一對象治療(或處理)前后的比較同一樣本接受不同處理的比較
配對的兩個受試對象分別給予兩種處理
SAS程序:
procmeans;加tprt選項procunivariate;1/7/202525例8
程序例4-1datattest1;inputx1x2@@;d=x1-x2;cards;113140150138150140135135128135100120110147120114130138123120;procmeansmeanstderrtprt;vard;run;1/7/202526AnalysisVariable:DMeanStdErrorTProb>|T|---------------------------------------------------6.80000005.2042717-1.30661890.2237--------------------------------------------------
程序中如無vard;
TheSASSystemVariableMeanStdErrorTProb>|T|--------------------------------------------------------------X1125.90000005.162794224.38601930.0001X2132.70000003.415812938.84873200.0001D-6.80000005.2042717-1.30661890.2237--------------------------------------------------------------1/7/202527成組t檢驗原理:
H0:
SAS程序:
procttest;procttest;
/*過程名*/class<變量名>;/*分組變量名*/var<變量名>;/*分析變量名*/run;1/7/202528
例9:程序4-3datattest3;doc=1to2;/*c循環開始,循環次數為2*/inputn;/*輸入n值*/doi=1ton;/*i循環開始,循環次數為n*/inputx@@;/*輸入x值,注意@@的合理使用*/output;/*output將x輸出,循環語句中必須使用。*/end;/*i循環結束*/end;/*c循環結束*/cards;52793343033381983229274310;procprint;procttest;classc;varx;run;1/7/202529/*循環的結果*/OBSCNIX
11512792152334315330341543385155198623122972322748233310
TTESTPROCEDURE
Variable:XCNMeanStdDevStdError-------------------------------------------------------------------15290.4000000056.9938593225.4884287523271.0000000040.5832477823.43074903
VariancesTDFProb>|T|---------------------------------------------Unequal0.56035.60.5971Equal0.50996.00.6284
ForH0:Variancesareequal,F'=1.97DF=(4,2)Prob>F'=0.7272
1/7/202530兩樣本含量相等時,可去除inputn;例10:datat;doc=1to2;doi=1to5;inputx@@;output;end;end;cards;279334303338198229274310345344;procprint;procttest;classc;varx;run;1/7/202531OBSCIX1112792123343133034143385151986212297222748233109243451025344TTESTPROCEDURE
Variable:XCNMeanStdDevStdError-------------------------------------------------------------------15290.4000000056.9938593225.4884287525300.4000000049.4398624622.11017865VariancesTDFProb>|T|---------------------------------------------Unequal-0.29647.80.7747
Equal-0.29648.00.7745ForH0:Variancesareequal,F'=1.33DF=(4,4)Prob>F'=0.78961/7/202532兩樣本幾何均數的比較在data語句中進行對數變換:x=log10(x)例11:王潔貞主編dataG;doc=1to2;inputn;doi=1ton;inputx@@;x=log10(x);output;end;end;cards;
11100200400400400400800160016001600320091001001002002002002004001600;procttest;classc;varx;run;1/7/202533TTESTPROCEDUREVariable:XCNMeanStdDevStdError------------------------------------------------112.793624530.452000870.1362833992.334477770.382096020.12736534VariancesTDF
Prob>|T|---------------------------------------Unequal2.461518.00.0242Equal2.418618.00.0264ForH0:Variancesareequal,F'=1.40DF=(10,8)Prob>F'=0.64701/7/202534三、方差分析(一)統計回顧
應用:兩個或兩個以上均數的比較
條件:
樣本來自正態總體;方差齊;相互獨立的隨機樣本基本原理:變異分解SS總=SS組內+SS組間
;自由度分解ν總=ν組間+ν組內組內均方MS組內=SS組內/v組內組間均方MS組間=SS組間/v組間
F=MS組間/MS組內當F≥Fα(ν1,ν2),則P≤α,拒絕H0,接受H1當F<Fα(ν1,ν2),則P>α,接受H0,。1/7/202535方差分析---基本語句Procanova[data=<數據集名>];
Class分組變量;/*指明分組變量,
必須放在model語句前*/Model因變量=分組變量;/*規定按分組變量對因變量作方差分析*/[means分組變量[/多重比較的方法];]
/*計算每個分組變量所對應的因變量均值,對分組變量進行多重比較,其方法可用snk(q檢驗)、dunnett、LSD法等。該語句可多次使用*/[means分組變量/hovtest=方法;]
/*進行方差齊性檢驗(homogeneityofvariancetest),常用方法為Bartlett和Levene’s法,默認為Levene’s法*/[freq變量名;]
/*規定頻數變量*/
1/7/202536分組變量:把要考察的處理因素做為分組變量。它的取值即為分組變量的水平,可以是數值型,也可是字符型。例5-1中,衣料就是分類變量,其取值有四個水平。因變量:也稱響應變量,為連續的數值型變量。例5-1中,因變量為十硼氫的吸附量
效應:方差分析模型中規定的各分組變量組合代表其相應的效應。主效應:由分組變量本身引起,不考慮其他因素的影響,可以用分組變量本身表示。例5-1中,只有一個效應,即衣料的效應。如果對某一因變量,它的研究因素為A、B兩個,主效應就是由A、B兩個分組變量引起的,不考慮A對B的作用。在model語句中表示為AB。方差分析---幾個概念
1/7/202537
交叉效應:即交互作用。用*連接兩個變量以表示它們之間的交互作用。在model語句中可用A*B表示。檢驗在A因素的各個水平B因素的效應是否相同,即一個因素的效應是否依賴于交叉項里其他因素。
相應的模型有主效應模型(完全隨機、隨機區組、拉丁方等)和含交互作用項的模型(析因設計、正交設計)1/7/202538完全隨機設計資料的方差分析例12:程序5-1dataanova1;doc=1to4;doi=1to5;inputx@@;output;end;end;cards;2.332.002.932.732.332.482.342.682.342.223.063.063.002.663.064.005.134.612.803.60;procanova;classc;/*分組變量為c*/modelx=c;/*按變量c分組對因變量X進行方差分析*/meansc/snk;/*對變量c的各水平用snk法作均數的多重比較*/Meansc/hovtest/*進行方差齊性檢驗*/run;1/7/202539方差分析結果
ClassLevelInformation
Class①Levels②Values③C41234Numberofobservationsindataset=20
①
在class語句中規定的分組變量名②分組變量的水平數③分組變量的取值DependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>F
變異來源自由度離均差平方和均方F值P值模型Model38.433760002.8112533311.160.0003誤差Error164.029160000.25182250總變異CorrectedTotal1912.46292000R-Square④C.V.RootMSE⑤XMean
變異系數因變量的均值0.67670816.907650.501819192.96800000④決定系數R2,反映了在總變異中由模型解釋的變異所占的比例,越接近1,表明模型對這批數據擬合越好。⑤誤差均方的平方根,剩余標準差SourceDFAnovaSSMeanSquareFValuePr>FC38.433760002.8112533311.160.00031/7/202540SNK法兩兩比較結果:
Student-Newman-Keulstestforvariable:X
NOTE:ThistestcontrolsthetypeIexperimentwiseerrorrateunderthecompletenullhypothesisbutnotunderpartialnullhypotheses.
Alpha=0.05df=16MSE=0.251823誤差的均方NumberofMeans234均數間相隔組數CriticalRange0.6728120.81894120.9080258相差有無意義的臨界值Meanswiththesameletterarenotsignificantlydifferent.SNKGrouping⑥MeanNC
SNK分組標志均數樣本數分類變量值(水平數)A4.028054
B2.968053B2.464051B2.412052⑥SNK分組標志:相同字母代表組間差別無統計學意義。如c=3和c=1以及c=2組的標志均為B,表明這三組的均數無差別;而c=4組的標志為A,因此它與其它三組的差別均有統計學意義。1/7/202541Levene'sTestforEqualityofXVarianceANOVAofSquaredDeviationsfromGroupMeansSumofMeanSourceDFSquaresSquareFValuePr>FC31.35850.45283.93390.0280Error161.84180.1151AnalysisofVarianceProcedureLevelof--------------X--------------CNMeanSD152.464000000.36712396252.412000000968000000028000000.900705281/7/202542例13:程序5-3樣本含量不等時方差分析dataanova3;doc=1to3;inputn;doi=1ton;inputx@@;output;end;end;cards;527933430333819832292743103210285117;procanova;classc;modelx=c;run;1/7/202543隨機區組設計資料的方差分析dataanova4;doa=1to4;dob=1to8;inputx@@;output;end;end;cards;5.275.275.885.445.666.225.835.275.275.225.835.385.446.225.725.114.944.885.385.275.385.615.385.004.614.665.005.004.885.224.884.44;procanova;classab;modelx=ab;meansa/snk;run;例14程序5-41/7/202544方差分析結果AnalysisofVarianceProcedureClassLevelInformationClassLevelsValuesA41234B812345678Numberofobservationsindataset=321/7/202545AnalysisofVarianceProcedureDependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>FModel105.402375000.5402375043.140.0001Error210.262975000.01252262Total315.66535000R-SquareC.V.RootMSEXMean0.9535822.1119040.111904515.29875000SourceDFAnovaSSMeanSquareFValuePr>FA32.904375000.9681250077.310.0001B72.498000000.3568571428.500.00011/7/202546AnalysisofVarianceProcedureStudent-Newman-Keulstestforvariable:XNOTE:ThistestcontrolsthetypeIexperimentwiseerrorrateunderthecompletenullhypothesisbutnotunderpartialnullhypotheses.Alpha=0.05df=21MSE=0.012523NumberofMeans234CriticalRange0.11635920.14103160.1559574Meanswiththesameletterarenotsignificantlydifferent.SNKGroupingMeanNAA5.6050081A5.5237582B5.2300083C4.83625841/7/202547拉丁方設計資料的方差分析
拉丁方設計的方差分析主要適用于:三個處理水平數相同且無交互作用。亦稱三因素方差分析。利用拉丁方陣安排試驗,拉丁方陣亦稱r階拉丁方,是用r個拉丁字母排成r行r列的方陣,每個字母在每行每列中只出現一次。如5×5拉丁方:ABCDEBCDEACDEAB
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年網絡管理員考試學習方向試題
- 學科交叉與綜合課程設計計劃
- 幼兒園語言學習活動策劃計劃
- 持續學習的個人工作目標計劃
- 2025年時事政治熱點題庫考試試題庫(歷年真題)附答案詳解
- 工行會計試題及答案
- 工兵心理測試題及答案
- 黃岡小學試題及答案
- 法學概論的理論架構與試題及答案分析
- 窗簾行業跨界合作與創新案例考核試卷
- 妊娠合并急性闌尾炎課件
- 電纜井工程量計算-公式表格Excel版本
- 駕照體檢表完整版本
- 山東春節風俗 孔府宴、泰山祈福與鞭炮齊鳴
- 《機動車檢測維修案例分析》(工程師)案例分析
- 蘇教版三年級數學下冊《小數的初步認識》課件(區級公開課)
- 巖土工程中英文對照外文翻譯文獻
- 2023年1月浙江省高考英語真題聽力試題(附聽力音頻+答案+文本)
- 空天地一體化通信網絡
- 足球入隊資格申請書
- 原發性骨質疏松癥診療指南(2022)解讀
評論
0/150
提交評論