




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
試驗三SAS描述統計分析質的初步結論。據時可以給人留下深刻的印象。統計圖形的種類很多,利用SAS可以便利的繪制常用的統計圖形。試驗目的把握使用SAS對數據作描述性統計分析的方法。把握SAS/GRAPH能,能用SAS的統計圖形對數據進展描述性統計分析。試驗內容一、用INSIGHT計算統計量、繪制統計圖形二、用“分析家”計算統計量、繪制統計圖形三、編程實現描述性統計〔MEANS、UNIVARIATE、FREQ過程、編程繪制統計圖〔GPLOTGCHART〕試驗指導一、用INSIGHT計算統計量【試驗【試驗3-1】按性別分別計算SASHELP.CLASS中身高的均值、標準差、中位數和其它四分位數,簡潔分析學生身高的狀況。在INSIGHTSolutio〔解決方案Analysi〔分析InteractiveDataAnalysis〔交互式數據分析SAS/INSIGHTOpen”對話框,在對話框中選擇數據集:SASHELP.CLASS,單擊“Open〔翻開INSIGHT3-1左所示。用DistributionAnalyz〔分析Distribution(Y〔分布Distribution對話框。在數據集CLASS的變量列表中,選擇height,然后單擊“Y”按鈕,height被選為分析變量,選擇sex,然后單擊“Group”按鈕,sex3-1右所示。 圖3-1 在INSIGHT中計算統計量Outpu〔輸出3-。表3-1 描述性統計選項選項MomentsQuintilesBasicConfidenceIntervalsTestsforLocation
說明矩統計量分位數根本置信區間位置檢驗
選項FrequencyCountsTestsforNormality
說明頻數統計尺度的穩健估量正態性檢驗BoxPlot/MosaicPloChar3-2所示。圖3-2 描述性統計選項兩次單擊“OKheight按sex分組的各種矩統計量〔Moments〕和分位數Quantile,如圖3-3所示。結果分析91060.5889低于男63.91,女生的標準差5.01834.9379,說明女生的身高較為分散一些。圖3-3分組顯示的各種矩統計量和分位數62.5、56.5和64.3,說明身高大于或小于62.556.5,而另有四分之一的女生身超群過了64.3;男生的中位數、四分之一分位數和四分之三分位數分別為64.15、59.0和67.0,說明身高大于或小于64.15的男生各占一半,有四分之一的男生身高不超過,而另有四分之一的男生身超群過了67.0。二、用“分析家”計算統計量【試驗二、用“分析家”計算統計量【試驗3-2500名學生的“概率統計學”課程的考試成績中,隨機地603-2所示〔數據集為:MYLIB.SY3-2,變量名為F1〕:表3-2 “概率統計學”考試成績6375839145819330728082838176678472588364936375997476959183618285834488726694687888719485827910090838884487280858087766296求出上述數據的平均值、方差、極差、中位數、四分之一分位數及四分之三分位數,并分析成績分布狀況。在“分析家”中翻開MYLIB.SY3-2數據集Solution〔解決方案Analysi〔分析Analys〔分析家翻開“分析家”窗口。Fil〔文件AsSASNameOpen…〔按SAS名稱翻開的對話框中,選擇MYLIB.SY3-2。用SummaryStatisticsStatistic〔統計Descriptiv〔描述性統計SummaryStatistics〔匯總統計量SummaryStatisticsF1Analysis”3-4左所示。圖3-4 選定分析變量與統計量單擊“Statistics”按鈕,翻開“SummaryStatistics:Statistics”對話框。對話框中列3-3。3-3可計算統計量Mean均值Numberofobservations觀測數Standarddeviation標準差Numberofmissingvalues缺失數Standarderror標準誤Skewness偏度Variance方差Kurtosis峰度MinimumMaximumRange極差Student”sttCoefficientofvariationt檢驗值p值變異系數Sum和Correctedsumofsquares校正平方和Median中位數Uncorrectedsumofsquares未校平方和選擇輸出統計量平均值、方差、極差,如圖3-4右所示。兩次單擊“OK”按鈕后,得3-5所示。圖3-5 描述性統計量用Distributions菜單項計算分位點在“分析家”窗口選擇主菜單“Statistic〔統計”→“Descriptiv〔描述性統計”→按鈕,選定分析變量。單擊“OK”按鈕,即可得到關于變量F13-6所示。圖3-6 矩統計量和根本統計測度另外,還有位置檢驗、分位數以及極值觀測〔5個觀測,如圖3-7所示。圖3-7 位置檢驗、分位數以及極值觀測結果分析學生成績的均值、方差和極差分別為77.72、194.07和70,方差和極差較大,說明成績的分布很分散。中位數、四分之一分位數及四分之三分位數分別為81、72和86,說明成績大于或小于81的學生各占一半,有四分之一的學生成績不超過72;而有四分之一的學生成86,從均值和中位數可以看出有一大半學生的成績超過了平均數。三、編程實現描述性統計三、編程實現描述性統計【試驗3-3】編程實現描述性統計。1.1.用FREQ編制SASUSER.CLASS中age(年齡)的頻數表,代碼如下:procfreqdata=SASUSER.CLASS;tablesage;RUN; 圖3-8 頻數表2.用NEANS2.用NEANS按性別分別計算SASUSER.CLASS中體重的均值、標準差、極差、中位數、四分之一分位數和四分之三分位數,代碼如下:proc means data=SASUSER.CLASS mean std range median q1 var weight;class run;3-9所示。圖3-9 使用class語句分類計算均值、標準差、極差、中位數和分位數或者proc sort data=SASUSER.CLASS;bysex;run;proc means data=SASUSER.CLASS meanstdrangemedianq1q3;var bysex;run;3-10所示。說明:1)通常使用BY語句時要求數據集須按BY變量排序,使用CLASS語句無此要求。2)meansBYBY變量的每個值分別供給一個表,使用CLASS語句則將全部結果排列在一個表之中。3.用UNIVARIATE圖3-10 3.用UNIVARIATE計算SASUSER.CLASSage(年齡)的眾數、2.5%97.5%分位數。proc univariate data=SASUSER.CLASS;var age;output out=pct pctlpre=p pctlpts=2.5 run;proc print run;3-11所示,age(年齡)12,2.5%11,97.5%16。 圖3-11 眾數和分位數說明:UNIVARIATE過程中的output語句表示將UNIVARIATE產生的統計量輸出到“out=”后定義的數據集中,本例數據集名稱為pct,output語句中的選項pctlpre用于指定數pctlpts2.5%97.5%分位數。四、用INSIGHT四、用INSIGHT繪制統計圖形3-4】爭論Sasuser.gpagpa分數的分布:畫出gpa的直方圖、盒形圖;通過直方圖、盒形圖簡述不同性別的gpa數據的特點。INSIGHT中翻開數據集Sasuser.gpa。1.1.繪制直方圖選擇菜單“Analyze〔分析”→“Chart(Y)〔條形圖Histogram/BarChart(Y)”對話框。gpagpa變量,然后單擊“Y”按鈕,gpa3-12所示。單擊“OK”按鈕,即可得到直方圖,如圖3-13左所示。單擊圖形框左下角處的三角形,在翻開的菜單中alue〔值,即可在圖中顯示頻數值,如圖3-13右所示。
圖3-12 話框假設在“Histogram/BarChart(Y)”對話框中選定gpa變量作為分析變量,然后選擇sexGrou〔分組O”后可將gpa分數按男女學生分別畫出3-14所示。 圖3-13 在INSIGHT中繪制直方圖2.繪制盒形圖圖3-14 不同性別gpa2.繪制盒形圖Analyz〔分析BoxPlot/MosaicPlot(Y〔馬賽克圖“BoxPlot/MosaicPlot(Y)”對話框。在數據集gpa的變量列表中,選擇gpa變量,然后單擊“Y”按鈕,gpa3-15左所示。Outpu〔輸出YAxisVertica〔垂直的Y軸”如圖3-15右所示。單擊“OK”按鈕返回對話框。 圖3-15 “BoxPlot/MosaicPlot(Y)”對話框單擊“OK”按鈕,即可得到盒形圖,如圖3-16左所示。單擊圖形框左下角處的三角形,在翻開的菜單中選擇“Mean〔均值3-16右所示。圖3-16 在INSIGHT中繪制盒形圖按(1)中方法翻開“BoxPlot/MosaicPlot(Y)”對話框,選擇gpa變量,單擊“Y”按鈕,再選擇sex變量,然后單擊“X”按鈕,如圖3-17左所示,可以將男女生gpa分數的兩個盒形圖畫在同一個坐標系下,如圖3-17右所示,便于查看男女生gpa分數的分布狀況。圖3-17 畫在一個坐標系下單擊圖3-17MeanValue在盒形圖上標出男女生gpa分數的均值、中位數、四分之一分位數和四分之三分位數等。圖3-18 顯示均值、中位數、四分之一分位數和四分之三分位數等3.結果分析3-133-16可以看到gpa分數在均值兩邊的分布是不對稱gpa分數超過了平均值。這局部高分學生的分數比較集中,由于盒形圖中均值線右邊局部較短,而其他低分局部的學生成績較為分散,gpagpa分數是極端值,它不具有代表性。gpa分數直方圖〔3-14〕和盒形圖〔3-17右〕可以看到,男女生gpa分數的分布狀況類似,都略微左偏。兩條中位數線位置沒有明顯區分,但女生中位數線左方局部更長一些,說明女生的gpa分數低分局部更分散一些。五、用“分析家”繪制統計圖形五、用“分析家”繪制統計圖形3-5】某高校對學生逃課的狀況進展抽樣調查的結果如表3-4所示:3-4學生逃課狀況表年級性別逃課的狀況年級性別逃課的狀況2023級男從不逃課2023級男從不逃課2023級男間或逃課2023級男從不逃課2023級男間或逃課2023級男從不逃課2023級男間或逃課2023級男從不逃課2023級男間或逃課2023級女從不逃課2023級男間或逃課2023級女從不逃課2023級男間或逃課2023級女從不逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級男間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級女間或逃課2023級男常常逃課2023級男常常逃課2023級女常常逃課2023級男常常逃課2023級女常常逃課2023級男常常逃課2023級女常常逃課2023級男常常逃課2023級女常常逃課2023級男常常逃課2023級女常常逃課2023級女常常逃課2023級女常常逃課2023級女常常逃課2023級女常常逃課2023級女常常逃課利用統計圖形從整體上對逃課狀況進展分析。利用統計圖形對兩個年級逃課狀況進展比較分析。1.數據預處理1.數據預處理由于“分析家”對漢字處理效果不是很好,用變量grade、sexcase分別代表年級、2023202320232023”分別NSA首先將表3-4處理成Excel〔sy4_2.xl3-19所示。sy4_2.xls導入為SAS數據集Mylib.sy4_2。或在“分析家”中直接翻開sy4_2.xls后存為數據集Mylib.sy4_2。以下操作總假定已經在“分析家”中翻開數據集2.利用統計圖形從整體上對逃課狀況進展分析Mylib.sy4_2。2.利用統計圖形從整體上對逃課狀況進展分析繪制三維餅圖
圖3-19 數據表sy4_2.xlsGraph〔圖形PieChar〔餅圖PieChar變量列表中的case,單擊“Chart3-D3-20左。 圖3-20 總體狀況三維餅圖再單擊“Options”按鈕,進入“Options”窗口。單擊“SliceValues”選項卡,選中“Percent”單項選擇按鈕,如圖3-20右所示,兩次單擊“OK”按鈕,得到標有百分比的立體三維餅圖,如圖3-21所示。繪制三維條形圖Graph〔圖形BarChart〔條形圖Vercita〔垂直BarChart”對話框,選擇變量列表中的case,單擊“Chart3-D選3-22上所示。
圖3-21 總體狀況三維餅圖單擊“Options”按鈕,進入“Options”窗口,單擊“Statistics”選項卡,選中“DisplayStatistics”復選框,如圖3-22下所示。兩次單擊“OK”按鈕,得到標有頻數的立體三維條3-23所示。結果分析
圖3-22 設置三維條形圖3-213-238%26%,間或逃課的占66,這說明絕大多數學生逃過課,眾數為“間或逃課況,有一小局部常常逃課,這是值得我們留意的。3.利用統計圖形對兩個年級逃課狀況進展比較分析圖3.利用統計圖形對兩個年級逃課狀況進展比較分析分別繪制兩個年級的二維餅圖Graph〔圖形PieChar〔餅圖PieCharcase,單擊“Chart”按鈕,選定分析變量,選中2-D選項,再單擊“Options”按鈕,翻開“Options”對話框。Percent”單項選擇OKVariables”按GRADE選為分組3-24所示。
圖3-24 Variable對話框O3-25所示。圖3-25 兩個年級二維餅圖分別繪制兩個年級的二維條形圖Graph〔圖形BarChar〔條形圖Vercita〔垂直“VercitalBarChart”對話框,選擇變量列表中的case,單擊“Chart”按鈕,選定分析變量,2-Dgrade變量,單擊“GroupBy3-26左所示。單擊“Options”按鈕,進入“Options”窗口,單擊“Statistics”選項卡,選中“DisplayStatisticsOK”按鈕,得到標有頻數的兩個年級的二維條形圖,如圖3-26右所示。 結果分析
圖3-26 兩個年級三維條形圖3-253-26右看出兩個年級學生逃課的狀況的差異,主要在兩個極端,即“從不逃課”和“常常逃課”上。2023202320%,而“從不逃課”12%20232023級嚴峻得多。4.利用統計圖形對男女生逃課狀況進展比較分析兩個年級的逃課狀況中,眾數均為“間或逃課2023級的異眾比例為38,2023級的異眾比例為30%,這說明“間或逃課”并不能很好地代表2023級逃課的狀況,相比之20234.利用統計圖形對男女生逃課狀況進展比較分析分別繪制男女生的餅圖Graph〔圖形PieChar〔餅圖PieChar”對話框,選擇變量列表中的case,單擊“Chart”按鈕,選定分析變量,選中3-D選項,再單擊“Options”按鈕,進入“Options”窗口,單擊“SliceValues”選項卡,選中“Percent”單項選擇按鈕,單擊“OK”返回,再單擊“Variable”選項Sex選為分組變量,3-27所示。兩次單擊“OK”分別得到標有百分3-28所示。
圖3-27 Variable對話框 分別繪制男女生的三維條形圖
圖3-28 男女生三維餅圖Graph〔圖形BarChar〔條形圖Vercita〔垂直“VercitalBarChart”對話框,選擇變量列表中的case,單擊“Chart”按鈕,選定分析變量,再選擇sex變量,單擊“GroupBy”按鈕,選定分組變量。3-D選項,再單擊“Options”按鈕,進入“Options”窗口,單擊“Statistics”選項卡,選中“DisplayStatistics”按鈕,兩次單擊“OK”按鈕,得到標有頻數的男女生的兩個3-29所示。結果分析3-283-29。男女生均以“間或58%和74%,42%,女生的異眾比例為26%,這說明用“間或逃課”代表男生逃課的明白,這是由于男生走“兩個極端”的不少。她們逃課的狀況。圖3-29 男女生三維條形圖六、編程繪制統計圖六、編程繪制統計圖使用GCHART3-6】使用GCHART3-5中有關圖形。〔圖形略〕goptionsftext=“宋體“htitle=1;title”總體狀況三維餅圖”;proc gchart data=Mylib.sy4_2;pie3d case/type=PCT;run;title”總體狀況三維條形圖”;procgchartdataMylib.sy4_2;vbar3d case/outside=FREQ;run;title”兩個年級二維餅圖”;procgchartdata=Mylib.sy4_2;pie case/group=grade type=PCT;run;title”兩個年級二維條形圖”;procgchartdataMylib.sy4_2;vbar case/group=grade outside=FREQ;run;title”男女生三維餅圖”;procgchartdata=Mylib.sy4_2;pie3d case/group=sex type=PCT;run;title”男女生三維條形圖”;procgchartdata=Mylib.sy4_2;vbar3d case/group=sex outside=FREQ;run;title””;使用GPLOT3-7GPLOT過程繪制SASUSER.AIRcodatetime的散點圖以及winddatetime的連線圖。goptionsftext=“宋體“htitle=1;proc gplot data=sasuser.air;plotco*datetime;title”codatetime的散點圖”;symbolv=doti=nonecv=orangeproc gplot data=sasuser.air;plotwind*datetime;title”winddatetime的連線圖”;symbolv=stari=joincv=redc
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高端定制服務機器人企業制定與實施新質生產力項目商業計劃書
- 高精度溫度測量儀行業深度調研及發展項目商業計劃書
- 精密塑料電子連接器企業制定與實施新質生產力項目商業計劃書
- 貸款車掛名協議書
- 金融科技品牌策劃行業跨境出海項目商業計劃書
- 魚線輪行業深度調研及發展項目商業計劃書
- 互聯網保險社群經濟與營銷企業制定與實施新質生產力項目商業計劃書-20250408-155949
- 人教新課標版語文四年級上冊28 尺有所短寸有所長練習卷(解析版)2
- 通過本實訓項目的學習使大家了解電容式傳感器結構及其特點本實
- 《旅游英語》電子教案-Unit 7
- 游泳館會員合同協議書
- 產業園 可行性研究報告
- 星河季度工作總結
- 海外不動產買賣中介合同范本
- DB44-T 2605-2025 生活垃圾焚燒發電設施能源消耗計算與限額
- 2025江蘇中考:化學必背知識點
- 2024-2025學年度廣東省廣州市南沙區中考英語一模試卷(含解析)
- 高標準農田項目規劃設計方案
- 數據庫應用技術-第三次形考作業(第10章~第11章)-國開-參考資料
- 基礎有機化學實驗知到智慧樹章節測試課后答案2024年秋浙江大學
- MOOC 頸肩腰腿痛中醫防治-暨南大學 中國大學慕課答案
評論
0/150
提交評論