




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三章描述性統計描述統計量統計圖形一、描述統計量描述性統計是最根本的統計分析,通過對原始數據進行總括和描述來說明總體的情況和特征。描述性統計一方面利用一系列數字指標來概括數據的信息,另一方面利用直觀簡單的圖形來展現數據的特性。描述統計量包括:表示位置的統計量、表示分散程度的統計量和表示分布形態的統計量。
1、根本概念一、描述統計量(1)表示位置的統計量均值:由樣本的總和除以樣本的個數,即中位數:將樣本按照大小順序排列之后,處于中間位置的樣本值眾數:樣本中出現頻率最大的樣本值百分位數:將樣本按照從小到大排列后,處于p%位置的樣本值被稱為第p百分位數1、根本概念一、描述統計量〔2〕表示分散程度的統計量方差:各樣本值與均值差值平方的平均值,即標準差:方差的平方根,即標準誤:樣本均值的標準誤差,定義為變異系數:是將標準差表示為均值的百分數,即極差:樣本中最大值與最小值之差1、根本概念一、描述統計量(3)表示分布形態的統計量偏度:是衡量數據分布對稱性的指標,定義為
當數據關于均值對稱分布時,偏度為0;當數據向右偏時,偏度大于0;當數據向左偏時,偏度小于0。峰度:是衡量數據分布尖峭程度的指標,定義為當數據分布為標準正態分布時,峰度等于0;當數據分布比標準正態分布更尖峭時,峰度大于0;當數據分布比標準正態分布更平緩時,峰度小于0。2、MEANS過程一、描述統計量MEANS過程的主要功能是計算根本的描述統計量,此外還可以進行一些參數估計和假設檢驗。MEANS過程的語句格式為:PROCMEANSDATA=數據集名<選項列表><統計量關鍵字列表>;VAR變量名列表;BY分組變量名;CLASS分組變量名;RUN;其中,只有PROC語句是必須的,其他語句可以根據用戶需要進行選用。2、MEANS過程一、描述統計量語句說明:〔1〕PROC語句規定開始運行MEANS過程,并指定要分析的數據集名。MEAR過程默認輸出的統計量有:觀測總數、均值、標準差、最大值和最小值。如果要計算其他統計量或其中的某一些統計量,那么可在PROC語句中指定統計量的關鍵字。〔2〕VAR語句規定要計算描述統計量的數值型變量及其順序。假設不使用此語句,那么默認對所有的數值型變量進行計算。〔3〕BY語句規定了分組變量,要求在BY分組內計算描述性統計量。〔4〕CLASS語句規定了觀測分組,要求在觀測分組內計算描述性統計量。CLASS語句與BY語句的功能類似,但是CLASS語句不要求數據集事先按照變量進行排序,而且兩個語句在輸出格式上也有一些區別。2、MEANS過程一、描述統計量PROC語句中的統計量關鍵字關鍵字統計量關鍵字統計量N有效觀測數MAX最大值NMISS缺失值個數MIN最小值MEAN均值RANGE極差VAR方差MEDIAN中位數STDDEV|STD標準差Q1四分之一分位數STDERR標準誤Q3四分之三分位數CV變異系數QRANGE四分位數間距SUM總和P1第1百分位數SUMWGT加權值總和P5第5百分位數CSS校正平方和P10第10百分位數USS未校正平方和P90第90百分位數SKEWNESS偏度P95第95百分位數KURTOSIS峰度P99第99百分位數3、UNIVARIATE過程一、描述統計量UNIVARIATE過程也可以提供描述統計量的計算,另外還有統計頻數、繪制圖形和假設檢驗的功能。UNIVARIATE過程的語句格式為:PROCUNIVARIATEDATA=數據集名<選項列表>;VAR變量名列表;BY分組變量名;CLASS分組變量名;RUN;使用UNIVARIATE過程計算描述統計量與MEANS過程所用的語句和選項都根本類似,只是UNIVARIATE過程不需要指定統計量關鍵字,而是默認給出所有的根本統計量和一些關于位置檢驗的結果。1、條形圖和餅圖二、統計圖形條形圖和餅圖是常見的展現屬性數據的圖形。條形圖主要用來描繪屬性變量每個取值的頻數,清晰地反映它們之間的差異。餅圖用來描繪屬性變量每個取值的頻數所占的比例,反映它們之間相對數量的多少。1、條形圖和餅圖二、統計圖形GCHART是SAS/GRAPH模塊提供的輸出高精度彩色圖表的過程,可用于制作二維或三維的條形圖和餅圖等。GCHART過程的語句格式為:PROCGCHARTDATA=數據集名;圖形名變量名</選項>;RUN;GCHART過程中,通過圖形名調用相應的程序來繪制某一類的圖形。圖形名說明BLOCK3維平鋪條形圖HBAR水平條形圖HBAR3D3維水平條形圖VBAR垂直條形圖VBAR3D3維垂直條形圖PIE餅圖PIE3D3維餅圖DONUT環形圖STAR星形圖2、散點圖和連線圖二、統計圖形散點圖和連線圖是常用的表現兩個變量之間變化關系的圖形。散點圖是以數據集中的某兩個變量為坐標軸,將每個觀測對應一個點繪制在圖中,來反映兩個變量間的相互關系。連線圖那么是用直線或曲線將散點圖中的所有點連接起來而得到,用來更清晰的表現某種變化趨勢。1、條形圖和餅圖二、統計圖形GPLOT也是SAS/GRAPH模塊提供的一個繪圖過程,可用于制作高精度的散點圖和連線圖。GPLOT過程的語句格式為:PROCGPLOTDATA=數據集名;PLOT縱軸變量名*橫軸變量名<=第三個變量名></選項>;SYMBOL<選項>;AXIS<選項>;RUN;其中,PROC語句和PLOT語句是必須的。PLOT語句用于規定縱軸變量和橫軸變量,并可選第三個變量來對觀測進行分組。SYMBOL語句為可選語句,用來規定圖中線和點的特征。2、散點圖和連線圖3、直方圖、經驗分布圖和QQ圖二、統計圖形直方圖、經驗分布圖和QQ圖是常見的表現數據分布特征的圖形。直方圖經常用來展示數值型變量的分布。一般做法是先將數值型變量的取值分成假設干等間距的區間,然后統計數據落入每個區間的頻數,并在區間上畫出一個矩形,用矩形的高度來表示每個區間頻數的大小。對于一個適宜的分組,利用直方圖可以去近似總體的分布密度。3、直方圖、經驗分布圖和QQ圖二、統計圖形經驗分布圖是根據樣本觀測值作出的經驗分布函數而繪制的,經驗分布函數是樣本對總體累積分布函數的一個估計。QQ圖是鑒別樣本分布是否近似于某種類型分布的一種直觀簡便的圖形。它是以某種分布的分位數為橫坐標,以樣本值為縱坐標繪制的散點圖。1、條形圖和餅圖二、統計圖形CAPABILITY過程是由SAS/QC模塊提供,可以用來繪制直方圖、經驗分布圖和QQ圖等,其語句格式為:PROCCAPABILITYDATA=數據集名<選項>;HISTOGRAM變量名</選項>;
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園供貨合同方協議書
- T/SAQ 1001-2022火力發電高效清潔利用亞臨界機組高溫綜合升級改造規范
- 勞動合同附加勞動協議書
- 中式風格家具轉讓協議書
- 兩個兒子撫養老人協議書
- 快遞公司外包車輛協議書
- 仲裁工資賠償撤訴協議書
- 揚州廢舊鍋爐拆除協議書
- 室內抹灰工程承包協議書
- 日俄雙方談判恢復協議書
- 鋼結構施工 課件項目3 鋼結構工程安裝
- 《神經網絡模型》課件
- 四川省成都外國語2025年高三聯考數學試題科試題含解析
- 后現代思潮與教育
- 四川省樹德中學2025年高三第一次模擬考試(物理試題含解析)
- 2025年科技節活動小學科普知識競賽題庫及答案(共80題)
- 售電合同協議
- 教師家訪制度與實施策略全面解析
- 餐飲低值易耗管理制度
- 展會保安服務合同(2篇)
- 衛生院安全管理制度匯編
評論
0/150
提交評論