




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章定量資料的統計描述第二章定量資料的統計描述02問題1:何為定量資料?問題2:何為統計描述(statisticaldescription)?第二章定量資料的統計描述02
統計描述:用統計表、或統計圖、或統計指標(描述統計量)概括和揭示資料(data)的數量信息和特征。目的使資料簡潔、明了,便于人們了解資料的規律性。第二章定量資料的統計描述02一、變量的頻數分布1、離散型定量變量的頻數分布例2-11998年某山區96名孕婦產前檢查次數資料如下:
0,3,2,0,1,5,6,3,2,4,1,0,6,5,……,4,7。第二章定量資料的統計描述02檢查次數頻數頻率(%)累計人數累計頻率(%)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5>51212.596100.0合計96100.0————表2-11998年某地96名婦女產前檢查次數頻數分布第二章定量資料的統計描述02第二章定量資料的統計描述02
頻數(frequency):重復某隨機試驗,某隨機事件出現的次數,稱為頻數。
頻數分布表(frequencydistributiontable)簡稱頻數表(frequencytable):含有組段與頻數的統計表,稱頻數表。
直方圖(histogram):為直觀反映頻數表,利用直角坐標系繪制頻數圖,橫軸表示變量的“各種情形”,縱軸表示頻數、或頻率、或頻率密度。第二章定量資料的統計描述022、連續型定量變量的頻數分布問題:
1)何為連續型定量變量?
2)其與離散型定量變量有何區別?
3)連續型定量變量的頻數分布表該如何繪制?第二章定量資料的統計描述02例2-2抽樣調查某地120名18歲到38歲健康男性居民血清鐵含量(umol/L),數據如下。試編制血清鐵資料的頻數分布表。7.428.6523.0221.619.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.14…….14.1816.52第二章定量資料的統計描述02組段頻數頻率(%)累計頻數累計頻率(%)6---10.8310.838---32.5043.3310---65.00108.3312---86.671815.0014---1210.003025.0016---2016.675041.6718---2722.507764.1720---1815.009579.1722---1210.0010789.1724---86.6711595.8326---43.3311999.1728---3010.83120100.00合計120100.00————表2-2120名正常成年男子血清鐵含量(umol/L)頻數表第二章定量資料的統計描述02連續型定量變量頻數表的編制方法:1)計算全距(range,R)
R=最大值-最小值=29.64-7.42=22.22確定組段數(K)與組距如等組距,則組距=R/K3)確定組段、計數歸表第二章定量資料的統計描述02圖2-2120名健康成年男子血清鐵含量頻數直方圖第二章定量資料的統計描述020.040.08圖2-3120名健康成年男子血清鐵含量頻率密度直方圖第二章定量資料的統計描述02問題:頻數直方圖與頻率密度直方圖的意義是否一樣?第二章定量資料的統計描述02潛伏期(小時)頻數累計頻數0---353512---7010524---4014536---2316848---1218060---618672---841187合計187——表2-3187例某種沙門氏菌食物中毒潛伏期分布第二章定量資料的統計描述02圖2-4187例某種沙門氏菌食物中毒潛伏期頻數直方圖第二章定量資料的統計描述02變量頻數分布的類型:1)對稱分布2)偏態分布:正偏峰(positiveskew)分布(向左偏)負偏峰(negativeskew)分布(向右偏)第二章定量資料的統計描述02變量頻數分布的兩個特征1)集中趨勢(centraltendency)2)離散趨勢(tendencyofdispersion)第二章定量資料的統計描述02二、定量變量的特征數(描述定量變量的統計指標、或定量變量的數值特征)第二章定量資料的統計描述021、描述集中趨勢的統計指標(平均數average)1)算術均數(arithmeticmean),簡稱均數2)幾何均數(geometricmean,G)3)中位數(median,M)4)眾數(mode)5)調和均數(harmonicmean,H)第二章定量資料的統計描述021)算術平均數:描述對稱分布資料的平均水平第二章定量資料的統計描述02月工資x員工數f員工比重f/Σff·xx·f/Σf80050.104000801000100.20100002001200200.4024000480150070.1410500210200050.1010000200250030.067500150合計501.00660001320某公司員工工資情況(單位:元)第二章定量資料的統計描述02第二章定量資料的統計描述022)幾何平均數:個體變化范圍越過多個數量級的資料第二章定量資料的統計描述023)中位數:可用于各種分布的定量資料。指總體中有一半個體的數值低于這個數,一半個體的數值高于這個數。對于樣本資料,有如下計算公式:n為奇數時:n為偶數時:第二章定量資料的統計描述02
對于頻數表資料,可用百分位數的方法計算中位數。百分位數(percentile,Px):
對總體來說,它表示總體中數值小于的Px個體恰有x%。對樣本來說,它表示在按照升序排列的數列里,小于Px的個體數在整個樣本中所占百分比為x%。顯然,中位數就是P50。第二章定量資料的統計描述02樣本百分位的計算公式為:式中:L為所求百分位數所在組段的下限;
i為該組段的組距;
fx為該組段的頻數;
n為總頻數;
fL為該組段之前的累計頻數。第二章定量資料的統計描述024)眾數:總體中指出現機會最高的數值;樣本眾數則是在樣本中出現次數最多的數值。表2-11998年某地96名婦女產前檢查次數頻數分布檢查次數頻數頻率(%)累計人數累計頻率(%)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5>51212.596100.0合計96100.0————第二章定量資料的統計描述025)調和均數:先求原始數據的倒數的算術均數,該算術均數的倒數便稱為原始數據的調和均數。第二章定量資料的統計描述02問題:算術平均數與中位數的區別與聯系1、都是用來表示總體的一般水平或分布的集中趨勢,都屬于抽象化的代表值。2、代表的意義不同:算術平均數是對所有變量值來計算的平均數,它能概括反映整個數列中每個變量值的平均水平;
中位數則是根據總體中處于中間位置上的少數變量值來確定的代表值。從這一點來說,算術平均數對數據的概括能力比中位數顯然來的更強一些。第二章定量資料的統計描述023、與中位數相比,算術平均數對數據變化的“靈敏度”很高。但算術平均數極容易受到個別極端值的影響,即對極端值的“耐抗性”較低。“靈敏度”與“耐抗性”是一對矛盾,實際應用中,可根據這些特點和分析的要求,審慎的選擇有關指標。(分布類型)4、適用資料的類型:算術平均數和中位數均適用于定量資料,但中位數還適用于有序分類資料。第二章定量資料的統計描述02問題:考核甲、乙、丙三個中藥店服務員的技術水平,令每人每次從盒中取10克某種中藥,各取5次進行稱量,結果如下(g):甲:9.610.510.09.510.4乙:9.910.19.910.29.9丙:9.59.59.69.49.4第二章定量資料的統計描述022、描述離散趨勢(變異)的統計指標1)極差(range,R)2)四分位數間距(quartilerange,QR)3)方差(variance)4)標準差(standarddeviation)5)變異系數(coefficientofvariation)第二章定量資料的統計描述021)極差:
R=最大值–最小值A:2628303234B:2427303336C:2629303134第二章定量資料的統計描述02極差:計算方便;只考慮兩個極值;與n有關,用于比較是需注意。
第二章定量資料的統計描述022)四分位數間距:
QR=P75–P25第二章定量資料的統計描述02四分位數間距:包抱總體中數值居中的50%的個體;與全距的區別僅僅在于計算范圍較窄。計算時沒用到每個個體的數值;其值越大,說明變量變異越大。第二章定量資料的統計描述023)方差,又稱均方差(meansquaredeviation)第二章定量資料的統計描述02xX-u(x-u)226-41628-243000322434416合計04029第二章定量資料的統計描述02第二章定量資料的統計描述024)標準差:方差的算術平方根,即為標準差。第二章定量資料的統計描述02
標準差與方差的含義類似,值越大,說明變量的變異越大,都適合用來表達對稱分布的離散趨勢。兩者不同的是量綱不一樣。第二章定量資料的統計描述025)變異系數:標準差與均數之比,即為變異系數。用于描述對稱分布資料的變異程度。變異系數無量綱,可用于量綱相同、或不同的變量變異程度大小的比較。第二章定量資料的統計描述02變異程度指標總結:全距、四分位數間距:具有絕對數的形式方差:離均差平方的算術平均數標準差:離均差平均數的形式。共同點:都有具體計量單位,都受計量單位的影響(英尺、米;美元、英鎊)變異系數:是一類相對數形式的變異指標。排除計量單位對計算結果的影響。第二章定量資料的統計描述02
n1=31015均數=10元標準差=5元n2=395100105均數=100元標準差=5元第二章定量資料的統計描述02
同樣的變異指標值對于不同的平均水平通常具有不同的實際分析意義。只有當兩個被比較事物平均數相同或相近時,直接利用標準差等有量綱的變異指標來進行分析,才是合理的。第二章定量資料的統計描述02人均年收入標準差四分位數變異系數%甲市600015032002.5乙市1200018035001.5兩個城市的居民年收入情況乙市年收入與標準差均高于甲市,是否可認為乙市收入差距高于甲市呢?變異系數顯示:乙市居民的收入差距相對于他們的平均收入來說,比甲市要低的多。故以居民對收入差距所承受的壓力而言,甲市比乙市要高。第二章定量資料的統計描述02對稱分布偏態分布開口數據等比級數資料平均水平算術均數中位數中位數幾何均數中位數變異程度標準差方差變異系數全距四分位數間距全距四分位間距全距對數標準差描述統計量的一般應用總結表第二章定量資料的統計描述02問題:均數、方差(標準差)常用來描述對稱分布資料,為什么?第二章定量資料的統計描述023、描述分布形態的統計指標1)偏度系數(coefficientofskewness,SKEW)SKEW是度量隨機變量分布對稱性的指標。理論上,總體偏度系數取值為0時,分布是對稱的;取值為正時,分布為正偏態;取值為負時,分布為負偏態。第二章定量資料的統計描述022)峰度系數(coefficientofkurtosis,KURT)KURT是度量隨機變量分布曲線較正態分布曲線的峰態“平闊或陡峭”的指標。理論上,正態分布的總體峰度系數為0;取值為負時,其分布較正態分布的峰平闊;取值為正時,其分布較正態分布的峰尖峭。第二章定量資料的統計描述02一班90人《衛生統計》考試成績第二章定量資料的統計描述02二班90人《衛生統計》考試成績兩班成績情況如何?用什么方法來揭示其差別?此研究個體、變量、變量值?抽樣研究、普查?兩班均是《衛生統計》成績第二章定量資料的統計描述02兩班《衛生統計》成績頻數分布表第二章定量資料的統計描述02第二章定量資料的統計描述02一、二班《衛生統計》成績統計結果第二章定量資料的統計描述02三、統計表與統計圖
statisticaltableandstatisticalgraph
第二章定量資料的統計描述02作用與特點統計研究結果的表現形式是多種多樣的。除單純的文字敘述外,統計表與統計圖也是一種常用形式。統計圖表簡單明了,可代替冗長的文字敘述,便于閱讀和把握主要的研究結果。在數字語言中,統計表應是基本的,統計圖常起補充作用。把文字敘述與統計圖表結合起來才是最完美、最生動的數字語言。第二章定量資料的統計描述02統計圖表都是一種具有綜合性和總結性的敘述數字資料的方法。兩者的形式不同,使用的場合也各有側重。統計圖在表示事物的變化趨勢、事物間關系和分布方面有其特別的優勢,缺點是對資料的描述不夠細致。統計表則容量大,能將數字精確到所需小數位,并有利于進一步的統計處理,故其應用更為廣泛。第二章定量資料的統計描述022000年三種雜志統計表使用情況雜志使用率%中華內科雜志85.0%中華兒科雜志87.3%中華預防醫學雜志87.8%第二章定量資料的統計描述022000年對7種中華系列雜志(中華內科雜志、中華兒科雜志、中華風濕病學雜志、中華預防醫學雜志、中華病理學雜志、中華眼科雜志、中華放射學雜志)717篇論著的調查,有統計圖的80篇(11.2%),共有統計圖132個。 第二章定量資料的統計描述02統計表
statisticaltable第二章定量資料的統計描述02一、統計表的編制要求簡單明了,重點突出,對比鮮明。主語謂語劃分清楚。主語是統計表所要說明的事物,謂語是用來說明事物的指標,多為數字指標。一般說來,統計表的主語排在左端,謂語排在表的右端。第二章定量資料的統計描述02二、統計表的結構
表號標題橫標目名稱縱標目橫標目數字合計第二章定量資料的統計描述021、標題:標題應概括表的主要內容,一般包括研究的時間、地點和研究內容,寫在表的上端中央。2、標目:標目是表格內的項目,文字應簡明,有度量單位者需注明。標目有橫目和縱標目兩種。橫標目列于表的左側,是表的主語位置,說明橫行數字的涵義,一般是所分析研究事物的分組。縱標目列于表的右上方,是表的謂語位置,說明各縱列數字的涵義,一般表示被研究事物的各項指標。第二章定量資料的統計描述023、線條:一張表至少要有三條線(三線表)。有合計欄的表格可再用橫線將“合計”分隔開,對一些有兩組標目的組合表,需用橫線將兩組標目分隔開。其它豎線和斜線一概省去。4、數字:一般用阿拉伯數字表示,同一指標的小數位應一致,且按小數點位數對齊。不留空格,無數字用“——”表示,缺失數字用“….”表示。5、備注不要列入表內,如表內有需要說明的內容,應在表內做出*號標記,并在表底線下加以說明。第二章定量資料的統計描述02
三、統計表的種類
1、簡單表
表3-1某地某年**藥治療急性咽喉炎療效比較組別例數有效數有效率%試驗組1079386.9對照組1089477.8第二章定量資料的統計描述022、復合表
表3-2某地某年不同年齡、性別的兒童青少年意外損傷情況
年齡(歲)男女調查數損傷數損傷率%調查數損傷數損傷率%3.5--4476614.77424296.846.5--1215927.571239534.289.5--118012210.341070807.4812.5--121715012.331136665.8115.8--18.56226510.45582203.44合計468149510.5744512485.57第二章定量資料的統計描述02四、應用舉例
表1治療組與對照組的療效比較治療組對照組療效常規劑量大劑量常規劑量大劑量例數百分率(%)例數百分率(%)例數百分率(%)例數百分率(%)顯效21/6830.914/6023.30/240.03/319.7有效43/6863.244/6073.321/2487.526/3183.9無效4/685.92/603.43/2412.52/316.4總有效率64/6894.158/6096.722/2487.529/3193.5第二章定量資料的統計描述02
表1
不同治療劑量的治療組和對照組療效比較*:總有效=顯效+有效級別總例數療效總有效*顯效有效無效例數率(%)治療組1283587612295.3常規劑量68214346494.1大劑量60144425896.7對照組5534755090.9常規劑量2402132187.5大劑量3132622993.5第二章定量資料的統計描述02
問題:某地不同年齡兒童身高體檢資料
年齡例數均數±標準差587114.1±5.086605117.4±5.88--------------第二章定量資料的統計描述02問題:某地不同年齡不同性別兒童身高體檢資料年齡男女nmean±SDnmean±SD575114.1±5.0887114.7±5.166158117.4±5.88183117.1±5.80---------------------第二章定量資料的統計描述02問題:某地城鄉不同年齡不同性別兒童身高體檢資料男女年齡城市鄉村城市鄉村nX±SnX±SDnX±SDnX±SD567第二章定量資料的統計描述02統計圖
statisticalgraph第二章定量資料的統計描述02
統計圖是利用幾何學上的點、線、面、體等圖形,有時也利用自然地圖來表示資料的多少和分布,以及變化趨勢或相互關系。
第二章定量資料的統計描述02一、制圖的一般原則1、按資料的性質和分析目的選用合適的圖形。2、要有標題:概括表的主要內容,包括時間、地點和研究內容,一般寫在圖的下端中央。3、統計圖一般有橫軸和縱軸:橫軸是主語位置所在,縱軸則為謂語位置。一般將兩軸的相交點即為原點處定為0,橫軸尺度自左至右,縱軸尺度自下而上,縱橫比例大致為5:7。4、當要用不同線條和顏色表達不同事物或對象時,需要附圖例加以說明。第二章定量資料的統計描述02二、常用統計圖的種類、選擇與作用圖形種類資料性質特征和作用條圖間斷性品質資料以條的高度表示數值,比較大小百分構成圖間斷性品質資料以全長為100%,看結構圓圖間斷性品質資料扇面表示數值,每1%為3.6度,結構直方圖連續性數量資料以矩形面積表示數值,看群體分布線圖動態資料看變化趨勢散點圖連續性、間斷性看兩變量間的關系統計地圖連續性、間斷性表示事物數量地理分布第二章定量資料的統計描述022000年對7種中華系列雜志(中華內科雜志、中華兒科雜志、中華風濕病學雜志、中華預防醫學雜志、中華病理學雜志、中華眼科雜志、中華放射學雜志)717篇論著的調查,有統計圖的80篇(11.2%),共有統計圖132個。其中線圖居首位87個(65.9%),條圖次之共22個(16.7%)。第二章定量資料的統計描述02三、常見統計圖1、條圖(bargraph):用等寬的直條長短來代表按性質分類的資料各類別的數值大小,表示它們之間的對比關系。以橫軸為基線,表示條個類別;縱軸表示其數值。縱軸尺度從“0”開始,中間不宜折斷。在同一圖內尺度單位代表同一數量時,必須一律相等。各直條的寬度應相等,間隙的寬度與直條的寬度相等或為直條寬度的1/2。復式直條圖一個組包括兩個以上直條,直條所表示的類別應用圖例說明。第二章定量資料的統計描述02三城市某種傳染病發病率(‰)比較第二章定量資料的統計描述02某地89年與90年男女嬰兒死亡率(‰
)比較第二章定量資料的統計描述022、百分條圖(percentgraph):表示事物內部各組成部分的構成情況,又稱構成條圖。先繪制一個標尺,尺度分成10格,每格代表10%,總長度為100%。繪制一直條,全長等于標尺的100%,直條寬度可任意選擇,以直條內相對面積的大小代表數量的百分比。直條各部分用線分開,并注明簡要文字及百分比。資料可由大到小,或按習慣次序,自左至右順序排列。如有兩種或以上性質類似的資料相比較,則繪制的各直條應全長相同,且各直條中各部分的排列次序要一致,以利比較分析。第二章定量資料的統計描述02某礦1961~1965年各期存活矽肺構成比較
第二章定量資料的統計描述023、圓圖(circlegraph):用途與百分條圖相同,表示事物內部各部分的構成情況。先繪一圓形,由于圓周360度,因此每1%相當于3.6度的圓周角,將百分比乘以3.6度即為構成部分應占的圓周角度數。圓形圖上各部分按自然順序或大小排列,一般相當于時種9點或12點為起點,順時鐘方向排列,扇形
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合作登報創業協議書
- 夫妻財產清算協議書
- 工傷待遇和解協議書
- 高危安全包攬協議書
- 工程材料協議書范本
- 動力餐車轉讓協議書
- 拆房意外免責協議書
- 村屯垃圾承包協議書
- 崗位工資協議書到期
- 工程返工處理協議書
- 2024福建省能源石化集團有限責任公司秋季社會招聘120人筆試參考題庫附帶答案詳解
- 吉林省吉林市2024-2025學年高三下學期3月三模試題 英語 含答案
- 2025-2030直銷銀行行業發展分析及投資戰略研究報告
- 2025年常州紡織服裝職業技術學院單招綜合素質考試題庫及答案1套
- 中央空調系統維保服務報價清單
- 以問題為導向的健康照顧教學課件
- 新版《土地開發整理項目預算定額標準》講解
- 烏靈膠囊幻燈課件
- DB44∕T 1188-2013 電動汽車充電站安全要求
- 環網柜出廠檢驗規范標準
- 人教統編版高中語文必修下冊第八單元(單元總結)
評論
0/150
提交評論