




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第3章平均數、標準差與變異系數第3章平均數、標準差與變異系數1數據有兩種變化趨勢:集中趨勢和離散趨勢。表示數據集中趨勢的指標有多個,如平均數(算術平均數、幾何平均數)、中位數、眾數,使用最多的是算術平均數。表示數據離散趨勢的指標有多個,如極差、平均離差、方差與標準差,使用最多的是方差與標準差。數據有兩種變化趨勢:集中趨勢和離散趨勢。2資料中各觀察值的總和除以觀察值的個數所得的商,稱為算術平均數,簡稱為平均數或均數。用符號表示。
平均數的意義:平均數用來描述資料的集中性,即指出資料中數據集中較多的中心位置,常用于同類性質資料間的相互比較。一、集中趨勢資料中各觀察值的總和除以觀察值的個數所得的商,稱為算術平均數3計算方法1.直接法適用于樣本含量較小的非頻數資料如果一個含量為n的樣本,其n個觀察值分別用x1、x2……xn表示,則它們的平均數為其中,(Sigma)為總和符號,表示從第一個觀察值x1累加到第n個觀察值xn,若在意義上已明確時,簡記為x。計算方法4常數的總和等于該常數的n倍,即代數和的總和等于總和的代數和,即總和符號內的常數因子可以提取到總和符號之外,即其中C為常數(a為常數)關于總和符號的幾個性質常數的總和等于該常數的n倍,即其中C為常數(a為常數)關于52.加權法如果樣本中有n1個x1,有n2個x2,那么,n1+n2個數的平均數是加權平均數。同理:各組的次數fi
是權衡各組中值
xi在資料中所占比重大小的數量,因此f被稱為是x的“權”,加權法也由此而得名。2.加權法6在計算離散型頻數資料的平均數時,式中x為組值,f為頻數,N為總頻數(∑f),k為組數。在計算離散型頻數資料的平均數時,7表3-150只小雞出殼天數的頻數分布表表3-150只小雞出殼天數的頻數分布表8在計算連續型頻數資料的平均數時,式中m為組中值,f、N和k同上式。在計算連續型頻數資料的平均數時,9組別組中值m頻數(f)fm44.25—45.029045.75—46.529347.25—48.01048048.75—49.51259450.25—51.026132651.75—52.544231053.25—54.043232254.75—55.5291609.556.25—57.01162757.75—58.515877.559.25—60.0212060.75—61.54246合計20010695表3-2某純系蛋雞200枚蛋重的頻數分布表
=10695/200=53.475組別組中值m頻數(f)fm44.25—45.02904510平均數有以下幾個基本特性:(1)平均數的計算與樣本內每個值都有關,它的大小受每個值的影響。(2)若每個xi都乘以相同的數k,則平均數亦應乘以k。(3)若每個xi都加上(或減去)相同的數A,則平均數亦應加上(或減去)A。平均數有以下幾個基本特性:(1)平均數的計算與樣本內每個值都11中位數(median)將資料中所有觀察值從小到大依次排列,處于中間位置的數。以Md表示。適用條件
資料呈偏態分布或頻數分布類型不明,以及一端或兩端無確定數值,這種資料用中位數作為代表值比用算術平均數為好。非頻數資料,先將各觀察值由小到大排列,當n為奇數時,第(n+1)/2位置的觀察值即為中位數,即:Md=x(n+1)/2中位數(median)將資料中所有觀察值從小到大依次12其中:L—中位數所在組的下限;i—組距;f—中位數所在組的頻數;n—總頻數;c—小于中數所在組的累積頻數。當n為偶數時,和位置的兩個觀察值之和的二分之一即為中位數,即:若資料已分組,并編制成了頻數分布表,可利用頻數分布表計算中數。其中:L—中位數所在組的下限;i—組距;f—中位數所在組的頻13潛伏期(小時)病例數f累計例數0——252512——588324——4012336——2314648——1215860——516372——1164[例]某地區有164人因沙門氏菌食物中毒,其潛伏期資料經整理如下表,試計算中位數。潛伏期(小時)病例數f累計例數0——252512——5814眾數(Mode)資料中出現次數最多的那個數或頻數最多一組的組中值,記為Mo。眾數(Mode)資料中出現次數最多的那個數或頻數最多一組的組15
fmax=24,Mo=2250只小雞出殼天數的頻數分布表Md=22fmax=24,Mo=2250只小雞出殼天16組別組中值m頻數(f)fx44.25—45.029045.75—46.529347.25—48.01048048.75—49.51259450.25—51.026132651.75—52.544231053.25—54.043232254.75—55.5291609.556.25—57.01162757.75—58.515877.559.25—60.0212060.75—61.54246合計20010695表3-2某純系蛋雞200枚蛋重的頻數分布表
=10695/200=53.475fmax=44,Mo=52.5Md=53.35組別組中值m頻數(f)fx44.25—45.02904517幾何平均數(Geometricmean)定義
指n個觀察值乘積的n次方根。即適用條件
主要應用于數據呈倍數關系或不對稱分布的資料,算術平均數對這類資料的代表性差。如抗體效價(1:10,1:100,1:1000,1:10000)、增長率或生長率、動態發展速度等。幾何平均數(Geometricmean)定義指n個觀18計算1、應用公式計算(實際應用時常取對數)計算19例海蝦養殖試驗,各旬的生長速度3.0,1.51.3,1.2,1.2,1.1,1.1,求海蝦的旬平均生長速度。解:即海蝦平均生長速度為1.38。其算術平均數為例海蝦養殖試驗,各旬的生長速度3.0,1.51.3,1.20當資料編成頻數分布表時,—各組組中值;—各組次數;當資料編成頻數分布表時,21二、離散趨勢資料的另一方面的特征是變異程度。如:
A組資料:3、4、5、6、7平均數為:5
B組資料:1、3、5、7、9平均數為:5
這里的平均數5對于A組資料的代表性好?還是對于B組資料的代表性好?
可見,只表明了數據的集中程度是遠遠不夠的,還需要進一步說明數據的變異程度。只有通過變異程度的描述,才知道代表值的代表性。表示數據變異特征的數值叫變異數。常用的變異數有:極差、平均離差、方差、標準差、變異系數等。二、離散趨勢資料的另一方面的特征是變異程度。如:
A組資22極差(全距)極差=最大值-最小值只利用了資料中最大值和最小值,不能準確表達資料中各個觀察值的變異程度。平均離差
極差(全距)23它不能表示整個資料中所有觀察值的總偏離程度使用不方便,在統計學中未被采用消除離均差的負號離均差的平方之和(簡稱平方和,記為SS)稱為均方(縮寫為MS),又稱為樣本方差,記為S2標準差S離均差它不能表示整個資料中所有觀察值的總偏離程度使用不方便,在統計24首先求出離均差,即每個數與它們的平均數之間的離差;然后將所有的離均差平方,再相加,得出離均差平方和;最后用n-1除離均差平方和(按照統計學理論,不要用樣本含量n去除),所得的商稱為樣本方差,用符號s2表示。方差s2是離均差平方的平均數。雖然方差在實際應用中用得最廣泛,但因它的單位是原始數據單位的平方,所以它不能直接地指出某個數x與平均數之間的偏離究竟達到什么程度。為此,采用標準差s做標準,衡量x與平均數之間的離散程度。首先求出離均差,即每個數與它們的平均數之間的離差;然后將所有25自由度(degreeoffreedom):統計學借此來反映一批變量的約束條件。例如一個有5個觀察值的樣本,因為受到統計數的約束,在5個離均差中,只有4個數值可以在一定范圍內自由變動取值,而第五個離均差必須滿足這一限制條件。自由度記作DF,一般樣本自由度等于觀察值個數(n)減去約束條件的個數(k),即DF=n-k。
自由度(degreeoffreedom):統計學26樣本方差樣本標準差樣本方差樣本標準差27為了方便計算,將離均差平方和轉化為另一種形式,同時略去下標,上式可表示為:為了方便計算,將離均差平方和轉化為另一種形式,同時略去下標,28在計算離散型頻數資料的標準差時,式中x為組值,f為頻數,N為總頻數(∑f),k為組數。在計算離散型頻數資料的標準差時,29在計算連續型頻數資料的標準差時,式中m為組中值,f、N和k同上式。在計算連續型頻數資料的標準差時,30標準差的特性(一)標準差的大小受資料中各觀察值的影響,觀察值間變異大的標準差也大,反之則小;(二)計算標準差時,各觀測值加上或減去一個常數,標準差的值不變;(三)當每個觀察值都乘以一個常數a時,所得的標準差是原來標準差的a倍.標準差的特性31樣本的方差為總體的方差為樣本的方差為總體的方差為32變異系數Coeffcientofvariation資料的單位不同或平均數相差很大時,直接利用標準差比較資料間變異程度是不妥的,需用變異系數。變異系數同標準差一樣是衡量資料變異程度的統計量。變異系數消除了不同單位和平均數的影響,可以用來比較不同資料的相對變異程度。變異系數Coeffcientofvariation資料33變異系數是標準差與平均數的比,記為CV。兩個小麥品種株高變異的比較變異系數是標準差與平均數的比,記為CV。34特點和作用(一)變異系數是一個無單位的相對數;(二)變異系數同時受到平均數和標準差的影響,因此,在利用變異系數來表示資料的變異程度時,最好將平均數和標準差也列出。(三)變異系數不受單位不同或平均數不同的影響,對于單位不同和平均數不同的資料,都可以用變異系數來比較其特點和作用35第3章平均數、標準差與變異系數第3章平均數、標準差與變異系數36數據有兩種變化趨勢:集中趨勢和離散趨勢。表示數據集中趨勢的指標有多個,如平均數(算術平均數、幾何平均數)、中位數、眾數,使用最多的是算術平均數。表示數據離散趨勢的指標有多個,如極差、平均離差、方差與標準差,使用最多的是方差與標準差。數據有兩種變化趨勢:集中趨勢和離散趨勢。37資料中各觀察值的總和除以觀察值的個數所得的商,稱為算術平均數,簡稱為平均數或均數。用符號表示。
平均數的意義:平均數用來描述資料的集中性,即指出資料中數據集中較多的中心位置,常用于同類性質資料間的相互比較。一、集中趨勢資料中各觀察值的總和除以觀察值的個數所得的商,稱為算術平均數38計算方法1.直接法適用于樣本含量較小的非頻數資料如果一個含量為n的樣本,其n個觀察值分別用x1、x2……xn表示,則它們的平均數為其中,(Sigma)為總和符號,表示從第一個觀察值x1累加到第n個觀察值xn,若在意義上已明確時,簡記為x。計算方法39常數的總和等于該常數的n倍,即代數和的總和等于總和的代數和,即總和符號內的常數因子可以提取到總和符號之外,即其中C為常數(a為常數)關于總和符號的幾個性質常數的總和等于該常數的n倍,即其中C為常數(a為常數)關于402.加權法如果樣本中有n1個x1,有n2個x2,那么,n1+n2個數的平均數是加權平均數。同理:各組的次數fi
是權衡各組中值
xi在資料中所占比重大小的數量,因此f被稱為是x的“權”,加權法也由此而得名。2.加權法41在計算離散型頻數資料的平均數時,式中x為組值,f為頻數,N為總頻數(∑f),k為組數。在計算離散型頻數資料的平均數時,42表3-150只小雞出殼天數的頻數分布表表3-150只小雞出殼天數的頻數分布表43在計算連續型頻數資料的平均數時,式中m為組中值,f、N和k同上式。在計算連續型頻數資料的平均數時,44組別組中值m頻數(f)fm44.25—45.029045.75—46.529347.25—48.01048048.75—49.51259450.25—51.026132651.75—52.544231053.25—54.043232254.75—55.5291609.556.25—57.01162757.75—58.515877.559.25—60.0212060.75—61.54246合計20010695表3-2某純系蛋雞200枚蛋重的頻數分布表
=10695/200=53.475組別組中值m頻數(f)fm44.25—45.02904545平均數有以下幾個基本特性:(1)平均數的計算與樣本內每個值都有關,它的大小受每個值的影響。(2)若每個xi都乘以相同的數k,則平均數亦應乘以k。(3)若每個xi都加上(或減去)相同的數A,則平均數亦應加上(或減去)A。平均數有以下幾個基本特性:(1)平均數的計算與樣本內每個值都46中位數(median)將資料中所有觀察值從小到大依次排列,處于中間位置的數。以Md表示。適用條件
資料呈偏態分布或頻數分布類型不明,以及一端或兩端無確定數值,這種資料用中位數作為代表值比用算術平均數為好。非頻數資料,先將各觀察值由小到大排列,當n為奇數時,第(n+1)/2位置的觀察值即為中位數,即:Md=x(n+1)/2中位數(median)將資料中所有觀察值從小到大依次47其中:L—中位數所在組的下限;i—組距;f—中位數所在組的頻數;n—總頻數;c—小于中數所在組的累積頻數。當n為偶數時,和位置的兩個觀察值之和的二分之一即為中位數,即:若資料已分組,并編制成了頻數分布表,可利用頻數分布表計算中數。其中:L—中位數所在組的下限;i—組距;f—中位數所在組的頻48潛伏期(小時)病例數f累計例數0——252512——588324——4012336——2314648——1215860——516372——1164[例]某地區有164人因沙門氏菌食物中毒,其潛伏期資料經整理如下表,試計算中位數。潛伏期(小時)病例數f累計例數0——252512——5849眾數(Mode)資料中出現次數最多的那個數或頻數最多一組的組中值,記為Mo。眾數(Mode)資料中出現次數最多的那個數或頻數最多一組的組50
fmax=24,Mo=2250只小雞出殼天數的頻數分布表Md=22fmax=24,Mo=2250只小雞出殼天51組別組中值m頻數(f)fx44.25—45.029045.75—46.529347.25—48.01048048.75—49.51259450.25—51.026132651.75—52.544231053.25—54.043232254.75—55.5291609.556.25—57.01162757.75—58.515877.559.25—60.0212060.75—61.54246合計20010695表3-2某純系蛋雞200枚蛋重的頻數分布表
=10695/200=53.475fmax=44,Mo=52.5Md=53.35組別組中值m頻數(f)fx44.25—45.02904552幾何平均數(Geometricmean)定義
指n個觀察值乘積的n次方根。即適用條件
主要應用于數據呈倍數關系或不對稱分布的資料,算術平均數對這類資料的代表性差。如抗體效價(1:10,1:100,1:1000,1:10000)、增長率或生長率、動態發展速度等。幾何平均數(Geometricmean)定義指n個觀53計算1、應用公式計算(實際應用時常取對數)計算54例海蝦養殖試驗,各旬的生長速度3.0,1.51.3,1.2,1.2,1.1,1.1,求海蝦的旬平均生長速度。解:即海蝦平均生長速度為1.38。其算術平均數為例海蝦養殖試驗,各旬的生長速度3.0,1.51.3,1.55當資料編成頻數分布表時,—各組組中值;—各組次數;當資料編成頻數分布表時,56二、離散趨勢資料的另一方面的特征是變異程度。如:
A組資料:3、4、5、6、7平均數為:5
B組資料:1、3、5、7、9平均數為:5
這里的平均數5對于A組資料的代表性好?還是對于B組資料的代表性好?
可見,只表明了數據的集中程度是遠遠不夠的,還需要進一步說明數據的變異程度。只有通過變異程度的描述,才知道代表值的代表性。表示數據變異特征的數值叫變異數。常用的變異數有:極差、平均離差、方差、標準差、變異系數等。二、離散趨勢資料的另一方面的特征是變異程度。如:
A組資57極差(全距)極差=最大值-最小值只利用了資料中最大值和最小值,不能準確表達資料中各個觀察值的變異程度。平均離差
極差(全距)58它不能表示整個資料中所有觀察值的總偏離程度使用不方便,在統計學中未被采用消除離均差的負號離均差的平方之和(簡稱平方和,記為SS)稱為均方(縮寫為MS),又稱為樣本方差,記為S2標準差S離均差它不能表示整個資料中所有觀察值的總偏離程度使用不方便,在統計59首先求出離均差,即每個數與它們的平均數之間的離差;然后將所有的離均差平方,再相加,得出離均差平方和;最后用n-1除離均差平方和(按照統計學理論,不要用樣本含量n去除),所得的商稱為樣本方差,用符號s2表示。方差s2是離均差平方的平均數。雖然方差在實際應用中用得最廣泛,但因它的單位是原始數據單位的平方,所以它不能直接地指出某個數x與平均數之間的偏離究竟達到什么程度。為此,采用標準差s做標準,衡量x與平均數之間的離散程度。首先求出離均差,即每個數與它們的平均數之間的離差;然后將所有60自由度(degreeoffreedom):統計學借此來反映一批變量的約束條件。例如一個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 玉溪職業技術學院《地理課程與教學論》2023-2024學年第二學期期末試卷
- 武漢紡織大學外經貿學院《隸書楷書(2)》2023-2024學年第二學期期末試卷
- 山東財經大學《語文教學能力實訓》2023-2024學年第二學期期末試卷
- 西南財經大學《中國傳統體育》2023-2024學年第二學期期末試卷
- 武漢紡織大學《法醫學基礎實驗》2023-2024學年第一學期期末試卷
- 西南醫科大學《西方經典名著賞析》2023-2024學年第二學期期末試卷
- 空調安裝勞務合同年
- 培訓班老師勞動合同
- 商場門面房租賃合同
- 承包坑塘合同協議書
- 全國優質課一等獎高中物理必修一《實驗:探究平拋運動特點》精美課件
- 土地征收回收補償方案范本
- 建標 156-2011 特殊教育學校建設標準
- 煤礦井下密閉專項設計
- 配電箱每日檢查記錄表
- 箱涵拉森鋼板樁支護專項施工方案
- 分泌性中耳炎教學課件
- 江蘇省2022年五年制專轉本英語真題
- 臨床血液學檢驗技術-第十章-第二節-常見出血性疾病及檢驗-課件
- 普通地質學教材
- 常減壓煉油仿真工藝流程簡介
評論
0/150
提交評論