




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
4.3平均指標(平均數-集中程度測度)數據集中區(qū)變量x學習目標1. 集中趨勢各測度值的計算方法集中趨勢各測度值的特點及應用場合
算術平均數調和平均數幾何平均數中位數眾數數據分布的特征集中趨勢
(位置)偏態(tài)和峰態(tài)(形狀)離中趨勢
(分散程度)數據分布特征的測度數據特征的測度分布的形狀集中趨勢離散程度眾數中位數均值離散系數方差和標準差峰態(tài)四分位差異眾比率偏態(tài)集中趨勢
(Centraltendency)一組數據向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數據水平的代表值或中心值不同類型的數據用不同的集中趨勢測度值低層次數據的測度值適用于高層次的測量數據,但高層次數據的測度值并不適用于低層次的測量數據一、平均指標的概念和作用(一)平均指標的含義平均指標是同質總體各單位某一數量標志值在具體時間、地點、條件下達到的一般水平。平均指標具有以下特點:(1)同構型(2)抽象性(3)代表性(二)平均指標的作用
1.平均指標可以反映分配數列中各變量值分布的集中趨勢2.平均指標可以反映現象總體的綜合特征3.平均指標經常用來進行同類現象在不同空間、不同時間條件下的對比分析
二、平均指標的類別及計算均值(Mean)
中位數 (Median)眾數 (Mode)算術平均數(Mean)調和平均數(Harmonicmean)幾何平均數(Geometricmean)(一)算術平均數(Mean)1.簡單算術平均數(Simplemean)簡寫為:簡寫為:分組資料時,各組變量值應用組中值M代替。2.加權算術平均數(Weightedmean)加權算術平均數
(權數對均值的影響)
甲乙兩組各有10名學生,他們的考試成績及其分布數據如下
甲組:
考試成績(x): 020100
人數分布(f):118
乙組:考試成績(x): 020100
人數分布(f):811已改至此!!某電腦公司銷售量數據分組表按銷售量分組組中值(Mi)頻數(fi)Mi
fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合計—12022200加權算術平均數
(例題分析)3.算術平均數的重要數學性質(1)各變量值與算術平均數的離差總和等于0,即:未分組資料:分組資料:(2)各變量值與算術平均數的離差平方和最小。即:未分組資料:為最小。分組資料:為最小。
這兩個性質是進行趨勢預測、回歸預測、建立數學模型的重要數學理論依據。為最小。算術平均數(均值,mean)
小結集中趨勢的最常用測度值一組數據的均衡點所在(重心)體現了數據的必然性特征易受極端值的影響用于數值型數據,不能用于分類數據和順序數據(二)調和平均數(Harmonicmean)
調和平均數是總體各單位標志值倒數的算術平均數的倒數,又稱為倒數平均數記作。1.簡單調和平均數
2.加權調和平均數
調和平均數
(例題分析)某日三種蔬菜的批發(fā)成交數據蔬菜名稱批發(fā)價格(元)
xi成交額(元)mi=xi
fi成交量(公斤)fi甲乙丙1.200.500.801800012500640015000250008000合計—3690048000【例】某蔬菜批發(fā)市場三種蔬菜的日成交數據如表,計算三種蔬菜該日的平均批發(fā)價格算術平均數與調和平均數的關系及運用調和平均數一般作為算術平均數的變形使用,它仍然是依據算術平均數的基本公式——標志總量除以總體單位總量來計算。若已知條件為分組資料的各組變量值及各組的標志總和即時,可采用加權調和平均法計算平均指標;若已知條件為分組資料的各組變量值及各組的次數時,可直接用加權算術平均法計算平均指標。算術平均法和調和平均法在相對指標和平均指標的平均數的應用
計算相對指標和平均指標的平均數應根據被研究標志的性質即具有的權數資料用不同的方法。舉例見書P73-74。
調和平均數(harmonicmean)
小結均值的另一種表現形式易受極端值的影響計算公式為原來只是計算時使用了不同的數據!(三)幾何平均數(Geometricmean)幾何平均數是個變量值乘積的次方根,主要用于計算比率的平均數。在實際應用中,幾何平均數主要用于計算社會經濟現象的發(fā)展速度、比率(如本利率)等變量的平均。1.簡單幾何平均數(根據未分組資料計算)
2.加權幾何平均數(根據分組資料計算)
簡單幾何平均數
(例題分析)
【例】某水泥生產企業(yè)1999年的水泥產量為100萬噸,2000年與1999年相比增長率為9%,2001年與2000年相比增長率為16%,2002年與2001年相比增長率為20%。求各年的年平均增長率。年平均增長率=114.91%-1=14.91%簡單幾何平均數
(例題分析)
【例】一位投資者購持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內的平均收益率算術平均:
幾何平均:加權幾何平均數
(例題分析)【例】某人有一筆款現存入銀行10年,前2年的平均率為6%,第3至5年的年利率為5%,后5年的年利率為3%,如果按復利計算,這筆款項的平均年利率為多少?幾何平均數(geometricmean)
小結
n個變量值乘積的
n次方根適用于對比率數據的平均主要用于計算平均增長率計算公式為5.可看作是均值的一種變形(四)眾數(Mode)
眾數()是指總體中出現次數最多的標志值。由于它出現的次數最多,在總體各標志值之中它的代表性較強,能夠鮮明地反映數據分布的集中趨勢。1.由單項式數列確定眾數單項式數列確定眾數,只需觀察找出次數最多的標志值即可。2.由組距數列確定眾數(1)確定眾數所在組(2)利用公式計算眾數的近似值下限公式:上限公式:式中:—為眾數;—是眾數組的下限;—是眾數組的上限;
—為眾數組的次數;—為眾數組前一組的次數;
—為眾數組后一組的次數;—為眾數組的組距。
3.眾數的特征及作用眾數是一種位置平均數,不受極端值的影響。當總體單位數多且具有明顯集中趨勢時,計算眾數既方便且意義明確。(當然,如果總體單位數少或沒有明顯的集中趨勢,則眾數就不存在。當變量數列中有兩個或幾個變量值的次數都比較集中時,就可能有兩個或幾個眾數)眾數也適用于定類、定序數據集中趨勢的測度,尤其頗適用于定類資料集中趨勢的測度。
眾數
(不唯一性)無眾數
原始數據:10591268一個眾數
原始數據:65
9855多于一個眾數
原始數據:252828
364242分類數據的眾數
(例題分析)不同品牌飲料的頻數分布
飲料品牌頻數比例百分比(%)可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100解:這里的變量為“飲料品牌”,這是個分類變量,不同類型的飲料就是變量值在所調查的50人中,購買可口可樂的人數最多,為15人,占總被調查人數的30%,因此眾數為“可口可樂”這一品牌,即
Mo=可口可樂順序數據的眾數
(例題分析)解:這里的數據為順序數據。變量為“回答類別”甲城市中對住房表示不滿意的戶數最多,為108戶,因此眾數為“不滿意”這一類別,即
Mo=不滿意甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510合計300100.0眾數(mode)小結出現次數最多的變量值不受極端值的影響一組數據可能沒有眾數或有幾個眾數主要用于分類數據,也可用于順序數據和數值型數據(五)中位數(median)中位數()是將總體各單位的標志值按大小順序排列,處于中間位置的那個標志值。1.中位數的計算:確定中點位次;找出中點位次對應的標志值(中位數)。(1)由未分組資料計算中位數先將總體各單位的標志值按大小順序排列,再按下式確定中位數所在的位次,進而確定中位數。未分組數據的中位數
(9個數據的算例)【例】:9個家庭的人均月收入數據原始數據:15007507801080850960200012501630排
序:7507808509601080
1250150016302000位置:123456789中位數1080未分組數據的中位數
(10個數據的算例)【例】:10個家庭的人均月收入數據排
序:
660
75078085096010801250150016302000位置:12345
678910(2)由分組資料計算中位數
在單項式分組資料下:首先計算累計次數,再按確定中位數的位次,找出中位數所在組,該組的變量值就是中位數。在組距式分組資料下:首先計算累計次數,按確定中位數所在組,再利用公式按比例求得中位數的近似值,此公式有下限公式和上限公式兩種。式中:—為中位數所在組的下限;—為中位數所在組的次數;—為中位數組前一組的累計次數(累計次數按向上累計計算);—為中位數所在組的組距。—中位數所在組的上限;——中位數組前一組的累計次數(累計次數按向下累計計算)。下限公式:
上限公式:
2.中位數的特征和作用中位數是位置平均數,不受極端值的影響(當次數分布非對稱,特別是資料中存在極端值時,中位數作集中趨勢的測度量較準確)。中位數適用于測度數量資料集中趨勢外,尤其適用于測度定序數據的集中趨勢,但不適用于定類數據。順序數據的中位數
(例題分析)解:中位數的位置為300/2=150
從累計頻數看,中位數在“一般”這一組別中。因此
Me=一般甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)累計頻數
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計300—中位數
(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數據,也可用數值型數據,但不能用于分類數據各變量值與中位數的離差絕對值之和最小,即三、集中趨勢的其它測度量—四分位數(quartile)將資料按大小順序排列后,分割成四等分,得到三個分割點,每個分割點上的數值就是四分位數。四分位數位置的確定:未分組資料分組資料順序數據的四分位數
(例題分析)解:QL位置=(300)/4=75QU位置=(3×300)/4
=225
從累計頻數看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此
QL
=不滿意
QU
=一般甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)累計頻數
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計300—數值型未分組數據的四分位數
(9個數據的算例)【例】:9個家庭的人均月收入數據原始數據:15007507801080850960200012501630排
序:75078085096010801250150016302000位置:123456789數值型未分組數
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學習網絡技術的正確方式試題及答案
- 計算機二級MySQL語言應用規(guī)范試題及答案
- 后勤裝備運行管理制度
- 公司往來文件管理制度
- 宿舍天臺物資管理制度
- 培訓基地門禁管理制度
- 公司注冊商標管理制度
- 小區(qū)物業(yè)車庫管理制度
- 出租工位平臺管理制度
- 員工待崗輪休管理制度
- 快手信息流廣告優(yōu)化師(初級)認證考試題庫(附答案)
- 2023-2024年外賣騎手行業(yè)現狀及發(fā)展趨勢研究報告
- 染料敏化太陽能電池材料課件
- 建工集團全資子公司負責人年度經營業(yè)績考核辦法
- 2025年湖北省武漢市高考數學模擬試卷(附答案解析)
- 融匯畫方網絡準入設備技術白皮書
- 道口抓拍系統施工方案
- 三星堆-巴蜀與青銅文化的見證
- 人工智能導論(天津大學)知到智慧樹章節(jié)答案
- 詳盡的施工方案
- DB3305T 323-2024政府儲備糧綠色倉儲技術規(guī)范
評論
0/150
提交評論