




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
項目四靜態數據處理技術任務5數據離中趨勢處理任務導入:某企業甲、乙兩個班組工人的平均日產量分別為:甲班組為8.5件/人,乙班組為11.9件/人;甲、乙兩班組工人日產量的標準差分別為:甲班組σ=2.22(件),乙班:σ=2.69(件)。任務要求:試分析甲乙兩班組工人平均日產量哪個代表性要強一些?一、標志變異指標概述離中趨勢:是數據分布的又一特征,是指一組數據遠離其中心值的程度,表明該組數據值的差異或離散狀況。離中趨勢常用標志變異指標來進行測度。標志變異指標:是描述數據采集對象各單位標志值差別大小程度的指標,又稱標志變動度、離散程度或離中程度。如果說均值是說明總體分布的集中趨勢,那么標志變異指標則是說明總體分布的離散趨勢。不同類型的數據有不同的離中程度測度方法,離中趨勢測度經常用到的標志變異指標有:異眾比率、四分位差、極差、方差和標準差等。(一)標志變異指標的概念一、標志變異指標概述(1)反映一組數據離中程度。(2)標志變異指標是評價平均數代表性的依據。標志變異指標值越大,平均數的代表性越低;反之,平均數的代表性越高。(3)一般來說,標志變異指標值越大,總體各單位變量值分布的離散趨勢越高、均衡性越低;反之,總體各單位變量值分布的離散趨勢越低、均衡性越高。(二)標志變異指標的作用一、標志變異指標概述二、全距全距又稱極差,是總體各單位標志的最大值和最小值之差,可用來測度數值型數據的離中程度,易受極端值的影響。其一般計算公式為:全距=最大變量值-最小變量值用符號表示為:二、全距根據原始資料和單項數列計算全距時,可直接用上述公式。但如果掌握的資料是組距數列,則全距的計算公式為:全距=最大變量值組上限-最小變量值組下限由于全距只考慮了兩個極端值之間的差距,沒有利用全部觀測值的信息,所以不能充分反映全部觀測值之間的實際差異程度,在應用上有一定的局限性。三、平均差平均差是各變量值與其均值離差絕對值的平均數,它也能全面反映一組數據的離散程度。(一)平均差的概念平均差越大,說明數據的離散程度越大;平均差愈小,說明數據的離散程度越小。平均差計算方法簡單,能完整地反映了全部數據的分散程度,主要用來測度數值型數據的離中趨勢,但由于絕對值計算不方便,故實際中應用較少。三、平均差(二)平均差的計算公式或式中,A.D是平均差,xi是各單位標志值,
是平均數,n是總體單位數,fi是各組單位數。三、平均差(三)平均差的Excel處理下面我們以某電腦公司日銷售量為例,利用Excel對數據進行處理來測度平均差。三、平均差(三)平均差的Excel處理第一步,分在B列、D列、E列和F列插入一列,分別輸入“組中值(x)”、“xifi”、
和三、平均差(三)平均差的Excel處理第二步,根據組中值的計算方法,在B3到B8單元格中分別填入相應的組中值;
第三步,求出各組的銷售量及總銷售量;第四步,求出日銷售量均值;第五步,求出組中值與日均銷售量離差的絕對值;第六步,求出;第七步,求出平均差;該平均差數值表明,每一天的銷售量與平均數相比,平均相差17臺。四、標準差1.方差(一)方差與標準差的概念方差是指數據采集對象各單位標志值與其算術平均數的離差平方的算術平均數。2.標準差標準差是指數據采集對象各單位標志值與其算術平均數的離差平方的算術平均數的平方根。
標準差越大,說明數據的離散程度越大;標準差越小,說明數據的離散程度越小。四、標準差1.方差的計算公式(二)方差與標準差的計算公式或
四、標準差2.標準差的計算公式(二)方差與標準差的計算公式或
四、標準差(三)標準差的Excel處理仍以上述電腦公司銷售情況為例來進行標準差的Excel的處理,已經計算出算術平均數為145。四、標準差(三)標準差的Excel處理第二步,依次求出E2-E11的值、F2-F11的值第三步,根據方差公式求出方差第四步,根據平方根函數(SQRT)求出標準差四、標準差(三)標準差的Excel處理說明:未分組的數據,可借助于Excel中的函數求方差和標準差方差:可借助于“VARP”函數來計算(樣本方差要使用“VAR”函數)標準差:可借助于“STDEVP”函數來計算五、離散系數離散系數又稱變異系數,主要是用于比較性質不同的數據采集對象總體數據的離散程度。常用的離散系數有全距系數、平均差系數、標準差系數等。離散系數中最為常用的是標準差系數,它是指標準差與其均值的比值,可以消除了數據水平高低和計量單位的影響。標準差系數的計算公式為:六、離中趨勢的其它測度量異眾比率指非眾數值的次數之和占總次數的比重,主要用于對分類數據離散程度的測度,用VMo表示,其計算公式為:(一)異眾比率其中,fMo
為眾數值次數,N為總次數含義:非眾數組的頻數占總頻數的比率,用于衡量眾數的代表性。異眾比率數值越大,說明眾數的代表性越低,即觀測值差異較大;異眾比率數值越小,說明眾數的代表性越高,即觀測值差異較小。六、離中趨勢的其它測度量(一)異眾比率大家算一算異眾比率是多少?表4-4-1某店鋪不同品牌飲料銷售情況的頻數分布
=70%在所調查的50人當中,購買其他品牌飲料的人數占70%,異眾比率比較大。因此,用“冰紅茶”代表消費者購買飲料品牌的狀況,其代表性不是很好.眾數的代表性怎么樣?六、離中趨勢的其它測度量(二)四分位差四分位差,也稱為內距或四分間距,是上四分位數(QU,即位于75%)與下四分位數(QL,即位于25%)之差,反映中間50%數據的離散程度。數值越小,說明中間的數據越集中,數值越大,說明中間的數據越分散。四分位差主要用于對順序數據離散程度的測度,對于數值型數據也可以計算四分位差,但不適合分類數據,它不受極端值的影響。四分位差主要用于衡量中位數的代表性。其公式為:QD=QU–QL六、離中趨勢的其它測度量(二)四分位差可以假設非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5表4-4-2某城市家庭對住房狀況評價的頻數分布QU=300*0.75%=225=一般=3QL=300*0.25%=75=不滿意=2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 防詐騙課件小游戲
- 電力行業事故案例
- 社區性獲得性肺炎護理
- 2025年建筑施工安全生產月培訓
- 成人經鼻高流量氧療護理規范團體標準解讀課件
- 系統集成公司管理流程
- 物業管理行業商業計劃書
- 動脈血氣分析的判讀
- 2024年2月份跨國采購原液濃度差異退貨檢測協議
- 工程之星操作步驟
- 華北電力大學丁肇豪:多主體數據中心算力-電力跨域協同優化
- 科技公司費用報銷制度及流程比較
- 顱內出血護理操作
- 2024年紹興諸暨市水務集團有限公司招聘考試真題
- 2025年新版供電營業規則考試題庫
- 2025年長白山職業技術學院單招職業技能測試題庫帶答案
- 2025年公務員遴選考試公共基礎知識必考題庫170題及答案(四)
- 2024年內蒙古呼和浩特市中考物理試題【含答案、解析】
- 辦公用品及設備采購產品手冊
- 河道清淤工程施工組織設計方案
- 農業行業安全生產培訓
評論
0/150
提交評論