




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第3章統計整理學習目標掌握統計分組的概念、方法、作用及分組標志的選擇原則熟悉統計表的結構、種類和變量數列的編制方法等統計整理3.1統計整理的意義與步驟3.2統計分組3.3分配數列3.4統計資料的匯總3.5統計表3.1統計整理的意義與步驟3.1.1統計整理的意義它是根據統計研究的任務與要求,對調查所取得的各種原始資料進行審核、分組、匯總,使之系統化、條理化,從而得到反映總體特征的綜合資料的工作過程。統計由對個別現象的認識上升到對總體現象的認識的一個重要階段,在統計工作中起著承前啟后的作用,它既是統計調查的繼續和深化,又是統計分析和預測的基礎與前提。意義定義定義在進行資料整理之前對資料整理的各個環節作出的具體規定具體方案(1)確定匯總的指標與綜合統計表。(2)確定分組方案,包括不同的指標應采用的不同分組,以及按數量標志分組的組數、組距等。(3)選擇資料匯總的形式,以及匯總的組織工作與時間進度安排。(4)確定資料審查的內容與方法。(5)確定與歷史資料的銜接方法。特別情況方案現有資料與歷史資料不能直接對比,應采取增加分組、調整口徑等辦法3.1.2統計資料整理方案3.1.4統計資料報送的組織形式報送形式123傳統的報送方式,包括郵寄報送、電話電報報送等方式。計算機數據處理和遠程傳輸,是由報送單位把統計資料按照規定的要求處理好,將數據直接傳輸到受表單位的計算機內。磁介質報送統計資料,是將計算機處理好的統計資料錄入軟磁盤或磁帶,把這種磁盤(帶)報送給受表單位。磁盤(帶)能容納大量的信息,所以,復雜的、大型的統計調查資料,多采用這種報送方式,并可把基層單位的統計資料一并報送,實行超級匯總。3.1.3統計資料整理的程序(3)將匯總的結果編制成統計表與分析表,以便進一步分析。(2)按分組要求,對調查資料采用規定的匯總形式進行分組、匯總,匯總出各項指標的總數與各分組的總數。(1)對原始資料進行審查與檢查。主要檢查資料的完整性、及時性和準確性方法:計算檢查和邏輯檢查(4)對統計資料的系統積累。統計整理3.1統計整理的意義與步驟3.2統計分組3.3分配數列3.4統計資料的匯總3.5統計表3.2統計分組3.2.1統計分組的概念
根據研究的任務和對象的特點,按照某種分組標志將統計總體分為若干組成部分。統計分組的對象是總體;統計分組應有分組標志;統計分組對總體而言是“分”,對總體單位而言是“合”。3.2.2統計分組的作用1、統計分組的作用(1)對于零星的、分散的統計資料,經過統計分組整理后,可以發現其特點和規律。例如:統計上述工人的工資,進行分組整理,得到表3.1從表3.1中可以看出,工資在1500~1800元間的工人占該企業全部工人數的70%,其中:工資在1600~1700元的工人數占32%,工資較低(1500元以下)和較高(1900元以上)的工人數占的比重分別為9%和4%,這就可以得到該企業工人工資水平的具體分布。結論(2)可以將復雜的社會經濟現象,劃分為性質不同的各種類型。統計工作中應用最廣泛、最主要的分組,是將社會經濟總體分為若干類型,也叫國民經濟分類。按經濟類型分組首先是按照生產關系的類型分組,即按生產資料的所有制性質分組,如國有經濟、集體經濟、其他經濟等的劃分。分類形式按經濟活動性質不同的部門分類,如下表(3)可以分析總體各個組成部分的結構情況。
在分析研究社會經濟現象時,將總體按照某個標志分成若干組成部分以后,計算總體內部各組成部分占總體的比重,揭示總體內部的構成,表明部分與總體、部分與部分之間的關系。從表3.3中可看出不同的年齡層次、不同性別的在業和失業人口,就能分析當前勞動就業面臨的問題。結論:(4)可以揭示現象之間的依存關系。
統計中運用分組法研究這種依存關系時,是將總體單位中的一個標志作為分組標志進行分組,觀察其他標志與分組標志的聯系情況。由表3.4的分組資料可見,銷售額與流通費用具有明顯的依存關系,即銷售額越大,每百元銷售額中的流通費越少。這種依存關系,只有通過分組才能揭示出來。結論:3.2.3統計分組的方法統計分組的關鍵是選擇分組標志與劃分各組界限。分組標志是確定將統計總體區分為各個性質不同的組的標準或依據。劃分各組界限,是根據分組標志劃定各相鄰組間的性質界限和數量界限。選擇分組標志的原則根據研究目的與任務選擇分組標志選用能反映事物本質或主要特征的標志根據現象所處的歷史條件及經濟條件來選擇標志123正確確定各組界限反映事物的屬性、性質的標志分組國家統計局的分類目錄《國民經濟行業分類和代碼》、《全國工農業產品(商品、物資)分類與代碼》、《大中小型工業企業劃分標準》、《行業劃分標準》、《關于統計上劃分城鄉的規定》按品質標志分組選擇反映事物數量差異的數量標志分組按數量標志與按品質標志分組的不同之處在于:數量標志下變異表現為許多不等的變量值,它們能準確地反映現象在數量上的差異,但不能明確地反映現象性質上的區別。按數量標志分組3.2.3分組體系它是根據統計研究的任務與要求,對調查所取得的各種原始資料進行審核、分組、匯總,使之系統化、條理化,從而得到反映總體特征的綜合資料的工作過程。定義平行分組體系和復合分組體系形式2)復合分組和復合分組體系簡單分組定義:對同一總體選擇兩個或兩個以上的標志層疊起來分組,稱為復合分組。特點:可以從幾個不同的角度了解總體內部的差別和關系,比簡單分組能更全面、更深入地研究問題。平行分組體系定義:復合分組形成的體系稱為復合分組體系。特點:復合分組的組數隨著分組標志的增加而成倍增加,如果組數太多,反而不易揭示問題的實質。1)簡單分組和平行分組體系簡單分組定義:總體按一個標志進行的分組稱為簡單分組。特點:只能反映現象在此分組標志下的差異,而不能反映在其他標志特征方面的差異,說明問題比較簡單。平行分組體系定義:對同一總體選擇兩個或兩個以上的標志分別進行簡單分組,就形成平行分組體系特點:每一個分組固定一個分組標志的差異,以反映總體內部的分布情況說明:進行復合分組時,要先按照主要標志對總體進行第一次分組,然后按次要標志再進行第二次、第三次分組。左側是對運輸總量進行分組。按主要分組標志第一次分為貨運、客運兩組,按次要分組標志第二次分為鐵路、水運、公路三組,第三次分組分為中央和地方。分組數為2×3×2=12(組)統計整理3.1統計整理的意義與步驟3.2統計分組3.3分配數列3.4統計資料的匯總3.5統計表3.3分配數列3.3.1分配數列的概念分配數列可用以研究總體各單位的分布狀況,而且是進一步分析總體平均水平和變異程度的基礎資料。編制分配數列,不僅是反映統計整理結果的需要,也是進行統計分析的需要。作用統計整理中,為了使整理后的資料更直觀,通常將按某一標志進行分組后的總體再按一定的順序進行排列,同時列出每個組的總體單位數形成一個數列,稱之為分配數列,或次數分配(分布),各組的總體單位數稱次數或頻數。定義3.3.2分配數列的種類分配數列根據標志的特征不同,可分為品質(屬性)數列和變量數列。分配數列包含兩個組成要素,即分組和次數。定義按品質標志分組形成的分配數列稱為品質數列。它由各組名稱和次數組成。品質數列定義按變量標志分組形成的分配數列稱為變量數列。按變量標志分組就是將變量值劃分為不同的區段,通過各組數量的差別和變化來區分現象的不同性質。變量數列包含兩個構成要素:各組變量值(X);另一個是總體單位在各組中出現的次數(f)或頻率。變量數列分類分為單項數列和組距數列單項數列中每一組的變量值只有一個,即每組由一個變量值來代表。組距數列中每一組數值是由兩個變量值所確定的一個數值范圍來表示的。按形式離散型變量是指變量的取值是不連續的,相鄰兩值之間以整數位斷開,其變量值只能取整數,不可能有小數連續型變量是指變量的取值是連續不斷的,相鄰兩值之間可作無限分割,即變量值可以用小數表示按照變量類型分為離散型變量數列和連續型變量數列組限,即分組的數量界限,包括上限和下限。各組的最大值稱為該組的上限,最小值稱為該組的下限;組距,是各組上限和下限之差;各組組距都相等的組距數列稱為等距數列。各組組距都不等的組距數列稱為異距數列;閉口組,上限和下限都齊全的組稱閉口組;開口組,有上限而缺下限或有下限而缺上限的組稱開口組;組中值,是各組上限與下限的中點值。一些概念組中值是用來代表各組實際變量值的一般水平的,其前提條件是:各組的變量值在其組內是均勻分布的,或在組中值兩側是對稱分布的,這樣它的代表性才較高。實際情況在閉口組條件下在開口組的條件下,開口組的組距以鄰組組距為準
對于數量標志是離散型變量的分組,變量值個數少,變動幅度小,只要編制單項數列,變量值個數即為組數3.3.3變量數列的編制確定組數確定組距組距、全距、組數的關系組距分組等距分組在標志值變動均勻的情況下,可采用等距分組.異距分組在標志值變動很不均勻,變動幅度大,遇到極偏斜的次數分配等情況下,應采用異距分組整理我國2000年第五次人口普查資料時,采用了以下分組確定組限
劃分離散型變量的組限時,為如實反映各組組距,以及保證組中值計算的準確,相鄰組的組限必須間斷,同時又能相互銜接。
劃分連續型變量的組限,相鄰組的組限必須重疊,各組間不存在變量值的間斷。組限劃分用組中值代表各組內變量值的一般水平有一個前提,即各單位的變量值在本組范圍內均勻分布或在組中值兩側呈對稱分布。我們在劃分各組組限時,必須考慮使各組內變量值的分布盡量滿足這一要求,這樣組中值的代表性就高。此外,為了計算方便,應力求使組中值取整齊數值。組中值存在原因:組距數列掩蓋了各組單位的實際變量值。為了反映分布在各組中個體單位變量值的一般水平,往往用組中值代表各組。組中值和組限的關系計算:已知33個國家婦女的平均期望壽命如下,要求編制組距數列。808380808381828177747375636765727074768070725467525356717677746668將變量值從小到大按順序排列:525354566365666767687070717272737474747576767777808080808181828383最大值為83,最小值為52,全距為31,經初步加工,可大致看出資料的集中趨勢。組數定為4組,則組距I=31/4=7.75。一般組距取10的倍數1233.3.4次數分布的描述方法及主要類型次數分布的描述方法1)列表法-用統計表的形式來描述次數分布的方法2)圖示法-利用各種統計圖形來表示次數分布的方法1)鐘形分布接近中間的變量值分布的次數多,兩側變量值分布的次數少,其曲線圖形就像一口古鐘。鐘形分布可分為對稱分布和非對稱分布。次數分布的主要類型2)U形分布靠近中間的變量值分布的次數少,而靠近兩端的變量值分布的次數多,其曲線圖就像英文字母“U”3)J形分布J形分布可分為正J形分布和反J形分布。前者是指變量的次數隨變量值的增大而增多,其曲線圖就像英文字母“J”;后者是指變量的次數隨變量值的增大而減少,其曲線圖類似反寫的英文字母“J”3.3.5次級資料的整理當原有分組資料的分組方法不科學、不合理,或原有分組不可比時,必須對原有分組資料進行再分組。再分組的種類(1)按原有分組標志重新劃成新的分組標志組,并將原分組資料按比例計算劃成新組資料。(2)先劃定新分組的標志,并確定其比重,然后將原分組資料按比重重新分組整理。統計整理3.1統計整理的意義與步驟3.2統計分組3.3分配數列3.4統計資料的匯總3.5統計表3.4統計資料的匯總3.4.1計算機匯總的組織形式計算機匯總的組織形式逐級匯總集中匯總超級匯總定義:由最初一級匯總單位進行計算機匯總后,將綜合資料磁盤上報上級統計機構逐級匯總,直至匯總出全國的統計資料,而不上報原始統計資料。逐級匯總集中匯總定義:將基層統計資料集中到中央(或省市)錄入和匯總稱為集中匯總作用:簡化匯總的組織工作和匯總過程,并取得全部原始資料,但匯總的工作量比較集中,數據的錄入時間長,查詢訂正差錯經歷的環節較多,反饋資料的制表量大定義:是由某一級(如縣、市)的統計機構對其所轄單位不經過下一級匯總單位(如專業局)而直接進行集中匯總,并將匯總的資料及原始資料的磁盤同時上報上級統計機構,上級部門可以根據上報的綜合資料匯總,也可以根據上報的原始資料直接匯總。作用:可以避免統計資料在匯總過程中的損失,而且能保證時效性。目前,我國工業統計年報采用的就是超級匯總形式。超級匯總3.4.2統計報表的表式設計
應注意統一性與靈活性相結合。4
基層報表與綜合報表應相互協調,避免脫節。2基層報表的指標應相對集中,便于錄入、分組的品質標志。31要根據調查的目的與要求,確定調查范圍,選擇調查指標。3.4.3編制計算程序3.4.4編碼(1)唯一性原則。(2)可延伸性原則。(3)含義性原則。(4)簡短性原則。(5)凡有統一規定的標準編碼應直接采用,不得另行編碼,以保證統計的規范化。(6)對被調查單位的編碼,一般采用地區碼加部門碼再加順序的方法編制,以免互相重復。(7)對指標與分組標志的編碼,由于各種調查使用的指標不一樣,因而可自行規定。(8)應保持編碼的連續性。3.4.5數據的錄入與質量控制做好錄入前資料的登記與審查工作在資料錄入過程中,控制錄入質量利用計算機進行審查1231)邏輯性審查2)比較法審查3)設置疑問框審查4)對成品資料的邏輯審查3.4.6建立數據庫統計整理3.1統計整理的意義與步驟3.2統計分組3.3分配數列3.4統計資料的匯總3.5統計表3.5統計表3.5.1統計表的概念
以縱橫交叉的線條所繪制的表格來表現統計資料的一種形式。廣義上的統計表包括統計工作各個階段中所用的一切表格;狹義上的統計表則是指統計整理與分析研究階段所使用的表格。3.5.2統計表的構成和內容
統計表是由總標題、橫行標題、縱欄標題和指標數值四部分構成。另外,有些統計表在表下還增加補充資料、注解、附記、資料來源、某些指標的計算方法、填表單位、填表人員以及填表日期等內容。統計表的內容一部分是統計表所要說明的總體,它可以是各個總體單位的名稱、總體的各個組,或者是總體單位的全部,這一部分習慣上稱為主詞;另一部分則是說明總體的統計指標和指標數值,這一部分習慣上稱為賓詞。3.5.3統計表的分類從作用上分1)調查表2)匯總表或整理表3)分析表1)簡單表2)簡單分組表3)復合分組表按主詞加工方法的不同分按賓詞指標設計的不同分1)不分組設計,即對賓詞指標不進行任何分組,直接把各項指標在表中平行排列2)簡單分組設計,又稱簡單設計,是對賓詞指標按不同的標志進行簡單分組后,并將其在表中平行排列。3)復合分組設計,又稱復合設計,是對賓詞指標按兩個或兩個以上的標志進行復合分組后,在表中作層疊的配置。3.5.4統計表的設計(1)統計表的總標題應簡明、確切,概括地反映出表的基本內容,以及資料所屬的空間和時間范圍。(2)統計表的主詞與賓詞之間必須相互對應,從而表明統計表中任一指標數值反映的量所屬的性質及其限定的時間、空間和條件。(3)統計表各主詞之間或賓詞之間的順序應根據諸如時間的先后、數量的大小、空間的位置等自然順序合理編排。(4)統計表中的指標數值都有一定的計量單位。(5)如果統計表的欄數較多,通常要加編號。(6)統計表的形式通常都應設計成縱橫線交叉組成的長方形表格,長寬之間應保持適當的比例,上下兩端的端線以粗線繪制,表中其他線條一般以細線繪制。表中的左、右兩端習慣上均不畫線,采用不封閉的“開口”。(7)在填寫表中的統計資料時,字跡應清楚,數應填寫整齊,數位要對準,計量單位應按統計表的規定填寫,不能留下空白。學習要點★統計整理的意義★統計資料整理方案★統計資料整理的程序★統計資料報送的組織形式★統計分組的概念★統計分組的作用★統計分組的方法★分組體系★分配數列★變量數列的編制★次數分布的描述方法及主要類型★次數分布的主要類型★次級資料的整理★統計匯總★統計表同步練習★判斷題(1)連續變量的分組,只能是組距式的。()(2)單項式分組就是把一個變量分為一組。()(3)較大制累計頻率表示大于該組變量值下限的頻率合計有多少。()(4)根據等距數列和異距數列繪制直方圖時,均以橫軸表示各組組限,縱軸表示各組次數。()(5)賓詞指標的簡單設計,是將賓詞指標進行復合分組后,在表中平行的排列。()(6)統計整理的關鍵是對各項整理的指標進行匯總。()(7)能夠對統計總體進行分組,是由于統計總體中的各個單位“同質性”特點所決定的。()(8)統計分組的關鍵問題是確定組距和組數。()(9)按數量標志分組的目的,就是要區別各組在數量上的差別。()(10)在確定組限時,最大組的上限應大于最大變量值。()★填空題(1)統計整理是對調查得到的原始資料進行(),使其條理化、系統化的工作過程。(2)統計整理是把反映()特征的大量原始資料轉化為反映()的基本統計指標的工作過程。(3)統計整理的關鍵在于(),統計分組的關鍵在于()。(4)在統計總體內部進行的一種定性分類方法,就是()。(5)按數量標志分組形成的分配數列,稱為(),它包括()和()兩個要素。(6)編制組距數列時,如資料中存在少數特大和特小變量值,往往采用()形式處理。(7)用組中值代表各組實際變量值的一般水平,是假定變量值在各組內呈均勻分布,或在組中值兩側呈()。(8)對于連續變量劃分組限時,相鄰組的組限是()。(9)各種不同的社會經濟現象有著特殊的次數分布,主要可歸納為()、()和()。(10)利用統計圖形來描述次數分布的方法,稱為()。常用的圖形有()、()和()。(11)統計表按主詞是否分組及分組的程度,可分為()、()和()。(12)為了消除異距數列中組距不等對各組次數的影響,需要計算()。(13)計算機匯總的組織形式有()、()和()。★單項選擇題(1)統計整理主要是對()的整理。A歷史統計資料 B統計分析資料 C原始調查資料 D綜合統計資料(2)某連續變量數列,其末組為開口組,下限為200,又知其鄰組的組中值為170,則末組組中值為()。A230 B260 C185 D215(3)統計表中的主詞是指()。A表中全部統計資料的內容 B描述研究對象的指標C各種指標所描述的研究對象 D分布在各欄中的指標數值(4)下列哪一種資料,宜編制單項數列()。A連續變量且變量值變動幅度較小 B連續變量且變量值變動幅度較大C離散變量且變量值變動幅度較小 D離散變量且變量值變動幅度較大(5)統計中把反映總體單位特征的大量原始資料轉化到反映總體數量特征的基本統計指標——總量指標的工作過程,叫做()。A統計設計 B統計整理 C統計分析 D統計資料的開發與應用(6)統計分組的關鍵在于()。A分組標志的正確選擇 B按品質標志分組C運用多個標志進行分組,形成一個分組體系 D善于運用復合分組(7)統計分組標志的選擇、確定是至關重要的問題,因為分組標志一經確定()。A總體各單位的所有標志都抽象化了 B不但突出了現象總體在此標志下的差異,也把總體在其他標志下的差異暴露了C突出了現象總體在此標志下的性質差異,而掩蓋了總體在其他標志下的差異D掩蓋了現象總體在此標志下的性質差異,而把總體在其他標志下的差異表現出來(8)某管理局對其所屬企業的生產計劃完成百分比采用如下分組,請指出哪項是正確的()。A80%~89%,90%~99%,100%~109%,110%以上B80%以下,80.1~90%,90.1%~100%,100.1%~110%C90%以下,90%~100%,100%~110%,110%以上D85%以下,85%~95%,95%~100%,105~115%(9)簡單分組與復合分組的區別在于()。
A總體的復雜程度不同 B選擇分組標志的性質不同
C組數的多少不同 D選擇分組標志的數量多少不同(10)單項式分組適合運用于()。
A連續型數量標志 B品質標志
C離散型數量標志且標志值變動范圍比較小
D離散型數量標志且標志值變動范圍很大,標志值的項數又很多
(11)統計分組的組數和組距是相互制約的,表現在()。
A組數越多,組距也越大 B組數越多,組距越小
C組距越小,組數也越少 D組數與組距不發生關系(12)次數密度消除了()。
A組數過多,組距過小的影響 B組距因素的影響
C各組頻率的影響 D各組各單位標志值不均勻的影響(13)變量數列就是()。
A按品質標志分組的數列 B按數量標志分組的數列
C動態數列
D因變量按自變量的變量值從小到大一一對應排列的平行數列(14)次數分配中,靠近中間的變量值分布的次數少,靠近兩端的量值分布的次數多,這種分布的類型是()。
A鐘型分布 BU型分布 CJ型分布 D倒J型分布(15)頻數和頻率“向上累計”指的是()。
A變量值從小到大依次累計
B數列中各組頻數和頻率從變量值低的組向變量值高的組累計
C數列中各組頻數和頻率從變量值大的組向變量值小的組累計
D頻數或頻率從小到大依次累計(16)劃分連續變量的組限時,相鄰的組限必須()。
A重疊 B相近 C不等 D間斷(17)在表的主詞中列出了被研究現象總體、地域或時期,這是()。
A簡單表 B簡單分組表 C復合分組表 D分析表(18)統計整理的直接結果,并作為統計分析基礎的綜合指標是()。
A質量指標 B總量指標 C相對指標 D平均指標(19)有20個工人看管機器臺數資料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4。按以上資料進行分組,應采用()。
A單項分組 B等距分組 C異距分組 D以上幾種分組均可(20)比較法審查是()。
A利用邏輯理論檢查指標之間有無矛盾
B主要審查數據之間的關系
C利用指標之間的比例關系進行審查
D與上期資料進行對照研究(21)超級匯總()。
A是將基層統計資料集中到中央(或省市)匯總
B是越過一級匯總單位直接進行集中匯總
C是由最初一級匯總單位逐級進行匯總
D是由上級統計機構進行集中匯總★多項選擇題(1)對離散變量分組()。A可按每個變量值分別列組 B也可采用組距式分組C相鄰組的組限不應重疊,但要相互銜接 D各組組距可相等也可不相等E要按“上限不在內”的原則處理與上限相同的變量值(2)下列各項中,屬于連續型變量數列次數分布的是()。A工人技術等級和全部工人數 B煤炭灰分程度和煤炭產量C平均勞動生產率和工人數 D在校學生數和全市學校數E產品品種和全部產品產量(3)下列分組哪些是按品質標志分組()。A職工按工齡分組 B科技人員按職稱分組 C人口按民族分組D企業按所有制分組 E人口按地區分組(4)分配數列在統計研究中的重要意義表現在()。A表明現象總體標志值的大小 B反映現象總體標志總量在各組上的分配狀況C表明總體單位結構情況、分布特征 D表明現象和過程發展變化的速度E據以計算總體各單位標志值的一般水平(5)分配數列中,各組標志值作用從頻數中反映出()。A頻數越大的組,標志值對于總體標志水平所起的影響也越大B頻數越大,則組標志值也越大C標志值很小的組,相應的頻數也小D組標志值相應的頻數很小,標志值對于總體標志水平所起的影響也就小(6)下面適于編制組距式變量分布數列的有()。A工業企業總產值計劃完成程度B工廠工人看管機器臺數(最多10臺,最少5臺)C企業實現利稅總額D學校的學生人數E工人的文化程度(7)統計分組的作用是()。A劃分社會經濟類型 B說明總體的基本情況C研究同質總體的結構 D說明總體單位的特征E分析被研究現象總體諸標志之間的聯系和依存關系★多項選擇題(8)下面哪些分組是按數量標志分組()。
A企業按銷售計劃完成程度分組 B學生按健康狀況分組
C工人按產量分組 D職工按工齡分組
E企業按隸屬關系分組(9)在分配數列中()。
A各組的頻數之和等于100 B各組的頻率大于0 C頻數越小,則該組的標志值所起的作用越小
D總次數一定,頻數和頻率成反比
E頻率表明各組標志值對總體的相對作用的程度(10)對連續型變量與離散型變量,組限的劃分在技術上有不同的要求。如果對企業按工人人數分組,正確的方法應該是()。
A300人以下,300~500人 B300人以下,300~500人(不含300) C300人以下,310~500人 D299人以下(含299),300~499人
E299人以下,300~499人★簡答題(1)試述統計整理的意義和基本步驟。(2)什么是統計分組?它的作用是什么?(3)什么叫分組標志?如何正確地選擇分組標志?(4)單項式分組和組距式分組分別在什么情況下運用?什么情況下應編制等距數列或異距數列?(5)什么叫統計表?統計表有何作用?其主要分類有哪些?(6)次數分布的主要類型有哪幾種?其分布特征如何?(7)使用電子計算機進行匯總的步驟如何?★計算題某市電子工業系統各企業職工人數資料如下:根據上述資料可分成以下幾組:300以下,301~400,401~500,501~600,601以上,并編制等距數列。(2)某縣50個鄉糧食平均畝產量(公斤)資料如下:請根據以上資料編制等距分布數列,并繪制直方圖及次數分布折線圖。(3)某工業局所屬各公司的資料如表3.17。根據表3.17資料要求:①按計劃完成程度分組,整理出一個統計表,組距為10%。②按企業的工人人數分組,整理出一個統計表,以表明企業規模與勞動生產率之間的關系,組距為499人。★計算題(4)2008年某化工廠工人每月工資分布如表3.18,要求:①計算各組頻率和累計頻率(較小制)。②畫出頻數分布曲線圖。③說明表的主詞和賓詞。④賓詞指標屬于哪一種設計。第4章綜合指標學習目標掌握總量指標、相對指標、平均指標及標志變異指標的概念、特點、種類和計算方法。熟悉各指標之間的聯系與區別,并能運用它們進行計算和分析。綜合指標4.1總量指標4.2相對指標4.3平均指標4.4標志變異指標4.1總量指標總量指標是人們對社會經濟現象獲得總體認識的客觀依據和起點。總量指標是實行社會管理的基本數量依據,制定政策、編制計劃和檢查計劃執行情況及日常經濟管理都要借助它。總量指標是計算相對指標和平均指標的基礎。相對指標和平均指標都是由兩個總量指標對比計算出來的,是總量指標的派生指標。因此,總量指標的計算是否科學、合理、真實,會直接影響相對指標和平均指標的計算結果。作用反映社會經濟現象在一定時間、地點和條件下的總體規模或水平的統計指標,通常以絕對數的形式表現,故又稱絕對指標概念4.1.1總量指標的概念和作用4.1.2總量指標的種類一些定義總量指標按其說明的總體內容的不同,分為總體單位總量和總體標志總量。總體單位總量就是總體單位的總數,反映總體本身的規模的大小。總體標志總量表示總體各單位某一數量標志值的總和。種類特點時期指標時間指標說明某種現象在某段時期內發展形成的總量結果,又稱流量(Flow)說明現象在某一時刻上所達到的數量,又稱存量(Stock)(1)時期指標可以累計,具有可加性。(2)時期指標值的大小與時期的長短成正比。而時點指標的大小與時點間隔長短未必有直接關系。(3)時期指標一般通過連續登記加總求得。時點指標則通過在不同時點上間斷登記得到。4.1.3總量指標的計量單位123實物單位是根據事物的屬性特征而采用的單位,用來計量同質的實物總量。以實物單位計量的總量指標又稱實物指標。價值單位是以貨幣來度量社會物質財富和勞動成果的一種計量單位。勞動單位是用勞動時間表示的計量單位,一般用工日、工時表示。勞動單位主要用于編制和檢查生產作業計劃,核算企業工人工資和勞動生產率。用勞動單位表示的總量指標,統計學上稱為工作量指標。1)
自然單位2)
度量衡單位3)
復合單位4)
標準實物單位4.1.4總量指標的計算及其應遵循的原則總量指標的計算方法直接法間接法或推算法關系推算法抽樣推斷法計算總量指標應遵循的原則123科學性原則可比性原則統一性原則綜合指標4.1總量指標4.2相對指標4.3平均指標4.4標志變異指標4.2相對指標4.2.1相對指標的概念和作用由于現象是相互聯系、相互制約的,建立和借助相對指標有助于進一步研究現象之間的數量關系及其規律相對指標能將現象在絕對數方面的具體差異加以抽象,使一些不能直接對比的總量指標可以對比作用社會經濟現象中兩個有關的指標之比,借以表明各種經濟現象間的數量對比關系,故又叫相對數。概念4.2.2相對指標的表現形式無名數異距分組倍數和系數是將對比基數抽象為1而計算的相對數。成數是將對比基數抽象為10而計算的相對數,百分數(%)是將對比基數抽象為100而計算的相對數。千分數(‰)是將對比基數抽象為1000而計算的相對數。將相對指標中的分子和分母的指標計量單位結合使用,形成雙重單位4.2.3相對指標的種類及其計算計劃完成情況相對指標結構相對指標比例相對指標強度相對指標比較相對指標動態相對指標1計劃完成情況相對指標定義一定時期的實際完成數與計劃數之比,用以檢查、監督計劃完成情況。通常用百分數表示,又稱計劃完成百分比。其基本計算公式為:不同計劃數下的計算公式計劃數為絕對數例4.11998年上半年,全國海關共征稅365.72億元人民幣,扣除特定區域自用物資等政策性退稅16.42億元人民幣,則上半年完成國家下達的年征稅800億元人民幣計劃完成情況為:全國海關系統1998年上半年沒能按期完成計劃征稅任務,實際征稅低于半年計劃進度,少征400億元×(1-87.3%)=51億元人民幣。由此我們可以認為:由于亞洲金融危機帶來的進出口不振和恢復減免稅優惠政策,海關系統實現預定800億元關稅的目標難度較大。結論:計劃數為相對數例4.2某上市公司計劃2006年中期凈資產收益率比2005年同期提高2%,而實際凈資產收益率比2005年同期提高4%;同時,該公司計劃單位產品成本比2005年同期降低5%,而實際降低6%,則該上市公司凈資產收益率超計劃完成(提高)1.96%,單位產品成本超計劃完成(降低)1.05%。結論:計劃數為平均數例4.32009年某工業企業甲種產品單位成本水平計劃為50元,實際為45元,則甲種產品單位成本計劃完成情況相對指標=該企業甲產品單位成本實際比計劃降低了10%。結論:長期計劃執行情況的檢查采用不同的分析方法累計法水平法例4.4表4.1是“十一五”時期某地區國有大中型企業固定資產投資完成資料:若該企業“十一五”時期計劃固定資產投資額為410億元,則計劃完成情況相對指標=表明該企業超額14.15%完成了固定資產投資計劃。按累計法檢查計劃執行情況,將計劃期全部時間減去自計劃執行之日起至累計實際數量已達計劃數量之日所用的時間,即為提前或延后完成計劃時間。從例子中可以看出該企業到2010年第二季度止實際完成投資額累計為(68+83+95+105+29+30)=410億元,正好達到計劃投資額,故提前半年完成了投資計劃。結論:知識點提升-對上例利用統計資料考核計劃執行進度計算06年的計劃執行進度:68/410×100%=17%07年的計劃執行進度(68+83)/410×100%=37%完成計劃量(40%)08年的計劃執行進度:同上計算,完成計劃量60%09年的計劃執行進度:同上計算,完成計劃量86%該企業在投資計劃執行進程中出現前松后緊的現象。由此可見,計劃執行進度指標可以用來對整個計劃期間的計劃執行進程作動態分析,以預測計劃完成可能出現的情況,考核計劃執行進程的均衡性。結論:例4.5某企業按照五年計劃的規定,某產品在五年計劃的最后一年應達到年產50萬噸的生產水平,表4.2為其計劃執行情況。采用水平法檢查計劃執行情況,只要在連續一年的時間長度內,實際完成的水平達到了計劃末年的水平,就算完成了五年計劃,剩余時間為提前期。由例4.5的資料可看出,該企業自第四年第四季度至第五年第三季度止的連續一年時間內,產量已達到計劃要求,故該企業提前一個季度完成了五年計劃。結論:2結構相對指標定義利用分組法,將總體區分為數個部分,然后以總體總量作為比較標準,求出各部分數量值占總體數量值的比重,以反映總體內部組成結構,故又叫結構相對數。基本計算公式3比例相對指標定義反映總體中各組成部分之間數量聯系的程度和比例關系的一種綜合指標。基本計算公式為:比例相對指標和結構相對指標的異同都是揭示事物內部組成結構,結構相對指標是一種包含關系,分子是分母的一部分,分子分母不能互換比例相對指標的分子分母是一種并列關系,分子分母可以互換。例4.6根據我國第四次人口普查結果,總人口數為113051萬人,其中男性為58182萬人,女性人數為54839萬人,則4比較相對指標定義比較相對指標就是同類事物在同一時間不同空間條件下的某一指標值的數量對比關系。基本計算公式為:例4.72004年英國和美國的國民生產總值分別為21409億美元和116675億美元,人均國民生產總值分別為36977美元和42076美元。則5動態相對指標定義將同一現象在不同時期的兩個數值進行動態對比而得出的相對數,以表明現象在時間上發展變化的程度,也稱發展速度,一般用百分數或倍數表示。基本計算公式為:例4.82004年上半年鋼材出口量為751.46萬噸,2005年同期鋼材出口量為1157.25萬噸。以2004年為基期,則2005年鋼材出口量比2004年同期增長了54%結論:6強度相對指標定義相對指標指兩個性質不同但有聯系的總量指標數值之比,用來表明現象的強度、密度和普遍程度。基本計算公式為:例4.9某地有200萬人口,有儲蓄機構100個,則儲蓄機構的網點密度可以表示為:200萬人/100個=2萬人/個(4.1)或100個/200萬人=0.5個/萬人(4.2)強度相對指標值越小,網點密度越大,這種指標數值大小與現象的強度或密度成反比的強度相對指標稱為逆指標。式(4.2)的計算結果表明,強度相對指標值越小,網點密度越小,這種指標值的大小與現象的強度或密度成正比的強度相對指標稱為正指標。結論:4.2.4運用相對指標應遵循的原則123兩個對比指標有可比性相對指標要與總量指標相結合多種相對指標相結合綜合指標4.1總量指標4.2相對指標4.3平均指標4.4標志變異指標4.3平均指標4.3.1平均指標概述在同質總體內,將各單位同一標志數量差異抽象化,反映各單位某一標志值的一般水平,具有一定的代表性。能反映總體分布的集中趨勢。因為從變量數列的分布來看,標志值愈接近平均數,其出現次數愈多,而偏離平均數愈遠的標志值出現的次數愈少,且平均數兩邊的正離差和負離差大體相等,相互抵消。特點平均指標指社會經濟現象總體內各單位某數量標志值在一定的時間、地點和條件下所達到的一般水平,又稱平均數。定義第一,利用平均指標可以對比同類現象在不同地區、不同單位的一般水平,有利于反映各地區、各單位的工作質量和業績。第二,利用平均指標可以對比同一現象在不同時期的一般水平的變化,反映現象發展變化的趨勢及其規律性。第三,利用平均指標可以分析現象之間的依存關系。第四,利用平均指標可以進行數量上的估計推算。有時,根據樣本計算的平均指標,可以用來推算整個總體的標志總量。作用4.3.2算術平均數總體各單位標志值總和除以總體單位數所得的比值公式概念簡單算術平均數加權算術平均數由單項變量數列計算加權算術平均數
由組距變量數列計算加權算術平均數先計算各組組中值作為該組變量的代表值,然后進行加權運算。基本形式例4.10某學生在期末考試中五門課程的成績分別為85,66,42,93,84。則由于受42,66兩個極端低值的影響,該生平均成績較低。算術平均數受極端數值的影響較大,在統計分析和統計實踐中,有時剔除個別極端數值,不參與計算,以正確反映社會經濟現象的一般水平。結論:例4.11某車間有100名工人,按工人看管機器的臺數分組編制成單項數列如表4.4。每個工人平均看管機器臺數各組單位數(f)在這里對平均數的大小起著權衡輕重的作用,統計中稱之為“權數”。權數既可用絕對數表示,也可用各組單位數占總體單位數的比重知識點提升對上例以相對數進行加權計算每個工人平均看管機器臺數例4.12以某校教師月生活消費資料(見表4.5)為例計算如下:4.3.2算術平均數簡單調和平均數是在資料未分組的條件下,各標志值倒數的算術平均數的倒數,故又稱倒數平均數。簡單調和平均數例4.13以A、B、C三地甲商品價格水平(見表4.6)為例,說明如下:根據正指標計算三地平均價格可用算術平均數的方法,即則將其換算成正指標應是1/6.33=0.158(元/kg),顯然與前面的計算結果0.183(元/kg)不一致。如果根據逆指標計算,也采用算術平均數,正確步驟逆指標顛倒過來變成正指標,然后求其算術平均數取倒數最終得到加權調和平均數例4.14某商品在三個農貿市場的銷售情況的有關資料如下,根據表4.7所列的資料計算該商品平均單價。根據加權調和數計算:加權調和平均數的運用在變量數列中,只掌握各組標志值總量(M)而沒有被平均標志值的相應單位數(F)資料,就不能直接采用加權算術平均數計算平均數,而應采用加權調和平均數。當被平均的標志值表現為相對數或平均數,并且掌握被平均的標志值(X)及其分子(M)的資料時,就應采用加權調和平均數的方法來計算平均數。如果掌握被平均的標志值(X)及比式的分母(f)的資料,用加權算術平均數公式。例4.15某公司四家企業的實際產值計劃完成程度和計劃產值的資料如表4.8所示,求其平均計劃完成程度。已知計劃完成程度和實際產值,應用加權調和平均數計算,權數M為計劃完成程度比值的分子即實際產值。若已知計劃完成程度和計劃產值時,應用加算術平均數計算,權數為計劃完成程度的分母即計劃產值(f)。4.3.4幾何平均數就是N個單位的標志值的連乘積的正的N次方根,適用于計算標志值的連乘積等于總比率或總速度的那些社會經濟現象的平均比率或平均速度。定義簡單幾何平均數加權幾何平均數基本形式例4.16某流水作業的裝配線分三道工序,第一道工序的產品合格率為95.8%,第二道工序為95.0%,第三道工序為93.0%,則平均工序產品合格率為:簡單幾何平均數實例方法2方法1例4.17某投資銀行一筆長期投資的年利率按復利計算,25年間年利率的分配情況為:有1年為3%,有4年為5%,有8年為8%,有10年為10%,有2年為15%,見表4.9。求平均年利率。計算:加權幾何平均數實例4.3.5中位數和眾數將總體各單位的某一數量標志值按其大小順序進行排列,位于標志值數列中間位置的那個標志值稱為中位數,一般用Me表示定義中位數的確定與計算例4.182006年世界10強企業按其營業收入排序資料如表4.10所示。根據未分組資料確定中位數步驟1標志值按大小順序排列步驟2根據公式(n+1)/2(n為單位數)確定中位數的位置這10家企業的營業收入的中位數為若計算前9家企業營業收入的中位數,中位數位置為即第五家企業營業收入192604百萬美元為其中位數若n為偶數,則處于標志值數列中間位置的兩個標志值的簡單算術平均數為中位數結論步驟1計算各組的累計次數步驟2根據中點的位次,對照累計次數確定中位數所在的組,該組所對應的標志值就是中位數。中點位次根據分組資料確定中位數例4.19表4.11是某工廠工人按技術級別的分組資料,求其中位數。中位數位置為100屬于組別3中位數3例4.20表4.12是某郵局抽樣調查快遞郵件的重量分組資料,計算郵件重量中位數。步驟1確定中位數中點位次根據累計次數可知,中位數應在第四組(30~40)內步驟2假定中位數所在組內的標志值均勻分布,用插補法按比例推算中位數的近似值50-40=10中位數所在組的次數的比例為10/32標志值為:中位數所在組的次數的比例為22/32標志值為:眾數指現象總體中出現次數最多的標志值概念由未分組資料或單項數列確定眾數,直接找出出現次數最多的那個變量值確定和計算由組距數列確定眾數。從等距分組數列計算眾數時,應先確定出現次數最多的一組為眾數組,然后參照變量數列次數的分布情況,由公式計算眾數的近似值。例4.20-1表4.12是某郵局抽樣調查快遞郵件的重量分組資料,計算郵件重量眾數。4.3.6應用平均指標應注意的問題平均指標只能應用于同質總體注意各種形式的平均數的特點及其適用條件用組平均數補充說明總平均數注意一般與個別相結合綜合指標4.1總量指標4.2相對指標4.3平均指標4.4標志變異指標4.4標志變異指標4.4.1標志變異指標的概念和作用標志變異指標可以衡量平均指標的代表性。標志變異指標可以反映現象的穩定性和均衡性。標志變異指標是統計分析的一個基本指標,在相關分析、趨勢分析、抽樣推斷和預測決策中都要利用這一指標。作用反映總體各單位標志值的變動幅度或離差程度的綜合指標,又稱標志變動度。概念4.4.2標志變異指標的種類與測定變異指標全距(R)平均差(A.D)標準差(σ)標志變異系數(f)簡單平均差加權平均差例4.21已知甲、乙兩組工人的日產量分別如下:甲組工人日產量(件):20,22,31,25,19,15;乙組工人日產量(件):20,24,22,23,21,22。簡單平均差實例甲乙兩組工人的平均日產量都為22件,但甲組平均差大于乙組平均差,故甲組平均數的代表性不如乙組的高。結論據此計算加權平均差實例例4.22抽樣調查某林區100株云杉,分組整理得到如表4.16分配數列:每株云杉的胸徑與平均胸徑平均相差5.32厘米結論加權平均差實例例4.23表4.17是根據某車間100名工人日產量資料編制的分配數列。標準差系數實例例4.24已知甲、乙兩家企業員工平均工資水平分別為600元和900元,標準差分別為42元和54元,則甲企業的標準差系數大于乙企業的標準差系數,乙企業員工的平均工資的代表性高于甲企業。結論4.4.3是非標志的標準差在數理統計上,將這種用“是”、“否”或“有”、“無”來表現的非此即彼的標志,稱為是非標志或交替標志。一般用“1”表示總體中具有某種性質的單位標志值;用“0”表示總體中不具有某種性質的單位標志值。概念確定和計算例4.25某班40名學生在統計學期末考試中,及格人數為38名,不及格人數為2名,試計算該班學生統計學平均及格率及標準差。★總量指標★相對指標★平均指標★變異指標學習要點同步練習★判斷題(1)同一個總體,時期指標值的大小與時期長短成正比,時點指標值的大小與時點間隔成反比。()(2)總量指標和平均指標反映了現象總體的規模和一般水平,但掩蓋了總體各單位的差異情況,因此通過這兩個指標不能全面認識總體的特征。()(3)用總體部分數值與總體全部數值對比求得的相對指標說明總體內部的組成狀況,這個相對指標是比例相對指標。()(4)某廠生產某種產品的單位成本計劃在去年的基礎上降低4%,實際降低了3%,則成本降低計劃的完成程度為99.04%。()(5)變異指標與平均指標從不同的側面反映了總體的特征,因此變異指標數值越大則平均指標的代表性越高,反之平均指標的代表性越低。()(6)在特定條件下,加權算術平均數等于簡單算術平均數。()(7)國民收入中積累額與消費額之比為1∶3,這是一個比較相對指標。()(8)中位數和眾數都屬于平均數,因此它們數值的大小受到總體內各單位標志值大小的影響。()(9)對任何兩個性質相同的變量數列,比較其平均數的代表性,都可以采用標準差指標。()(10)標準差系數是測量標志變異程度的一個相對指標,因而其數值的大小與標志值之間的差異程度無關。()★單項選擇題(1)某商場銷售洗衣機,2008年共銷售6000臺,年底庫存60臺,這兩個指標是()。
A時期指標 B前者是時期指標,后者是時點指標
C時點指標 D前者是時點指標,后者是時期指標(2)下面屬于結構相對指標的是()。
A招生錄取率 B人均鋼產量 C輕、重工業比重 D人均國民收入(3)產品的合格率、設備利用率這兩個相對數是()。
A結構相對指標 B強度相對指標
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 銀行金融法規與合規試題及答案2025年分析
- 2024年網絡編輯師考試中必須掌握的試題及答案
- 銀行財務報表分析技巧試題及答案
- 吉林省四平市鐵西區2023-2024學年六年級下學期語文期末考試試卷(含答案)
- 知識點回歸2025年國際金融理財師試題及答案
- 財務比率國際金融理財師試題及答案
- 提升競爭力的網絡編輯師考試試題與答案
- 網絡編輯師考試基本素養提升試題及答案
- 案例研究2025年特許金融分析師考試試題及答案
- 2025年銀行資格考試的考試內容總結試題及答案
- FZ/T 54098-2017聚乳酸牽伸絲
- Oracle-EBS生產制造解決方案
- 植物生理學第十三章植物的逆境生理課件
- 宮頸癌護理查房
- 施工單位人員退場制度
- 漢譯巴利三藏相應部3-蘊篇
- 建筑外窗抗風壓性能計算書
- 年產萬噸酒精發酵車間設計
- 生物化學與分子生物學人衛版教材全集
- 照片里的故事
- 土木工程畢業設計框架結構教學樓計算書
評論
0/150
提交評論