第三章--統計數據處理課件_第1頁
第三章--統計數據處理課件_第2頁
第三章--統計數據處理課件_第3頁
第三章--統計數據處理課件_第4頁
第三章--統計數據處理課件_第5頁
已閱讀5頁,還剩102頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、經濟管理類專業應用型本科教材統 計 學 電子工業出社出版 主編 杜家龍第三章 統計數據處理 教學目的 了解統計數據處理的意義、內容和程序,掌握統計數據分組、編制變量數列、制作統計表、統計圖的方法和技術。能夠應用數據處理技術對客觀現象的數量特征,作出基本的統計描述。 重點難點 統計數據預處理,統計分組、編制變量數列,制作統計表和統計圖。第一節統計數據處理概述 一、統計數據處理的概念和內容(一)統計數據處理的意義統計數據處理就是對搜集得到的初始數據進行審核、分組、匯總,使之條理化、系統化,變成能反映總體特征的綜合數據的工作過程。統計數據處理,是統計由對個別現象的認識上升到對總體現象認識的一個重要階

2、段,在統計研究工作中起著承先啟后的作用,它既是數據搜集的繼續和深化,又是數據分析的基礎和前提。 (二)數據處理的原則和內容 1.數據處理的原則 統計數據處理必須遵循目的性、聯系性和簡明性三原則。 統計數據處理原則目的性原則聯系性原則簡明性原則2.統計數據處理的內容確定指標和分組原始數據預處理匯總計算各指標編制統計表系統積累統計數據第一,根據統計研究的目的和要求,確定應該計算的指標,并根據分析的需要確定具體的分組;第二,對大量的原始數據進行預處理;第三,對各指標進行匯總,計算出各組單位數、總體單位數以及各組或總體的有關標志值之和;第四,將匯總處理的數據編制成統計表;第五,對統計數據進行系統積累。

3、 (三)統計數據預處理 1.數據的審核與篩選 對于通過直接調查取得的原始數據,應主要從完整性和準確性兩個方面去審核。 完整性審核主要是檢查應調查的單位或個體是否有遺漏,所有的調查項目或指標是否填寫齊全等。統計數據預處理篩選審核訂正排序 準確性審核主要包括兩個方面:一是檢查數據資料是否真實地反映了客觀實際情況,內容是否符合實際;二是檢查數據是否有錯誤,計算是否正確等。審核數據準確性的方法主要有邏輯檢查和計算檢查。 邏輯檢查主要是從定性角度審核數據是否符合邏輯,內容是否合理,各項目或數字之間有無相互矛盾的現象。 計算檢查是檢查調查表中的各項數據在計算結果和計算方法上有無錯誤。 對于第二手數據,除了

4、對其完整性和準確性進行審核外,還應著重審核數據的適用性和時效性。 首先應弄清楚數據的來源、數據的口徑以及有關的背景材料,以便確定這些數據是否符合分析研究的需要,是否需要重新加工處理等。 此外,還要對數據的時效性進行審核,一般來說,應盡可能使用最新的統計數據。 2.數據的訂正 第一,對可以肯定的一般錯誤,即代為更正,并向有關單位核對; 第二,對可疑之處或無法代為更正的錯誤,通知原報單位復查更正; 第三,對在個別單位發現的有代表性的重大差錯,除通知原報單位更正外,還要通報尚未報送資料的單位,以防止類似錯誤的發生; 第四,對于違反統計法規的,應查明責任,予以適當處理。 3.數據的排序 數據排序就是按

5、照一定的順序將數據排列,以便初步顯示數據的一些明顯特征和規律,為研究者找到解決問題的線索。此外,排序還有助于對數據的檢查糾錯,為分組、匯總提供依據。 第二節 統計分組 一、統計分組的概念和性質 統計分組的概念 統計數據分組是指根據統計研究的目的和要求,將總體單位或全部數據按照一定的標志劃分成若干類型(組),使組內的差異盡可能小,組間的差別盡可能明顯,從而使大量無序的、混沌的數據變為有序的、反映總體特征的資料。 統計分組的特性 首先,統計分組具有分與合的雙重功能,是分與合的對立統一; 其次,統計分組的目的是要在同質性的基礎上研究總體的內在差異性; 第三,統計分組在體現分組標志的組間差異的同時,卻

6、可能掩蓋了其他標志的組間差異,因此,統計分組存在一定的局限性; 第四,統計分組的關鍵是選擇分組標志和劃分各組界限。二、統計分組的主要作用 1.劃分現象的不同類型 統計分組的最基本作用,就是把復雜自然或社會現象劃分為各個性質不同的組成部分,以認識事物質的差別。 例如,把社會產品劃分為生產資料和消費資料;將國民經濟劃分為第一產業、第二產業和第三產業等。 2.反映總體的內部結構 在統計分組基礎上,計算各部分占總體的比重可揭示總體內部結構,表明總體中各部分與整體以及各部分之間存在的數量關系,從而反映事物的構成特征和性質。 通過比較總體內部結構的動態變化還可以揭示現象發展變化過程和規律。 3.分析現象之

7、間的依存關系 客觀現象之間存在著廣泛的相互依存關系,根據研究目的,按照一定標志對總體進行分組,然后觀察與分組標志相關標志的其它標志的數量變化,可揭示相關事物之間的數量依存關系。 如農作物的耕作深度與收成率之間的關系、家庭收入與生活費支出之間的關系、市場商品價格與其需求量之間的關系等等,都可以通過統計分組來研究。三、統計分組的類型 統計數據分組按反映研究對象的特點和分組的形式分類主要有以下類型。 (一)按照分組標志的性質不同,可將統計分組分為屬性分組與變量分組。 1.屬性分組 屬性分組是按照反映事物屬性的品質標志進行的分組。例如,人口按性別、民族、文化程度、職業、婚姻狀況等標志分組,工業企業按經

8、濟類型、行業、地區等標志分組。 2.變量分組 變量分組是指按照數量標志進行的分組。變量分組的組限是指各種不等的變量值。例如,把工業企業按生產能力分為:10億元以下、10100億元、100億元以上三個組,把學生總體按愛好學科數分為1個、2個、3個、3個以上等組。 (二)簡單分組、復合分組與分組體系 按照分組標志的多少和分組的形式不同,可將統計分組分為簡單分組、復合分組與分組體系。 1.簡單分組 所謂簡單分組,就是將總體按一個標志進行的分組。這種分組只能從某一方面去說明總體特征。例如,某地工業企業按規模分組就是一個簡單分組:國有企業集體企業股份合作企業聯營企業 2.復合分組 復合分組是按照兩個或兩

9、個以上的標志,重疊起來對總體進行分組。這里所謂重疊,是指在前一次分組結果的內部再進行下一次分組。例如,某地工業企業先按規模標志、再按所有制標志所進行的復合分組;某高校教師按職務、年齡和性別分組。 國營經濟大型企業 私營經濟 其他經濟 國營經濟中型企業 私營經濟 其他經濟 國營經濟小型企業 私營經濟 其他經濟 高校教師的復合分組第一標志(職務)第二標志(年齡)第三標志(性別)高級職稱(教授、副教授)45歲以上男女45歲以下男女非高級職稱(講師、助教)45歲以上男女45歲以下男女 3.分組體系 分組體系是按照兩個或兩個以上相互聯系、相互補充的標志,對被研究對象進行平行分組所形成的體系。分組體系可以

10、從不同角度、不同方面對某一現象作出比較全面的說明。 例如,我國2009年國民經濟和社會發展統計公報中的人口構成統計表(公報表15),就是一個分組體系。表3.1 我國2009年人口數及其構成指標年末人數(萬人)比重(%)全國總人口其中:城鎮 鄉村其中:男性 女性其中:014 1459 60歲及以上 其中:65歲及以上133474621867128868652648222466392097167141130910046.653.451.448.618.569.012.58.5 四、統計分組方法等距分組不等距分組單項式分組組距式分組分組方法按品質標志分組按數量標志分組 (一)按品質標志分組 按品質標

11、志分組又分簡單品質分組和復雜品質分組兩種情況。 1.簡單的品質標志分組 簡單的品質分組是指分組標志一經確定,組的名稱和組數也就隨之確定,而且各單位應分在哪一組也比較明確,不存在組與組之間界限區分困難的分組。例如,人口按性別分為男、女兩組,具體到每一個人應該分在哪一組是一目了然的。 2.復雜的品質標志分組 復雜的品質分組是指分組標志選定以后組間界限不易劃分,存在交叉過渡形態,總體中的各單位歸并于何組比較困難的統計分組。 為保證各種統計分類的科學性、統一性和完整性,便于各部門掌握和使用,通常由國家統計局會同有關部門制定統一分類目錄,在全國范圍內實行。如國民經濟行業分類目錄、商品分類目錄等。 (二)

12、按數量標志分組 1.數量標志分組的意義 按數量標志分組是指選擇反映事物數量差異的數量標志,根據其變異范圍區分各組界限,將總體劃分為若干個性質不同的組成部分。 例如,研究居民家庭貧富狀態時,按恩格爾系數(即食品類支出占整個居民家庭消費支出的比重)分組,將其在60以上的劃分為貧困家庭;5060的為溫飽家庭;4050為小康家庭;40以下的為富裕家庭。 2.數量標志分組的方式 根據總體各單位某一數量標志值的變動特征,可供選擇的分組方式有單項式分組和組距式分組兩種。 (1)單項式分組 單項式分組是指按每一個具體變量值對現象總體所進行的分組。如某班學生按年齡分組(見表3.2)。表3.2 某班學生按年齡分組

13、表按年齡分組(歲)人數(人)比例()1718192021510209610.0020.0040.0018.0012.00合計50100.00 單項式分組一般適用于離散型變量,且變量值不多、變動范圍較小的情況。 (2)組距式分組 組距式分組是指按變量值的一定范圍對現象總體所進行的分組。在現象總體的變動范圍內,將其劃分為若干個區間,各區間內的所有變量值作為一組,其性質相同,組與組之間的性質相異。例如,某校學生家庭收入分組情況統計表就是一個組距式分組表(見表3.3)。 組距式分組一般在變量值變動幅度較大的條件下采用。在組距式分組中,涉及到組限、組距、組數、組中值等分組要素。表3.3(a)某校學生家庭

14、收入分組統計表按年收入分組(萬元)學生數(人)占總戶數比例()3以下34455667788以上90025104360289014406506306.718.832.621.610.84.94.7合計13380100.0表3.3(b)某車間50名工人日加工零件數分組表按零件數分組頻數(人)頻率(%)110以下110115115120120125125130130135135以上358141064610162820128合計50100 組限組限是用來表示各組之間界限的變量值,是決定事物質量的數量界限。其中,在每一組中最小的變量值為下組限,簡稱為下限;最大的變量值為上組限,簡稱為上限。組距式分組中有

15、重疊式組限和非重疊式組限兩種組限表示方法。 組距組距是指一組變量值的區間長度,也就是每一組的上限與下限之間的距離。即: 組距上限下限。 組數組數即分組個數。 組中值組中值即組距的中點數值,它是各組變量值的代表水平。 重合式組限組的組中值非重合式組限組的組中值缺下限組的組中值鄰組組中值鄰組組距缺上限組的組中值鄰組組中值十鄰組組距 五、統計資料的再分組 統計資料的再分組是指把統計分組資料按某種要求重新劃定各組界限,再將資料中的單位數或比重分布做出相應的調整。 例如,表3.4所示某工業部門勞動生產率的分組資料與研究目的不一致,主要是組數多、組距小,不利于簡明地觀察問題,需要進行再分組。表3.4某工業

16、部門勞動生產率分組表組號按勞動生產率分組(千元/人)企業數比例(%)職工數比例(%)總產值比例(%)123456789106以下677889910101111121213131414以上11141015209124236.209.4810.7816.2620.0012.9311.545.402.694.729.6612.8313.0016.7819.1210.989.043.821.842.93合 計100100.00100.00 為了與相鄰地區同行業的同類指標進行比較,將企業的勞動生產率重新劃分為四組,即:人均產值在12.5千元以上的為優秀企業;1012.5千元之間的為良好企業;7.510千

17、元之間的為一般企業;7.5千元以下的為后進企業。其再分組的結果如表3.5所示:表3.5某工業部門勞動生產率再分組表組別按勞動生產率分組(千元/人)企業數比例(%)職工數比例(%)總產值比例(%)ABCD7.5以下7.5101012.512.5以上304023721.0741.6527.1710.1128.9942.4021.93 6.68合 計100100.00100.00 表3.5再分組的步驟如下: 第一步 確定再分組的各自范圍。 即A組包括原第1組、第2組的全部和第3組的一部分; B組包括原第3組的一部分和第4組、第5組的全部; C組包括原第6組、第7組的全部和第8組的一部分; D組包括原

18、第8組的一部分和第9組、第10組的全部。第二步 計算新組各自相連組的比例??捎孟噙B組的部分組距除以相連組的組距之和而求得。其具體計算過程為:如A組在相連組中所占比例B組在相連組中所占比例10.50.5同理C組在相連組中所占比例0.5,D組在相連組中所占比例0.50.5 第三步 確定再分組的對應單位數。即計算各組變量值的區間范圍所對應的單位數(此處為企業數比例、職工數比例和總產值比例)。 其具體計算過程為: A組企業數比例=1114100.5=30%,用同樣方法可得到B組為40,C組為23,D組企業數比例為7。 職工數比例和總產值比例的各組對應數可按上述計算過程類推,其結果見表3.5。 第三節

19、頻數分布一、頻數分布的概念 在分組的基礎上,把所有數據或總體單位按組歸并、排列,形成所有數據或總體各單位在各組間的分布,稱為頻數分布,又稱為分布數列。例如表3.6是我國2009人口按城鄉分組形成的頻數分布。表3.6 2009年末我國大陸人口的城鄉分布按性別分組人口(萬人)f構成(%)f/f總人口城鎮鄉村1334746218671288100.0 46.6 53.4二、頻數分布的種類頻數分布按分組標志和分組形式的不同可分成如下類別:頻數分布變量分布單項式頻數分布組距式頻數分布 品質分布等距式分布異距式分布圖3.1 頻數分布的種類 ()品質頻數分布 品質頻數分布,簡稱為品質數列,它是經過屬性分組后

20、形成的頻數分布,其組別表現為一系列的概念或范疇,如表3.6所示。 (二)變量頻數分布 變量頻數分布,簡稱為變量數列,它是經過變量分組后形成的分布數列,其組別表現為不同的數值或數域。變量數列又分為單項數列和組距數列。 1.單項數列 單項數列是以一個變量值為一組編制的變量頻數分布,如表3.7就是一個單項數列。對離散型變量,且變量值項數較少、變動范圍較小時,可編制單項數列反映其分布狀況。表3.7某高校在校學生年齡分布按年齡分組(歲)學生人數(人)f比重(%)f/f171819202122235418922828313197245.418.822.728.113.0 9.6 2.4合 計1006100

21、.0 2.組距數列 組距數列是以表示一定變動范圍的兩個變量值構成的組所編制的變量頻數分布,如表3.8就是一個組距數列。對于連續型變量或項數較多、變動范圍較大的離散型變量,需要用組距數列去反映其分布情況。表3.8某集團公司職工分組表按月工資分組(元)職工人數(人)f比重(%)f/f2000以下20002100210022002200230023002400240025002500以上5072105487368121594.05.78.338.629.29.64.6合 計1262100.0三、累計頻數和累計頻率 累計頻數和累計頻率是將變量頻數分布中各組頻數或頻率依次累加而得到的各組累計頻數或累計頻

22、率。 累計的方法有兩種:一是向上累計,即將各組頻數或頻率由變量值低的組依次向變量值高的組累計,它表明從第一組下限開始到本組上限為止的累計頻數或累計頻率;二是向下累計,即將各組頻數或頻率由變量值高的組依次向變量值低的組累計,它表明從最末一組的上限開始到本組下限為止的累計頻數或頻率。如表3.9。表3.9某集團公司職工基本工資分組表按月工資分組(元)職工人數(人)比重(%)向上累計向下累計人數比重%人數比重2000以下20002100210022002200230023002400240025002500以上5072105487368121594.05.78.338.629.29.64.650122

23、2277141082120312624.09.718.056.685.895.4100.0126212121140103554818059100.096.090.382.043.414.24.6合 計1262100.0四、組距式變量數列的編制 組距式變量數列的編制過程則比較麻煩,從外在形式上看,它要做確定分組標志、確定組距和組數、確定組限等一系列工作。從本質意義上看,它要通過科學分組(正確確定組數和組距)去反映總體各單位在某一數量標志上的分布特點和規律,進而認識總體的特征、構成和性質。下面,我們通過實例說明組距式變量數列的編制程序和過程。 例3.1 某班學生高等數學考試成績資料如表3.10所示

24、,試據此數據編制適當的組距數列,以反映學生成績分布狀況。表3.10 某班學生高等數學考試成績(單位:分)97 55 84 63 57 52 74 76 56 5960 62 62 85 56 77 63 86 73 6799 94 53 78 92 97 64 86 62 6664 59 75 74 95 96 78 84 82 9681 96 95 64 97 92 68 82 77 71 考試成績屬于連續型變量,故應編制組距數列。其編制過程為: (1)將原始數據按大小順序排列,并確定最大值、最小值和全距。其結果如下: 將數據從小到大排列表3.11 某班學生高等數學考試成績排序(單位:分)5

25、2 57 62 64 71 76 81 85 94 9653 59 62 64 73 77 82 86 95 9755 59 63 66 74 77 82 86 95 9756 60 63 67 74 78 84 92 96 9756 62 64 68 75 78 84 92 96 99 求最大值、最小值和全距 最大值99,最小值52, 全距最大值最小值995247 (2)確定組距數列類型。由于考試成績分布比較均勻,在近50分的變動范圍內,平均來說是以1分為幅度逐漸變動的,故可編制等距數列。 (3)確定組數和組距。 等距數列組距=全距組數。確定組數和組距時,一般應遵循以下幾條原則:考慮到組距內

26、的同質性。本例中必須將及格與不及格的質的界限體現出來,不能分成4555、5565、。要能反映總體分布規律,即要體現原始數據分布的集中趨勢或離中趨勢。組距不能太大或太小。經驗表明,組數一般應在515組內,組距最好是5的整數倍數。當數據項數較多時分組可適當多一些,數據項數較少時分組可以適當少一些。本例數據項數較少,因此組數應少一些,故可考慮分為5組。 在等距數列情況下,如果總體單位數不是很多,變量變動范圍不是很大時,可用斯特吉斯(HASturges)經驗公式計算出一個參考組距。公式為:將表3.11資料代入公式, (分)。考慮到組距一般為5的整數倍,可定組距為10分。 (4)確定組限和組限的表示法

27、確定組限應遵循以下幾條原則: 最小組下限低于或等于最小變量值,最大組上限應大于最大變量值; 如果有極端值,可用開口組; 組限應有利于表現總體單位分布規律; 對于等距數列,如果組距是5的倍數,則每組下限也最好是5的倍數。 此外,還應確定組限用同限(重疊式)還是用異限(非重疊式)。因為考試成績從本質上說是連續變量,為避免遺漏,采用同限表示。但本例中考試成績取整數,故既可用同限,也可用異限。選用同限,則組限可分為五個組 :60分以下60707080809090100 (5)從最小組起依次排列,并分別計算各組頻數和其他有關指標,形成分組統計表(見表3.12)。按考分分組(分)學生人數(人)比重()60

28、以下607070808090901008121081216.0024.0020.0016.0024.00合計50100.0表3.12 某班學生高等數學考試成績分組表 五、頻數(次數)分布的類型 客觀現象的頻數(次數)分布主要有鐘形分布、U形分布和J形分布三種類型。圖3.2 次數分布類型 ()鐘形分布 鐘形分布是指靠近兩端的變量值分配次數較少,中間變量值則分配次數較多,繪制成的曲線圖形狀宛如一口古鐘的次數分布(見圖3.1)。鐘形分布是最常見的分布,其突出特征是“中間大,兩頭小”。 如果鐘形分布的中間變量值次數最多,兩側變量值分配的次數隨著其與中間變量值距離的增大而漸次減少,并圍繞中心變量值兩側呈

29、完全對稱分布,則稱為對稱分布。 對稱分布中的正態分布是最重要的分布,許多客觀現象總體都趨近于正態分布。中心變量值兩側的變量值次數分布不對稱的稱為非對稱分布或偏態分布,通常有左偏態和右偏態兩種。 (二)U形分布 U形分布的特征與鐘形分布特征恰恰相反,靠近中間的變量值分布次數少,靠近兩端的變量值分布次數多,分布特征是“兩頭大,中間小”。繪成的曲線圖形如英文字母“U”。例如,人口在不同年齡上的死亡率一般近似地表現為U形分布。 (三)J形分布 J形分布有正反兩種情況:次數隨變量值增大而增多時所繪成的曲線圖形如英文字母“J”,稱為正J形分布;次數隨變量增大而減少時所繪成的曲線圖猶如反寫的英文字母“J”,

30、稱為反J分布。 例如,商品供給量隨著價格的提高而不斷增加,使供給曲線呈正J分布;人口總體按年齡大小的分布一般呈反J形分布。第四節統計表和統計圖一、統計表 (一)統計表的概念和構成 所謂統計表,就是由縱橫交叉的線條所組成的用于顯示統計數據的表格。統計表由總標題、橫標目、縱標目和統計數字四個要素構成 總標題中國國內生產總值1992年1993年金 額(億元)比 重()金 額(億元)比 重()速度()(92為100)國內生產總值24363100.031380100.0113.4第一產業580023.8665021.2104.0第二產業1170048.01624551.8120.4第三產業686328.

31、2848527.0109.3 總標題是統計表的名稱,用以概括說明整個表的內容,一般位于表的上方中央; 橫標目是橫行內容的名稱,代表統計所要說明的對象,也稱為主詞,一般列在表的左邊; 縱標目是縱欄內容的名稱,是用來說明主詞情況的統計指標,也稱為賓詞,一般列在表內的上方; 統計數字是各項指標的具體數值,內容由橫標目和縱標目所限定。 填表說明,一般表下附有資料來源、指標計算方法、填報單位、填表人、填表日期等說明。 (二)統計表的分類 在統計研究中通常按作用、反映對象的特點和分組情況對統計表進行分類。 1.調查表、匯總表和分析表 統計表按作用不同可以分為調查表、匯總表和分析表。 調查表是在統計調查中用

32、于登記、搜集原始資料的表格; 匯總表是用于統計資料整理、匯總的表格; 分析表是用于統計分析的表格。 2.空間數列表和時間數列表 統計表按所反映統計數列的時空性質不同,可以分為空間數列表和時間數列表。 空間數列表又稱靜態表,是反映同一時間條件下不同空間范圍內的統計數列的表格,它可以說明現象在不同空間內數量分布狀態。 時間數列表又稱動態表,是反映同一空間條件下不同時間上的統計數列的表格,它可以說明在既定的空間范圍內現象在不同時間上的變動過程。 時空間數結合表,指將時間數列和空間數列結合起來編制的統計表。 3.簡單表、分組表和復合表 統計表按對總體分組的情況不同,可以分為簡單表、分組表和復合表。 簡

33、單表是指對總體未做任何分組,僅按單位名稱或時間順序排列而成的統計表。 分組表又稱簡單分組表,是對總體的統計單位按一個標志進行分組而形成的統計表。 復合表又稱復合分組表,是對總體的統計單位按兩個或兩個以上的標志進行交叉重疊分組,或按每一標志單獨分組平行排列而形成的統計表。 (三)統計表的編制規范 設計和填寫統計表時必須遵循以下規范要求。 (1)統計表的標題、項目、指標要簡明扼要,能準確反映內容,使人一目了然,便于分析。如果指標的計量單位只有一個,則通常列在表的右上角,如果計量單位較多,則列在相應的指標欄內。 (2)統計表的縱欄、橫行的排列要盡量反映出內容方面的邏輯關系。 (3)當統計表的欄目較多

34、時,可編號說明其相互關系。主詞欄和計量單位欄常用甲、乙、丙等文字編號,賓詞欄常用1、2、3等數字編號。 (4)表中的合計欄可以排在前面,也可以排在最后,如果只列出其中部分項目,則合計欄必須排在前面。 (5)表中的統計數字要根據縱橫關系對位,數字為零時要寫出“0”來,不應填寫數字的空格用“”線表示;未發生的數字空著不填;估算的數字應在表下說明;無法取得的資料用“”號表示;如果某項數字與鄰項數字相同,則仍應填寫數字,不得用“同上”、“同左”等字樣或符號代替。 (6)表的上下兩端用粗線,左右兩邊不封口,縱欄之間用細線分開,橫行之間可以不加線。如果橫行過多,也可以每五行加一細線。 (7)統計表的資料來

35、源及其他需要說明的問題可在表下加以注明。二、統計圖 用來表現統計數據的各種幾何圖形、具體事物的形象、符號等都叫統計圖。用統計圖來顯示統計數據,具有直觀、生動、形象、易懂的優點。統計圖沒有冗長的數據和呆板的表格形式,易為一般人接受和理解。不同的統計圖,繪制方法不同,但都必須遵守如實反映、便于比較、通俗易懂、鮮明醒目、靈活機動原則。 常用統計圖可作如下分類:常用統計圖數據類型定性數據定量數據條形圖圓形圖折線圖雷達圖直方圖曲線圖 (一)直方圖和條形圖 1.直方圖 直方圖是用矩形的寬度和高度來表示頻數分布的圖形。在平面直角坐標系中,橫軸表示數據分組,縱軸表示頻數或頻率,這樣各組與相應的頻數就形成了一個

36、矩形,即直方圖。如根據表3.14可繪制成直方圖如圖3.3。 表3.14 我國2000年至2009年國內生產總值 單位:萬元 年份20002001200220032004總產值89442109655120333135823159878年份20052006200720082009總產值184937216314265810314045335353圖3.3 直方圖例:某企業職工月生活費支出表生活費支出(元)職工數(人)比重(%)200以下 20 20200-400 50 50400-600 20 20600-800 10 10合計 100 100職工生活費支出直方圖 2.條形圖 條形圖是用寬度相同的條

37、形的高度或長度來表示數據變動的圖形。條形圖可以橫置和縱置,縱置時也叫柱形圖。如根據表3.15資料繪制條形圖如下(見圖3.4):表3.15 2009年我國對主要國家和地區出口額統計表 單位:億美元國家/地區歐盟美國中國香港東盟日本出口金額 2363220816621063979國家/地區韓國印度中國臺灣俄羅斯出口金額 537297205175圖3.4 條形圖 (二)折線圖和曲線圖 1.折線圖 折線圖也稱頻數多邊圖,它是在直方圖的基礎上把相鄰直方形的頂邊中點連接成一條折線,再把拆線兩端與橫軸上直方形兩側延伸的假想組中點相連,就形成了頻數分布折線圖。 折線圖也可以用組中值與次數求坐標點連接而成。例如

38、,根據表3.14可繪制如下折線圖(見圖3.5)。圖3.5 頻數分布折線圖 2.曲線圖 曲線圖是用曲線的升降起伏來表示被研究現象的變動情況及其趨勢的圖形。曲線圖根據所示數據的性質和作用不同,可分為頻數分布曲線圖、動態曲線圖和依存關系曲線圖。 在頻數分布折線圖的基礎上,當變量數列的組數無限增多時,折線圖便近似地表現為一條平滑的曲線,折線圖就變成了頻數分布曲線圖。例如,根據表3.16資料,可繪制出圖3.6所示頻數分布曲線圖。圖3.6 頻數分布曲線圖 (三)圓形圖和環行圖 1.圓形圖 圓形圖是以圓的面積或圓內各扇形的面積來表示數值大小或總體內部結構的一種圖形。根據作用不同,可分為圓形比較圖、圓形結構圖

39、和圓形結構比較圖。我們主要介紹圓形結構圖。 圓形結構圖通過圓內各扇形的面積來反映總體中各組成部分所占的比例。 繪制圓形結構圖的關鍵是正確計算各扇形的面積。由于在相同半徑條件下,扇形面積與圓心角成正比,且圓心角度數為360,故各扇形的中心角度為3600各組頻率。 例如,根據2003年公布的我國第二次基本單位普查統計資料(見表3.17),企業法人占 59.2,那么扇形的中心角度數應為360o59.2213.120。依此類推,我們可繪制圓形結構圖如圖3.7所示。表3.17我國法人單位按單位類別分組統計表按單位類別分組單位數(萬個)比重(%)企業法人302.659.2機關、事業法人102.620.1社會團體法人10.62.1居(村)委會79.215.6其他法人15.73.0合計510.7100.0圖3.7 圓形結構圖 2.環形圖 環形圖中間有一個“空洞”,總體中的每一個部分數據用環中的一段表示。環形圖可以同時繪

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論