




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三章統計整理學習目標(一)知識目標1.了解統計整理的意義;2.掌握統計整理的步驟;3.理解統計分組的含義和作用;4.掌握統計分組的方法;5.了解次數分布的概念和主要類型;6.掌握統計圖的種類和相應的繪制方法。(二)技能目標1.能夠準確進行分組標志的選擇;2.能夠編制變量數列;3.能夠編制統計表;4.能夠繪制統計圖。引導案例長期以來,由于部門職責的劃分,我國土地資源除了由專門的土地行政主管部門統一管理外,其他部門實際上也參與了對土地資源的管理,如耕地、草地、林地、水域和水利設施用地、城市建設用地等歸農業、林業、水利、建設等行政部門管理。這些部門在管理過程中,根據需要也制定了一套適合本部門的管理標準,這在一定程度上就造成我國土地資源分類標準不統一的問題。標準不統一,直接導致各類用地的統計數據差異很大。例如,據有關人士研究指出,關于全國草地的實際面積,相關部門的統計數據相差7億畝;關于全國林地的面積,統計數據竟然相差20億畝。土地資源基礎數據數出多門,口徑不一,數據矛盾,對于國土資源規范化管理和國家宏觀管理、科學決策帶來了不利影響。如果沒有一個統一的標準,很難保證土地數據的客觀、真實、準確。鑒于上述情況,《土地調查條例》(以下簡稱《條例》)規定土地調查采用《土地利用現狀分類》國家標準。根據這一規定,第二次全國土地調查和今后的日常變更調查均應采用《土地利用現狀分類》國家標準。《條例》將國家標準納入行政法規,為建立權威的土地調查數據規范體系,合理確定土地分類,保證土地調查質量和數據真實提供了有力的法律保障。問題1.為什么相關部門的統計數據會相差那么大?2.你了解我國的土地分類標準嗎?第一節統計整理的意義和步驟一、統計整理的意義統計整理是指根據統計研究的任務與要求,對搜集來的各種原始資料進行科學的分類和匯總,為統計分析提供系統化、條理化的綜合資料的工作過程。統計整理是整個統計工作和研究過程的中間環節,起著承前啟后的作用。統計整理是統計調查的繼續,又是統計分析的基礎。統計調查所搜集到的資料,只能反映總體各單位的具體情況,是分散、零碎、表面的。只有通過科學的審核、分類、匯總等整理工作,才能實現由個別到全體、由特殊到一般、由現象到本質、由感性到理性的轉化,才能從整體上反映出事物的數量特征。否則統計調查所得的資料再豐富、再完備,其作用也發揮不出來,統計調查就將徒勞無益,統計分析也將無法進行。如表3-1只是2009年世界五百強的一個排列,還需要進一步整理。統計整理還是積累歷史資料的必要手段。統計研究中經常要進行動態分析,這就需要有長期累積的歷史資料,而根據積累資料的要求,對已有的統計資料進行篩選,以及按歷史的口徑對現有的統計資料重新調整、分類和匯總等,都必須通過統計整理工作來完成。二、統計整理的步驟統計整理的全過程包括對統計資料的審核、分組、匯總和編制統計圖表四個環節,需要按照一定的步驟進行。第一,對搜集到的資料進行全面審核,以確保統計資料符合統計研究目的的要求,資料準確無誤。第二,根據研究目和統計分析的需要,選擇整理的標志,并進行劃類分組。統計分組是統計整理的重要內容和統計分析的基礎,只有正確的分組才能整理出有科學價值的綜合指標,并借助這些指標來揭示現象的本質與規律。第三,在分組的基礎上,將各項資料進行匯總,得出反映各組和總體數量特征的各種指標。第四,統計資料的顯示。即通過編制統計表和繪制統計圖,將整理出的資料簡捷明了、系統有序地顯示出來。第五,對統計數據分門別類地系統積累。分組、匯總和編制統計圖表將會在后面的章節介紹,這里重點介紹數據的審核。數據的審核是對調查資料進行審核是統計整理的第一步,包括以下內容。(1)審核資料的完整性和及時性。審核資料的完整性,就是看調查單位或填報單位是否齊全;規定的項目是否都有答案,應報資料的份數是否符合規定。審核資料的及時性,是看填報單位是否按時報送了有關資料。對不報、漏報或遲報的現象都要及時查清。(2)審核資料的正確性,是檢查所填報的資料是否準確可靠。常用的審核方法有邏輯檢查和計算檢查兩種。①邏輯檢查。首先,從理論上或常識上檢查資料是否有悖常理、有無不切實際或不符合邏輯的地方。如一張調查表中,一個人年齡是9歲,職業卻是教師,其中必有一處填報錯誤。又如在某勞動密集型行業的報表中,企業規模為大型,而職工人數則是10人,這其中也必有一錯。其次,是檢查各項目之間有無相互矛盾的地方。例如,企業的凈產值大于同期總產值就是明顯的邏輯錯誤。②計算檢查,即檢查各項指標的計算口徑、計量單位是否符合規定,并通過各種計算方法來檢查各指標間的數字是否相互銜接。(3)歷史資料的審核在利用歷史資料(或其他間接資料)時,應審核資料的可靠程度、指標含義、所屬時間與空間范圍、計算方法和分組條件與規定的要求是否一致。一般可以從調查資料的歷史背景、調查者搜集資料的目的以及資料來源等,來判斷資料的可靠程度,也可以從指標間的相互關系以及指標的變動趨勢來檢查它的正確性。對不能滿足現在要求、缺漏或有疑問的資料,要進行有科學根據的推算、彌補和訂正。通過上述審核,如發現有缺報、缺份和缺項等情況,應及時催報、補報;如有不正確之處,則應視不同情況進行處理。對于可以確定的一般錯誤,應及時代為更正,并通知原報單位。對于可疑之數或無法代為更正的錯誤,應要求原單位復查更正。如果所發現的差錯在其他單位也可能發生時,應將錯誤情況通報所有單位,以免發生類似錯誤。對于嚴重的錯誤,應發還重新填報,并查明發生錯誤的原因。第二節統計分組一、統計分組的含義對社會經濟現象進行分析研究,不僅需要分析研究總體的數量特征,而且需要對總體中各個組成部分進行分析研究,這樣才能更全面地、深刻地認識事物的本質及其規律。統計分組是指根據統計研究的需要,將總體中各單位按照一定的標志劃分為若干部分(組)。總體中的各單位在某一(些)方面是相同的(即同質性),而在其他許多方面則是不同的(即差異性),統計分組的目的是把不同性質的單位分開,把性質相同的單位合在一起。因此,統計分組同時具有兩方面的含義:對總體是“分”,而對個體是“合”。二、統計分組的作用(一)區分社會經濟現象的類型統計分組的根本作用在于區分現象的性質。經濟現象千差萬別,性質各異,任何一批數據都存在著差異,在進行統計分組之前,這種差異處于無序狀態,顯現不出來,通過統計分組,反映出了統計總體的基本性質和特征。分組實際上就是按差異的大小進行分類,差異小的歸入一組,差異大的歸入不同的組。因此,統計分組的結果使組內的差異縮小,而組與組之間的差異擴大。所以說,統計分組的過程就是區別事物性質的過程。要了解各種社會經濟現象的性質、特點及其相互關系,必須按某種標志把它們劃分為性質不同的部分。例如國民經濟按行業分組,可以劃分為20個行業門類:(1)農、林、牧、漁業;(2)采礦業;(3)制造業;(4)電力、燃氣及水的生產和供應業;(5)建筑業;(6)交通、運輸、倉儲及郵政業;(7)信息傳輸、計算機服務和軟件業;(8)批發和零售業;(9)住宿和餐飲業;(10)金融業;(11)房地產業;(12)租賃和商務服務業;(13)科學研究、技術服務和地質勘探業;(14)水利、環境和公共設施管理;(15)居民服務和其他服務業;(16)教育;(17)衛生、社會保障和社會福利業;(18)文化、體育和娛樂業;(19)公共管理和社會組織;(20)國際組織。通過分類,可以反映我國各行業的發展,為進一步研究其水平與結構提供了便利條件。又如,產業可以劃分為第一產業、第二產業、第三產業;經濟類型可以劃分為國有、集體、民營、合營、個體、外資、中外合資等多種類型。通過對比分析,可以充分揭示出各類企業的特征及其發展規律。表3-2是我國城鎮居民家庭收入消費性支出按商品類別分組的統計表,它將全部消費品分為八大類,盡管它們同屬于消費品,但在效用上卻有“質”的差別。通過這種分類,可以反映我國居民的商品性消費中不同類別的商品所占的地位和作用,也為進一步研究我國消費品零售額的水平與結構提供了便利條件。(二)研究總體內部結構及其變化從數量上反映總體內部的結構是統計研究的重要任務。利用統計分組,可將社會經濟現象分成若干個組成部分,計算出各組成部分的數值在總體中所占的比重,就可揭示總體的內部構成情況。總體的內部結構可體現部分與整體的關系以及各部分之間存在的差別和相互聯系,反映事物從量變到質變的過程,幫助人們掌握事物的特征,認識事物的性質。如表3-3,就從我國三次產業構成的變化,反映出我國經濟發展產業結構的變化;如表3-4,就從我國貨物進出口額構成的變化,反映出我國貿易結構的變化。(三)探討現象之間的依存關系社會經濟現象之間都不是孤立的,而是相互聯系、相互制約的。通過統計分組,可以揭示現象之間這種依存關系。統計分組是一切統計研究的基礎,應用于統計工作的全過程,是統計研究的基本方法之一。如農作物的耕作深度與收成率之間、合理密植與農產量之間、家庭的工資收入與生活費支出之間、工人技術級別與產品質量之間、工人勞動生產率與產品成本之間、市場商品價格與其需求量之間等等,都在一定程度上存在相互依存的關系。所有這些依存關系,都可通過統計分組分析出影響因素與結果因素之間的變動規律。如表3-5,可以反映工人勞動生產率與企業成本利潤率的關系。三、分組標志的選擇分組標志,即將同質總體區分為不同組的標準或依據。分組標志一旦選定,就必然突出了總體在該標志下的性質差別,而掩蓋了總體在其他標志下的不同。即對同一總體按不同標志進行分組會得到不同的分組結果甚至相反的結論。分組標志選擇不當,不但無法顯示現象的根本特征,甚至會混淆事物的性質,歪曲社會經濟的真實情況。因此,分組標志的選擇是統計分組的核心問題。為了達到統計分組的目的,在進行統計分組時要遵循以下原則。(一)根據統計研究的目的選擇分組標志正確選擇分組標志是統計分組的關鍵。分組標志選擇得恰當與否,直接影響到分組的科學性。統計總體中的個體有許多標志,選擇什么標志作為分組標志,要根據統計研究的目的來確定。例如,要了解某單位職工的學歷狀況,就應選擇“文化程度”為分組標志;要了解學生的學習情況,要以“成績”為分組標志,而不能用“性別”、“年齡”為分組標志,因為這些內容與要了解的內容無關。(二)要選擇最能夠反映現象本質的標志作為分組標志明確了統計研究的目的,還不等于能夠選擇好分組標志。因為說明同一問題可能有若干個相關標志,在進行分組時,應選擇最能反映事物本質特征的標志。如要研究城鎮居民家庭生活水平狀況時,反映居民家庭生活水平的標志有:家庭人口數、就業人口數、每一就業者負擔人數(含本人)、家庭年收人、平均每人年收人等。其中最能反映居民家庭生活水平狀況的標志是“平均每人年收入”,應選擇這一標志作為分組標志。(三)要考慮現象所處的歷史條件和經濟狀況以及標志內涵的變化來選擇分組標志社會經濟現象隨著時間、地點、條件的變化而發生變化,其標志的內涵也會發生變化。同一分組,在過去適用,現在就不一定適用;在這一場合適用,在另一場合就不一定適用。
例如,在計劃經濟時期,企業按所有制形式分組一般是分為四組,全民所有制企業、集體所有制企業、私營企業和其他企業。而現在按企業登記注冊類型可分為:(1)國有企業;(2)集體企業;(3)股份合作制企業;(4)聯營企業;(5)有限責任公司;(6)股份有限公司;(7)私營企業;(8)港澳臺商投資企業;(9)外商投資企業;(10)個體企業等類型。又如,對最低生活水平的確定,就不能沿用20世紀八九十年代的標準,而應根據目前的生活水平狀況制定標準,然后再進行分組。此外,行業的劃分,也發生了很大變化。四、統計分組的方法統計分組的關鍵是選擇分組標志和劃分各組界限。因此,統計分組的方法就是指分組標志的選擇和各組界限的劃分方法。(一)按分組標志的性質可分為品質標志分組和數量標志分組品質標志是說明事物性質、屬性差異的標志。按品質標志分組是指選擇反映事物屬性差異的品質標志作為分組標志進行分組。按品質標志分組能直接反映事物間質的差別,給人以明確、具體的概念。因為事物的屬性差異是客觀存在的,有些品質標志分組,由于界限清晰,分組標志有幾種具體表現,就分成幾組。例如,人口按性別、民族、職業、文化程度等分組,企業總體按所有制分為國有、集體、聯營、股份合作、其他等組。有些品質標志分組有時也很復雜,其相鄰組之間的界限不容易劃清。有些在理論上容易區分,但在實際社會經濟生活中卻難于辨別。例如,人口按城鄉分組,居民一般分為城市和鄉村兩組,但因目前還存在有些既具備城市形態又具備鄉村形態的地區,分組時就需慎重考慮。其他如部門分類、職業分類也都存在同樣的問題。2、數量標志按數量標志分組是指選擇反映事物數量差異的數量標志作為分組標志進行分組。統計的研究對象是社會經濟現象的數量方面,因此按數量標志分組是研究分組的重點。如企業按工人數、產值、產量等標志進行分組;而居民生活水平則可以用收入水平、消費水平等標志來進行分組。按數量標志分組的目的,并不是單純確定各組在數量上的差別,而是要通過數量上的變化來區分各組的不同類型和性質。因此,按數量標志分組,應根據事物內在特點和統計研究的要求,先確定總體在某數量標志的特征下有幾種性質不同的組成部分,再研究確定各組成部分之間的數量界限。(二)正確劃分各組界限劃分各組界限,就是要在分組標志的變異范圍內,劃定各相鄰組間的性質界限或數量界限。劃分各組界限,應當依據統計研究的目的和要求,確定總體在已選定的分組標志下有多少種性質不同的具體表現,再研究確定各組之間的具體界限。例如,人口按年齡分組,男性分為0~6歲、7~17歲、18~59歲、60歲以上;女性分為0~6歲、7~17歲、18~54歲、55歲以上。這是由于國家對男女職工規定退休年齡的不同而有所差別。如表3-9某村男性村民按年齡分組。(三)簡單分組、復合分組與并列分組1.簡單分組簡單分組是對總體只按一個標志進行的分組,因此只能說明總體某一方面的情況。2.復合分組復合分組是對總體按兩個或兩個以上的標志進行的多層次分組,即在按某一標志分組的基礎上再按另一標志進一步分組。如表3-11將國家的國內生產總值按高收入、中等收入、中低收入和低收入來分,然后中等中又分為中等偏上、中等偏下,低收入國家又分為最不發達國家和重債國家等等。表3-12某校教師按先性別分組、再按職稱分組。3.并列分組并列分組是同時用兩個或兩個以上的標志,分別從不同的角度進行不重疊的多種分組。如表3-13對2010年人口數及其構成進行的分組,分別按性別、區域、年齡進行不重疊的多種分組,從不同角度說明2010年我國人口數及其構成。第三節次數分布一、次數分布的概念在統計分組基礎上,將總體單位按組歸并,形成了總體單位在各組間的分布,稱之為次數分布或分布數列。分布數列是指將組別與次數按一定的順序排列所形成的數列。次數是分布在各組的單位數叫次數,又稱頻數。比率是各組次數與總次數之比叫比率,又稱頻率。根據分組標志性質不同,分布數列可分為品質數列和變量數列。品質數列是指按品質標志分組所形成的分布數列。二、變量數列的編制變量數列可以分為單項數列和組距數列兩種。其中組距數列又有等距數列和異距數列之分。(一)單項式分組單項式分組就是用每一個變量值(標志值)作為一組,形成單項式變量數列。單項式分組一般適用于離散型變量且變量變動范圍不大的場合,如表3-13所示。單項式變量數列的編制比較明確、容易。但是用連續變量分組來編制分配數列時,或者雖是離散變量但數值很多且變化范圍很大時,單項數列就不能適用,而應考慮采用組距數列的形式。(二)組距式分組組距式分組就是將變量依次劃分為幾段區間,一段區間表現為“從…到…”距離,把一段區間內的所有變量值歸為一組,形成組距式變量數列。區間的距離就是組距。對于連續型變量或者變動范圍較大的離散型變量,適宜采用組距式分組。1.組限組限是指確定每組距離的數值,它分下限和上限,下限是毎組起點數值,上限是毎組終點數值。如表3-16中第二組“60萬元”是下限,“70萬元”是上限。如果變量是離散型變量,并且以自然單位作為計量單位,相鄰組的組限可以斷開;如果計量單位是自然單位的擴大倍數,相鄰組的組限必須重疊。如果變量是連續型變量,相鄰組的組限必須重疊。這時就存在數值歸屬問題。如80萬元是應該歸屬于第三組“70萬元~80萬元”還是第四組“80萬元~90萬元”?這時,應按“上組限不在內(不含上限)”的原則處理,反過來說,就是下限在內,即80萬元應該作為下限歸入第四組,其余依次類推。組距式分組中,常常會遇到首末兩組“開口”的情況,即用“×××以下”表示第一組,用“×××以上”表示最后一組,這些有上限無下限或有下限無上限的組,稱為開口組。如表3-16中“60萬元以下”和“100萬元以上”兩組。組限的確定應考慮以下幾點:第一,組限的確定應有利于表現總體分配的規律性,組限應是決定事物性質的數量界限。例如,按學生考試成績分組,60分必須作為組限,因為它是及格與不及格的界限。按計劃完成程度分組100%必須作為組限,因為它是完成還是未完成計劃的界限。第二,最低組下限應低于總體中最小變量值,最高組上限應高于總體中最大變量值,但不應過于懸殊。第三,總體中如果出現特大或特小變量值時,最低組和最高組可采用開口式(即只有上限或只有下限)。第四,為了方便計算組限應盡可能取整數,最好是5或10的整倍數。第五,由于變量有連續型變量和離散型變量兩種,其組限的確定方法是不同的。2.組距組距是毎組的距離,它等于上限與下限之差。如表3-16第二組的組距=70萬元-60萬元=10萬元組距式分組中,根據各組的組距是否相等可以分為等距分組和異距分組。(1)等距分組等距分組就是標志值在各組保持相等的組距,即各組的標志值變動都限于相同的范圍。凡是在標志值變動比較均勻的情況下,都可采用等距分組。例如,工人的年齡、工齡、工資的分組;零件尺寸的誤差、加工時間的分組;農產品單位面積產量、單位產品成本的分組等等。等距分組有很多好處,它便于繪制統計圖,也便于進行各類運算。(2)異距分組異距分組的形式應服從分組的要求,即性質相同的單位應合并在一個組內,性質不同的應當分開。現象的差別取決于現象的本質,而不在于數學形式,必須根據現象的本質特征和統計研究的目的任務來確定分組的等距與否。在下列情況下,就必須考慮采用異距分組。①標志值分布很不均勻的場合。例如,學生成績如果密集于某一范圍,如60-80分或70-90分之間,其它部分分布十分稀少,在這種場合若仍以10分為組距進行等距式分組,則無法顯示出分布的規律性,會使得這一密集的分數段分布的信息損失過大。因此,合理的做法是在分布比較密集的區間內使用較短的組距,在分布比較稀少的其余部分使用較長的組距,形成各組的組距不相等的異距分組。②標志值相等的量具有不同意義的場合。例如,每一年對于不同階段的人的成長是不一樣的,我國在研究人的成長狀況時,按年齡分組0~6歲為嬰幼兒,7~17歲為少年兒童,18~59(其中女性為18~54歲)為中青年,60歲(其中女性為55歲)以上為老年。③標志值按一定比例發展變化的場合。例如,百貨商場營業額差別是很大的,比如營業額從5萬元至5千萬元,可采取公比為10的不等距分組5~50萬元、50~500萬元、500~5000萬元。若用等距分組,即使組距為100萬元,也得分為50組,顯然是不合適的。對于異距分組方法的運用,沒有固定模式可供依循,需要統計人員在實踐中不斷探索,關鍵在于對所研究現象的內在聯系必須十分熟悉,才能很好運用異距分組來揭示事物的本質。3.組數組數即分組個數。一般來說,組數和組距成反比關系。組數和組距可以根據具體的情況先行確定,組數既不能太多,也不能太少,應充分保證各組都能有足夠的單位數。也可以利用斯德吉斯(H.A.Sturges)組數經驗公式來參考確定。其中,為組數,為組距,為數據個數,為全距。4.組中值組中值是各組中點的數值,其計算公式如下:閉口組組中值=(公式3-2)缺下限的最小組的組中值=
(公式3-3)缺上限的最大組的組中值=
(公式3-4)
如表3-16中第二組的組中值為(萬元),第一組的組中值為(萬元),第六組的組中值為(萬元)。【例3-1】對某企業30個工人完成勞動定額的情況進行調查,某原始資料如下(%)98819584938691102100103105100104108107108106109112114109117125115120119118116129113編制分布表。第一步:計算全距將各變量值由小到大排序,確定某最大值,最小值,并計算全距。變量的最大值是129%最小值是81%全距=最大值-最小值=129%-81%=48%第二步:確定組數和組距在等距分組時,組距與組數的關系是:可以先確定組數為5。在等距分組時,計算組距如下:,為了符合習慣和計算方便,組距近似地取10%。第三步:確定組限80~90,90~100,100~110,110~120,120~130第四步:編制頻數(頻率)分布表。三、次數分布的主要類型(一)鐘形分布鐘形分布的特征是“兩頭小、中間大”,即靠近中間的變量值分布的次數多,靠近兩端的變量值分布的次數少,如果將變量值與其對應的頻數在直角坐標系中對應的點連接起來繪制成曲線圖,宛如一口鐘,所以又稱鐘形分布。如圖3-1。在自然或社會經濟現象中,有許多次數分布是屬于鐘形分布的。例如,人體體重、身高,學生的成績,居民貨幣收入,單位面積的農產品產量,市場價格等現象都屬于鐘形分布。鐘形分布(二)U形分布U形分布的特征是:靠近中間的變量值分布的次數少,靠近兩端的變量值分布的次數多,形成“兩頭大,中間小”的分布特征。將這種分布繪成曲線,像英文字母“U”的形狀,故稱U形分布。如圖3-2。U形分布(三)J形分布J形分布的特征是“一邊小,一邊大”,即大部分變量值集中在某一端分布,有兩種類型。1、正J形分布正J形分布是次數隨著變量值的增大而增多。如投資額按利潤率大小分布,一般是正J形分布。如圖3-3。正J形分布2、反J形分布反J形分布是次數隨著變量值的增大而減小。如成年人數量按年齡大小分組,表現出年齡越高,人數越少。如圖3-4。反J形分布四、累計頻數與累計頻率向上累計又稱以下累計,是由標志值低的組向標志值高的組依次累計頻數(或頻率)。某組向上累計頻數表明該組上限以下的各組單位數之和是多少,某組向上累計頻率表明該組上限以下的各組單位數之和占總體單位數的比重。向下累計又稱以上累計,是由標志值高的組向標志值低的組依次累計頻數(或頻率)。某組向下累計頻數表明該組下限以上的各組單位數之和是多少,某組向下累計頻率表明該組下限以上的各組單位數之和占總體單位數的比重。居民月消費品支出額在1000元以下的有6人,占總數12%;月消費品支出額在1200元以下的有25人,占總數50%,以此類推。居民月消費品支出額在1000元以上的有44人,占總數88%;月消費品支出額在1200元以上的有25人,占總數50%等,以此類推。向上累計頻數(頻率)分布具有如下兩個特點:①第一組的累計頻數(頻率)等于第一組本身的頻數(頻率);②最后一組累計頻數等于總體單位數,最后一組的累計頻率等于1。類似地,向下累計頻數(頻率)分布具也有如下兩個特點:①第一組的累計頻數等于等于總體單位數,第一組的累計頻率等于1;②最后一組的累計頻數(頻率)等于最后一組本身的頻數(頻率);(二)累計頻數(頻率)分布圖累計頻數(頻率)分布圖,分為向上累計頻數(頻率)分布圖和向下累計頻數(頻率)分布圖。不論是向上累計或向下累計,它們均以分組變量為橫軸,以累計頻數(頻率)為縱軸。在直角坐標系上將各組組距的上限與其相應的累計頻數(頻率)構成坐標點,依次用折線(或光滑曲線)相連,即是向上累計分布圖。對于向下累計頻數分布圖,在直角坐標系上將各組組距下限與其相應累計頻數(頻率)構成坐標點,依次用折線(或光滑曲線)相連,即是向下累計分布圖,如圖3-5,從圖中可以看出,居民月消費額支出在1100元以下的有14人,占28%;在1100元以上的有36人,占72%。居民月消費額支出在1400元以下的有43人,占86%;以上的有7人,占14%等。由此可見,累計頻數和累計頻率可以簡要地概括地反映總體各單位的分布特征。向上累計分布曲線呈上升狀,向下累計分布曲線呈下降狀。組的次數〈或頻率〉較少,曲線顯得平緩;組的次數(或頻率)較密集,曲線顯得較陡峭。第四節統計圖一、統計圖的概念統計圖是根據統計資料,利用點、線、面或立體圖像等形式來表達其數量或變化動態的圖形。與統計表相比,統計圖具有鮮明、直觀、形象生動、一目了然、通俗易懂的特點,給人以明確而深刻的印象。所以統計圖也是表現統計資料的一種重要形式。隨著計算機技術不斷發展,電腦制圖功能日益強大,使得統計圖的制作更加方便和精確。二、統計圖的構成統計圖一般由圖題、圖目、圖尺、圖線、圖形、圖注等幾個部分組成。圖題是指統計圖的標題或名稱,它反映和標明統計圖的內容。圖目是指在橫軸的下面和縱軸的側面所標注的表明事物的類型、地點、時間、指標等的文字或數字,說明橫、縱軸所代表的事項及其單位。圖尺是指測定指標數值大小的標尺,也稱尺度。包括尺度線、尺度點和尺度數。圖線是構成統計圖的各種線,一般有基線(基準線)、圖示線(表現各種幾何圖形的線)、指導線(網格線)、邊框線等。圖形即圖式,是根據統計資料用較粗的圖示線繪成的圖形,它是統計圖的主體部分,主要通過它來表明社會經濟現象的數字資料。圖注即統計圖的注釋和說明部分,包括圖例、資料來源等。圖例是截取圖形的一部分用以說明圖形內容的樣本。三、統計圖的種類按圖形的形式不同,可分為三類:幾何圖、象形圖和統計地圖。(一)幾何圖幾何圖是利用幾何圖形來表現統計資料的圖形。如散點圖、柱形圖、條形圖、折線圖、餅形圖等。1.條形圖條形圖是用寬度相同的條形的高度或長度來表示數據變動的圖形。條形圖可以橫置也可以縱置,縱置時又稱為柱形圖,也就是說,當各類別放在縱軸時,稱為條形圖,如圖3-14所示;當各類別放在橫軸時,稱為柱形圖,如圖3-15所示。某市居民關注不同類型廣告人數調查分布圖2006-2011年我國城鎮新增就業人數單位:萬人2.圓形圖又稱為餅圖,是用圓形和圓內扇形的面積來表示數值大小的圖形,主要用于表示總體中各組成部分所占的比例,對研究結構性問題十分有用。在繪制圓形圖時,總體中各部分所占的百分比用圓內的各個扇形面積表示,這些扇形的中心角度是按各部分百分比占360度的相應比例確定的。如根據表3-20,繪制出相應的圓形圖如圖3-16所示。3.環形圖環形圖與圓形圖又有區別,環形圖中間有一個空洞,總體中的每一部分數據用環中的一段表示;圓形圖只能顯示每一個總體各部分所占的比例,而環形圖則可以同時繪制多個總體的數據系列,每一個總體的數據系列為一個環。因此環形圖可以顯示多個總體各部分所占的相應比例,從而有利于進行比較研究。甲乙兩城市家庭對住房狀況評價圖4.直方圖直方圖是用矩形的寬度和高度來表示頻數分布的圖形。在平面直角坐標中,橫軸表示數據分組,即各組組限,縱軸表示頻數(一般標在左方)或頻率(一般標在右方),若沒有頻率的直方圖只保留左側的頻次數。這樣各組組距的寬度與相應的頻數的高度就繪制成一個個矩形,即直方圖。條形圖是用條形的長度(橫置時)表示各類別頻數的多少,其寬度(表示類別)是固定的;直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數密度,寬度則表示各組的組距,因此其高度與寬度均有意義。此外,由于分組數據具有連續性,直方圖的各矩形通常是連續排列,而條形圖則是分開排列。如對某城市一年(365天)的空氣質量進行監測,獲得空氣質量指數AQI(為整數)的數據如表3-21.將獲得的AQI數據按照區間,,,,,進行分組,得到頻率分布直方圖如圖3-18所示。5.折線圖和曲線圖折線圖可以在直方圖的基礎上,把直方圖頂部的中點用直線連接而成,也可以用組中值與頻數求坐標連接而成。如圖3-19所示。需要注意,折線圖的兩個終點要與橫軸相交,具體的做法是將第一個矩形的頂部中點通過豎邊中點(即該組頻數一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸。這樣才會使折線圖下所圍成的面積與直方圖的面積相等,從而使二者所表示的頻數分布一致。當對數據所分的組數很多時,組距會越來越小,這時所繪制的折線圖就會越來越光滑,逐漸形成一條平滑的曲線,這就是頻數分布曲線。2006-2011年我國城鎮新增就業人數單位:萬人6.描述時間序列的線圖線圖是在平面坐標上用折線表現數量變化特征和規律的統計圖。線圖主要用于顯示時間序列數據,以反映事物發展變化的規律和趨勢。2011年居民消費價格月度漲跌幅度繪制線圖時應注意以下幾點:①時間一般繪在橫軸,指標數據繪在縱軸;②圖形的長寬比例要適當,一般為橫軸略大于縱軸的長方形,其長寬比例大致為10:7,圖形過扁或過于瘦高,不僅不美觀,而且會給人造成視覺上的錯覺,不便于對數據變化的理解;③一般情況下,縱軸數據下端應從0開始,以便于比較。數據與0之間的間距過大,可以采取折斷的“∥”符號將縱軸折斷。(二)象形圖象形圖是利用事物的形象來表明統計資料的圖形。(三)統計地圖統計地圖是指在地圖上,利用點、線、面或形象等標志來比較各區域某項指標數值大小的圖形。四、繪制統計圖的一般要求1.應根據統計資料的性質和分析研究目的正確選擇圖形的類型。2.圖的名稱應簡明扼要,切合圖的內容。一般放在圖形的下方或上方。3.在同一圖內比較幾種不同的事物時,須用不同的線條或顏色表示,并附圖例說明。圖例的形狀、顏色、線紋圖案等都應與圖形本身相一致。4.縱、橫軸都應有標目,并注明統計資料的計量單位,計量單位應放在尺度線的頂端或外側。尺度數的位數不宜過多,如果過多,應擴大其計量單位,以減少位數。5.如果省略圖尺,在圖形上應標注指標數值。674五、統計圖的制作目前有許多統計軟件都提供了強大的統計作圖功能。下面簡要介紹如何創建Excel圖表。本章小結統計整理是指根據統計研究的任務與要求,對搜集來的各種原始資料進行科學的分類和匯總,為統計分析提供系統化、條理化的綜合資料的工作過程。統計整理的全過程包括對統計資料的審核、分組、匯總和編制統計圖表四個環節。統計分組是指根據統計研究的需要,將總體中各單位按照一定的標志劃分為若干部分(組)。分組標志的選擇要符合要求,要正確劃分各組界限。在統計分組基礎上,將總體單位按組歸并,形成了總體單位在各組間的次數分布。次數分布主要有鐘形分布、U形分布和J形分布等三種類型。同時還需要掌握向上累計和向下累計兩種分布形式的編制方法。統計圖是根據統計資料,利用點、線、面或立體圖像等形式來表達其數量或變化動態的圖形。統計圖一般由圖題、圖目、圖尺、圖線、圖形、圖注等幾個部分組成。按圖形的形式不同,可分為三類:幾何圖、象形圖和統計地圖。本章實訓模塊一:知識理解一、簡答題
1.什么是統計數據整理?簡述統計數據整理的原則和步驟。
2.統計數據分組的原則和方法是什么?3.統計分組的關鍵是什么?怎樣正確選擇分組標志?4.簡要說明單項數列、組距數列的適用范圍。
5.編制組距數列時怎樣確定組數和組距?二、判斷題(正確的畫“√”,錯誤的畫“×”)1.設計統計分組的基本原則是,必須保證某一標志在組內各單位之間,以及組與組之間都應具有差異性。()2.簡單分組涉及總體的某一個標志,復合分組則涉及總體兩個以上標志,因此,將兩個簡單分組排列起來,就是復合分組。()3.單項式頻數分布的組數等于變量所包含的變量值的種數。()二、判斷題(正確的畫“√”,錯誤的畫“×”)4.異距數列是各組組距不都相等的組距數列。()5.年代都是以數字表示的,所以按年代排列各種指標屬于按數量標志分組。()6.統計數據的整理就是對統計報表數據的整理。()7.圓形圖是以圓的面積或圓內各扇形的面積來表示數值大小或總體內部結構的一種圖形。()8.繪制圓形結構圖的關鍵是正確計算各扇形的面積。()二、判斷題(正確的畫“√”,錯誤的畫“×”)9.確定組限要遵循“上限不在內”原則,是指各組頻數的計量不能重復,恰好重疊在組限上的變量值一般歸入下限的一組。()10.統計資料整理必須對原始資料的完整性和準確性進行審核。()
11.統計分組是在統計資料整理階段產生并需在本階段處理的問題,統計設計、統計調查一般不涉及統計分組。()12.統計整理的內容包括兩個方面:統計數據的處理,即分組、匯總、制表;統計數據的管理,即傳輸、儲存、更新、輸出。()13.按照每戶每月收入總額分組,以反映每個家庭的收入水平和生活現狀。()二、判斷題(正確的畫“√”,錯誤的畫“×”)14.學生考試成績60分為及格,不足60分為不及格,這一計分規則體現了統計分組中“上組組限不在其內”的原則。()15.向下累計是將各組次數或頻率從變量值小的組向變量值大的組進行累計。()16.人口按居住地區分組是按品質標志進行的分組。()17.在編制等距數列時,如果全距等于56,組數為6,為統計運算方便,組距取9。()二、判斷題(正確的畫“√”,錯誤的畫“×”)18.常用的表示次數分布的圖形有直方圖、折線圖和曲線圖。()19.簡單分組和復合分組的區別在于選擇的分組標志的多少。()20.劃分連續變量的組限時,相鄰兩組的組限既可以是間斷的,也可以是重疊的。()三、單項選擇題(只有一個正確答案)1.統計分組的關鍵問題是()。
A確定分組標志和劃分各組界限B確定組距和組數
C確定組距和組中值D確定全距和組距2.某連續變量數列,其末組為開口組,下限為200,又知其鄰組的組中值為170,則末組組中值為()。
A260B215C230D1853.統計整理階段工作中最關鍵的問題是()。
A.對調查資料的審核B.統計分組
C.資料匯總D.編制統計圖表三、單項選擇題(只有一個正確答案)4.下列分組中按品質標志分組的是()。A人口按年齡分組B產品按質量優劣分組C企業按固定資產原值分組D鄉鎮按工業產值分組5.對企業先按經濟類型分組,再按企業規模分組,這樣的分組,屬于()。
A簡單分組B平行分組C復合分組D再分組6.用組中值代表各組內的一般水平的假定條件是()。A各組的次數均相等B各組的組距均相等C各組的變量值均相等D各組次數在本組內呈均勻分布三、單項選擇題(只有一個正確答案)7.對某地區的全部商業企業按實現的銷售額多少進行分組,這種分組屬于()。
A變量分組B屬性分組C分組體系D復合分組8.在頻數分布中,頻率是指()。
A各組頻數之比B各組頻率之比
C各組頻數與總頻數之比D各組頻數與各組次數之比9.頻數分布用來表明()。A總體單位在各組的分布狀況B各組變量值構成情況C各組標志值分布情況D各組變量值的變動程度三、單項選擇題(只有一個正確答案)10.在分組時,若有某單位的變量值正好等于相鄰組的下限時,一般應將其歸在()。
A上限所在組B下限所在組
C任意一組均可D另設新組11.在編制組距數列時,當全距不變的情況下,組距與組數的關系是()。
A正例關系B反比例關系
C乘積關系D毫無關系12.用組中值與次數求坐標點連接而成的統計圖是()。
A直方圖B條形圖C曲線圖D折線圖三、單項選擇題(只有一個正確答案)13.如果數據的次數分布是“兩頭小、中間大”,即靠近中間的變量值分布的次數多,靠近兩端的變量值分布的次數少,這種分布類型屬于()。
A.鐘型分布
B.U型分布
C.正J型分布
D.反J分布14.某地區農民家庭年人均純收入最高為2600元,最低為1000元,據此分為八組形成閉口式等距數列,各組的組距為()。
A.300
B.200C.1600
D.100
15.簡單分組和復合分組的區別在于()。
A.選擇的分組標志的性質不同
B.選擇的分組標志多少不同
C.組數的多少不同
D.組距的大小不同
三、單項選擇題(只有一個正確答案)16.設某集團公司對其所屬的企業的生產計劃完成百分比采用如下分組,請指出哪項是最合適的()。
A.80%-89%,90%-99%,100%-109%,110%以上
B.80%以下,80.1%-90%,90.1%-100%,100.1%-110%
C.90%以下,90%-100%,100%-110%,110%以上
D.85%以下,85%-95%,95%-105%,105%以上三、單項選擇題(只有一個正確答案)17.劃分連續變量的組限時,相鄰兩組的組限()。
A.必須是間斷的
B.必須是重疊的
C.既可以間斷的,也可以是重疊的
D.應當是相近的18.次數分布數列各組頻率之和應()。
A.等于100%B.大于100%C.小于100%D.視情況而定三、單項選擇題(只有一個正確答案)19.某組距式分組,起始組是開口組,上限為100,又知相鄰組的組距為50,則起始組的組距可以視為()。
A.50B.80C.90D.10020.某外商投資企業按工資水平分為四組:1000元以下,1000~1500元;1500~2000元;2000元以上。第一組和第四組的組中值分別為()。
A.750和2500B.800和2250C.800和2500D.750和225021.對職工的生活水平狀況進行分組研究,正確地選擇分組標志應當用()。
A.職工月工資總額B.職工人均月收入額
C.職工家庭成員平均月收入額D.職工的人均月崗位津貼及獎金數額三、單項選擇題(只有一個正確答案)22.次數分布中的次數是指()。
A.劃分各組的數量標志B.分組的組數
C.分布在各組的總體單位數D.標志變異個數23.某連續變量分為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 母豬個體差異對護理的影響試題及答案
- 稅務晉級面試題及答案
- 樹立正確學習觀2024年圖書管理員考試試題及答案
- 柜臺彩妝師面試題及答案
- 醫學考試知識藍圖試題及答案
- 網絡規劃設計師職場發展的新趨勢試題及答案
- 2025年公共衛生執業醫師的準備試題及答案
- 經營決策對初級會計師的重要性試題及答案
- 網絡設計師備考時的常見障礙試題及答案
- 系統架構設計師考試拓展思維練習試題及答案
- 瓶裝液化氣送氣工培訓
- 【MOOC】中醫與辨證-暨南大學 中國大學慕課MOOC答案
- 零星維修工程 投標方案(技術方案)
- 風電制氫制甲醇一體化示范制氫制甲醇項目可行性研究報告寫作模板-申批立項
- 2024年教科版(廣州版)英語五年級上冊期中模擬測試卷(無答案)
- 2024年人力資源行業變革:人工智能在招聘中的應用
- 2024-2030年中國玩偶行業發展前景預測及競爭力策略分析報告
- 上門按摩企業標準操作實務白皮書-愛尚往約企業標準開源手冊 2024
- 吉利并購沃爾沃績效分析
- DB11T 1028-2021 民用建筑節能門窗工程技術標準
- GB/T 32151.25-2024溫室氣體排放核算與報告要求第25部分:食品、煙草及酒、飲料和精制茶企業
評論
0/150
提交評論