統計學 第3章 統計整理_第1頁
統計學 第3章 統計整理_第2頁
統計學 第3章 統計整理_第3頁
統計學 第3章 統計整理_第4頁
統計學 第3章 統計整理_第5頁
已閱讀5頁,還剩74頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第3章統計整理1第三章統計(數據)整理

第一節統計整理的概念

第二節統計分組與統計分布(頻數分布)

第三節數據的顯示—統計表和統計圖下一頁返回目錄本章內容第3章統計整理2第一節統計整理的概念

一、統計整理意義二、統計整理的步驟三、Excel中的統計整理工具上一頁下一頁返回本章首頁第3章統計整理3一、統計整理的意義

統計整理是根據統計研究的任務,對調查所搜集到的大量原始資料進行分組和匯總,使其條理化、系統化的工作過程。上一頁下一頁返回本節首頁第3章統計整理4一、統計整理的意義統計整理在整個統計工作過程中的地位:

起著承前啟后的作用。第3章統計整理5二、統計整理的步驟

1.對數據進行審核

?

審核無誤后,將數據錄入計算機,建立數據表。?

數據表可以作為數據庫使用。上一頁下一頁返回本節首頁第3章統計整理62.數據排序

一般來說,錄入的數據是無序的,不能反映現象之本質與規律性,為了使用的方便,要將其進行排序,以便數據按要求排列。上一頁下一頁返回本節首頁二、統計整理的步驟3.數據分組并編制統計表將已排序的數據進行分組,并編制次數分布表與累計次數分布表

分組的目的是使性質相同的數據歸為一組,性質不同的數據分開,使數據之間的差異性顯示出來。次數分布表能表明各單位數在各組間的分布的狀態,從而描述出總體的內部結構,揭示總體的本質特征(見29頁)

累計次數分布表則能夠表明各標志值以上或以下所出現的次數或比重(見31頁)第3章統計整理7二、統計整理的步驟第3章統計整理84.制作統計圖

將次數分布的數據畫出各種各樣的統計圖,可以形象、直觀地表明數據的分布形態與發展變化的趨勢。上一頁下一頁返回本節首頁二、統計整理的步驟第3章統計整理9三、Excel中的統計整理工具

1.數據排序Excel可以根據用戶的要求對數據表的行或列數據進行排序。排序時,Excel將利用指定的排序順序重新排列行、列或各單元格,從而使現象的規則性更加簡潔地表現出來。上一頁下一頁返回本節首頁第3章統計整理10

2.頻數分布函數

頻數分布函數是Excel的一個工作表函數,是編制次數分布的主要工具,通過頻數分布函數,可以對數據進行分組與歸類,從而使數據的分布形態更加清楚地表現出來。3.數據透視表

數據透視表是一種交互式工作表,用于對已有數據表和數據庫中的數據進行匯總和分析的一種工具。上一頁下一頁返回本節首頁三、Excel中的統計整理工具第3章統計整理114.統計圖

Excel可以繪制許多圖表,其中大部分是統計圖,可用于數據的整理與分析,能夠直觀形象地描述現象的數量規律性。上一頁下一頁返回本節首頁三、Excel中的統計整理工具第3章統計整理12第二節統計分組與統計分布(頻數分布)

一、統計分組的意義和作用二、統計分組的方法三、統計分布(頻數分布、分布數列、分配數列)上一頁下一頁返回本章首頁一、統計分組的意義和作用第3章統計整理13

1.統計分組

就是根據統計研究的目的和客觀現象的內在特點,按某個標志(或幾個標志)把被研究的總體劃分為若干個不同性質的組,稱為統計分組。說明:統計分組對總體而言是“分”對個體而言是“合”第3章統計整理14一、統計分組的意義和作用總體經過分組,能夠突出組與組之間的差異而抽象掉組內各單位之間的差異,使數據變得條理化,便于進一步分析研究。2.統計分組的意義第3章統計整理15一、統計分組的意義和作用⑴互斥原則⑵窮盡原則3.統計分組遵循的基本原則第3章統計整理16(1)劃分現象的類型(2)揭示現象內部結構(3)分析現象之間的依存關系

上一頁下一頁返回本節首頁4.統計分組的作用一、統計分組的意義和作用第3章統計整理17某年我國的社會商品零售額資料一、統計分組的意義和作用零售額比重(%)國有城鎮集體其他8014.55.5合計100第3章統計整理18某年我國農民的消費結構如下

一、統計分組的意義和作用分類比重(%)消費品其中:食品其他勞務97.7662.6837.322.24合計100商場按銷售額分組商場數

各組商品流通費用率%50萬元以下50~200萬元200~400萬元400~600萬元600~800萬元800~1000萬元1000萬元以上25701307540181011.210.49.96.75.95.05.5商品銷售額和流通費用率之間有依存關系。其中,流通費用率=費用額/銷售額第3章統計整理20(1)按分組標志的多少,分為簡單分組和復合分組。

簡單分組是按一個標志對總體進行分組。

復合分組是用兩個或兩個以上的標志層疊在一起對總體進行分組。(例見P25)5.統計分組的分類一、統計分組的意義和作用第3章統計整理21如對學生按學科、學歷、性別分組學科學歷性別文科大專男生女生本科研究生及以上理工科一、統計分組的意義和作用第3章統計整理22說明:平行分組體系:多個簡單分組構成一個平行分組體系。復合分組體系:復合分組本身構成復合分組體系。一、統計分組的意義和作用第3章統計整理23(2)按分組標志的性質不同可分為

按品質標志分組(品質分組)按數量標志分組(變量分組)一、統計分組的意義和作用第3章統計整理24

按品質標志分組:就是以反映事物屬性差異的標志作為分組標志,將總體分為若干性質不同的組成部分。如按性別分組上一頁下一頁返回本節首頁一、統計分組的意義和作用第3章統計整理25

品質標志分組,按復雜程度大致可分為三種情況:

⑴在分組標志下各單位性質差異比較明確,區分比較容易,因而各組劃分比較簡單;

⑵在分組標志下存在性質差異的過渡形態,以致差異界限不分明;

⑶有些現象本身情況復雜,對其分組須經過實際和理論的深入考察、分析與研究,以確定分組原則和可供操作的劃分標準及界限。一、統計分組的意義和作用

例如:我國現行的工業行業分類就是按照產品使用方向、生產設備及生產工藝流程、使用原材料這樣三個標志,把工業劃分為40個大類,197個中類和611個小類。第3章統計整理26一、統計分組的意義和作用第3章統計整理27

按數量標志分組:從某個變量的差異程度上來區分各種類型。具體又可分為單項式分組和組距式分組。一、統計分組的意義和作用第3章統計整理28

單項式分組:離散變量的每個變量值為一組。例如工人平均日產量資料

上一頁下一頁返回本節首頁一、統計分組的意義和作用工人平均日產量(件)工人數絕對數比重(%)2345610153040208.713.026.134.817.4合計115100.0第3章統計整理29組距式分組:以變量值的一定變動范圍為一組。上一頁下一頁返回本節首頁一、統計分組的意義和作用組距式分組可以分為間斷組距式分組和連續組距式分組。在組距式分組中,凡是組限不相連的(或不相重疊的),稱為間斷組距式分組;凡是組限相連(或相重疊的),稱為連續組距式分組。組距式分組還可以細分為等距分組和異距分組。第3章統計整理30一、統計分組的意義和作用第3章統計整理31二、統計分組的方法

統計分組的關鍵問題是選擇分組標志和劃分各組界限。

1、分組標志的選擇原則:⑴根據研究的目的選擇分組標志⑵要選擇最能反映事物本質特征的標志⑶根據現象的歷史條件和經濟條件選擇分組標志第3章統計整理32二、統計分組的方法第3章統計整理332、各組界限的劃分分組標志確定后,則應劃分各組界限。⑴如果是按品質標志分組的,各組之間界限的劃分比較簡單。

⑵如果是按數量標志分組的,組和組之間的界限的劃分則需詳細分析和比較。下面主要研究此種分法。二、統計分組的方法第3章統計整理34三、統計分布(頻數分布、分布數列、分配數列)㈠統計分布的概念與種類

1、定義在統計分組的基礎上,將總體的所有單位按組歸類整理,并按一定順序排列,形成總體中各個單位在各組間的分布,稱為統計分布,又稱次數分布、頻數分布或分配數列。

上一頁下一頁返回本節首頁第3章統計整理35三、統計分布(頻數分布、分布數列、分配數列)2、分配數列的構成要素上一頁下一頁返回本節首頁總體按某標志所分的組各組出現的單位數,即次數或頻數構成要素次數:分布在各組間的總體單位數,又稱頻數。用f表示頻率:次數的相對數,各組次數占總次數的比重。用f/∑f表示第3章統計整理373、分配數列的分類變量數列品質數列分類異距數列等距數列組距式數列單項式數列三、統計分布(頻數分布、分布數列、分配數列)第3章統計整理381、變量數列的種類:單項式:一個變量值代表一組。組距式:一組變量值代表一組。其中:組距式又分為等距式和不等距式兩種(二)變量數列三、統計分布(頻數分布、分布數列、分配數列)等距式上一頁下一頁返回本節首頁不等距式上一頁下一頁返回本節首頁(三)影響變量數列分布的要素第3章統計整理41三、統計分布(頻數分布、分布數列、分配數列)組數、組距、組限、組中值第3章統計整理421、組數(n):某個變量數列共分多少組組數的確定有兩種方式:(1)根據對資料的定性分析確定(2)Sturges(斯特奇斯)經驗公式:其中,K表示組數,n表示數據的個數。

三、統計分布(頻數分布、分布數列、分配數列)第3章統計整理432、組距(d):指各組中的最大值與最小值之差組距數列可以分為等距數列和不等距(異距)數列。對于等距數列,可根據全部數據的最大最小值及組數來確定。計算公式為:組距=(最大值-最小值)/組數對于等距數列,兩者的關系:當全距(R)一定時,組數的多少和組距的大小成反比對于不等距數列,組數根據實際情況確定。三、統計分布(頻數分布、分布數列、分配數列)第3章統計整理44注:對于等距數列,由于各組組距相等,各組頻數多少不受組距的影響,所以分布密度與分布頻數一致。不等距數列由于各組組距不同,分布密度與分布次數不同。為了說明各組分布的疏密程度,可采用計算頻數密度的方法消除組距因素對頻數的影響。頻數密度是指單位組距的分布次數。頻數密度=各組次數/組距三、統計分布(頻數分布、分布數列、分配數列)第3章統計整理45例:某單位有高級職稱人員年齡分布數列:年齡分組/歲人數頻數密度30~3435~4950~5960~64245120380.43.012.07.6合計205—三、統計分布(頻數分布、分布數列、分配數列)第3章統計整理463、組限:⑴定義:組距的兩個端點稱為組限,是各組的數量界限。一個組中的最大值為組上限,最小值為組下限。若一組內只有上限或者只有下限,稱此組為開口組;上限與下限齊全的為閉口組。三、統計分布(頻數分布、分布數列、分配數列)第3章統計整理47⑵組限的劃分:a)最低組的下限應小于至多等于原始資料中的最小值,最高組的上限應大于至少等于原始資料的最大值,以保證分組的完備性。b)若變量為連續型,相鄰組的組限必須重疊;在統計次數時,應遵循的原則為:上組限不統計在本組內。(27頁)c)若變量為離散型,相鄰組的組限應該斷開。三、統計分布(頻數分布、分布數列、分配數列)第3章統計整理484、組中值:各組上限和下限之間的中點值。公式為:注意開口組的組中值的求法:缺下限組的組中值=首組上限–

相鄰組組距/2缺上限組的組中值=末組下限+相鄰組組距/2三、統計分布(頻數分布、分布數列、分配數列)總結:對變量數列分組應注意分組不能過粗,也不能過細1、分組過粗,容易將不同質的單位分在同組,看不出總體分布的特征。某班統計學成績(最低分56,最高分99)分數人數56~6060~100238合計40

2、分組過細,容易將具有相同性質的單位分開,也反映不出總體的分布特征。

分數人數56~6060~6464~6868~7272~7676~8080~8484~8888~9292~9696~10023413745344合計40

3、如下分法,則基本上能反映出總體分布的特征。

分數人數50~6060~7070~8080~9090~1002711128合計40第3章統計整理52三、統計分布(頻數分布、分布數列、分配數列)

例:某地區30戶居民人均月收入抽樣調查資料如下:(單位:元)173016301550172014201440162015401600144016401650166014701640168016101430170016601620152016701460160014901630159016101710舉例說明組距數列編制過程第3章統計整理53三、統計分布(頻數分布、分布數列、分配數列)(1)將原始資料按大小順序排列,確定總體的最大值、最小值。142014301440144014601470149015201540155015901600160016101610162016201630163016401640165016601660167016801700171017201730(2)確定編制數列的類型,即編制單項式數列或組距式數列。第3章統計整理54三、統計分布(頻數分布、分布數列、分配數列)第3章統計整理55三、統計分布(頻數分布、分布數列、分配數列)(3)確定組數和組距。

A、對資料進行定性分析,可將其分為高收入、中等偏上、中等收入、低收入四種類型,故設定為4組,組距為

B、若用Sturges(斯特奇斯)經驗公式第3章統計整理56三、統計分布(頻數分布、分布數列、分配數列)(4)確定組限(5)計算各組次數,編制頻數分布表第3章統計整理57三、統計分布(頻數分布、分布數列、分配數列)按月收入分組戶數1400~15001500~16001600~17001700~180074154合計301、鐘型分布主要特征是兩頭小、中間大,即靠近中間的變量值分布的頻數多,靠近兩端的變量值分布的頻數少。繪成曲線宛如一口古鐘。例P35如人的身高、學生的考試成績即為該分布第3章統計整理58四、次數分布的類型⑴正態分布(對稱分布)⑵正偏(右偏)分布⑶負偏(左偏)分布第3章統計整理59四、次數分布的類型2、“U”分布“U”分布的特征與“鐘型分布”恰好相反:靠近中間的變量值分布的頻數少,靠近兩端的變量值分布的頻數多,形成兩頭大、中間小的分布特征。(P35)如按年齡分組的人口死亡率即為“U”分布第3章統計整理60四、次數分布的類型3、“J”分布“J”分布有兩種:正“J”分布和反“J”分布(P36)正“J”分布:頻數隨著變量值的增大而增多。如投資額與利潤率的關系反“J”分布:頻數隨著變量值的增大而減少。如價格和銷售量的關系第3章統計整理61四、次數分布的類型第3章統計整理62第三節數據的顯示—統計表和統計圖?

一、統計表?二、統計圖上一頁下一頁返回本章首頁第3章統計整理63一、統計表㈠統計表的構成:

1.從表式上看,由表頭(總標題)、橫行標題、縱欄標題和指標數值四個部分組成。

2.從內容上看,也可分為主詞欄和賓詞欄。主詞欄是表中所要說明的總體及其組成部分,一般位于表的左邊;賓詞欄是各種指標,包括指標名稱和指標數值,位于表的右邊。例見P36第3章統計整理64統計表的結構1999~2000年城鎮居民家庭抽樣調查資料項目單位1999年2000年

調查戶數平均每戶家庭人口平均每戶就業人口平均每戶就業面平均一就業者負擔人數平均每人全部年收入#可支配收入平均每人消費性支出戶人人%人元元元

400443.141.7756.431.775888.775854.024615.91

4222.03.131.6853.671.866316.816279.984998.00資料來源:《中國統計年鑒2001》,中國統計出版社,2001,第305頁。注:本表為城市和縣城的城鎮居民家庭抽樣調查材料。

橫行標題指標數值附注縱欄標題總標題第3章統計整理65一、統計表㈡統計表的種類

1.按用途不同可劃分為調查表、整理表和分析表。調查表是用來搜集統計資料的表格;整理表是用于匯總或整理調查資料,以及表現統計匯總或整理結果的表格;分析表是用于對整理所得的統計資料進行定量分析的表格。第3章統計整理66一、統計表

2.按主詞分組的不同,可劃分為簡單表、簡單分組表和復合分組表(P37)簡單表是主詞未經任何分組的統計表簡單分組表是主詞按一個標志進行分組復合分組表是主詞按兩個或兩個以上標志進行分組第3章統計整理67一、統計表

3.按賓詞設計不同,可分為賓詞簡單排列、分組平行排列和分組層疊排列(P38)。賓詞簡單排列是指賓詞不加任何分組、按一定順序排列在統計表上賓詞分組平行排列是指賓詞欄中各分組標志彼此分開,平行排列賓詞分組層疊排列是指統計指標同時有層次地按兩個或兩個以上標志分組,各種分組重疊在一起。第3章統計整理68一、統計表

4.按統計資料的時間和空間,可分為空間數列表、時間數列表和時空結合表空間數列表是指同一時間條件下,不同空間范圍的統計表時間數列表是指同一空間條件下,不同時間范圍的統計表時空結合表指同時反映社會經濟現象在不同空間和不同時間內的數量分布第3章統計整理69一、統計表㈢統計表的設計

1.合理安排統計表的結構。

2.數據計量單位相同時,可放在表的右上角標明,不同時應放在每個指標后或單列出一列標明。

3.表中的上下兩條橫線一般用粗線,其他線用細線

4.通常情況下,統計表的左右兩邊不封口。

5.表中數字因小可以忽略不計時,一般用“0”表示;對于沒有數字的表格單元,一般用“—”表示;缺失資料的單元格,一般用“…”表示。

6.必要時可在表的下方加上注釋。第3章統計整理70二、統計圖常用的統計圖有四種:直方圖、折線圖、曲線圖、莖葉圖。見書上P41第3章統計整理71分組數據—直方圖(histogram)1.用矩形的寬度和高度來表示頻數分布的圖形,實際上是用矩形的面積來表示各組的頻數分布2.在直角坐標中,用橫軸表示數據分組,縱軸表示頻數或頻率,各組與相應的頻數就形成了一個矩形,即直方圖

第3章統計整理72注:對于異距數列,由于各組組距不同,頻數的差異不能直接表明變量的分布特征。制作直方圖時,要先計算出各組的頻數密度,然后以組距為寬,以頻數密度為高畫直方圖。第3章統計整理73分組數據—折線圖

(frequencypolygon)1.折線圖也稱頻數多邊形圖2.是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉3.折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數分布是一致的第3章統計整理74分組數據—曲線圖當變量數列的組數無限增多時,折線便趨于一條平滑的曲線。曲線圖的畫法與折線圖基本類似,只是在連接各個坐標點時,用平滑曲線而不是用折線。第3章統計整理75未分組數據—莖葉圖

(stem-and-leafdisplay)1.用于顯示未分組的原始數據的分布2.由“莖”和“葉”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論