統(tǒng)計學第二章 數(shù)據(jù)的收集與整理_第1頁
統(tǒng)計學第二章 數(shù)據(jù)的收集與整理_第2頁
統(tǒng)計學第二章 數(shù)據(jù)的收集與整理_第3頁
統(tǒng)計學第二章 數(shù)據(jù)的收集與整理_第4頁
統(tǒng)計學第二章 數(shù)據(jù)的收集與整理_第5頁
已閱讀5頁,還剩51頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、2-1復習復習2-2對某系學生情況的進行統(tǒng)計調(diào)查,抽取若干學生進行問卷調(diào)查。則某系全體學生是( ),問卷中,要求同學填寫生源地是( ),抽取的某位同學的性別為男是( ),該系學生上學期及格率是( ),某系的男生比例為30%是( )。A 總體 B 樣本 C 標志 D 指標E 標志值(標志表現(xiàn)) F 指標值2-32第二章第二章 數(shù)據(jù)的收集和整理數(shù)據(jù)的收集和整理通過本章的學習,我們應該知道:通過本章的學習,我們應該知道:1. 數(shù)據(jù)來源數(shù)據(jù)來源2. 數(shù)據(jù)是如何收集的數(shù)據(jù)是如何收集的3. 數(shù)據(jù)是如何整理的數(shù)據(jù)是如何整理的4. 如何做次數(shù)分布表如何做次數(shù)分布表S t a t i s t i c s2-4有

2、組織、有組織、有計劃地有計劃地搜集資料。搜集資料。要求:準確、要求:準確、完整、及時完整、及時對調(diào)查資料對調(diào)查資料去偽存真、去偽存真、去粗取精、去粗取精、科學分類、科學分類、濃縮簡化濃縮簡化描述性分析描述性分析推斷分析、推斷分析、決策分析。決策分析。要求:定性要求:定性定量結合定量結合2-5一、數(shù)據(jù)來源一、數(shù)據(jù)來源 Data Sources數(shù)據(jù)數(shù)據(jù)來源來源 直接來源直接來源(原始資料)(原始資料) 間接來源間接來源(次級資料)(次級資料)試驗試驗出版物出版物(或者網(wǎng)上或者網(wǎng)上)問卷調(diào)查問卷調(diào)查觀察觀察2-6二、數(shù)據(jù)收集方法二、數(shù)據(jù)收集方法2-7直接觀察法直接觀察法2-8調(diào)查者調(diào)查者強制、約束強

3、制、約束報告法報告法2-9采訪法采訪法調(diào)查者調(diào)查者被調(diào)查者被調(diào)查者 平等合作平等合作返回口頭詢問口頭詢問自填問卷自填問卷2-10危害自身健康危害自身健康影響他人健康影響他人健康浪費錢財浪費錢財容易引起火災容易引起火災破壞家庭團結破壞家庭團結容易控制,容易控制,但不易全面但不易全面調(diào)查問卷的問題類型:調(diào)查問卷的問題類型:容易造成人際容易造成人際關系緊張關系緊張不易控制,不易控制,但內(nèi)容豐富但內(nèi)容豐富您認為吸煙有哪您認為吸煙有哪些害處?些害處?危害自身健康危害自身健康影響他人健康影響他人健康浪費錢財浪費錢財容易引起火災容易引起火災破壞家庭團結破壞家庭團結其他其他 。2-112-12其他統(tǒng)計方法:登

4、記法、電話訪問、網(wǎng)絡調(diào)查、試驗設計,等等學校統(tǒng)計畢業(yè)生就業(yè)情況,一般流程:學生簽署三方協(xié)議后通知輔導員,向輔導員遞交相關材料,由輔導員定期整理本學院畢業(yè)生的就業(yè)情況,并向?qū)W校就業(yè)辦公室上報數(shù)據(jù)。在該項統(tǒng)計工作中用到了哪些數(shù)據(jù)收集方法?2-13按調(diào)查單位的范圍大小分為按調(diào)查時間是否連續(xù)分為三、統(tǒng)計調(diào)查的種類三、統(tǒng)計調(diào)查的種類2-142-15統(tǒng)計調(diào)查的各種形式普 查統(tǒng)計報表抽樣調(diào)查重點調(diào)查典型調(diào)查2-16普查(census)特點:全面調(diào)查一次性調(diào)查(非經(jīng)常性調(diào)查)概念:指國家為詳盡了解某項重要的國情國力而專門組織的一次性全面全面調(diào)查建立專門機構,配備專門人員調(diào)查。原則:規(guī)定統(tǒng)一的標準時點。規(guī)定統(tǒng)一

5、的普查期限,盡可能快地完成。規(guī)定調(diào)查的項目和指標。2-17由政府部門組織,采用統(tǒng)一的表格,自上而下布置,自下而上報告。任務:搜集國民經(jīng)濟和社會發(fā)展基本情況的資料,為制訂國民經(jīng)濟和社會發(fā)展計劃和檢查計劃執(zhí)行情況服務。特點:概念:統(tǒng)計報表制度(statistical report forms)來源基層逐級上報經(jīng)常性調(diào)查2-18抽樣調(diào)查(sampling survey)含義:是一種非全面調(diào)查,根據(jù)某種原則抽取一部分單位作為樣本進行光差,然后根據(jù)樣本數(shù)據(jù)推算總特特征。特點:1 (隨機抽樣)按照隨機原則從總體種選擇樣本;2 以樣本指標(統(tǒng)計量)為依據(jù),估計總體特征3 抽樣誤差可以事先計算并加以控制。作用

6、:不可能或不必要做全面調(diào)查的(無限總體;破壞性實驗)修正普查資料2-19抽樣調(diào)查的組織方式1 簡單隨機抽樣;2 系統(tǒng)抽樣;3 分層抽樣;4 整群抽樣;調(diào)查一個班的學生(共調(diào)查一個班的學生(共60人,其中男生人,其中男生10人,女生人,女生50人)情況,人)情況,需要抽取需要抽取12位同學作為樣本位同學作為樣本抽簽決定學號為2,7,12,17,22,27男生中隨機抽取2人,女生中隨機抽取10人抽取一個男生宿舍,一個女生宿舍的同學2-20抽樣調(diào)查優(yōu)點:經(jīng)濟性 時效性 準確性 靈活性原則:隨機 最大抽樣效果(最小抽樣誤差)2-21重點調(diào)查(key point survey)概念:在總體中選擇個別或部

7、分重點單位進行非全面調(diào)查。重點單位指在總體中這些單位的標志值在標志總量中占有絕大比重。能以較少的投入和較快的速度取得總體基本情況及變動趨勢的資料;只適用于客觀存在重點單位的情況(適用于存在類似“寡頭”或者“壟斷”的情況)特點:2-22典型調(diào)查(model survey)概念: 在初步分析的基礎上,有意識地選擇代表性的典型單位進行非全面調(diào)查。對于典型單位的挑選,更多地取決于主觀判斷作用:適宜于研究處于萌芽狀態(tài)事物和傾向性問題; 起步早起步早 措施力措施力 效果好效果好重慶合川市思居村新農(nóng)村建設典型調(diào)查重慶合川市思居村新農(nóng)村建設典型調(diào)查 農(nóng)村信息化建設調(diào)查分析農(nóng)村信息化建設調(diào)查分析以湖北省仙桃市的

8、以湖北省仙桃市的5個村鎮(zhèn)為典型個村鎮(zhèn)為典型調(diào)查對象調(diào)查對象 2-23總體單位總體單位調(diào)查單位調(diào)查單位2-24總體單位總體單位調(diào)查單位調(diào)查單位報表制度報表制度可以全面調(diào)查,但可以全面調(diào)查,但通常是調(diào)查限定規(guī)通常是調(diào)查限定規(guī)模以上的總體單位模以上的總體單位2-25總體單位總體單位調(diào)查單位調(diào)查單位普普 查查對全部單位對全部單位進行調(diào)查進行調(diào)查2-26總體單位總體單位調(diào)查單位調(diào)查單位重點調(diào)查重點調(diào)查只調(diào)查重點單位(單位只調(diào)查重點單位(單位數(shù)不多但其標志量占標數(shù)不多但其標志量占標志總量比重較大的單位)志總量比重較大的單位)2-27總體單位總體單位調(diào)查單位調(diào)查單位典型調(diào)查典型調(diào)查對典型單位進行調(diào)對典型單位

9、進行調(diào)查,典型單位的選查,典型單位的選擇并不一定按規(guī)模擇并不一定按規(guī)模2-28總體單位總體單位調(diào)查單位調(diào)查單位抽樣調(diào)查抽樣調(diào)查按隨機原則選擇調(diào)按隨機原則選擇調(diào)查單位,各單位被查單位,各單位被選中的機會相同。選中的機會相同。2-29統(tǒng)計調(diào)查的組織形式統(tǒng)計調(diào)查的組織形式統(tǒng)計報表普 查重點調(diào)查典型調(diào)查抽樣調(diào)查制度化的經(jīng)常性調(diào)查專門組織的一次性調(diào)查全面調(diào)查非全面調(diào)查2-30統(tǒng)計調(diào)查方案的設計統(tǒng)計調(diào)查方案的設計組織調(diào)查之前統(tǒng)計調(diào)查方案的設計內(nèi)容:1、明確調(diào)查目的(為什么調(diào)查?)2、確定調(diào)查對象和調(diào)查單位(調(diào)查誰?)3、確定調(diào)查項目(調(diào)查什么?)4、確定調(diào)查方式,問卷設計(怎么調(diào)查?)5、確定調(diào)查時間和調(diào)

10、查期限6、制定調(diào)查的組織實施計劃統(tǒng)計調(diào)查方案:用來指導整個調(diào)查工作的綱領性統(tǒng)計調(diào)查方案:用來指導整個調(diào)查工作的綱領性文件,是統(tǒng)計設計在統(tǒng)計調(diào)查階段的具體化文件,是統(tǒng)計設計在統(tǒng)計調(diào)查階段的具體化返回2-31調(diào)查誤差抽樣誤差:由于隨機性原因產(chǎn)生的誤差非抽樣誤差:由于各種操作環(huán)節(jié)失誤,或設計不合理等原因造成的誤差2-32二手統(tǒng)計資料來源查閱公開出版物;查閱公開出版物;向政府統(tǒng)計機構咨詢;向政府統(tǒng)計機構咨詢;向其他機構咨詢;向其他機構咨詢;網(wǎng)上查詢。網(wǎng)上查詢。2-33返回2-342-352-362 數(shù)據(jù)的整理數(shù)據(jù)整理的程序2-37數(shù)據(jù)分組數(shù)據(jù)分組2-38統(tǒng)計分組的種類根據(jù)分組標志的個數(shù)分類:根據(jù)分組標

11、志的個數(shù)分類:簡單分組:僅按照一個標志進行分組簡單分組:僅按照一個標志進行分組復合分組:按照兩個或兩個以上的標志進行層疊分組復合分組:按照兩個或兩個以上的標志進行層疊分組根據(jù)分組標志的性質(zhì)分類:根據(jù)分組標志的性質(zhì)分類:品質(zhì)標志分組:如上市公司的行業(yè)分類品質(zhì)標志分組:如上市公司的行業(yè)分類數(shù)量標志分組:人口按年齡分組數(shù)量標志分組:人口按年齡分組2-39數(shù)量分組數(shù)量分組品質(zhì)分組品質(zhì)分組分分類類異距分組異距分組等距分組等距分組組距分組組距分組單項分組單項分組分組方法分組方法一般原則: 窮盡原則:各有歸屬,不能遺漏任何一個單位 互斥原則:一個單位不能歸屬于幾個組標志表現(xiàn)只標志表現(xiàn)只有一個值有一個值標志表

12、現(xiàn)在標志表現(xiàn)在一個區(qū)間一個區(qū)間組距?組限?變量值變動變量值變動區(qū)間的長度區(qū)間的長度相等相等2-40指每組兩端表示各組界限的變量值,各組指每組兩端表示各組界限的變量值,各組的最小值為下限,最大值為上限的最小值為下限,最大值為上限每組變量值變動區(qū)間的長度,為上下限每組變量值變動區(qū)間的長度,為上下限之差之差連續(xù)式分組組距d=上限-下限 間斷式分組組距d=上限-下限+12-41數(shù)據(jù)一共分為多少組數(shù)據(jù)一共分為多少組每組變量取值范圍的中點數(shù)值每組變量取值范圍的中點數(shù)值 2下限上限組中值=對于等距分組,組數(shù)n=R/d,其中R為全距,即R=最大標志值-最小標志值d=組距顯然組距越大,組數(shù)越小,怎樣選擇組距和組

13、數(shù)比較合理?Nnlg33.31 其中N為樣本單位數(shù)注意:連續(xù)型變量分組時上限的選取2-42變量數(shù)列中的組距數(shù)列組距數(shù)列編制比較復雜,下面主要研究它:(1)排序,找到最大最小值(2) 組數(shù)的確定在按實際情況稍做調(diào)整(3)組距的確定 R=Xmax-Xmin i=R/n(小數(shù)進一)(4)組限的確定(5)數(shù)出在每一組中的個體數(shù)(頻數(shù)),計算頻率,列表整理得到等距數(shù)列Nnlg33.31 2-43q對于離散變量,相鄰組組限可以間斷,也可重疊;q對于連續(xù)變量,相鄰組組限必須重疊;q符合“上組限不計入”原則;q首末兩組可使用“以下”及“以上”的開口組。2-44【例】根據(jù)抽樣調(diào)查,某鎮(zhèn)【例】根據(jù)抽樣調(diào)查,某鎮(zhèn)6

14、060戶居民月消費資料如下,要戶居民月消費資料如下,要求編制變量數(shù)列,形成次數(shù)分布。求編制變量數(shù)列,形成次數(shù)分布。753753845845740740723723891891860860563563556556670670998998663663790790925925589589683683776776700700703703639639807807708708715715643643661661545545671671780780708708667667701701500500612612650650840840778778777777775775889889653653631631948

15、9488278279109106986987607606236234154155235237637637387386476478358357707708788785785785695698058055165167687687757752-45第一步,先將第一步,先將6060個數(shù)據(jù)排序,找出最大值個數(shù)據(jù)排序,找出最大值998998和最小值和最小值415415,這個數(shù)列的全距這個數(shù)列的全距R R998-415998-415583583厘米。厘米。第二步,確定組數(shù)和組距:第二步,確定組數(shù)和組距:根據(jù)公式:根據(jù)公式:n = 1 + 3.33n = 1 + 3.33(lg60)(lg60)7,再根據(jù)實際

16、情況調(diào)整(因為全距再根據(jù)實際情況調(diào)整(因為全距583583,分,分6 6組可使每組組距組可使每組組距為為100100,分組后組限可取整)取組數(shù)為,分組后組限可取整)取組數(shù)為6 6,組距為,組距為100100第三步,確定組限:第三步,確定組限:第一組組限定為第一組組限定為400500400500;第二組第二組500600500600;依此類推,;依此類推,第六組為第六組為90010009001000也可以也可以第一組組限定為第一組組限定為500以下,第六組為以下,第六組為900及以上及以上2-46第四步,進行歸組,即將各個變量值歸入相應的組中,數(shù)第四步,進行歸組,即將各個變量值歸入相應的組中,數(shù)

17、出各個組中變量的個數(shù),即為頻數(shù)。出各個組中變量的個數(shù),即為頻數(shù)。第五步,計算頻率。將各組頻數(shù)除以總樣本個數(shù),即為頻第五步,計算頻率。將各組頻數(shù)除以總樣本個數(shù),即為頻率率各組單位數(shù)占總體單位總數(shù)的比重各組單位數(shù)占總體單位總數(shù)的比重頻率=頻數(shù)/總樣本個數(shù)單位組距中的頻數(shù)單位組距中的頻數(shù)某組頻數(shù)密度=該組頻數(shù)/該組組距單位組距中的頻率單位組距中的頻率某組頻率密度=該組頻率/該組組距2-47月消費(元)月消費(元)戶數(shù)戶數(shù)頻率(頻率(%)400-50011.7500-600813.3600-70015250800-9001118.3900-100046.7合計合計60100

18、居民月消費分布表居民月消費分布表2-48第六步,繪圖:一般繪制散點、折線或柱狀圖第六步,繪圖:一般繪制散點、折線或柱狀圖如果是等距分組,如果是等距分組,EXCEL繪制折線圖、散點圖或柱繪制折線圖、散點圖或柱狀圖基本相似。但散點圖需要再計算組中值,以組中狀圖基本相似。但散點圖需要再計算組中值,以組中值為橫坐標值為橫坐標如果不是等距分組,則一般繪制散點圖,需要計算如果不是等距分組,則一般繪制散點圖,需要計算組中值,以組中值為橫坐標。組中值,以組中值為橫坐標。在其他分組類型中需要具體情況具體分析。例如:在其他分組類型中需要具體情況具體分析。例如:如果進行品質(zhì)分組,無法繪制散點圖,只能繪制折線如果進行

19、品質(zhì)分組,無法繪制散點圖,只能繪制折線圖或柱狀圖,還可以通過繪制餅圖表現(xiàn)分組后的結構。圖或柱狀圖,還可以通過繪制餅圖表現(xiàn)分組后的結構。單項式分組,一般繪制折線圖或柱狀圖,也可以通過單項式分組,一般繪制折線圖或柱狀圖,也可以通過繪制餅圖表現(xiàn)分組后的結構。繪制餅圖表現(xiàn)分組后的結構。2-49表示低于某分組上限的頻數(shù)與頻率。表示低于某分組上限的頻數(shù)與頻率。表示高于某分組下限的頻數(shù)與頻率。表示高于某分組下限的頻數(shù)與頻率。2-50消費分組消費分組頻數(shù)頻數(shù)頻率頻率(%)(%)向上累積向上累積向下累積向下累積頻數(shù)頻數(shù)頻率頻率/%/%頻數(shù)頻數(shù)頻率頻率/%/%400-500400-5001 11.71 1500-

20、600500-6008 813.39 9600-700600-700151525.02424700-800700-800212135.0800-900800-900111118.3900-1000900-10004 46.7合計合計60601002-51消費分組消費分組頻數(shù)頻數(shù)頻率頻率(%)(%)向上累積向上累積向下累積向下累積頻數(shù)頻數(shù)頻率頻率/%/%頻數(shù)頻數(shù)頻率頻率/%/%400-500400-5001 11.71 11.71.7500-600500-6008 813.39 915.015.0600-700600-700151525.0242440.040.0700-800700-80021

21、2135.0454575.075.05050800-900800-900111118.3565693.393.31515900-1000900-10004 46.760601001004 4合計合計60601002-52消費分組消費分組頻數(shù)頻數(shù)頻率頻率(%)(%)向上累積向上累積向下累積向下累積頻數(shù)頻數(shù)頻率頻率/%/%頻數(shù)頻數(shù)頻率頻率/%/%400-500400-5001 11.76060100100500-600500-6008 813.3595998.398.3600-700600-700151525.0515185.085.0700-800700-800212135.0363660.060.0800-900800-900111118.3151525.02510004 46.74 46.76.7合計合計60601002-53消費分組消費分組頻數(shù)頻數(shù)頻率頻率(%)(%)向

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論