




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、工作任務五工作任務五 調查數據處理和分析調查數據處理和分析l學習目標學習目標 l1.知識目標l(1)理解數據處理的涵義;l(2)了解調查數據的審查的內容、方法和基本步驟;l(3)掌握市場調查缺失數據的處理技術和方法;l(4)了解數據分析的的涵義、特點和原則;l(5)掌握數據分析的方法。l2.技能目標l(1)會調查數據的編碼、錄入與匯總;l(2)會運用統計表,統計圖表達調查數據信息;l(3)會運用總量、相對和動態指標對調查數據進行分析;l(4)會運用集中趨勢分析技術對調查數據進行分析;l(5)會運用離中趨勢分析技術對調查數據進行分析。5.1數據處理數據處理l5.1.1數據處理概述數據處理概述l1
2、.數據處理的含義l數據處理,又稱數據資料整理,是指將調查所得的原始資料按照調查目的和調查任務的要求,運用科學的方法進行加工整理,使之條理化、系統化,并能反映調查現象總體特征的綜合資料的工作過程。 l2.數據處理的內容l主要有以下幾個方面:對調查所得原始資料進行審查;缺失數據的處理;調查數據的排序、分類、編碼、錄入、匯總;將整理后的數據繪制成圖表。5.1.2調查數據的審查調查數據的審查l1.數據審查的內容數據審查的內容l(1)數據資料的完整性l(2)數據資料的準確性l(3)數據資料的及時性l(4)數據資料的一致性5.1.2調查數據的審查調查數據的審查l2.數據資料準確性的審查方法數據資料準確性的
3、審查方法l(1)經驗判斷,即根據已有的經驗,判斷數據的真實性和準確性 。 l(3)計算審核,即根據調查項目有關指標之間存在的數量關系,檢查所接受資料數據的正確性,審查過程中,主要看各個數字在計算方法和計算結果上有無錯誤。l(2)邏輯檢查,就是根據調查項目之間的內在聯系和實際情況,對數據進行邏輯判斷,看其是否有違背常理或者前后矛盾的地方。5.1.3有問題問卷的處置有問題問卷的處置l1.無效問卷l(1)回答不完全。如果一份問卷中至少有三分之一的問題沒有回答,這份問卷應視為無效問卷。l(2)調查對象不符合要求。如有的調查中規定某類的人員不能成為調查對象,如果問卷是由這類人員作答,就是無效問卷。l(3
4、)答案選擇高度一致,即回答沒有什么變化。如,不管什么問題都選擇第一個答案。l(4)截止日期后收回的問卷,即這些問卷其回答的可靠性很低,提供的極有可能是虛假信息。虛假信息的危害非常大,甚至比缺乏信息帶來的還要大,所以這些問卷要全部作廢。5.1.3有問題問卷的處置有問題問卷的處置l2.不滿意的問卷l(1)模糊不清。可能由于調查員記錄的原因,把“”畫在兩個答案之間。l(2)前后不一致或有明顯錯誤的。如一個年齡為20歲的被訪者職稱是教授;一個月收入低于1 000元的被訪者卻擁有一處豪宅等。l(3)模棱兩可。要求單項選擇的閉式問題卻選擇了多個答案。l(4)不符合作答要求。比如跳答或不按要求回答。5.1.
5、3有問題問卷的處置有問題問卷的處置l3.有問題問卷的處理方法l(1)退回問卷重新調查l(2)放棄不用l(3)視為缺失數據的處理,如果不滿意問卷數量所占比例較少,而且涉及的變量不是關鍵變量,在無法退回問卷做重新調查時,可以按缺失數據的處理方式進行處理。5.1.3缺失數據的處理缺失數據的處理l1.推理插補l推理插補,是對缺失或不一致的數據通過推斷來確定。這種推理一般是根據數據資料中其他回答項的數據推理得來的。l例如,一個三項數值的和是100,其中的兩項分別是30和40,剩下的一項數值可以推算出是30。其數據間的邏輯關系是,第三項數值是三項數值之和與已知兩項數值之差。5.1.3缺失數據的處理缺失數據
6、的處理l2.均值插補l均值插補,是對缺失或不一致的數據用數列的均值來代替的插補方法。l(1)當原數列沒有明顯升降趨勢和季節波動時,用整個數列的平均值插補缺項。l(2)當原數列各期增(減)量大體相同時,可以用前期數據加平均增(減)量來插補缺項。5.1.3缺失數據的處理缺失數據的處理l2.均值插補l均值插補,是對缺失或不一致的數據用數列的均值來代替的插補方法。l(1)當原數列沒有明顯升降趨勢和季節波動時,用整個數列的平均值插補缺項l(2)當原數列各期增(減)量大體相同時,可以用前期數據加平均增(減)量來插補缺項。5.1.3缺失數據的處理缺失數據的處理l3.比例插補,是根據事物之間的比例關系推算所缺
7、數據的插補方法。l4.熱平臺插補l熱平臺插補是使用相似類型被調查者的已有記錄的信息(供者)來代替一個缺失的或的或不一致的數據(受者)。熱平臺插補有序貫熱平臺插補和隨機熱平臺插補兩種基本類型。5.1.4調查數據資料的排序調查數據資料的排序l調查數據資料的排序是指把收集到的數據資料按照某一數量標志或指標數值的大小順序重新排列。一般來說,錄入數據清單的數據資料是無序的,不能反映現象的本質和規律性,為了使用方便,通常要將收集到的所有數據資料進行排序。5.1.5 數據資料的分類(分組)l審核后的數據資料只有進行分類(分組)和匯總,才能為市場分析提供系統化和條理化的綜合指標數據,這也是保證數據資料客觀準確
8、的重要條件。 l1、分組的類型l1)按品質標志分組l2)按數量標志分組l3)簡單分組l4)復合分組5.1.5 數據資料的分類(分組)l2、分組(分類)的步驟l第一,選擇恰當的分組標志l第二,確定分組形式l第三,確定組距和組數l第四,確定組限與組中值組數最小變量值最大變量值組距=組中值=2下限上限 缺下限的開口組組中值=2鄰組組距上限缺上限的開口組組中值=2鄰組組距下限 5.1.6調查數據的編碼、錄入調查數據的編碼、錄入l1.調查數據的編碼l(1)編碼的含義l利用計算機對調查資料進行加工整理時,需要對調查項目進行編碼,以保證計算機對錄入信息的高效處理。所謂編碼,就是將調查表中的各個項目進行編號,
9、將其所承載的信息轉化為符號或數字代碼,通過計算機語言對調查資料進行進行分類匯總和統計分析。 5.1.6調查數據的編碼、錄入調查數據的編碼、錄入l(2)編碼的作用l1)減少數據錄入和分析的工作量,節省費用和時間,提高工作效率。l2)將定性數據轉化為定量數據,把整個問卷的信息轉化為規范標準的數據庫,進而可以利用統計軟件,采用統計分析方法進行定量分析。l3)減少誤差。量化的數據簡單易懂,不像文字資料容易丟失重要信息,在編碼過程中,還可以利用編碼修正回答誤差,替代缺失值,因此編碼有助于減少調查誤差。5.1.6調查數據的編碼、錄入調查數據的編碼、錄入l(3)幾種常見的編碼方法l對甄別條件的設定、甄別質量
10、的控制和主持人的主持水平要求高;l所取得的信息是方向性的,不易精確地進行定量分析,不能將結論推及總體;l有些涉及隱私、保密等問題,不容易當眾詢問;l由于受時間的限制,需在有限時間內完成規定的內容,容易造成無法深入討論。 5.1.6調查數據的編碼、錄入調查數據的編碼、錄入l1)順序編碼法l順序編碼法又稱系列編碼法,是指用一個標準對信息資料進行分類,并按照一定的順序用連續的數據或字母進行編碼的方式。l例如,一項對家庭年收入的調查項目,把不同年收入的家庭劃分為以下五個檔次。l20000元及以下 (1)l2000040000元 (2)l4000060000元 (3)l6000080000元 (4)l8
11、0000元及以上 (5)5.1.6調查數據的編碼、錄入調查數據的編碼、錄入l2)分組編碼法l分組編碼法又稱區間編碼法,是根據調查事物的特性和信息資料分類及其處理的要求,將具有一定位數的代碼單元分成若干個組,每一個組的數字均代表一定的意義。l分組編碼法編碼簡單,便于計算機處理,但位數過多,容易造成系統維護上的困難。5.1.6調查數據的編碼、錄入調查數據的編碼、錄入個人基本情況的調查個人基本情況的調查性別居住地家庭人口數月收入水平回答編碼回答編碼回答編碼回答編碼 男 1大城市 1單身 13000元以下 1 女 2中小城市 2兩人 230006000元 2縣鎮 3三口之家 360009000元 3農
12、村 4四人及以上 4900012000元 412000元以上 5若某被調查者的信息是:女性,居住地某大城市,單身,月收入30006000元,信息碼是2112。5.1.6調查數據的編碼、錄入調查數據的編碼、錄入l3)信息組碼編碼法l信息組碼編碼法,是指把調查信息資料區分成一定的組,每個組給予一定的組碼進行編碼的方法。l 某地市場商品價格變動情況的調查,調查組碼分類如下:l級別名稱碼l百貨組0125l食品組2650l服裝組5170l家電組7180l其他組811005.1.6調查數據的編碼、錄入調查數據的編碼、錄入l4)表意式文字編碼法l表意式文字編碼法,又稱助記編碼法,是用數字、文字、符號等表明編
13、碼對象的屬性,并依此方式進行信息資料編碼的方法。l例如,用210BXJ表示容量為210升的進口電冰箱,其中210為暗箱容量,BX表示冰箱,J表示進口。l這種編碼方法表現直觀,易于理解,便于記憶。5.1.6調查數據的編碼、錄入調查數據的編碼、錄入l2.調查數據的錄入調查數據的錄入l(1)數據錄入的含義l數據錄入,是將經過編碼的數據資料輸入到計算機存儲設備中的過程。市場調查發達的國家在數據采集中常常采用計算機輔助電話調查(CATI)、計算機輔助面訪(CAPI)等調查方式,計算機錄入工作在調查訪問時就完成了。 5.1.6調查數據的編碼、錄入調查數據的編碼、錄入l(2)數據錄入質量的檢查l1)數據庫軟
14、件自動檢查法l通過數據庫結構的編輯,可以對錄入的過程進行邏輯檢查,避免數據錄入過程中出現某種類型的邏輯錯誤。l2)重復輸入數據l重復輸入數據的核查方式主要有雙機錄入或三機錄入。雙機錄入,是指將同一份問卷,分別由兩個錄入人員在計算機上進行兩次錄入,將兩次錄入的結果逐一進行比較,相同的部分被認定為沒有錯誤,不同部分立即檢查問卷進行核對,及時修正錯誤;5.1.6數據資料的顯示數據資料的顯示l1.統計表統計表l(1)統計表的結構l統計表從結構形式上看,一般由表號、總標題、橫行標題、縱欄標題和數字資料等幾個部分組成。l(2)統計表的種類l統計表根據制表的方式不同,可分為簡單表和交叉表。5.1.6數據資料
15、的顯示數據資料的顯示l2.統計圖統計圖l(1)條形圖 5.1.6數據資料的顯示數據資料的顯示l(2)折線圖 5.1.6數據資料的顯示數據資料的顯示l(3)圓形圖 5.2調查數據的分析調查數據的分析 l 1.數據分析的的涵義l調查數據分析,是根據研究的目的和要求,運用科學的方法和手段,對調查數據進行定性和定量分析,揭示現象的本質和規律,為決策和管理提供咨詢服務的過程。數據分析所采用的主要是一些統計分析技術。 5.2調查數據的分析調查數據的分析 l2.調查數據分析的特點l(1)數據分析過程要定性分析和定量分析相結合l(2)數據的定量分析以統計分析方法為主l(3)數據分析不能孤立于被調查研究的現象獨
16、立地進行l(4)數據分析過程是一次認識上的質的飛躍5.2調查數據的分析調查數據的分析l3. 調查數據分析的基本原則l(1)科學性原則是指在數據分析中,應該根據調查數據的屬性和特點、調查數據的來源渠道、調查研究的任務和目的,選擇科學合理的分析方法進行分析。l(2)客觀性原則是指在數據分析中,必須遵守實事求是原則,充分了解研究對象的各種實際情況,尊重調查數據事實,保證分析結果的公正與客觀。l(3)目的性原則是指數據分析必須圍繞調查研究的任務和目的來進行,其分析的結果必須能夠滿足調查研究的需要。l(4)系統性原則是指數據分析要將所研究的現象進行分解,然后對各種復雜的聯系進行分析和綜合。5.2.2總量
17、指標分析總量指標分析l總量指標的計算方法有直接計算法、推算與估算法。l(1)直接計量法是指對研究的現象進行直接讀數、點數或測量后,將總量數值計算出來的方法。l(2)推算與估算法l1)因素關系推算法。因素關系推算法是指利用社會經濟現象的各個影響因素之間的關系,根據已知因素來推算未知因素的方法。l2)比例關系推算法。比例關系推算法是指利用各種相關現象的比例關系進行推算的一種方法。l 3)平穩關系推算法。平穩關系推算法是指利用各種平穩關系來推算未知指標的方法。5.2.3 相對指標分析相對指標分析l(1)結構相對指標 結構相對指標是在對總體進行分組的基礎上,各組數值與總體數值對比得到的相對數。用來反映
18、社會經濟現象總體內部的構成情況,說明總體內各部分在總體中的地位。結構相對指標通常用百分數表示,其計算公式為:總體的全部數值總體各部分(各組)數值結構相對指標= 100%5.2.3 相對指標分析相對指標分析l(2)比例相對指標l比例相對指標又稱比例相對數,是在同一時間內同一經濟現象的總體內部不同部分指標數值之間的比例關系,用來表示總體內部各組成部分的構成比例。比例相對指標可用百分數或系數來表示,也可用1:m:n的連比形式表示,其計算公式為:總體中另一部分(組)數值總體中某一部分(組)數值比例相對指標=5.2.3 相對指標分析相對指標分析l(3)比較相對指標l比較相對指標是把同一時間內同類經濟現象
19、的指標在不同空間狀態下的數值對比構成的相對指標。它可以反映同類事物在不同國家、不同地區或不同單位之間的差異程度,一般用百分數、系數或倍數表示。計算公式為: 另一地區(單位)的同類指標數值某一地區(單位)的某類指標數值比較相對指標=5.2.3 相對指標分析相對指標分析l(4)強度相對指標。強度相對指標是由兩個性質不同但又有聯系的總量指標進行對比的比值,用來反映社會現象之強度、密度、普及程度。其計算公式為:的總量指標數值另一有聯系而性質不同某一總量指標數值強度相對指標5.2.4 動態指標分析動態指標分析 2004 200420082008年我國城鎮人均純收入年我國城鎮人均純收入年 份2004年20
20、05年2006年2007年2008年人均純收入(元)942210493117591378615781環比發展速度(%)111.4112.1117.2114.5定基發展速度(%)100111.4124.8146.3167.5環比增長速度(%)11.412.117.214.5定基增長速度(%)11.424.846.367.5增長1%絕對值(元)94.2104.9117.6137.95.2.5 數據的集中趨勢分析數據的集中趨勢分析l(1)眾數。l眾數是總體中各單位在某一標志上出現次數最多的變量值。大學生每周上網次數的調查表大學生每周上網次數的調查表上網次數被訪問者一次18二次20三次21四次33五次
21、15六次13七次10合 計1305.2.5 數據的集中趨勢分析數據的集中趨勢分析l(2)中位數。l中位數是將總體各單位的變量值按大小順序排列,處于中間位置的那個變量值。 21n中位數的位置5.2.5 數據的集中趨勢分析數據的集中趨勢分析l案例案例5-13 某項對消費者每月去大型超市購物次數的調查,20個被調查者每月去大型超市的次數按順序排列是:0,1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,5,5,6,7,則中位數是多少? l 解:5 .102120中位數的位置這說明中位數的位置在第10位和第11位中間,因此,中位數應是第10個數與第11個數的算術平均數。即等于35.2.5 數
22、據的集中趨勢分析數據的集中趨勢分析l(3)算術平均數 l1)簡單算術平均數,是在未分組的資料條件下計算簡單算術平均數,其公式為:nxnxxxxxn3215.2.5 數據的集中趨勢分析數據的集中趨勢分析l2)加權算術平均數,在資料已分組并得出次數分布資料時,要計算加權算術平均數,其公式為:fxfffffxfxfxxnnn.2122115.2.5 數據的集中趨勢分析數據的集中趨勢分析fxxf 2010 2010年某院校大學生生活費用支出情況年某院校大學生生活費用支出情況學生人數組中值生活費用支出 元 人數乘組中值 500以下2940011 600 5007007760046 200 7009002
23、780021 600 9001100以上24100024 0001100以上13120015 600合 計170119 000 ).(700170119000元fxfx5.2.6 數據的離中趨勢分析數據的離中趨勢分析l(1)極差l極差是數據中最變量大值和最變量小值之差。其基本公式為:l 極差=最變量大值最變量小值l案例案例5-16 某高校有8位學生,他們每月的生活費支出分別是: 500、550、600、650、700、750、800、850元則他們生活費支出的極差:l極差=850500=350(元)l極差受最變量大值和最變量小值的影響,如果因特殊原因出現特別大或特別小的數值,極差就不能確切反映各數據真實的變異程度。5.2.6 數據的離中趨勢分析數據的離中趨勢分析l(2)平均差l平均差,即平均離差。它是將各變量值與平均數離差絕對值的總和除以離差的項數。計算公式分為簡單和加權兩種。l1)對于未分組資料,采用簡單式計算,其公式為:l
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025租客簽訂租房合同時應注意哪些事項
- 2025年個體沿街商鋪租賃合同
- 2025打印機的租賃合同樣本
- 玩具行業新興市場開發考核試卷
- 2025年棉服購銷合同范本
- 2025電磁爐專賣店代理合同書范本
- 2025年多方合作的協議合同
- 2025年古董藝術品買賣合同模板
- 2025健身設備購銷合同范本
- 2025商業店鋪合作經營合同范本
- 家政服務行業環保管理制度
- 完整的欠貨款協議書范文范本
- 2024年山東省濟寧市中考生物試題卷(含答案解析)
- 浙美版小學二年級下冊美術教學計劃及教案全冊
- 健合集團在線測評原題
- 公路工程標準施工招標文件(2018年版)
- 個人理財-形考作業4(第8-9章)-國開(ZJ)-參考資料
- 2024年江西省職業院校技能大賽(研學旅行賽項)備考試題庫(含答案)
- 人教版九年級數學復習教案全冊
- 【建筑專業】16J914-1公用建筑衛生間(完整)
- 小學數學高效課堂教學策略研究中期報告
評論
0/150
提交評論