




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1第七章 調查資料的處理與分析2一、 調查資料的處理與分析3(一一)資料處理與分析的基本意資料處理與分析的基本意義原則義原則資料處理與分析的概念:資料處理與分析的概念: 是指將收集到的各類信息資料,按照一定的程序和方法,進行分類、計算、分析和選擇等使之成為適用的信息資料的過程。41、資料處理的基本原則、資料處理的基本原則及時及時 在處理與分析過程中要強調時間性,提高處理速度。因為信息資料都有一定的時效性。準確準確 這是資料工作的生命。即一要真實,二要準確。真實,是定性要求,即處理的是真的情報、信息。準確是定量的要求,適量減少誤差和模糊度。系統系統 即在處理與分析過程中必須強調全面客觀地反映市場
2、的變化和特征,形成系統化的信息資料。可使資料具有更多的價值,更利于使用。 5適用適用 一是采用的處理與分析方法要適當,二是處理與分析后,形成的信息資料要符合實際需要。經濟經濟 以較少的費用,形成盡可能多的有用的信息資料。2、 基本要求基本要求 要有正確的觀點要有正確的觀點: 現代信息觀念、實事求是的觀念 、時間觀念、市場觀念、服務觀念、效率效益的觀念。 要有專職的稱職的信息處理與分析人員要有專職的稱職的信息處理與分析人員。 要有嚴格的制度要有嚴格的制度。 要有科學合理的標準要有科學合理的標準。 要有科學、認真、高效的工作態度要有科學、認真、高效的工作態度。 63、資料處理與分析的意義、資料處理
3、與分析的意義 首先,通過處理與分析,使信息資料統一化、系統化、適用化。 其次,可以提高市場調查資料的價值。 再次,可以產生新的信息。 最后,可以發現并糾正市場調查過程中的不足。7(二二)資料處理與分析過程及其內容資料處理與分析過程及其內容 1、一般過程:(1)現場控制 (2)邏輯處理鑒別 分類 編碼 合并 比較 篩選(3)數學處理數學處理統計分析建模與解模(4)系統研究 (5)編 寫8二、資料處理與分析的若干方法二、資料處理與分析的若干方法 (一一)鑒別的方法鑒別的方法1、不真實的信息資料的幾種形式、不真實的信息資料的幾種形式 誤傳、虛構、添加、拼湊、混淆、夸張、偏頗、孤證(僅憑幾個孤立的現象
4、進行推理判斷)、回避、捉影(事出似有因,細查卻無實據)、假象(以表面現象甚至假象掩蓋了事實本質)。2、鑒別的方法、鑒別的方法:分析判斷法、核對法(與客觀事物或權威資料相核對)、比較法、作證法(調查收集能驗證原信息資料真實性、準確性、適用性的佐證,來鑒定初始信息的質量)。9(二二)編碼的方法編碼的方法1、基本原則:基本原則: 編碼應與分類相適應、編碼時應預留足夠的位置、代碼要系統化、盡量使編碼具有兼客性和通用性2、常見的編碼方法:常見的編碼方法: 第一種:順序編碼法(系列編碼法)只用一個標準分類,并按一定的順序用連續的數字或字母進行編碼此方式短而簡單,易于管理,但不適合進行分組處理。 10順序編
5、碼法(系列編碼法)順序編碼法(系列編碼法) 如,一項調查家庭收入的項目把不同收入家庭分為五個檔次,順序編碼時可用15分別代表從低到高的五個檔次: 1) 小于8000元 2) 8001元15000元 3) 15001元24000元 4) 24001元35000元 5) 大于35000元11第二種第二種 分組編碼法(區間編碼法)分組編碼法(區間編碼法)根據事物的特性和信息資料分類及其處理的要求,把具有一定位數的代碼單元分成若干個組(區間),每一組(區間)的數字均代表一定的意義,所有項目都有同樣的數碼個數。 比如,對消費者使用信用卡的意向調查相關的信息,包括性別、職業、月收入、意向四項,可用分組編碼
6、法則進行編碼(見下表)。此法使用相當廣泛,易記憶,處理較方便,但有時位數過多,造成系統維護上的困難。 12分組編碼法(區間編碼法)分組編碼法(區間編碼法)性別 :1男性 、2女性 職業 :1經理人員、2銷售人員、3機關人員、 4職工 、5教師 、 6工程技術人員 7私營業主、8學生 、9其他 月收入 :01 400元以下、02 401500元 、 03 501600元、 04 601700元 05401500元、06 701800元 07 801900元、08901 1000元 091000以上意向: 1已有卡 、 2準備用、 3不準備用、4無意向1593:男教師,不準備用 13 第三種:信息
7、組碼編碼法第三種:信息組碼編碼法把信息資料區分為一定的組,每一組給予一定的組碼進行編碼。如:對市場商品調查的分類編碼可用此法,(見下表)組別 名稱碼百貨組 0030食品組 3160五金組 6180紡織組 81100 這種方法能以較少的位數分組,但一旦編碼體系確定,遇到某些組內資料增加,處理起來困難。14第四種:表意文字編碼法(記憶編碼法)第四種:表意文字編碼法(記憶編碼法)用數字、文字、符號等表明編碼對象的原理,并按此進行信息資料編碼。如:用20TVC表示20英寸彩色電視機,其中:“20”表示規格,TV表示電視機。C代表彩色。直觀,易理解,便記憶。第五種:縮寫編號法第五種:縮寫編號法把慣用的縮
8、寫字直接用作代碼進行編碼。如: LB KG YD CM 磅 千克 碼 厘米15(三)定性市場信息資料的簡明加法定性市場信息資料的簡明加法定性市場信息資料是指那些以文字來描述事物的特征的非數量化的信息資料。1、匯集法、匯集法。把許多原始信息資料按一定的目的匯集在一起,以集中反映某些事物的概況和問題。此法要求相關信息的量要多一點,反映的面要寬一點;要圍繞一定的主題進行資料匯集;要避免把許多資料簡單堆砌,而要把相關的信息資料有機地匯集起來。162、歸納法:、歸納法:將反映某一主題的市場信息資料集中在一起,加以系統的綜合歸納,以準確全面,概要地說明該主題。3、縱深法:、縱深法:按事物發展縱的方向,即按
9、時間順序或邏輯次序,把有關的資料進行綜合深入的研究。4、連橫法:連橫法:把彼此相關的若干個不同的方面或不同時期的資料,有機地橫向連接起來,作出比較分析和相關分析。5、推理法:、推理法:在占有并詳細分析研究大量的資料前提下,依事物內在聯系和發展規律,進行科學的判斷,推理。17(四四)定量市場信息資料的簡明加工法定量市場信息資料的簡明加工法定量市場信息資料是指那些反映事物的量的數量化的信息資料。通過簡明加工,使大量的數據資料更加有序、更加鮮明、更加容易被人理解和接受。1、對比法:、對比法:把某些定量資料同其他相關資料進行對比(縱比,橫比,各部與全部比,先進與落后比,同行業之比,等等)。對比可形成強
10、烈的反差,增加鮮明性,也能反映事物發展變化。182、化小法:、化小法:將某些數值很大,人們不易理解的數據,通過成比例化小為人們容易理解的數值較小的數據。比如:1987年底,居民儲蓄總余額3075億元,居民手持現金1200億元,合計4275億元。 對此數據,許多人并不十分明確,如化小為:人均達400元,則給人清晰的印象。 3替代法:替代法:把表示某一事物的數據不直接表現出來,而是用人們熟悉的數量概念或數量關系的事物來代替表示。比如,某項綠色工程的施工效益,相當于增加良田50萬畝。194、轉換法、轉換法:把人們比較生疏、不易理解的數字轉換成人們所熟悉的數字。如:解放日報88年4月13日一篇文章中寫
11、道:全國社會商品零售總額一年時4000億元,商業系統銷售是3000億元,全國10億人口,差不多每人每天手里拿著一元錢同商業部門打交道,加上銀行存款,就變成每人每天手里拿著一元錢,兜里放著一元錢,盯著商品的門。這里,既用了轉換法,又用了化小法。經原數據變成通俗,形象,便于理解記憶。5、圖表法、圖表法20三、三、 數據分析技術數據分析技術 數據分析是這對市場調查和預測過程中收集到的各種原始數據進行適當的處理,使其顯示一定的含義,進而反映不同數據之間以及新數據與原數據之間的聯系,并通過分析,得出某些結論。 數據分析主要采用的一些統計分析技術21(一一)交叉列表分析技術交叉列表分析技術1.概念 交叉列
12、表分析技術,是同時將兩個或兩個以上具有有限類目數據和確切值的變量按一定順序排列在一張表中,從中分析變量之間的相關關系,得出科學結論的技術。 變量之間的分類必須交叉對應,從而使交叉表中每一個節點的值反映不同變量的某一特征。 交叉列表分析簡便易行,其技術與結果易為一般調查人員接受。交叉列表的變量取決于客戶的要求和調研人員的分析判斷。 變量因素的確定應在資料之前。因為只有掌握足夠的數據資料,相依的交叉列表分析才能實際操作。 22例如, 國外曾對城市居民居住期限長短同對該地區百貨公司熟悉與否之間的相關聯系進行過一次研究。所有被調查居民的居住年限分為小于13年,13-30年,30年以上三檔。對百貨商店的
13、熟悉情況分為熟悉與不熟悉兩種。見下表(表4-1):熟悉情況 居住時間 合計 小于13 年1330年 30年以上 熟悉 52 53 27 132不熟悉 45 34 55 134列總計 97 87 82 266232. 交叉列表分析中變量的選擇和確定運用交叉列表分析時,變量的選擇和確定是關系到分析結果是否正確有效的關鍵性因素之一。見下例:(交叉列表運用不當,產生錯誤的結論)見下例:(交叉列表運用不當,產生錯誤的結論)國外某保險公司關于交通事故調查的最初紀錄顯示,該公司保戶中,有62%從未在開車時出過事故,如下:從未在開車時出過事故 62% 至少出過一次事故 38% 被調查總人數 14030人24對
14、上述數據進行分性別確定事故比率,以了解性別同事故的多少是否有某種聯系。如下: 男性% 女性%從未在開車時出過事故 56 68至少出過一次事故 44 32 100 100被調查總人數 7080人 6950人以上說明,男性事故比率高于女性以上說明,男性事故比率高于女性 25有人(尤其是男人)懷疑調查的正確性,覺得應把其他因素加入進去一并觀察。一個可能的解釋是:男性開車開得多,所以事故也多。于是把“駕駛里程”也作為第三變量加入進行研究。如下: 男性開車里程 女性開車里程 大于大于10000英里小于英里小于10000英里大于英里大于10000英里小于英里小于10000英里英里至少出過 一次事故 52%
15、 25% 50% 25%被調查總人數 5010 2070 1915 5035說明,事故發生率高低與駕駛里程有關系,而不是性別說明,事故發生率高低與駕駛里程有關系,而不是性別。263雙變量交叉分析列表法雙變量交叉分析列表法通常,把雙變量交叉列表中各項絕對數轉換成以百分數,能更清楚地顯示相關關系。雖然百分比可以按列或按行進行,但并非兩種計算結果都要有實際意義。如:表4-1所進行的分析就是一個實例。對表4-1,居住時間看作是自變量,對百貨公司的熟悉程度是因變量,按自變量為基準,既按列進行計算百分比。如下表:27從下表看出,居住時間長的居民對本地區購物環境反而不太熟悉。可能是因為在一個地區居住時期太長
16、反而變得不太活躍,也可能還有第三個因素起作用。因此有必要進一步調查。(下表:表4-2) 熟悉情況 居住時間 合計 小于13 年1330年 30年以上 熟悉 53. 6 % 60.9% 32.9%不熟悉 46.4% 39.1% 67.1%列總計 100% 100% 100%28如果對表4-2按行進行計算百分比,有下表(表4-3)。表4-3顯示,按行計算實際上是以因變量為基礎的計算,其結果沒有意義,因為它說明由于對百貨公司不熟悉,影響了居民在該地區住了很長時間。這違背邏輯。熟悉情況 居住時間 行合計 小于13 年1330年 30年以上 熟悉 33. 6 % 25.4% 41.0%100%不熟悉39
17、.4% 40.1% 20.5%100%294、 三變量交叉列表分析法三變量交叉列表分析法在雙變量交叉列表分析的基礎上,加入第三變量作進一步分析,分析結果可能出現四種可能:更精確地反映雙變量之間的聯系;原有雙變量之間不相關;使在雙變量條件下的不相關結論變為相關;可能顯示原有的聯系沒有改變;30以上情況可用下圖反映: 原有二變量 兩變量間有某種聯系 兩變量間無聯系 引入第三變量 引入第三變量 更精確地顯示 原二變量 無變化 原二變量間原二變量的聯系 間不相關 有某些聯系 31更精確顯示原有聯系。更精確顯示原有聯系。例如:研究時裝購買和婚姻狀況之間聯系。時裝購買分為高低兩狀況;婚姻分為已婚,未婚。對
18、1000消費者樣本調查資料,以雙變量交叉列表分析,見下表(表4-4):結論是未婚者比已婚者購買更多的時裝結論是未婚者比已婚者購買更多的時裝 時裝購買狀況 婚姻狀況 已婚 未婚 高31%52%低69%48%列總計100%100%被調查數70030032當將購買者性別作為第三變量引入后,得到三變量交叉列表分析結果,原結論得到原結論得到更準確的反映。更準確的反映。見下表(表4-5) 時裝購買情況 性別 男 女未婚已婚未婚已婚 高 35% 40% 25% 60% 低 65% 60% 75% 40% 列總計 100% 100% 100% 100%被調查數 400 120 300 18033顯示原有聯系是
19、虛假的顯示原有聯系是虛假的例:研究價格昂貴的小說與擁有者情況。用受教育程度和擁有昂貴小說數兩個變量進行分析,見下表(表4-6)是否擁有 受教育程度 大學 低于大學 是 32% 21% 否 68% 79% 列總計 100% 100%被調查者 250 75034再把收入水平作為第三變量列入,見下表(表4-7),證明:收入水平是影響因素,證明:收入水平是影響因素,而非受教育程度,而非受教育程度,原先二變量交叉列表分析結論是虛假的是否擁有 收入水平 高 低大學低于大學大學低于大學 是 20% 20% 40% 40% 否 80% 80% 60% 60% 列總計 100% 100% 100% 100%被調
20、查數 100 700 150 5035顯示出原先被隱含的聯系。例:年齡與出國旅游的愿望的關系。見下表(表4-8)。結論:結論:年齡不是影響年齡不是影響因素。因素。 出國旅游愿望 年齡小于45歲45歲以上 有 50% 50% 無 50% 50% 列總計 100% 100% 被調查數 500 50036再把性別引入作為第三變量。見下表(表4-9)結論:年齡與出國旅游愿望相關結論:年齡與出國旅游愿望相關。 出國旅游愿望 年齡 男 女小于45歲45歲以上小于45歲45歲以上 有 60% 40% 35% 65% 無 40% 60% 65% 35%列總計 100% 100% 100% 100%被調查數 3
21、00 300 200 20037不改變原先反映出的聯系。例:調查家庭規模與外出吃快餐的聯系。見下表(表4-10)。經常外出吃快餐 家庭規模 大 小 是 65% 65% 否 35% 35% 列總計 100% 100% 被調查數 500 50038再把收入水平引入,見下表(表4-11)。結論:還是沒關系。結論:還是沒關系。 經常外出吃快餐 收入水平 高 低家庭規模大家庭規模小家庭規模大家庭規模小 是 65% 65% 65% 65% 否 35% 35% 35% 35%列總計 100% 100% 100% 100% 被調查數 250 250 250 25039(二二) 數據資料的概括技術數據資料的概括
22、技術 概括技術是一種十分常用的數據資料的分析技術。它用于對單個變量的數據資料進行概括,屬單變量分析。 單變量總體中的所有單位的資料分布有集中趨勢和離中趨勢之分,數據概括技術也包括這兩方面。1. 集中趨勢(集中趨勢(Central Tendency)的概括技術)的概括技術 次數分布的集中趨勢,指次數分布趨向集中于一個分布的中心。其表現是,次數分布中心附近的變量值的次數較多,而相距次數分布中心較遠的變量值次較少 40例:對236名消費者進行的月均生活費開支調查。見下頁表4-12:顯示:301350元附近各組的消費者人數較多,這里是次數分布的中心區域,次數集中趨向于變量值為301350元這一組。41
23、月均生活費開支(元)(變量值) 消費者數(人)次數 各組人數比重()(頻率) 100-150 11 4.67151-200 20 8.48201-250 37 15.68251-300 46 19.49301-350 52 22.2351-400 42 17.8401-450 21 8.9451-500 7 2.97 合計 236 100.042顯然,集中趨向數據的特征是,總體中各單位的次數分布既有差異性,又有趨中性。它反映了社會經濟現象的特征,即社會經濟現象總體的數量特征存在著差異性,但客觀上存在一個具有實際經濟意義的能夠反應總體各單位數量的一般水平的值。概括技術就是找出這一數值所采用的方法
24、。最常用的反映總體各單位數值的一般水平的數值有眾數,中位數和平均數眾數,中位數和平均數。43眾數眾數 眾數。眾數是總體中各單位在某一標志上出現次數最多的變量值。如:對大學生上電影院看電影的調查顯示,大多數大學生每月看電影4次,這一數字就是眾數。所以眾數的確定較容易。44中位數中位數中位數是總體中各單位按其在某一標志上數值的大小順序排列時,居于中間位置的變量值。計算方式: n+1 中位數位置中位數位置 2 式中:n為標志值的項數(n為偶數時,取數列中間兩項值的算術平均數為中位數)例如:有一列數值:0,0,0,0,1,1,1,1,1,2,2,2,3,7,9,則,中間數位置1518 , 中位數為1。
25、 245平均數平均數平均數是總體中各單位數值的和除以標志值項數得到的值。有算術平均數,加權平均數,調和平均數,幾何平均數。462、離中趨勢(、離中趨勢(Dispersion)的概括技術)的概括技術 次數分布的離中趨勢,是指次數分布呈集中趨勢的狀態下,同時也存在偏離次數分布中心的趨勢。例如:表4-12所示資料中,消費者月均消費開支在100500之間這一范圍內,盡管大多數消費者開支在250400之間,但也有少數消費者的開支偏高或偏低,而使次數分布呈離中趨勢。47 在市場調查中,對集中趨對集中趨勢進行概括,反映事實的勢進行概括,反映事實的一般水平;對離中趨勢進一般水平;對離中趨勢進行概括,則反映各單
26、位標行概括,則反映各單位標志值之間的差異程度。志值之間的差異程度。48全距和平均差全距和平均差 全距全距全距最大標志值最小標志值全距不能確切地反映標志值的真實的變異程度,它只是一個較粗略的測量離中趨勢的標志。在運用中,當經濟現象的離散程度比較穩定時,可以使用。49全距和平均差全距和平均差 平均差(平均離差平均差(平均離差A.D.)是將離差數值的總和除以離差的項數的結果。公式為:平均差平均差 (A.D) X-X n式中:X:標志值;X:平均指標;X- X :離差;n:離差項數平均差的數值意義:平均差越大,則表示用眾數中位數平均數測算的數值代表性越小;反之,代表性越大50平均差系數平均差系數 平均
27、差系數平均差系數是用平均差除以相應的平均指標得到的數值。公式為: A.D. 平均差平均差系數 X 平均指數51平均差系數平均差系數 由于平均差是各個標志值與總體平均指標的平均差額,它同時受到標志值的變異程度和總體平均指標兩個因素的共同影響。因此,當對比兩個總體的變異程度時,如果它們的平均指標水平不同,就不能簡單地將兩個平均差進行對比。此外,平均差具有與平均指標相同的計量單位,所以,計量單位不同的總體的平均差也不能直接比較52平均差系數平均差系數 平均差系數是一個相對數,從而能用以比較平均指標水平不同或經濟現象(計量單位)不同的總體的標志變異程度。53平均差系數平均差系數 例如:A,B兩組各含有
28、五個企業某月的銷售收入(萬元)資料:A組:161,163,165,167,169B組:73, 74, 75, 76, 77A組的平均差比B組大,但平均差系數比B組小。正確的結論是:A組各企業間銷售收入的差異程度較小,而且A組的平均指標的代表性較大。54平均差和平均差系數計算結果見下表(表4-13):企業 平均銷售收入(萬元)X 平均差(萬元)A.D. 平均差系數V A.D.A.D. X A組 1652.41.45B組 751.21.655標準差標準差. (X-XA)2 S.D = N 例如:A,B兩組各有8個消費者年消費支出(百元)資料:A組:26,29,33,37,41,44,49,53B組
29、:35,36,37,38,40,41,42,43見下表(表4-14):兩組平均數均為兩組平均數均為39(百(百元),且計量單位相同故可將兩組比較。結論:元),且計量單位相同故可將兩組比較。結論:A組的平均指標的代表性比組的平均指標的代表性比B組小,組小,56A組(平均數39)B組(平均數39)開支 離差 差方支出 離差 差方2613 169 354 162910 100 363 933636 372 43724 381141 2 440 1 144 525 41 244910 100 42 3 953 14 19643 4 16合計合計312 0 634312 0 6057標準差系數標準差系數是標準差與相應的平均指標對比而得到的平均數值。與平均差一樣,標準差也反映標志變異程度的絕對指標,它受標志值的差異程度和平均指標兩個因素影響。對于標志值平均水平不同,或不同現象,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 什么的淚水中考語文作文
- 電氣機械維修手冊與指南考核試卷
- 水電工程施工現場安全事故案例分析考核試卷
- 6-5 PLA和PAL電子課件教學版
- 玻璃纖維的制備工藝考核試卷
- 旅行初二語文作文
- 新材料在D打印領域的應用考核試卷
- 球類生產過程中的實時監控技術考核試卷
- 景區旅游市場開發與拓展策略考核試卷
- 生態保護工程生態保護與生態工程長期效益評估考核試卷
- 2024-2025人教PEP版(三起)(2024)小學英語三年級上冊(全冊)教學設計及反思(完整版P84)
- 2025-2030中國鍛造(鍛件)行業投資策略及規劃建議研究研究報告
- 2025年上半年四川廣元旺蒼縣引進高層次人才23人重點基礎提升(共500題)附帶答案詳解
- 骨科快速康復護理理念
- GB 5009.268-2025食品安全國家標準食品中多元素的測定
- 設備部門級安全培訓
- 智研咨詢發布:2025年中國家庭智能機器人行業市場現狀及投資前景分析報告
- 2025年心理b證筆試試題及答案
- 《冠心病病人的護理》課件
- 2024年湖南省長沙市中考歷史試卷(附答案)
- 16J916-1住宅排氣道一
評論
0/150
提交評論