




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第11章抽樣設計
1開篇案例:兩種抽樣兩種命運防彈鋼板應焊在哪里?減少轟炸機的傷亡,就要往飛機上焊防彈鋼板;但不是機身全部而是某些部分。數學家沃爾德的方法十分簡單。他把統計表發給地勤技師,讓他們把順利返回的飛機上中彈彈孔的位置報上來。他自己鋪開一張大紙,畫出轟炸機的輪廓,再把那些小窟窿一個個地填上去。畫完后大家一看,飛機渾身上下都是窟窿,只有飛行員座艙和尾翼兩個地方幾乎是空白。數學家沃爾德為什么要這樣?防彈鋼板應該焊在哪里呢?2
沃爾德告訴大家,從數學家的眼光來看,這張圖明顯不符合概率分布的規律,而明顯違反規律的地方往往就是問題的關鍵。
飛行員們最終明白了數學家沃爾德這套做法的意義。飛行員座艙或者飛機尾翼中彈,轟炸機多半就會掉下來。難怪順利返航的轟炸機只有這兩處幾乎沒有中彈。所以:鋼板應該焊在哪里呢?3案例2:《文學摘要》的厄運預測結果實際結果阿爾夫·倫敦55%阿爾夫·倫敦37%富蘭克林·羅斯福41%富蘭克林·羅斯福61%自1912年開始進行民意測驗預測美國總統選舉,其民意測驗以精確性著稱,因為它成功預測了美國1912年到1932年之間的歷次總統選舉。
1936年,美國著名的《文學摘要》雜志社為了預測總統候選人羅斯福與蘭登兩人誰能當選。雜志社對240萬人進行了調查,他們以電話簿上的地址和俱樂部成員名單上的地址發出1000萬封調查信,回收200萬封。在統計史上,這是少有的樣本容量。花費了大量的人力、物力,預測蘭登將會當選,而剛起步不久的蓋洛普公司僅對5萬人進行了調查,認為羅斯福將會當選。最終的調查結果證實了蓋洛普的預測,不久,《文學摘要》雜志也倒閉了。4
抽樣框架選擇的錯誤。它借助了俱樂部的名單和電話號碼簿,從中獲得1000萬人的地址,將問卷郵寄給他們,當時美國正處于經濟蕭條時期,擁有電話和加入俱樂部的人顯然是富裕階層,而這些人大部分是共和黨的支撐者。這種抽樣方式排斥了窮人進入樣本的可能性,而當時羅斯福的新政是有利于窮人而非富人的,從而使樣本缺乏了代表性,所以得出的結論是錯誤的。
失敗原因:5上述兩個案例都涉及同一個重要問題——抽樣問題。但是處理方式不同,導致兩種完全不同的結果——一個有效地解決問題,另一個被問題所拖累,破產倒閉了。
6蓋洛普為什么能成功?其成功歸因于他們所采用的與傳統抽樣方法不同的配額抽樣法。配額抽樣以總體特征為基礎對總體進行分類,比如男性占比例,女性占比例,以及不同收入、年齡的人群又占多少比例等;然后按分類比例來選擇各類人作為被調查者,比如選一定比例的富人、黑人、都市女性等。根據這樣的比例來了解各類型民眾的意見,就使樣本具有了較高的代表性。應用這種方法,蓋洛普又成功地預測了1940和1944年的美國總統大選的結果,使其聲明鵲起,幾乎成為民意調查的代名詞。7【補充閱讀資料】現代抽樣方法的先驅—蓋洛普蓋洛普指出,當抽樣計劃中的調查對象涵蓋廣泛,涉及到不同地域、不同種族、不同經濟層次的各種人時,你只需隨機抽取而無需采訪每個人。盡管當時他的方法不能為每個人理解和認同,但是現在,這已經被廣泛使用。蓋洛普通常引出一些特例來解釋他自己在說什么或做什么。假設有7000個白豆子和3000個黑豆子十分均勻地混合在一起,裝在一個桶里。當你舀出100個時,你大約可以拿到70個白豆子和30個黑豆子,而且你失誤的機率可以用數學方法計算出來。只要桶里的豆子多于一把,那么你出錯的機率就少于3%。30年代早期,蓋洛普在全國很受歡迎。他從事美國東北部報刊的讀者調查。1932年夏天,一家新的廣告代理商電揚廣告公司,邀請他去紐約創立一個旨在評估廣告效果的調查部門,并制定一套調查方案。同年,他利用他的民意測驗法幫助他的岳母競選艾奧瓦州議員。這使他確信他的抽樣調查方法不僅在數豆子和報刊讀者調查方面有效,并有助于選舉人。只要你了解到抽樣范圍具有廣泛性,白人、黑人,男性、女性,富有、貧窮,城市、郊區,共和黨、民主黨,只要有一部分人代表他們所屬的總體,你就可以通過采訪相對少的一部分人,來預測選舉結果或反映公眾對其關心問題的態度。蓋洛普證實,通過科學抽樣,可以準確地估測出總體的指標。同時,在抽樣過程中,可以節省大量資金。88.1
抽樣調查與抽樣設計普查獲得了解某一事物比較全面、精確的數據或資料。如人口普查、工業普查、農業普查。普查原則:標準的時間點,統一調查項目,統一的步驟和方法。抽查不可能進行全面調查時。例,具有破壞性或損耗性的產品質量檢驗,燈泡使用壽命測量、新藥療效檢驗、產品的消費者測試等。不必進行全面調查時。如城鄉收支調查為節省費用。對資料進行檢查和修正時。98.1
抽樣調查與抽樣設計為什么選擇抽樣調查?抽樣調查的相對優勢①時間短、收效快。②質量高、可信程度好。③費用省、易推廣。抽樣調查的相對劣勢不支持小區域估計不支持稀少個體的特征估計抽樣誤差其它考慮10抽樣調查相關基本概念
總體(Thepopulation)
:根據一定研究目的而規定的所要調查對象的全體所組成的集合。是某些同質特征或共性的所有元素的集合。總體的數目一般用N表示。
樣本(Thesample)是總體的一部分,由總體中按一定程序抽得的部分個體。個體是指總體中的每一個考察對象。
樣本容量:樣本中個體的數量。常用n表示11
市場調研
日期10.30~11.211.1~311.1~311.2~311.2~311.3~411.3~4選舉結果主辦機構NewYorkTimes(紐約時報)Reuter(路透社)HarrisPoll(哈里斯民意測驗)ABC(美國廣播公司)NBC(國家廣播公司)USAToday(今日美國報)Gallup(蓋洛普公司)克林頓5449515251515149多爾3541393938383840佩羅特98979999其他22122222候選人得票百分比案例:美國1996年大選調查研究總體:美國全體選民調查訪問樣本:2000名選民(11月5日公布)12抽樣框將抽樣單位按一定順序排列編制的名單。在抽樣設計時,
必須有一份全部抽樣單位的資料,這份資料就是抽樣框,也叫總體的數據目錄或名單。是抽樣設計人員用來進行抽取樣本的工具,從中可以抽取到樣本。具體表現形式:人員名單、企業名錄、電話號碼、地圖和居民戶籍等。
13抽樣誤差抽樣誤差是指造成調查結果偏離真實結果的不穩定因素。包括:技術性誤差,指存在于測量過程中對結果造成影響的因素;包括:處理過程誤差,回答誤差,測量工具誤差,訪談員誤差等。系統誤差,指抽樣沒有嚴格按照隨機原則造成,樣本與總體的不一致造成的誤差。14【小思考】抽樣調查中是否一定存在抽樣誤差,能否控制?答:抽樣誤差是客觀存在和不可避免的,但誤差的大小是可以控制的。可通過選定不同的抽樣方法及樣本數目來控制誤差;另外,加強對抽樣調查的組織領導,也可提高抽樣調查的工作質量。15【小思考】欲調查洛陽市大學生的身高,本次調查中,總體、樣本、總體單位、抽樣單位、抽樣框分別是什么答:全市的大學生就是總體,總體單位是每一個大學生。由于總體比較大,又缺乏全市大學生名單這一抽樣框,因此,抽幾個大學作為樣本,這時每個大學就是抽樣單位,抽樣框是洛陽市的大學名單。16抽樣設計抽樣設計就是從一定總體抽取樣本資料以前,預先確定抽樣程序和方案,在保證所抽選的樣本對總體有充分代表性的前提下,力求取得最經濟、最有效的結果。抽樣設計的任務就是依據調查的目的,在給定的人力、物力、財力等條件下,在從所要調查的總體中抽取樣本資料以前,設計一個精度高且能夠由樣本正確推斷總體的良好的抽樣調查方案,力求取得最經濟、最有效的結果。17
8.2抽樣設計的基本程序界定調查總體選擇抽樣框確定抽樣方法決定樣本大小評估樣本正誤抽取樣本
市場調研
18程序1.界定目標總體如果不確定調查總體,就無法明確樣本是誰的部分單位,也無法說明用樣本特征所要推斷的是誰。目標總體是指由研究對象的全體單位構成的集合。簡稱總體。構成總體的每一個具體單位稱為總體單位,簡稱個體。總體按所包含的個體數目是否有限分為有限總體和無限總體。稱有限總體包含的個體數目為總體容量,記為N。例如,一家公司一年的汽車銷售量、一個地區的人口等都構成有限總體,但是一個湖泊、海洋有多少尾魚、一個森林有多少株樹等,構成無限總體。市場調查所研究的總體絕大部分是有限總體。19程序1.界定目標總體
定義目標總體的四個因素:抽樣單位:總體中個體類型,個人、家庭還是企業單位或其他什么類型;抽樣元素:個體的特征,包括人口統計特征、行為甚至心理特征等;抽樣范圍:個體的地理位置,即區域范圍;抽樣時間:調查的標準時點或時期。例如:1999年12月31日前,所有居住在中國境內,且年齡在15歲以上的個人。20調查總體的定義例如,“在過去三年里,在中國境內,所有購買過我們產品的機關、部隊、學校、企業和事業單位”例,在企業關于某商品價格的調查中,調查總體可定義為“從2013年1月15日到30日之間,洛陽市各大百貨商店中每一種競爭品牌的價格。”21調研者須區分目標總體與抽樣總體。
抽樣總體是指從總體中抽選出來的個體所組成的集合,簡稱樣本,構成樣本的個體數目稱為樣本容量,記為n。樣本容量n與總體容量N相比是個很小的數,往往是百分之幾或千分之幾,比例最大時樣本容量n一般也不超過總體容量N的1/3。在統計中,一般把抽取30個以上個體,即n≧30的樣本,叫做大樣本,而把抽取30個以下個體,即n<30的樣本,稱為小樣本。市場調查的抽樣推斷通常采用大樣本。22調研者還須區分抽樣單位與總體單位。
總體單位:例如,牙膏以支為單位。人數以個為單位抽樣單位與總體單位在形式上可能一致也可能不一致。例:抽查時以箱為單位來檢查,則抽樣單位為箱。抽樣時按街道來抽取,則街道就為抽樣單位。按大學來抽取,則大學就是抽樣單位。23
市場調研
對總體的范圍與界限做明確的規定。調查總體可從以下幾個方面進行描述:地域特征、人口統計學特征、產品或服務使用情況、認知特征等。(抽樣元素、抽樣單位、抽樣范圍、抽樣時間)界定調查總體可通過調查表的過濾性問題確定被調查者是否屬于調查總體。24
市場調研
第四節抽樣調查的基本程序依據已明確界定的總體范圍,收集總體中所有樣本單位的名單,建立供抽樣使用的抽樣框。(完整、不重復)問:為了解重慶市中學生的飲料消費情況,需要從全市500所中學中抽取10所中學,再從每所抽中的中學中抽取3個班級,最后從每個抽中的班級中抽取10名中學生。需要選擇哪些抽樣框?答:分別收集三個不同層次的抽樣框:全市500所中學的名單、每所抽中的中學里所有班級的名單、每個抽中的班級中所有學生的名單。:二、選擇抽樣框以合理的成本選擇誤差最小的抽樣框25
程序2:制定抽樣框架抽樣框架:供抽樣使用的所有調查單位的名單。抽樣單元:為了便于抽樣,通常把總體劃分為有限個互不重迭又窮盡的部分,每個部分稱為一個抽樣單元。一個抽樣框架應該包括下述部分或全部內容:識別資料:如姓名、家庭住址、身份證號碼等;聯系資料:確定個體所在位置的項目:地址/電話;分類資料:提供區分調查對象的有用信息;維護資料:像日期以及資料的變更信息等;識別和聯系資料是不可少的,而分類和維護資料有助于提高抽樣的效率。26抽樣框架的評估
抽樣框架的可能缺陷不完全涵蓋過涵蓋重復分類錯誤27
市場調研
第四節抽樣調查的基本程序依據研究目的的要求、各種抽樣方法的特點,以及其他限制因素決定采用哪種抽樣方法。三、確定抽樣方法考慮調查精確度的要求、總體性質、抽樣方法和人力、財力等客觀條件確定樣本的大小。其原則是:“代價小,代表性高。”四、決定樣本量的大小28
市場調研
第四節抽樣調查的基本程序在上述幾個步驟的基礎上,嚴格按照所選定的抽樣方法和數量,從抽樣框中抽取一個個的樣本單位,構成樣本。五、抽取樣本29
市場調研
第四節抽樣調查的基本程序對樣本的質量、代表性、偏差等進行初步的檢驗和衡量,其目的是防止由于樣本與總體偏差過大而導致失誤。
六、評估樣本正誤
其基本方法是:將可得到的總體資料(如人口普查資料),與樣本中的同類指標進行對比。通常使用兩個或兩個以上的標準。總體特征男生78%女生22%本省64%外省36%樣本特征男生76%女生24%本省67%外省33%308.3抽樣方法0實驗法
非隨機抽樣抽樣技術
隨機抽樣等距抽樣簡單隨機抽樣分層隨機抽樣整群抽樣多階段抽樣方便抽樣判斷抽樣配額抽樣滾雪球抽樣31一、隨機抽樣
依據概率論的基本原理進行抽樣,使總體中的每個樣本單位都有一個已知的、均等機會被選入樣本中,從而避免抽樣過程的人為誤差,也稱為概率抽樣。
市場調研
第二節抽樣調查方法32
市場調研
第二節抽樣調查方法(一)簡單隨機抽樣1、含義
從總體中不加任何分組、排隊,完全按照隨機原則抽取樣本單位,使每個樣本單位被抽到的概率完全相等。又稱純隨機抽樣、簡單任意抽樣。33簡單隨機抽樣
適應于調研總體中各個體之間差異較小且各個體數目較少的情況,或者調查對象不明,難以分組、分類時的情況。常用方法(1)抽簽法:a、先編號b、再把相應號碼寫在卡片上c、任意抽選,直到抽足規定樣本數適用于調查總數中個體數目少的情況。34
市場調研
第二節抽樣調查方法2、操作辦法(1)隨機數表法:先將樣本單位編號,再使用由0--9十個數字按完全隨機順序(采用數學公式或計算機隨機)排列成的表格,抽取符合總體編號的樣本單位。35
隨機數表(部分)36隨機數表(部分)108985776450969249852849136750696110490714759938
4460
0628
8142353672741351275831409388849266488331546535818969044396070170-------------------------------------------------37隨機數表依機率抽取。
假定由2000名調查對象,以隨機數表隨機抽取150名樣本,其抽樣步驟如下:(1)將2000名調查對象,由0001編至2000等2000個連續編號。(2)由隨機數表,利用抽簽方法選取號碼開始點。例如選取為第三行第一列。(3)由設定之起始點,選取號碼,選取號碼以調查對象之編號位數相同:即1475,9938,4460,0628,....,有效號碼樣本2000以下。(4)若抽樣單位與隨機數表抽樣號碼條件相同即為樣本,大于調查編號,跳過不取。(5)若逢重復號碼,亦應跳過。
(6)依上述方法,連續采用150個號碼,即為完成樣本選用。38(2)抽簽法:對各樣本單位編號,制作同等規格、不同編號的卡片,充分混勻后隨手抽取卡片,所抽取卡片的編號對應的樣本單位即組成樣本。適合于規模較小的總體。(3)搖號法:使用專門的機器對事先編號的各樣本單位進行選擇。適合于規模較大的總體。
市場調研
第二節抽樣調查方法393、簡單隨機抽樣的優缺點(1)優點直觀明了每個樣本單位被抽取的概率相同,易估計總體指標適合與其他抽樣方法結合使用(2)缺點需要所有樣本單位的完整列表、逐一編號、工作量大。忽略總體已有的信息,降低樣本的代表性,當調查總體內部差異性較大時就不如分組后再抽樣的代表性好。
市場調研
第二節抽樣調查方法404、簡單隨機抽樣的適用性總體數量較小易獲得所有樣本單位的完整列表樣本單位之間差異程度較小或難以分組總體在空間范圍內較為集中
市場調研
第二節抽樣調查方法41分析:總體單位數目為300,樣本單位數目為10。利用隨機數表進行抽樣,其程序如下:第一步:給總體各單位編號,號碼的位數要一致,都是三位,不夠位的在前加“0”,總體各單位編號是從001-300。第二步:以隨機數表中第二行,第三列的數字“0”作起點,往后取兩位數字,構成一個與總體單位具有相同位數的號碼“093”作為起始號碼。第三步:從起始號碼開始,從左到右依次抽取10個不重復的位于001-300之間的號碼,分別是:093,240,006,120,143,254,085,047,164,148。42例2:某居民區有620戶居民,擬抽取15戶調查其家庭收入情況。首先需要將居民根據其門牌號碼重新編號為1-620。然后確定從隨機數表的第二排第三列的數組開始自上而下、自左而右取樣。取得的結果是:421,281,266,435,574,520,498,578,567,345,090,149,284,206,04343二、等距抽樣1、定義
系統抽樣(Systematicsampling):又稱等距抽樣,就是先將調研總體的各個體按一定標志排列起來,然后按照固定順序和一定間隔來抽取樣本個體。2、排隊標志、抽樣間隔、抽樣起點排隊標志按與調查項目無關的標志排隊。抽樣間隔(距離)=調研總體數(N)/樣本數(n)抽樣起點確定在第一段距離中,用簡單隨機抽樣方式抽取第一個樣本。44
某地區有零售店110戶,采用等距離抽樣方法抽選11戶進行調查。第一步,將總體調查對象(110戶零售店)進行編號,即從1號至110號。第二步,確定抽樣間隔。已知調查總體N=110,樣本數n=11戶,故抽樣間隔=110/11=10(戶)。第三步,確定起抽號數。用10張卡片(即抽樣間隔)從1號至10號編號,然后從中隨機抽取1張作為起抽數號。如果抽出的是2號,2號則為起抽號數。第四步,確定被抽取單位。從起抽號開始,按照抽樣間隔選擇樣本。本例從2號起每隔10號抽選一個,直至抽足11個為止。計算方法是:22+10=122+10×2=22……2+10×10=102即所抽的單位是編號為2、12、22、32、42、52、62、72、82、92、102的11個零售店。45例如:從1500名居民中抽100名居民作為樣本進行消費者調查。采用等距抽樣,如何抽取?分析:具體的抽樣程序如下:第一步,將1500名居民隨機編上號碼,1-1500。第二步,計算抽樣距離,k=1500/100=15。第三步,確定抽樣起點可以用兩種方法:方法一,在1-~1500中用隨機數表法抽出0862作為第一個被抽中的號碼。方法二,在第一段15人(編號為1-15)中用簡單隨機抽樣方法抽出一人,假設其編號為5。第四步,進行等距抽樣可以用兩種方法:方法一,以862作為起始號碼,每隔15人抽取一個號碼,當結果大于1500時,減去1500即為抽中的號碼,則順序依次為862,877,892,…,1492,7(1492+15-1500),22,37,…,847。方法二,以5號為起點,每隔15個人抽取一人,則下一段被抽取的號碼是20,再下一段是35,依次往下,直到抽滿100名(最后一名的號碼是1490)為止。46使用等距抽樣,有一個非常重要的前提條件,就是總體中各單位的排列順序必須是隨機的(無關標志排隊),不存在任何與研究變量相關的規則分布。否則,等距抽樣的結果就會產生很大的偏差,主要會導致周期性偏差和順序偏差。思考題:從600名大學生中抽選50名大學生進行調查,用等距抽樣法如何抽取?47系統抽樣的優缺點
優點等距離抽樣,方法簡單,省卻了一個個抽樣的麻煩,適用于大規模調查。還能使樣本均勻地分散在調查總體中,不會集中于某些層次,增加了樣本的代表性。是應用最廣泛的一種抽樣方式。缺點(1)當抽選間隔和被調查對象本身的節奏性(或循環周期)重合時,會影響調查精度。(2)抽樣誤差計算較復雜。48三、分層隨機抽樣
1、定義分層抽樣:是先將調研總體的所有個體按某一重要標志進行分類(組),然后在各類(組)中采用簡單隨機抽樣方式或系統抽樣方式抽取樣本個體的一種抽樣方式。分層時:層間差異性要明顯。要知道各層中的個體數目和比例。分層數目不宜過多。492.分層抽樣的過程抽樣程序。共分以下四個階段:1)確定分層變量。即將總體分層按照一定的標準進行,常見的如年齡、性別、行政區等。2)分層。即將總體按照分層變量分成若干層,即N1,N2,N3…,分層是互相排斥(不允許同一單位既可屬于這一層,又可屬于那一層)且窮盡的(每個單位都歸屬于一定的層),N=N1+N2+N3+…3)確定各層的樣本量。即確定所需要的樣本總數n和從總體的各層單位中抽取樣本的數n1,n2,n3…,并令n=n1+n2+n3…。4)在各層內部進行抽樣。按照隨機原則,用簡單隨機抽樣方法或等距抽樣方法,從各層中抽取所需的樣本數目,各層的樣本之和構成了總體的樣本。50分層抽樣示意母群體總數樣本總人數層次二層次一層次三…層次n取樣一取樣二取樣三…取樣n513、分層隨機抽樣的方式等比例分層抽樣按各層(或各類)中的個體數目占總體數量的比例分配各層的樣本數量。此方式簡便易行、分配合理,適應于層內差異較小的情況。非等比例分層抽樣不是按各層中個體數占總體數的比例分配樣本個數。而是根據其他因素(層內均方差、抽樣工作量和費用大小等)調整各層的樣本個體數,即有的層可多抽些樣本個體,有的可少抽些樣本個體。此方式是用于各層的單位數目相差懸殊,或層內方差較大的情形。52等比例分層抽樣(1)按比例分層抽樣:按照各個層中單位數量占總體單位數量的多少等比例地分配各個層的樣本單位數量的方法。計算公式為:
nk—每層的(單位)數量
N—母體的(單位)數量
n—總樣本數
NK/N—每層占總體的比重53
市場調研
第二節抽樣調查方法子樣本n1180n2350n3300n4170子總體N118000N235000N330000N417000n=1000N=10000054
市場調研
第二節抽樣調查方法練習
某機構要調查城市居民家用電器的潛在需求,這種商品的消費量與居民家庭收入水平相關。已知某城市有100萬戶家庭,且居民的收入水平差異較大,其中高收入家庭15萬戶,中等收入家庭65萬戶,低收入家庭20萬戶。本次調查擬抽取1000個家庭作為樣本。
請問:采用分層比例抽樣法,應從各層選取多少個樣本單位?5556例如:某地共有居民2萬戶,按經濟收入高低進行分類,其中高收入居民為4000戶,中等收入居民為12000戶,低收入居民有4000戶。要從中抽出400戶進行購買力調查,采用等比例分層抽樣,如何抽取?具體的抽樣程序如下:第一步,計算各層在總體中的比例。高收入戶:4000/20000=20%中等收入戶:12000/20000=60%低收入戶:4000/20000=20%第二步,各層在總體中所占的比例與各層在樣本中所占的比例是一樣的。因此,計算樣本在各層中的具體分布數目。高收入戶:400×20%=80(戶)中等收入戶:400×60%=240(戶)低收入戶:400×20%=80(戶)第三步,在各層中采用等距抽樣方法抽取樣本單位。57思考:某電視機廠要對120萬用戶進行抽樣調查,按照用戶的企業規模,可分為大、中、小三層,其中大用戶36萬戶;中用戶60萬戶;小用戶24萬戶。若確定抽取1000戶進行調查,則各層應抽取的樣本數量為多少?(300戶,500戶,200戶)分層比例抽樣法適用于各層之間的標準差大致相近的事物,若各層之間的標準差相差很大,就不適合采用分層比例抽樣法,而應采用分層最佳抽樣法。58(2)紐曼分層抽樣:也叫最佳分層抽樣,是在各層內根據變異數大小(標準差)調整各層的樣本數量,以提高樣本的可信度。公式為:樣本標準差的差別主要憑經驗判斷確定,也可通過計算公式確定。計算公式為:59
各層中的標準差估計值,反映的是各層的每一個個體值和平均值之間的差異。如果某層中的各個體特征比較接近,差異較小,那么理論上,標準差就小。因此,少抽取一些數目的樣本,仍可以代表、反映該層的大致情況。如果某層內各個體差異較大,那么標準差就較大,因而要適當多選些樣本才合理。60某地共有居民2萬戶,按經濟收入高低進行分類,其中高收入居民為4000戶,中等收入居民為12000戶,低收入居民有4000戶。要從中抽出400戶進行購買力調查,如果各層樣本標準差高收入為300元,中收入為200元,低收入為100元,用最佳分層抽樣法,如何抽取?按照公式計算,得出各類型應抽選的樣本單位數為:高收入樣本單位數目為:400×(1200000÷4000000)=120(戶)中收入樣本單位數目為:400×(2400000÷4000000)=240(戶)低收入樣本單位數目為:400×(400000÷4000000)=40(戶)61例如:某電視機廠要對120萬用戶進行抽樣調查,按照用戶的企業規模,可分為大、中、小三層,其中大用戶36萬戶;中用戶60萬戶;小用戶24萬戶。若確定抽取1000戶進行調查,設大用戶的標準差為5%;中用戶的標準差為2%;小用戶的標準差為3%,則各層應抽取的樣本數量為:大用戶抽取樣本數:中用戶抽取樣本數≈323(戶)小用戶抽取樣本數≈193(戶)62(3)德明分層抽樣:又稱經濟抽樣或最低成本抽樣。當各層的調查費用有明顯差異時,在不影響可信度的前提下,調整各層的樣本量,使調查費用盡量減少。它兼顧了各層的差異與調查費用,計算公式為式中:Ck—各層中單位調查費用634.分層抽樣的優缺點
優點:分層抽樣實質上是把科學分組方法和抽樣原理結合起來。從精度看,分層抽樣〉系統抽樣〉簡單隨機抽樣缺點:“分層注意”64
市場調研
第二節抽樣調查方法(四)整群抽樣1、含義
整群抽樣:將總體分為S個互不重疊的相似子群,每一個子群都可代表總體,然后從這S個群中隨機抽取若干群,對選中的群內各樣本單位進行普查。人為劃分的群體(如銷售地區)自然形成的群體(如班級、行政區)65整群抽樣示意母群體總數集群二集群一集群三集群四集群五集群七集群六集群八…集群n集群一集群三…集群m母群體共分成n個集群共抽取m個集群6667
市場調研
第二節抽樣調查方法2、操作辦法確定分群的標準(如行政區劃、班級);將總體(N)分成S個互不重疊的群;根據樣本量(n)確定抽取的群數;采用簡單隨機抽樣或系統抽樣的方法,從S群中抽取確定的群數;對所抽取群的樣本單位進行普查68例如:某校有學生2000名,計劃從中抽160名進行調查。可將學生宿舍作為抽樣單位。假設該校共有學生宿舍250個,每個宿舍住8個學生。我們可以從250個宿舍中隨機抽取20個,其中男生宿舍10個,女生宿舍10個,對抽中的每個宿舍的所有學生進行調查,這20個宿舍總共160名學生就是此次抽樣調查的樣本。例:某街道由200個里弄,每一個里弄有50戶居民。如何從該街道抽取1000戶作為樣本?可以從200個里弄中隨機抽取20個里弄,將這20個里弄中的全部1000戶居民作為調查對象。69
市場調研
第二節抽樣調查方法通信公司將對某大學學生的通信消費狀況進行調查,樣本容量為800個。公司對該大學的學生情況不太了解,而且很難得到所有大學生的人員清單。但他們通過努力,獲得了該學校所有班級的名單。為此,研究人員擬采用何種抽樣方法?其步驟是?練習答:采取整群抽樣法。其步驟是:
1、對該大學的學生以班級分成若干群;
2、隨機抽取20個班級(群);
3、獲取被抽取班級的人員清單;
4、對該20個班級進行普查,獲得最終樣本。70
市場調研
第二節抽樣調查方法3、整群抽樣的優缺點(1)優點在組織實施上簡單易行節省人力、財力和時間(2)缺點樣本的代表性差,抽樣誤差大71
市場調研
第二節抽樣調查方法4、整群抽樣的適用性難以獲得完整的抽樣框時群與群之間差異小,群內個體差異大時調查時間緊、經費少樣本分布地區范圍廣、規模大的總體72五、多階段抽樣
1、定義多階段抽樣:在許多大規模、復雜的市場調查中,調查單位一般不是一次性直接抽取到的,而是采用兩階段或多階段抽取的方法,即先抽大的調查單元,在大單元中抽小單元,再在小單元中抽較小單元,這種方式稱多階段抽樣。2、特點
抽樣單位的抽選不是一步到位,而是分階段抽樣。組織方便,對于總體單位多且分散的情況更有效。但在設計抽樣方案、計算抽樣誤差和推斷總體上比較復雜。73案例:99’尼爾森全國零售調研
0山東煙臺威海榮成蓬萊
…威海棗莊濟寧蓬萊商店普查…廣東全國34個省市區山西河北濟南第一階段第二階段第三階段74隨機抽樣技術的技術特點優點1.隨機抽樣是從總體中按照隨機原則抽取一部分單位進行的調查2.隨機抽樣技術能夠計算調查結果的可靠程度不足1.對所有調查樣本都給予平等看待,難以體現重點。2.抽樣范圍比較廣,所需時間長,參加調查的人員和費用多。3.需要具有一定專業技術的專業人員進行抽樣和資料分析。一般調查人員難以勝任。758.3.3非隨機抽樣技術非隨機抽樣,是指抽樣時不遵循隨機原則,而是按照研究人員主觀判斷或僅按方便原則抽選樣本。一般在如下情況采用:受客觀條件限制,無法進行嚴格的隨機抽樣;為了快速獲得調查結果;對調查對象不確定或無法確定的情況;總體各單位間離散程度不大且調查員具有豐富經驗時采用。非隨機抽樣技術有四種:方便抽樣、判斷抽樣、配額抽樣、雪球抽樣76一、方便抽樣1、定義方便抽樣(ConvientSampling):又稱偶遇抽樣,即從調研人員工作方便出發,在調研對象范圍內隨意抽選一定數量的樣本進行調查。(適用于探索性調查,街頭攔截式面訪調查)2、兩種方法街頭攔人法:在街上或路口任意找某個行人,將他(她)作為被訪者,進行調查。空間抽樣法:對某一聚集的人群,從空間的不同方向和方位對他們進行抽樣調查。3、特點簡便易行,節約時間和費用;要求調研總體同質性高抽樣結果偏差較大,可信度較低77街頭攔截法78
市場調研
第二節抽樣調查方法3、方便抽樣的適用性探索性調查同質性強的總體時效性要求較高的調查流動性大的總體 79二、判斷抽樣1、定義判斷抽樣(JudgmentSampling):又叫目的抽樣,即憑研究人員的主觀意愿、經驗和知識,從總體中選擇具有典型代表性的樣本作為調查對象的一種抽樣方法。前提是研究人員須對總體的有關特征有相當高的了解,此法在我國市場調研中得到廣泛運用。適用于總體規模不大、樣本量小及樣本不易分門別類挑選。如某批發商要調查零售商銷售其產品的情況,批發商根據自己的經驗和判斷,選定一些具有代表性的零售商作為樣本進行調查。802、兩種具體做法第一種情況是,選擇最能代表普遍情況的調查對象,即選取“多數型”、或“平均型”的樣本作為調查對象。第二種情況是,選擇那些異乎尋常的個案,目的是調查造成異常的原因。3、特點簡便、易行、及時易發生主觀判斷產生的抽樣誤差,且無法計算可信度81
市場調研
第二節抽樣調查方法2、判斷抽樣的優缺點優點:充分發揮研究人員的主觀能動性;簡便易行;
缺點:受主觀影響大;依賴研究人員的工作經驗和判斷能力。82
市場調研
第二節抽樣調查方法3、判斷抽樣的適用性研究人員對總體情況比較熟悉研究人員從事過類似調研83三、配額抽樣1、定義配額抽樣(QuotaSampling):是非隨機抽樣中最流行的一種,配額抽樣類似隨機抽樣中的分層抽樣,它也是首先將總體中的所有單位按一定的標志分為若干類(組),然后在每個類(組)中用方便抽樣或判斷抽樣方法選取樣本單位。采用配額抽樣,首先對總體中所有單位按其屬性、特征分類,這些屬性、特性稱為“控制特征”,然后按各個控制特征分配樣本數額。2、與分層抽樣的區別84配額抽樣多特征分層主觀確定樣本誤差不可估算分層抽樣單特征分層隨機抽取樣本誤差可估算注意:配額抽樣與分層抽樣的區別853、配額抽樣的分類獨立控制配額抽樣:是根據調研總體的不同特性,對具有某個特性的調查樣本分別規定單獨分配數額,而不規定必須同時具有兩種或兩種以上特性的樣本數額。優點:簡單易行,選擇余地較大;缺點:可能圖一時方便,選擇樣本過于偏向某一組別,影響樣本代表性。交叉控制配額抽樣:是對調查對象的各個控制特性的樣本數額交叉分配。特點:調查面較廣,提高了樣本代表性。86[舉例]獨立控制配額抽樣
例如,在某項調查中,確定樣本總數為180個,可單獨選擇消費者收入、年齡、性別三個標準中的一個進行抽樣。按獨立配額抽樣,其各個標準樣本配額比例及配額數如下表所示。87[舉例]交叉控制配額抽樣
88行業比例所有制比例商店規模比例飲食業40%國營25%大型10%煙酒糖業26%集體50%中型30%百貨業34%個體25%小型60%合計100%合計100%合計100%大型中型小型合計國營集體個體國營集體個體國營集體個體飲食業X11X12X13X14X15X16X17X18X1940%煙酒糖X21X22X23X24X25X26X27X28X2926%百貨業X31X32X33X34X35X36X37X38X3934%小計100%合計10%
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 喬木遷移施工方案
- 2024版煤礦安全生產標準化管理體系-總體介紹解讀
- 《視覺系統結構與功能》課件
- 游泳救生員在水域救援的技巧及試題及答案
- 2025奶茶店商鋪門面轉讓合同
- 新員工公司級安全教育基礎培訓
- 模具專業人員的職業發展試題及答案
- 救生員職業資格考試練習題及答案
- 游泳救生員資格考試策略與技巧集錦試題及答案
- 模具設計與生產流程的配合試題及答案
- 2025廣東省能源集團西北(甘肅)有限公司招聘18人筆試參考題庫附帶答案詳解
- 面粉代理合同協議
- 2024年5月26日河南省事業單位聯考《職業能力測試》真題及答案
- 基金從業人員資格歷年真題答案2024
- 尋甸城鄉投資開發集團有限公司筆試信息
- 2025年江蘇揚州水利建筑工程有限責任公司招聘筆試參考題庫含答案解析
- 健康管理考試題庫及答案
- 【MOOC】隧道工程-中南大學 中國大學慕課MOOC答案
- 《始得西山宴游記》名師課件1
- 鐵路基礎知識考試題庫500題(單選、多選、判斷)
- 銀行保險客戶KYC基礎信息表
評論
0/150
提交評論