社會調查方法第四講PPT課件_第1頁
社會調查方法第四講PPT課件_第2頁
社會調查方法第四講PPT課件_第3頁
社會調查方法第四講PPT課件_第4頁
社會調查方法第四講PPT課件_第5頁
已閱讀5頁,還剩68頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第1頁/共73頁 新聞周刊6月22日公布的民調顯示,在受訪的1010名注冊選民中,奧巴馬獲得了51的支持率,高出麥凱恩36的支持率15個百分點。 10月16日,有關美國總統大選的民意調查和民調分析機構指出,民主黨候選人巴拉克奧巴馬(Barack Obama)的支持率處于遙遙領先的地位,領先優勢多達30個百分點。第2頁/共73頁第四講抽樣原理與第四講抽樣原理與類型類型第3頁/共73頁第一節抽樣的基本問題一、抽樣及其相關的概念(一)總體與元素 總體(population): 理論上要研究要素的特定合體。 構成它的所有元素的集合。 元素(element): 構成總體的最基本單位。 社會調查中,總體由

2、社會中的某些個人組成,這些個人便是構成總體的元素。 元素的同質性與異質性 目標總體vs調查總體 調查總體:從目標總體中去掉一部分無法接觸的元素后的總體。第4頁/共73頁(二)樣本(Sample) 從總體中按一定方式抽取出的一部分元素的集合。(三)抽樣(Sampling) 從組成某個總體的所有元素的集合中,按一定的方式選擇或抽取一部分元素的過程。(四)抽樣單位(Sampling Unit) 一次直接的抽樣所使用的基本單位。 抽樣單位有時與構成總體的元素相同,有時不同。第5頁/共73頁(五)抽樣框(Sampling Frame) 抽樣框又稱做抽樣范圍,指一次直接抽樣時總體中所有抽樣單位的名單。 因

3、抽樣單位發生變化 一份合格的抽樣框中元素必須與號碼一一對應 窮盡性與互斥性第6頁/共73頁總體抽樣框樣本第7頁/共73頁(六)參數值與統計值 參數值(Parameter):又稱總體值,關于總體中某一變量的綜合描述,總體中所有元素的某種特征的綜合數量表現。 統計值(Statistic):又稱樣本值,關于樣本中某一變量的綜合描述,是樣本中所有元素的某種特征的綜合數量表現。第8頁/共73頁第9頁/共73頁二、抽樣的作用第10頁/共73頁產品的銷售量產品的銷售量第11頁/共73頁就業狀況就業狀況第12頁/共73頁電視臺的收視率電視臺的收視率第13頁/共73頁我國土地沙漠化問題非常嚴重我國土地沙漠化問題

4、非常嚴重, ,全國沙漠化土地面積已超全國沙漠化土地面積已超過過174000174000平方公里平方公里, ,并以每年并以每年34003400平方公里的速度擴張。平方公里的速度擴張。 你知道這些數據是怎么來的嗎?你知道這些數據是怎么來的嗎?通過調查獲得的。通過調查獲得的。 怎么調查?怎么調查?是對考察對象進行全面調查還是抽樣調查?是對考察對象進行全面調查還是抽樣調查?第14頁/共73頁媽媽媽媽:“兒子,幫媽媽買盒火柴去。兒子,幫媽媽買盒火柴去。”媽媽媽媽:“這次注意點,上次你買的火柴好多劃不著。這次注意點,上次你買的火柴好多劃不著。” 兒子高興地跑回來。兒子高興地跑回來。孩子:孩子:“媽媽,這次

5、的火柴全劃得著,我媽媽,這次的火柴全劃得著,我每根每根都試過了。都試過了。” 這個調查具有破壞性,不可能這個調查具有破壞性,不可能每根每根試過試過,不能展開全面不能展開全面調查。調查。第15頁/共73頁通過對樣本統計值的描述來準確的勾畫出總體的面貌l抽樣的優點低成本,較不費時w 比起研究整個總體而言,更便宜、方便低誤差w 較好的結果避免元素的滅絕w 例如:火柴第16頁/共73頁第二節抽樣的類型與抽樣程序一、抽樣類型抽樣方法概率抽樣簡單隨機抽樣系統抽樣分層抽樣整群抽樣多段抽樣非概率抽樣偶遇抽樣判斷抽樣定額抽樣雪球抽樣第17頁/共73頁 概率抽樣(probability sampling):總體中

6、每一個個體都有一個已知不為零的被選機會進入樣本。(基于概率) 非概率抽樣(nonprobability sampling):不按照概率均等原則,而是根據人們的主觀經驗或其他條件來抽取樣本 。(基于研究主觀條件)第18頁/共73頁二、抽樣的一般程序1.界定總體:對從中抽取樣本的總體范圍與界限作明確的界定。2.制定抽樣框:依據已經明確界定的總體范圍,收集總體中所有全部抽樣單位的名單3.決定抽樣方案:依據研究的目的和要求,具體決定采用哪種抽樣方法。4.實際抽取樣本 :5.評估樣本質量:對樣本的代表性、偏差等進行初步的檢驗和衡量。第19頁/共73頁三、抽樣設計的原則 目的性原則:為調查服務 可行性原則

7、:是否切實可行,易于執行 高效性原則:在調查結果的精確性和調查所需的費用之間尋求平衡,在規定的費用之內達到盡可能高的精確度。第20頁/共73頁第三節抽樣原理要精確地描述大型總體時,需要進行概率抽樣。一、概率抽樣原理(一)代表性與選擇概率 代表性(representativeness):樣本具有跟所從中挑選出來的總體相同的特征。 通過對樣本的分析所得出來的描述和解釋也同樣適用于總體。 代表性給概化和推論統計提供了可能性。 在概率抽樣下,代表性會更好。 如果總體中的每一個元素被抽取為樣本的概率相同,那么從這個總體中抽取的樣本,就具有對該總體的代表性。第21頁/共73頁 概率抽樣的優點: 可避免偏見

8、 能夠估計樣本的精確度及代表性第22頁/共73頁(二)抽樣分布抽樣分布:根據概率的原則而成立的理性分布,顯示出從一個總體中不斷抽取樣本時,各種可能可能出現的樣本統計值的分布情況。以平均數抽樣分布為例:第23頁/共73頁總體分布總體分布:擲一次骰子出現的點數擲一次骰子出現的點數樣本均值第24頁/共73頁抽樣分布抽樣分布:擲兩次擲兩次骰子的平均骰子的平均值的值的分布(樣本擴大到分布(樣本擴大到2 2)第25頁/共73頁抽樣分布抽樣分布:擲兩擲兩次骰子的平均次骰子的平均0.000.050.100.150.200.250.300 0.51 1.52 2.53 3.54 4.55 5.56 6.5745

9、8. 1,5 . 3)(2XXEx)(xf樣本均值第26頁/共73頁第27頁/共73頁中心極限定理:在一個含有N個元素,且平均數為,標準差為的總體中,抽取所有可能n個元素的樣本,若用X1,X2 Xm分別表示這m個樣本的平均數,那么樣本平均數Xi的分布將是一個隨n增大而越來越趨于具有平均數和標準差 的正態分布。當n足夠大時(通常假定大于30),無論總體的分布如何,其樣本平均數所構成的分布都趨于正態分布。第28頁/共73頁總體總體分布分布骰子骰子第29頁/共73頁第30頁/共73頁 平均數的抽樣分布是正態分布,因此樣本平均數次數所占比例是可以求得的。 68.26%的樣本平均數落在SE之間 SE為標

10、準誤 90%的樣本平均數落在1.65SE之間 95%的樣本平均數落在1.96SE之間 98%的樣本平均數落在2.33SE之間 99%的樣本平均數落在2.58SE之間 根據樣本平均數對總體平均數進行推論第31頁/共73頁 置信度(Confidence Level) 置信水平,指總體參數值落在樣本統計值某一區間內的概率。反映的是抽樣的可靠性程度。 置信度為95%,指總體參數值落在樣本統計值的某一區間的概率。 置信區間(Confidence Interval) 指在一定的置信度下,樣本統計值與總體參數值之間的相近程度,根據樣本統計值,推算出總體參數可能存在的區間。反映抽樣的精確性程度。 = X +K

11、SE 第32頁/共73頁l 置信度與置信區間相互關系置信度低而置信區間精確置信度高而置信區間寬泛第33頁/共73頁二、樣本規模與抽樣誤差(一)樣本規模及其計算 樣本規模(Sample Size)樣本容量,指樣本中所含元素的多少。 統計學中,30以上為大樣本,30以下為小樣本。 社會調查中,至少不能少于100個元素 與要分析的變量有關,每個層次不得少于30第34頁/共73頁 樣本規模計算公式(簡單隨機抽樣推論總體平均數): t置信度所對應的臨界值 總體的標準差 e 抽樣誤差(即標準誤)222e*tn 第35頁/共73頁22* (1)tppne222*tne簡單隨機抽樣推論平均數 (age inc

12、ome)推論比例(gender crime)224*tneGenerally第36頁/共73頁 在95%的置信度條件下所需的樣本規模第37頁/共73頁(二)影響樣本規模確定的因素 總體的規模 抽樣的精確性要求 總體的異質性程度 調查者所擁有的經費、人力和時間第38頁/共73頁 總體規模 總體越大時,要保證一定的精確度,樣本也要增大。 樣本規模的增加與總體規模不保持同等的增長速度。 在有關因素一定時,樣本規模速度大大低于總體規模的增加第39頁/共73頁 抽樣的精確性要求 在其它條件一定的情況下,置信度要求越高,所要的樣本規模越大 在其他條件一定的情況下,置信區間越小(精確性越高),則要求的樣本規

13、模越大第40頁/共73頁 總體的異質性程度 在同質程度高的總體中抽樣時,的樣本規模小一些 在異質程度高的總體中抽樣時,樣本規模要大一些 異質的分布情況,對于AB兩個選項,選擇AB選項的樣本各為50%,與分別為70%與30%時,所需要樣本量不同,前者需樣本量更大。第41頁/共73頁 調查者所擁有的經費、人力和時間 從實際出發,要求樣本量越小越好 從樣本的代表必、抽樣精確性考慮,要求樣本量越大越好 要在兩者之間進行權衡,達到最高效第42頁/共73頁(三)樣本規模與抽樣誤差 (無意識)抽樣誤差(Sampling Error,即標準誤):隨機誤差,用樣本統計值去估計總體參數值時所出現的誤差,是由于抽樣

14、本身的隨機性所引起的誤差。 無論采用何種抽樣方式,這種誤差都不可避免。 取決總體的分布方差和抽樣規模第43頁/共73頁 非抽樣誤差(度量誤差):指在整個調查過程中所產生的,在調查訪問、回答、記錄、填寫、匯總、錄入等工作中所出現的各種誤差。 隨著樣本的增大而增大抽樣誤差非抽樣誤差調查總誤差第44頁/共73頁第四節 抽樣方法抽樣方法概率抽樣簡單隨機抽樣系統抽樣分層抽樣整群抽樣多段抽樣非概率抽樣偶遇抽樣判斷抽樣定額抽樣雪球抽樣第45頁/共73頁一、 非概率抽樣方法抽樣方法概率抽樣簡單隨機抽樣系統抽樣分層抽樣整群抽樣多段抽樣非概率抽樣偶遇抽樣判斷抽樣定額抽樣雪球抽樣第46頁/共73頁一、偶遇抽樣(Ac

15、cidental or Convenience Sampling) 方便抽樣、自然抽樣 指研究者根據現實情況,以自己方便的形式抽取偶然遇到的人作為調查對象 僅僅選擇那些離得最近的、最容易找到的人作為調查對象 街頭攔訪等第47頁/共73頁 無法保證總體中每一個成員都具有同等被抽中的概率 推論總體時存在危險 思考: 調查人大學生使用圖書館的習慣,在圖書館進行攔訪,該抽樣方式可能對結果產生什么影響? 對老年人主觀幸福感進行調查,請居委會主任幫助聯系,可能存在什么問題?第48頁/共73頁二、判斷抽樣(Judgemental of Purposive Sampling) 立意抽樣、目的抽樣 根據研究目的

16、和自己的主觀分析來選擇和確定調查對象。 典型調查 如無家可歸者、街頭行乞人員、染發者第49頁/共73頁 可發揮研究人員主觀能動作用 對研究人員要求較高 對研究的總體情況比較熟悉 分析判斷能力較強 研究方法與技術十分熟練 研究經驗比較豐富 仍然無法做總體推論,但可以進行類別比較第50頁/共73頁三、定額抽樣(Quota Sampling) 配額抽樣 盡可能地依據有可能影響研究變量的各種因素對總體分層,并找出具有各種不同特征的成員在總體中所占的比例 依據這種劃分以及種類成員的比例去選擇調查對象,使樣本中的成員在上述各種因素、特征的構成和在樣本中的比例盡量接近總體情形。第51頁/共73頁 總體:20

17、00人,男生60%,女生40%,文科理科各50%,一至四年級各占40%、30%、20和10% 定額抽取規模為100的樣本 第52頁/共73頁 目的在于抽選出一個總體的“模擬物” 通過主觀分析來確定和選擇組成這種模擬特的成員 事先規定的條件,有目的地尋找 含有“方便”的成分,調查者無意中根據自己的需要進行選擇第53頁/共73頁四、雪球抽樣(Snowball Sampling) 從總體中的少數成員入手,對他們進行調查,向他們詢問還知道哪些符合條件的人,再去找那些人并再詢問他們知道的人。 經常用于實地研究 每個被訪問的人都可能被要求介紹其他的人來參與調查 如同性戀調查、“小姐”生活狀態調查第54頁/

18、共73頁 容易找到相同性質的群體成員 容易接近飽和狀況 偏誤大,代表性受到質疑第55頁/共73頁 小結: 在某些場合,非概率抽樣是一種有用和便于進行抽樣的方法。 在代表總體的準確性和精確度上存在危險 不能直接進行推廣 需要進行概率抽樣第56頁/共73頁二、概率抽樣方法抽樣方法概率抽樣簡單隨機抽樣系統抽樣分層抽樣整群抽樣多段抽樣非概率抽樣偶遇抽樣判斷抽樣定額抽樣雪球抽樣第57頁/共73頁概率抽樣:按照概率原理進行,要求樣本的抽取具有隨機性。總體中每一個成員都具有同等的被抽中的可能性。第58頁/共73頁 簡單隨機抽樣(Simple random sampling) 給抽樣框內每一個抽樣單位進行編號

19、 準備號碼庫 隨機抽取所需要數量的號碼 借用隨機數表 比較麻煩,費時第59頁/共73頁 隨機數表構成: 隨機組成的5位數 以隨機順序排列N行N列 隨機數表的使用 對總體中的所有元素編碼 確定隨機數需要幾位數字(由總體規模決定,所抽取的隨機數要求有可能涵蓋所有元素,如總體為2000,共要4位數字) 隨機選定一個五位數為起點 隨意確定選擇順序:上、下、左、右、對角 在所選 出的五位數中確定其中N位作為抽中元素號碼第60頁/共73頁第61頁/共73頁 系統抽樣(Systematic sampling) 系統化地選擇完整名單中每第K個元素組成樣本。 對抽樣框內每一個抽樣單位進行編號 確定抽樣間距(如1

20、000個人中抽取100人,每隔10抽一人)=總體大小 /樣本大小 確定抽樣起點,在間隔單位中隨機選取一個起點 注意:元素排列不得具有周期性第62頁/共73頁 全樓80戶,抽取10戶進行調查 抽樣間隔為8 起始點為1 101,102,103108201,202,203208301,302,3033081001, 1008第63頁/共73頁 分層抽樣(stratified sampling) 對簡單隨機抽樣和系統抽樣的一種修正 減少抽樣誤差的因素: 大樣本比小樣本抽樣誤差小 同質總體比異質總體抽樣誤差小 把異質總體根據一定原則分為若干相對同質的次級總體 在次級總體中進行簡單隨機抽樣或系統抽樣 分層

21、變量:性別、專業、年齡、地區第64頁/共73頁 分層抽樣需要注意的問題一、分層標準: 以所要分析和研究的主要變量或相關變量作為分層標準; 以保證各層內部同質性強、各層之間異質性強、突出總體內在結構的變量作為分層變量; 以那些已經有明顯層次區分的變量作為分層變量。第65頁/共73頁 分層需要注意的問題二、分層的比例問題 按比例分層:按各種類型或層次中的單位數目同總體單位數目間的比例來抽取子樣本的方法。可得到一個與總體結構完全一樣的樣本。 不按比例分層:主要用于對不同層次的子總體進行專門研究或比較,如用于推斷總體,需要進行加權處理。第66頁/共73頁 整群抽樣(cluster sampling) 以整群作為抽樣單位(一個城市、一個社區) 只要該群(叢)被選中,則該群中的所有成員都進入隨后的子樣本。 適用于群內異質性較大、群間異質性較小的情況。 多級整群抽樣:總體-次級總體-再次級總體 注意 效率高,受抽樣框影響小 產生抽樣誤差的機會增多 盡量的多抽群, 減少群內元素第67頁/共73頁 多階段抽樣(Multistage Sampling) 按抽樣元素的隸屬關系或層次關系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論