




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、抽樣調查的類型概率抽樣:依據概率論的基本原理,按照隨機原則進行, 避免抽樣過程中的人為誤差。非概率抽樣:依據研究者的主觀意愿、判斷、是否方便等 抽取對象,誤差較大,樣本代表性無法保證。簡單隨機抽樣系統抽樣概率抽樣分層抽樣整群抽樣多階段抽樣抽樣方L|偶遇抽樣非概率抽m判斷抽樣定額抽樣滾雪球抽樣非概率抽樣方法1、偶遇抽樣/方便抽樣/自然抽樣“碰到誰就選誰”。這種抽樣方式表面上看與簡單隨機抽樣一樣。實則不然。 因為它不能保證總體中的每一個元素都有同樣的被抽取機會。那些最先碰到、最容易碰到、最方便碰到的對象具有比 其他對象大得多的機會被抽中。因此,不能用偶遇抽樣得到的樣本來推論總體。在人大東門過街天橋
2、上攔截過往人群而開展的各式調查, 以及在當代商場攔截顧客而進行的有關化妝品、服裝等各式 商品的調查,都屬于這樣的抽樣。來自這種抽樣的結果,當 然,也不能用來推論“全國”、“北京市”,哪怕是“人大附 近”的任何群體的情況。有些話題因為比較敏感、涉及隱私等原因,很多人不愿意 接受調查。但總會有一些人比較“積極”,“志愿”配合,接受調查。這種調查,也屬于方便調查,其結果也不能用于推 斷總體。這種抽樣方式常常用來作為試驗問卷的手段。2、判斷抽樣/目標抽樣/立意抽樣/主觀抽樣研究者依據自己研究的目標和主觀的分析來選擇和確定研究對象的抽樣方法。這種抽樣首先要確定抽樣標準。比如,為了體現莫個群體的 先進性,
3、我們在調查時刻意去 收集這個群體中那些特別先進的成員進行調查。由于標準的確定帶有較大的主觀性,故,用這種方法得到 結果與研究者的經驗、對研究對象的熟悉程度等有較大關 系。所得結果不能用于推論總體。我們過去十分熟悉的“典型調查”,實際上屬于這種主觀調查。這種抽樣方式 可以用來作為試驗問卷的手段 ;還常用來對總體中的次級集合進行比較研究:比如,要對“左派”和“右派”進行對比分析,可以選擇一個被認為是 “左派”的群體,和一個被認為是“右派”的群體,對該兩群體的成員進行抽樣調查。這種調查的結果并不能對“左派” 或“右派”進行完整的描述,但通過它們還是可以大致了解 二者間的一般差別。作為研究“異常案例”
4、的手段 :比如,為了對學生中“孤 獨”者進行研究,可以在學生集會上選取那些“躲在角落” 的學生或者那些根本不參加學生活動的學生進行調查。3、定額抽樣/配額抽樣根據總體中具有不同特征的成員的比例來確定樣本在相應特征方面的分布。配額抽樣假定:(1)只要類型劃分較細,那么,同一類型中的每一個個體都是同質的,因而無須采用隨機抽樣。(2)只要類型劃分合理,且分配給各類的名額符合總體中各類人 員的分布,那么,樣本就可以準確地反映總體。上述假設在理論上是成立的。但是,在實施過程中卻難以 做到。(1)難以獲得有關總體的眾多屬性分布材料;或者, 即使能夠獲得相應的材料,在選擇樣本時也無法一一顧及總體的所有屬性,
5、而只能照顧到總體的莫些主要屬性。(2)有關總體分布變化的最新信息常常難以獲得,因而配額分配的 合理性就難以保證,這可能成為影響調查結果的致命因素, 例如,1948年美國總統選舉預測。選舉之前,蓋洛普等民意 測驗機構預測杜威會戰勝杜魯門成為總統,但他們失敗了。原因之一是:他們使用了配額抽樣的調查方法,所使用的選 民配額比例是1940年人口普查所提供的選民結構數據。但 是,二戰促使大量美國人從農村涌入城市,從1940年到1948年,美國人口的城鄉結構發生了巨大變化。從分城鄉人口的 政治傾向來看,農村人口更支持共和黨,城市人口更支持民 主黨。這樣,當調查者在使用過時的人口城鄉結構資料進行 配額調查時
6、,就可能錯誤地預測選舉結果。4、滾雪球抽樣先收集目標群體少數成員的資料,然后再向這些成員詢問相關信息,我由他們認識的其他總體成員。這種方法產生的樣本代表性受到懷疑,因而它常常用于探索性研究。在特定總體的成員難以找到時,這種方法是最合 適的抽樣方法。比如,對吸毒者、同性戀者、非法移民、地 下組織成員的調查等的調查。概率抽樣: 一、常見的幾種概率抽樣方式:簡單隨機抽樣概率抽樣的最基本形式。按等概率的原則從含有 N個元素的總體中隨機抽取 n個元 素組成樣本(Nn)o常見的實施方式:1、抓閹方式步驟:獲取全體總體元素(N個)一一給每個元素編上號一一 將這些號置于一裝置中,并攪拌均勻一一從裝置中隨便抽
7、出n個元素,這些元素構成樣本。2、使用隨機數表抓閹方式在日常生活中比較常見。但是,當N很大時,要完成所有元素逐一書寫號碼、置于裝置中、攪拌均勻等工作 是十分困難的,甚至是不可能的。這時,一個更可行的方式是使用隨機數表。獲取全部總體元素(抽樣框)一一將所有元素一一按順 序編號一一用隨機數表抽選 n個元素:首先確定隨機數表 的起點;確定如何選擇隨機數的原則;按照確定的原則,在 隨機數表上逐一獲取隨機數,與抽樣框的編號比對,符合者 被選中,直到選取 n個元素為止。簡單隨機抽樣是概率抽樣的理想類型,沒有偏見,簡單易 行,并且在用樣本統計值對總體參數進行推斷時,有很健全 的規則。簡單隨機抽樣的不足:總體
8、元素的數量太大時,采用這種 方式不僅費時,工作量大,而且費用很高;更重要的是,當 總體異質性大時,使用這種方式的誤差比較大。課下實踐:我們都很希望知道自己的英文(中文)詞匯量。如何測定自己的詞匯量呢?試設計用簡單隨機抽樣方法測定自己英文詞匯量的抽樣方案。分層抽樣1、什么是分層抽樣?所謂分層抽樣,就是這樣一種抽樣方法:先將總體按照一 種或者幾種特征分為若干個子總體(類、群),每一個子總體稱為一層;然后從每一層中隨機抽取一個子群體;將這些 抽中的子群體合在一起構成總體的樣本。分層的原因:社會現象的復雜性和異質性。2、分層抽樣的優點:第一,當總體異質性較高時,分層能夠克服簡單隨機抽樣 的弱點:從不同
9、的層中抽取樣本,保證了樣本結構與總體結構的盡可能相似,從而改善了樣本對總體的代表性。第二,有些調查不僅要了解總體的情況,而且還要了解莫 些類別的情況。分層抽樣可以同時滿足這兩個方面的要求, 因為我們可以將每個層本身當成一個總體來處理。3、如何分層?常用的分層原則是:(1)以所要研究的變量或主要相關變量作為分層的標準。分層的理想變量是所要研究的變量。比如,要研究家庭購書量,最好的辦法是以年購書量為標準,將家庭分為購書 04本,59本,1014本,15-19 本,20本以上等類別,然后從這些類別中抽取家庭。但是,在實際的抽樣設計過程中,這種辦法不可行,因為 在調查結束之前,我們基本無法了解家庭的購
10、書情況,因而 也就無從進行這樣的分層。有效的替代辦法是:尋找與研究變量高度相關的變量,依 據這樣的變量來對總體進行分層。比如,研究發現,家庭成 員的受教育程度高低以及家庭中是否有在校學生這兩個變 量與一個家庭的購書兩有十分密切的關系。于是,我們可以 根據這兩個變量來對總體進行分層。(2)分層時,力爭使層內同質性高,層間的異質性高。(3)選用那些已有明顯層次區分的變量作為分層變量。比如,以往的社會研究發現, 性別、年齡、受教育程度、職 業等對很多社會屬性都有直接的影響作用。因此,這些變量常常作為分層的依據。4、分層的比例問題在不同的層中抽取多少元素,這是分層抽樣需要解決的一個重要問題。常見的辦法
11、有二:等比例分層抽樣、不等比例分層抽樣。(1)等比例分層抽樣:各層抽中的元素數量的比例關系與總體中各層的數量的比例關系相同。優點:樣本的結構與總體的結構相同,便于推斷。(2)不等比例分層有時候(比如,總體中莫層的元素數量極少時),不適合進行等比例分層,此時,特別小的層被抽中的元素數會特別 少,無助于對這種層的了解。此時,可以進行不等比例分層抽樣:人為地加大規模較小 的層的元素被抽中的機會。這樣得到的樣本就可能使我們對 規模較小的層也有充分了解。但是,這樣得到的樣本的結構與總體的結構不一致,不能 直接進行推斷。如果要用這樣的樣本推斷總體,需要樣本進行加權處理。等距抽樣(系統抽樣 /機械抽樣)將構
12、成總體的單位進行編號排序后,計算由抽樣間距,然 后按該固定的間距抽取個體的號碼來組成樣本的抽樣方法。抽樣步驟:(1)制定抽樣框:給總體的每一個單位按順序編號。(2)計算抽樣間距K:抽樣間距K等于總體規模除以樣 本規模。(3)在抽樣框的最前面 K個單位中,采用簡單隨機抽樣 的方法抽取一個單位(設該單位的編號為A),該單位為樣本的第一個單位。(4)在抽樣框中,自A開始,每隔K個單位抽取一個單 位,A, A+K , A+2K ,A+(n-1)K。(5)上述被抽中的單位構成樣本。等距抽樣的優點:與簡單隨機抽樣相比,它更簡單易行, 特別是當總體規模及樣本規模都比較大時,這一優點更顯突 由。正因為這一優點
13、,在實際的調查研究中,等距抽樣比簡 單隨機抽樣更多地被采用。使用等距抽樣的注意事項:相對于研究的變量而言,總體 元素的排列順序應該是隨機的,而不能由現與研究變量相關 的規則分布。否則,抽樣結果有可能由現系統的偏差。由現這類偏差的典型情況是:情況1:總體元素的排序是按照研究變量的高低(大小)進行的。一旦N和n確定后,K也確定了。這日t候,起點 A可能發揮重要作用。在一個依據研究變量從大到小順序配料 的抽樣框中,起點A越靠近整個抽樣框的起點, 則抽選的樣 本的均值越大;反之,起點 A越遠離整個抽樣框的起點,則 抽選的樣本的均值越小。情況2:在抽樣框中,總體元素的排列存在與抽樣間距相同的周期性分布。
14、比如,在人民大學的 1棟教師住宅樓中,有 18層,每層 有8套住房。在每層中,1號住房面積最小,2號略大,3號 更大,8號最大。101 , 102,108201, 202,208,1801, 1802,1808。一個研究者希望研究該居民樓住戶的家庭規模、家庭結構等。他用等距抽樣的方式選擇調查的住戶。恰好他的抽樣間距 K等于每層的套房數 8。這個時候,他的抽樣就面臨比較嚴重的調整了。為什么?原來,人民大學當初在“分配”住房時,是嚴格按照職稱(職務)來進行的。總起來講,職稱(職務)高的人是年齡比較大,資格比較老的人,他們集中地住在各層的7或8號房。而年齡小、資歷淺的人則高度集中在各層的1或2號房。
15、與此同時,年齡又高度地和一個人的家庭結構、家庭規模等 相關。這樣,這個研究者不論是抽中 1號房,還是8號房,抑或 別的任何一組住房,都會由現系統的偏差。所以,在使用等距抽樣的方法時,在編制抽樣框的過程,要特別注意避免上述情況的由現。整群抽樣整群抽樣與前3種抽樣方法最大的不同在于:前3種抽樣的抽樣單位就是總體的元素;而整群抽樣的抽樣單位是由總 體元素構成的群體。抽樣步驟:先從總體中隨機抽取一些由元素構成的群體,然后由所抽中的群體的全部元素構成樣本。比如,在研究人民大學學生消費情況時,先從全校1000個班級中抽選10個班級,然后對這10個班級的全體同學進 行調查。整群抽樣的優點:由于在整個抽樣過程
16、中,組織者接觸和 處理的對象由總體元素變為群體,這樣就使得資料收集工作 的難度大大降低,從而降低了工作的復雜程度,節省調查費 用。也因為如此,在實際的社會調查研究中,整群抽樣方法應 用非常普遍。整群抽樣的不足:樣本的分布面不廣,樣本對總體的代表 性相對縮小。為了克服上述不足,解決的辦法之一是適當地擴大被調查 的群的數量。另外,在抽樣設計時,要精心研究總體的特點。當構成總 體的各個群體之間的差別不大,而群內差異較大時,適宜于 選用整群抽樣方法。(與此形成對比的是,在分層抽樣中, 我們主張,在層間差異大、層內差異小時,適合于采用分層 抽樣。)多階段抽樣:在抽選樣本時不是一次直接從總體中抽取, 而是
17、分兩個或兩個以上的階段來進行。二、概率抽樣程序1、界定總體所確定的總體必須是研究目標所要考察的那一個總體。如果總體確定存在問題,抽樣結果也將面臨問題。反例:1936年美國總統大選,文摘雜志的調查:從電話號碼簿和車牌登記簿中抽由1000萬人進行調查。收回200萬份調查表,結果為:候選人蘭登得票57%,候選人羅斯福得票43% o =蘭登將獲勝。實際大選結果為:羅斯福得票61%文摘雜志為什么失敗?原因之一:他們所界定的總體有問題!有電話或汽車的人 不等于全部選民。而且,1936年正是美國大蕭條的后期,有 電話或汽車的人與全體選民之間的差距可能更大。他們確定 的這個總體排斥了窮人,而正是窮人在后來的選
18、舉中選擇了 羅斯福(窮人們支持羅斯福的新經濟政策!)。2、確定抽樣框確定抽樣框很重要。但在實際調查中又非常困難。對抽樣框的基本質量要求是:抽樣單位與抽樣框清單號碼 要對應:第一,一個抽樣單位不能對應兩個及以上號碼;第二,一個號碼不能對應兩個及以上抽樣單位;第三,抽樣框不能有遺漏(有些抽樣單位未被包括到抽樣 框中);第四,抽樣框中不能有空缺(清單號碼不能有空號)。3、決定抽樣方案依據研究目的、現實條件等確定選擇何種抽樣方法。4、抽取樣本需要注意的問題是:按照既定方案抽取的樣本,在調查中不能任意更改。2000年普查中“長表”部分由現的一個問題就是極少數普查員在普查時更改長表被調查戶,從而可能導致部
19、分長表項目失真。5、評估樣本質量樣本評估:對樣本的質量、代表性、偏差等進行檢驗和衡量。主要方法是對一些重要指標的總體參數值和樣本統計值進行比較。例如:2000年全國老年人生活狀況一次性調查:第一階段調查所得60歲以上老年人口的性別比為138 (58%: 42%)。這一結果表明該次調查在樣本選擇上由現了較大的偏差,必 然影響其代表性。(后來的補救辦法:一是在性別比嚴重偏 高的省重新進行調查;二是在對數據的統計分析中,總體的 相應結構做權數加以調整。)三、樣本設計的原則(1)目的性:樣本設計要緊扣調查目的而進行。(2)可測性:能夠從樣本中計算由有效的估計值。非概 率抽樣就基本不具備可測性。(3)可
20、行性:所設計的抽樣方案在實踐上是可行的。調 查組織者在設計過程中能夠預見到實際抽樣過程中可能由 現的各種問題,并對處理這些問題提由了可行的應對方法。(4)經濟性:所設計的抽樣方案要與所能支配和控制的資源相適應四、樣本規模的確定影響樣本規模的因素:(1)研究對象的變化程度,即變異程度;(2)要求和允許的誤差大小,即精度要求;(3)要求推斷的置信度。一般情況下,置信度取為95%(4)抽樣的方法。不同抽樣方法的設計效應是不一樣的。一般地講,研究的問題越復雜,差異越大時,樣本量要求 越大;要求的精度越高,可推斷性要求越高時,樣本量也越 大;同時,總體越大,樣本量也相對要大,但是,增大呈現由一 定對數特征,而不是線形關系;而抽樣方法問題 ,決定設計效 應的值,如果我們設定簡單隨機抽樣設計效應的值是1;分層抽樣由于抽樣效率高于簡單隨機抽樣,其設計效應的值小于 1,合適恰當的分層,將使層內樣本差異變小, 層內差異越小, 設計效應小于1的幅度越大。樣本規模的確定方法:略如何確定樣本量,基本方法很多,但是公式檢驗表明,當誤差和 置信區間一定時,不同的樣本量計算公式計算出來的樣本量是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年廣東理工職業學院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 2025年廣東亞視演藝職業學院高職單招職業適應性測試歷年(2019-2024年)真題考點試卷含答案解析
- 2025年平涼職業技術學院高職單招(數學)歷年真題考點含答案解析
- 2025年山西金融職業學院高職單招職業技能測試近5年常考版參考題庫含答案解析
- 胸液引流拔管后的護理
- 2025年天津商務職業學院高職單招職業適應性測試歷年(2019-2024年)真題考點試卷含答案解析
- 教育教學創新發展匯報
- T-CESA 1199-2022 人工智能 智能字符識別技術規范
- 911消防安全日課件
- 6歲中班兒童安全課件
- 消防安全知識培訓課件文庫
- 2025年合肥興泰金融控股(集團)有限公司招聘23人筆試參考題庫附帶答案詳解
- 2025年山東省淄博市張店區中考一模道德與法治試題(五四學制)(含答案)
- 湖北省部分高中聯考協作體2023-2024學年高二下學期期中考試政治試卷(原卷版)
- 安徽省合肥市2025屆高三下學期3月二模試題 地理 含解析
- 定期考核醫師述職報告范文5篇
- 2025年六年級數學下冊期中質量評估檢測題西師大版
- 困難氣道處理課件
- 2025-2030中國金屬化陶瓷基板行業市場發展趨勢與前景展望戰略研究報告
- 2025年中國民營精神病醫院行業市場前景預測及投資價值評估分析報告
- Unit4StageandScreen詞匯課件12023學年高中英語
評論
0/150
提交評論