




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1第五章 抽樣第一節 抽樣的基本概念第二節 非概率抽樣第三節 概率抽樣2抽樣設計將要解決的是調查誰的問題,即如何挑選調查對象的問題。要解決包括選擇哪一部分作為調查對象,這部分應包含的個體有多少,用什么樣的方法進行選擇,以及所選出來這一部分調查對象與總體間的關系是什么等問題。3第一節 抽樣的基本概念一、為什么需要抽樣普查45抽樣調查起源于統計學,1895年,挪威統計學家凱爾在國際統計學會(International Statistical Institute, ISI)第五屆大會上提出“用代表性樣本方法來代替全面調查”的建議,這一年被認為是抽樣調查歷史的開端。6抽樣就是從一個總體中抽取部分個體或
2、元素組成樣本的過程。原因:1、節省研究經費和時間 2、提高研究者對研究過程的管理效率總體樣本7抽樣的假設:1、部分是含于整體之中;2、部分與整體具有相同的特征、規律、相互關系及變化過程;3、部分能夠為研究者提供一個有關整體狀態、態度、意見和行為更加清晰的脈絡。8抽樣的目的獲得具有代表性的樣本代表性意味著:1、樣本和總體的分布系統相同2、總體和樣本的均值相同3、總體和樣本里變量之間的關系相同9二、抽樣的基本概念(一)總體和元素1、總體總體是研究中所涉及的所有個體的集合,它可以是一群人,一批文件,一些事件或觀念。2、元素構成總體的每一個個體就是元素。例如,研究我國媒體對艾滋病的報道,那么上萬家媒體
3、就成為本研究的總體,每一家具體的媒體是構成總體的元素。10確定研究的總體和元素,要依賴研究者個人的判斷。例如調查我國新聞工作者的職業意識,“新聞工作者”都包括哪些人?11(二)樣本(sample)按照一定方法,從總體抽取出的部分個體就組成了樣本,用它來代表總體。如果對總體中所有元素進行研究,稱為普查 (census)。12如:上海地區記者生存狀態調查總體限定為上海地區報紙、廣播電視、雜志的擁有記者證的一線采編人員,主要媒體單位包括SMG、文新集團、解放日報集團、第一財經日報、新民周刊、瞭望東方等上海主流媒體集團。被調查的200名記者以報紙平媒體記者為主要組成部分,占到樣本總數的60.67%。因
4、此本次調查樣本偏向于報紙、雜志平面媒體記者。主要基于以下因素考慮:上海主流媒體中廣播電視呈現一家獨大的局面,文廣集團是上海最大的廣播電視集團,而競爭相對激烈的領域在于平面媒體。13抽樣框指的是包含總體所有元素的詳細名單、地圖或其他形式的資料。可以分為名單抽樣框、地圖抽樣框、時間抽樣框等。在抽樣框中,每個元素都有自己的對應位置或順序,通常通過編號來實現。抽樣框14第一節 抽樣的基本概念幾個概念的區別總體樣本抽樣框抽樣研究對象的總體總體中抽出的成員總體的列表名單抽出樣本的過程15假定要進行一項有關改革開放30年來全國性報紙的廣告內容方面的研究,試說明抽樣過程為了簡化問題,假定研究的主要目的是改革開
5、放30年來人民日報、中國青年報、光明日報三份全國性報紙的廣告規模、內容及形式等方面的變化;總體:1978年1月1日至2007年12月31日在上述三份報紙上刊出的全部廣告;抽樣框:北京圖書館內可以查閱到的在此30年期間上述三份報紙上的廣告;抽樣單位:報紙,可以按照等距抽樣來進行;記錄單位:每份報紙上各個版面各種類型的廣告;總體參數:各類報紙和版面上不同時期刊出的平均廣告條數、平均面積數、各種類型廣告條數所占的比重、面積所占的比重等。16(三)概率抽樣和非概率抽樣概率抽樣是根據隨機原則進行的選擇,每個個體被選擇的概率是已知的。它可以在抽樣過程中避免人為因素造成的誤差,還可以計算出由樣本推斷總體時的
6、抽樣誤差,因而其樣本能夠推斷總體;非概率抽樣并不遵循隨機原則,而是根據主觀意識在研究對象中進行的選擇,它無法確定每個個體被選中的概率是多少,無法計算抽樣誤差,所以不能從樣本推斷總體。17(四)隨機性隨機性意味著沒有任何已知的準則能夠描述事件或解釋結果。隨機不等于隨意或隨便,它是根據概率論的基本原理來確定樣本,不遵循任何已知的確定的準則。18三、抽樣的原理小樣本、大樣本為什么大樣本能夠代表總體?大數法則:總體中的每一個元素都包含著能夠體現總體規律的穩定特征和不能體現總體規律的偶然現象。對某個元素來講,對總體的結論可能不成立;但當總體規模很大的時候,偶然現象可以相互抵消,總體呈現出穩定特征。19對
7、大樣本進行統計分析所得出的并非是針對所有個體都適用的結論,而是估計一定概率機會下總體特征出現的可能性有多大,個體所體現出的無規律的偶然性被限制在“一定概率機會”這個前提之下。2034標準常態曲線21中心極限定理當樣本數量足夠大的時候(如大于30),那么,無論總體的分布如何,其樣本的平均值所構成的分布都趨于正態分布。當無窮次地按照同一原則進行抽樣時,雖然每次抽取出來的樣本所包含的個體并不相同,但是這些樣本的均值的分布呈現正態分布,而且這個正態分布的中間位置(即樣本的平均值的平均值)就是總體的平均值。22四、抽樣過程中的誤差1、隨機誤差:不可控因素造成的誤差,降低了個體被選入樣本或被分析的機會。案
8、例:文學摘要的厄運預測結果實際結果阿爾夫.倫敦55%阿爾夫.倫敦37%富蘭克林.羅斯福41%富蘭克林.羅斯福61%23文學摘要為什么會出現這樣嚴重的錯誤?原因之一是抽樣框和總體不符:抽樣框主要是根據電話號碼簿和汽車登記冊建立的。另一個原因是由于回收率低引起的誤差:總共寄出了一百多萬份問卷,但是返回的問卷不足25%。242、抽樣誤差:抽樣誤差是指在采用隨機抽樣技術,由調查結果推算全體時,預先能算出來的誤差。抽樣誤差會受到樣本規模的影響:一般而言,采用隨機抽樣時,樣本規模愈大,抽樣誤差愈小。抽樣誤差是衡量樣本代表性強弱的標準。25樣本規模是指抽樣單位數,在隨機抽樣時必須確定必要的樣本數。樣本數過多
9、,浪費人力、物力、財力和時間;樣本數過少,會影響調查結果的精確度,造成較大誤差。五、樣本規模26影響樣本規模的因素: (一)對精確性的要求置信水平(confidence level):從樣本推論總體時,我們有多大的信心確定樣本會在可容忍誤差內正確反映總體。一般有90%、95或99置信水平。社會科學研究通常把置信水平定為95。27簡單隨機抽樣中推論總體平均數的樣本規模計算公式為:推論總體成數(或百分比)的樣本規模計算公式為:28簡單隨機抽樣所需要的最小樣本量抽樣誤差()置信水平90%時的樣本規模置信水平95時的樣本規模置信水平99時的樣本規模168069604166412170224014160
10、375610671849442560010405272384666618926746229(二)研究者的精力和經費(三)總體的異質性程度總體異質性程度越高,需要的樣本量越大。(四)研究方法和研究目的(五)數據分析里所涉及的變量數目一般來說,多變量數據分析比一元二元變量分析要求更大的樣本規模。30我們能不能說“總體越大,樣本規模越大” ?31第二節 非概率抽樣優點:1.按一定的主觀標準抽選樣本,可以充分利用已知資料。2.可以縮小抽樣范圍,節約調查時間、調查人員和調查費用。不足:無法判斷其誤差,檢查調查結果的準確性。32一、偶遇抽樣(accidental or haphazard sampling
11、)或任意抽樣、方便抽樣:研究者把一定時間內一定環境里最容易接觸到的人作為樣本的方法,如街頭攔訪、商業調查、試測。但是偶遇抽樣不是隨機的, 結果偏差較大,可信程度 較低,沒有足夠代表性。33志愿者抽樣(volunteer sampling)34志愿者抽樣存在的問題:1、回收率低;2、參加研究的志愿者往往更傾向于“夸大”真實情況。35二、立意抽樣(purposive sampling)或目的抽樣、判斷抽樣:指研究者根據特定目的和主觀判斷而確定研究樣本。適用情況:1、研究對象是那些難以接觸的、特定總體中的個體2、研究對象是獨一無二的個案3、研究者清楚地知道自己的目的是試圖深入了解某些特定類型的人群3
12、6三、配額抽樣(quota sampling )根據調查目的找出與研究目的關系密切的特性作為配額指標,抽樣時保證樣本中具有某種特性的比例與總體中具有這種特性的比例一致。37配額抽樣法是在分層基礎上進行的。配額抽樣法的基本步驟: 1、選擇控制特性作為分層標準 2、分層 3、確定各層樣本額 4、配額指派38配額抽樣根據其抽樣方法可以分為:1、獨立控制配額抽樣,規定按獨立的控制特征分配并抽取樣本,即對調查對象只規定具有一定控制特征的樣本抽取數目并規定配額,而不是規定具有兩種或兩種以上控制特征的樣本抽取數目并規定配額。2、非獨立控制配額抽樣,也稱為相互控制的配額抽樣或交叉控制配額抽樣。是同時對具有兩種
13、或兩種以上控制特征的每一個樣本數目都作出具體的規定。39獨立控制配額抽樣案例 一項研究要調查400名北京市區18-42歲的白領階層對時尚的看法,配額的重要指標是城區、性別、年齡、職業。根據已知的資料得知總體中這四個指標的大致比例,則400人的樣本也應該與總體中各項指標的比例相一致:城區東城西城朝陽海淀宣武崇文合計50501001005050400性別男女400人200200年齡18-28歲29-35歲36-42歲400人100200100職業公務員企業管理公司行政事業單位大學生400人8060140804040非獨立控制配額抽樣某大學有4000名學生,其中男生占60%,女生占40%,管理類和理
14、工類學生各占50%,大一、大二、大三、大四的學生比例分別為40%、30%、20%和10%,現在要抽取500人進行調查,按非獨立控制配額抽樣,其情況如下:男女管理類理工類管理類理工類年級一 二 三 四一 二 三 四一 二 三 四一 二 三 四人數60 45 30 1560 45 30 15 40 30 20 10 40 30 20 1041四、滾雪球抽樣(snowball sampling)或網絡抽樣(network sampling ):是指先隨機選擇一些被訪者并對其實施訪問,再請他們提供另外一些屬于所研究目標總體的調查對象,根據所形成的線索選擇此后的調查對象。 這種抽樣中有些分子最后仍無法找
15、到,有些分子被提供者漏而不提,兩者都可能造成誤差。 42第三節 概率抽樣優點:1.排除了人為的干擾。2.能夠計算調查結果的可靠程度。不足:1.對所有調查樣本都給予平等看待,難以體現重點。2.抽樣范圍廣,所需時間長,參加調查的人員和費用多。3.需要具有一定專業技術的專業人員進行抽樣和資料分析。43概率抽樣的基本程序1、明確研究的目的,確定研究所要估計的主要總體參數;2、確定研究總體和抽樣單元;3、確定和構造抽樣框: 在確定調查總體和抽樣單位后,應將總體按照抽樣單位劃分為各部分,構成抽樣框;4、選擇適當的抽樣方法以及確定樣本量的大小;5、制定抽樣方案的具體實施細節。44一、簡單隨機抽樣(simpl
16、e random sampling)又稱單純隨機抽樣,是所有隨機抽樣方法中最簡單的一種方法。它按照隨機的原則從調查總體中不加任何分類、排序、分組等先行工作,直接從總體中逐個抽取若干單位組成研究樣本。451、無放回的簡單隨機抽樣2、非常簡單隨機抽樣概率抽樣是不是等概率抽樣?46抽樣框在進行隨機抽樣時,研究者首先要列出一個包含所有元素的詳細名單,每個元素都對應著一個獨一無二的、以數字表示的位置,這個名單就是抽樣框。既沒有遺漏,也沒有重復。47簡單隨機抽樣的方法1、抽簽法:當總體很小的時候,將抽樣框中的N個元素編號,把每個元素的號碼寫在簽上,將簽充分的混合,隨機不放回的抽取直至樣本規模符合要求。2、
17、隨機數表法:從隨機數表上的任意位置開始,橫向或縱向地連續選擇數字,每個數字所代表的那個元素就被選入樣本。3、計算機模擬法;4、使用統計軟件直接抽取4849二、系統抽樣(systematic sampling)又稱等距抽樣、機械抽樣,就是先將總體各元素按一定標準排序編號,再根據樣本規模確定抽樣間隔,然后隨機確定以某個元素為起點,每隔若干個元素抽取一個,直到抽取元素符合樣本規模的要求。 抽樣間距 = 總體規模 樣本規模50先按某種順序給800名觀眾編號, 然后隨機確定起點為12, K=80010=80,則樣本包括編號為 12,92,172,252,332,412,492,572,652,732的十
18、個人。例:使用系統抽樣從800名觀眾中抽取10名作為調查對象511、媒介內容分析: 構成周抽樣2、系統抽樣有可能造成抽樣誤差。如抽樣框里的800個元素按收入高低排序:12,92,172,252,332,412,492,572,652,73275,155 ,235 ,315 ,395,475,555,635,715,795因此,抽樣框里的元素要不要按照某種順序排列,要看這種順序是否影響了研究變量。3、避開抽樣框里的元素排列周期52三、分層抽樣也稱分類抽樣,方法是將總體按照某些重要的指標分成若干個互不重疊、窮盡的層次,使總體中的每一個單位都屬于且只屬于一個層次,然后在每一層內分別進行簡單隨機抽樣或
19、系統抽樣,將各層所抽取出的子樣本組成總的研究樣本。53小學或以下10%初中20% 大專以上30%高中或中專40%大專以上3000人N1高中或中專4000人N2初中2000人N3小學或以下1000人N430n140n220n310n4總體N=10000樣本n=100人某電視臺需要了解某個電視節目的受眾接受程度,以觀眾受教育程度為標志,劃為四個層次:小學及以下、初中、高中或中專、大專及以上分別取樣,合并成樣本。54分層抽樣的優點:1、降低抽樣誤差:分層抽樣可以避免樣本差異過大導致的抽樣分布不準確。2、了解不同層的情況當具備某些特征的個體在總體里所占比例比較少,而這些特征又可能會影響最終的研究結果時
20、,研究者往往采用分層抽樣。55如研究我國新聞工作者的職業意識。研究者希望能夠發現新聞工作者的地理位置和他們的報道風格、收入水平、教育程度等因素之間的關系。東部大城市的新聞工作者要多過于西部,如果進行簡單隨機抽樣,西部的入樣概率低于東部。因此首先得按照地理位置(東南西北)和每個省的國民生產總值(高中低)將全國31個省劃分為12組,然后在每一組里進行隨機抽樣,最后的樣本才能夠體現不同地理位置、不同經濟發達程度地區的新聞工作者的特征。56在實際操作中,使用分層隨機抽樣應注意以下幾點:1、分層的標志必須可以把總體分隔為相互排斥的層次,而層間不能交叉重疊;2、各層之間差異大,但層內差異小;3、各層單位數
21、目和比例必須能夠獲得;4、分層的層次數量不宜太多。57分層抽樣與配額抽樣相同點:都是事先對總體中所有單位按其屬性、特征進行分類,這些屬性、特征我們稱之為“控制特征”;不同點:分層抽樣是按隨機原則在層內抽選樣本(簡單隨機抽樣&系統抽樣),配額抽樣則是由調查人員在配額內主觀判斷選定樣本(偶遇抽樣&立意抽樣)。58當研究者的抽樣框不完整,研究對象在地理位置上過于分散,而研究經費有限時,研究者如何抽樣?59四、整群抽樣(cluster sampling)或群集抽樣,是先將總體劃分為若干個群集,然后以簡單隨機抽樣的方法選取部分群集作為調查樣本,對群集內各個單位進行調查的一種隨機抽樣方法。優點:1.可以通
22、過轉換抽樣單位擴大抽樣的應用范圍2.可節省人力、財力60總體群數R=16 樣本群數r=4 樣本容量ABCDEFGHIJKLMNOPLHPD(一)單級整群抽樣611、定義 又稱多階抽樣、多級抽樣或分段抽樣,它是按抽樣元素的隸屬關系或層次關系,把抽樣過程分為幾個階段進行。 調查對象總體龐大,分布廣泛時采用。 如:全國省市區(簡單隨機抽樣)(二)多級整群抽樣622、多級整群抽樣的步驟以大群為單位編制抽樣框抽取若干大群以小群為單位給每個大群編制抽樣框分別從每個大群中抽取小群根據需要重復3、4步驟得到基本元素,構成研究樣本63多級整群抽樣案例共有50個村270人200人180人170人160人190人1
23、10人180人210人200人170人190人210人20人20人20人20人總體N=10000樣本n=100110人20人64案例調查背景:為了解普通居民對某種新節目的接受程度,需要在一個城市中抽選1000戶居民開展調查,在每戶居民中,選擇1名家庭成員作為受訪者。總體抽樣設計:由于一個城市中居民的戶數可能多達數百萬,除了一些大型的市場研究機構和國家統計部門之外,大多數企業都不具有這樣龐大的居民戶名單。這種情況決定了抽樣設計只能采取多階段抽選的方式。根據調查要求,抽樣分為兩個階段進行,第一階段是從全市的居委會名單中抽選出50個樣本居委會,第二階段是從每個被選中的居委會中,抽選出20戶居民。65
24、1、對居委會的抽選 從統計或者民政部門,我們可以獲得一個城市的居委會名單。將居委會編上序號后,用計算機產生隨機數的方法,可以簡單地抽選出所需要的50個居委會。2、在居委會中的抽樣 在選定了居委會之后,對居民戶的抽選將使用居委會地圖來進行操作。此時,需要派出一些抽樣員,到各居委會繪制居民戶的分布圖,抽樣員需要了解居委會的實際位置、實際覆蓋范圍,并計算每一幢樓中實際的居住戶數。然后,抽樣員根據樣本量的要求,采用系統抽樣或者其他方法,抽選出每個居委會的20戶,作為最終訪問的樣本。 663、確定受訪者 訪問員根據抽樣員選定的樣本戶,進行入戶訪問。以誰為實際的被調查者,是抽樣設計中最后一個問題。 如果調查內容涉及的是受訪戶的家庭情況,則對受訪者的選擇可以根據成員在家庭生活中的地位確定,例如,可以選擇收視時間最長的人、收入最高的人、實際負責購買決策的人等等。 673、多級整群抽樣的誤差:每級抽樣都會有誤差,故誤差較大。群集之間的差異越大,則整群抽樣的誤差越大。68當對某市的新聞工作者進行調查時,研究者需要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 金華祠堂古建施工方案
- 2024年項目管理績效考核系統試題及答案
- 會計實務運用試題及答案
- 項目管理師考試內容復習試題及答案
- 銀行外部審計及其對內部控制的影響試題及答案
- 證券市場Auditor角色的試題及答案
- 深入了解注冊會計師考試與國際標準的適應性研究試題及答案
- 2024年項目管理專業人士資格認證考試的探索試題及答案
- 2024年檢測微生物變化的重要性試題及答案
- 空氣凈化器產品差異化競爭考核試卷
- 2025年高考作文備考之十大熱點主題及寫作導引
- 《管理學原理》(課件)
- 2025年重慶中考押題道德與法治試卷(一)(含答案)
- 長城汽車2025人才測評答案
- 2025屆上海市浦東新區高三二模英語試卷(含答案)
- 【MOOC】航空燃氣渦輪發動機結構設計-北京航空航天大學 中國大學慕課MOOC答案
- 職業衛生評價考試計算題匯總
- JJF 1318-2011 影像測量儀校準規范-(高清現行)
- 酸洗磷化線材項目建議書范文
- 住院病歷交接登記本
- 沉井工程施工綜合方案
評論
0/150
提交評論