簡單隨機抽樣_第1頁
簡單隨機抽樣_第2頁
簡單隨機抽樣_第3頁
簡單隨機抽樣_第4頁
簡單隨機抽樣_第5頁
已閱讀5頁,還剩74頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

Chapter2簡單隨機抽樣

〔SimpleRandomSampling〕簡單隨機抽樣的定義與抽選方法簡單估計量及其性質(zhì)比率估計量及其性質(zhì)回歸估計量及其性質(zhì)樣本量確實定原那么假設干問題的補充精選ppt1簡單隨機抽樣的定義

與抽選方法一、定義從大小為N的總體抽取樣本量為n的樣本,假設全部可能的樣本被抽中的概率都相等,那么稱這樣的抽樣為簡單隨機抽樣。根據(jù)抽樣單位是否放回可分為放回簡單隨機抽樣和不放回簡單隨機抽樣。放回簡單隨機抽樣:每個樣本抽中的概率不放回簡單隨機抽樣:每個樣本抽中的概率精選ppt二、實施方法簡單隨機樣本的抽選,首先要將總體從1到N編號,每個單位對應一個號;然后從所編的號中抽號,如果抽到某個號,那么對應的那個單位入樣,直到抽夠n個單位為止。①抽簽法②隨機數(shù)法精選ppt

①抽簽法:簡單隨機抽樣就是從盛有N張票子的盒子里隨機無放回地摸取n(<N)張票,它可以有兩種取法:1)從盒子中一次性摸取n張票2)從盒子中隨機地摸取一張票,相應的單元入樣后,票不放回盒子;從余下的N-1張票中再隨機地摸取一張票,相應的單元也入樣且票也不放回盒子;依次實施,直到第n個樣本入樣。

兩種抽取的方法是等價的。每個樣本的被抽中的概率都是精選ppt精選ppt②隨機數(shù)法當總體較大時,抽簽法實施起來比較困難,這時可以利用隨機數(shù)表、隨機數(shù)骰子、搖獎機、計算機產(chǎn)生的偽隨機數(shù)進行抽樣。(1)利用隨機數(shù)表進行抽選。隨機數(shù)表是一張由0,1,2,…,9這十個數(shù)字組成的,一般常用的是五位數(shù)的隨機數(shù)字表,10個數(shù)字在表中出現(xiàn)的順序是隨機的,每個數(shù)字都有同樣的時機被抽中。

精選ppt(2)利用隨機數(shù)骰子進行抽選。(3)利用搖獎機進行抽選。(4)利用計算機產(chǎn)生的偽隨機數(shù)進行抽選。通常產(chǎn)生的偽隨機數(shù)有循環(huán)周期。Excel、SPSS等都有隨機數(shù)發(fā)生器等精選ppt簡單隨機抽樣在抽樣理論中的地位缺點:要求每一個單元都有一個號碼,這意味著必須有一個包含所有單元的完整抽樣框,而當N很大時,這點常常是不具備的;由此得到的樣本很分散,不利于調(diào)查。例如,對全國進行人口調(diào)查,總體單元超過12億,要對全國每個人都編上號,編制一個完整的抽樣框?qū)嶋H上是不可能的。即使可能,當抽到一個人也很難找到。優(yōu)點:簡單隨機抽樣在抽樣理論中占有重要地位,它是其它抽樣方法的根底,其理論也最為成熟。其它許多方法都是建立在簡單隨機抽樣的根底上。精選ppt相關(guān)符號精選ppt有關(guān)指標與符號指

總值均值比例比率有限總體方差無限總體方差精選ppt引理引理1:從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本,那么總體中每個特定的單元入樣的概率為n/N,兩個特定單元入樣的概率為n〔n-1〕/N〔N-1〕。一個特定單元入樣的概率兩個特定單元入樣的概率精選ppt精選ppt引理2:從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本。假設令:精選ppt簡單估計量的定義簡單估計量的性質(zhì)放回簡單隨機抽樣的簡單估計設計效應影響估計量精度的因素§2.2簡單估計量及其性質(zhì)精選ppt一、簡單估計量的定義對于簡單隨機抽樣,在沒有其它信息的條件下,最簡單的估計是利用樣本均值作為總體均值的估計,即總體均值的簡單估計量為:

也就是說,樣本均值是總體均值的簡單估計量。精選ppt例2.1:一個N=6的總體中抽取n=3的樣本,設這6個單元的值分別為Y1=21,Y2=12,Y3=15,Y4=24,Y5=6,Y6=18,那么總共可能有個樣本,每個樣本所包含的單元號及其數(shù)值見表2.1總體均值:總體方差:發(fā)現(xiàn):樣本均值的均值=總體均值樣本方差的均值=總體方差這并不是偶然的,是其重要的性質(zhì)。精選ppt證明:〔方法一:對稱性證法〕證明:〔方法二:引入示性變量〕精選ppt證明:〔方法一:引入示性變量〕精選ppt證明:〔方法二:對稱性證法〕根據(jù)對稱性論證法,有精選ppt精選ppt回憶簡單隨機抽樣的定義與抽選方法簡單隨機抽樣的實施方法兩個引理簡單估計量的定義樣本均值是總體均值的無偏估計。精選pptQ1:估計量的精度與抽樣比的關(guān)系大嗎?A1:當N很大時,抽樣精度根本取決于樣本量n,而與抽樣比幾乎無關(guān)。Q2:進行人口抽樣調(diào)查,如果需要各個省的數(shù)據(jù),要到達相同的精度,大省和小省所需要的樣本量幾乎相同還是相差很大?A2:幾乎相同。雖然此時抽樣比相差很大,但如果抽樣比相同,必然會導致小省精度不夠,大省抽樣過多而浪費。精選ppt一點解釋:1-f1-f:fpc(finitepopulationcorrection)有限總體校正系數(shù)總體未入樣率從一無限總體中抽取一個樣本容量為n的隨機樣本

一般而言,當抽樣比小于5%時,fpc可以忽略不計算,這樣的話估計量的標準差就估計的稍微高一些。精選ppt簡單估計量方差的無偏估計證明:說明樣本方差是總體方差的無偏估計即可。根據(jù)對稱性論證法和方差性質(zhì)精選ppt簡單估計量的性質(zhì)小結(jié)精選ppt具體例子例:從一個容量為100的總體中抽出樣本容量為10的簡單隨機樣本,要估計總體平均水平,并給出置信度為95%的置信區(qū)間。序號i12345678910yi4520466150895%的置信區(qū)間為[5-1.96×1.3115,5+1.96×1.3115]=[2.43,7.57]精選ppt例:從一個容量為100的總體中抽出樣本容量為10的簡單隨機樣本,序號i12345678910yi45204661508續(xù)上假設問:(2)估計總體的總量以及95%的置信區(qū)間。95%的置信區(qū)間為N×[5-1.96×1.3115,5+1.96×1.3115]=100×[2.43,7.57]=[243,757](3)總體均值估計的絕對誤差和相對誤差精選ppt〔三〕放回簡單隨機抽樣的簡單估計量有放回抽樣的精度低于不放回抽樣的精度。精選ppt百分數(shù)的估計及其誤差在問卷調(diào)查中對某個問題的答復為“是〞或“否〞的情況:假設某個問題的答案只有兩個,“是〞或“否〞,那么選擇“是〞或“否〞的比例即是需要估計的總體比例多項選擇題:某個問題有5種可選答案A、B、C、D、E,每人可任意選擇一項,那么對答案A而言,每個人的選擇可以是“A〞或“非A〞,由此“選擇A的比例〞即是需要估計的總體比例。同理,選擇B、C、D及E的比例都是我們需要估計的總體比例。總體比例常用百分數(shù)來表示,有時也俗稱為成數(shù)。精選ppt

如果我們只關(guān)心總體中某些特定類型的集合占整個總體的比例,那么我們的盒子模型中的票子分為兩類:我們感興趣的全標為1,其余全標為0。于是盒子成為:100-1盒子模型精選ppt具有該種屬性的比例為:

(1)具有某種屬性單位的個數(shù)N1的估計就是對總體總值估計(2)對總體比例的估計就是對總體均值的估計精選ppt方差用比例表示總體方差樣本方差

精選ppt估計量的定義和性質(zhì)估計量的性質(zhì)精選ppt精選ppt(1)當N,n,N-n都比較大時,a〔樣本中1的個數(shù)〕近似服從正態(tài)分布,(2)當N很大,但n不是很大時,a近似服從二項分布。二項分布是個離散分布,而正態(tài)分布是個連續(xù)分布,因此可將其進行連續(xù)性修正。P經(jīng)修正后的近似置信區(qū)間為:精選ppt應用舉例例:某超市開張一段時間之后,為改進銷售效勞環(huán)境,欲調(diào)查附近幾個小區(qū)居民到該超市購物的滿意度。于是在總體中抽取了一個樣本容量為200人的樣本。調(diào)查發(fā)現(xiàn)對該超市的購物環(huán)境表示滿意和根本滿意的居民有130位,請估計對超市購物滿意的居民的比例,并在置信度為95%下,給出估計的絕對誤差,相對誤差和變異系數(shù)coefficientofvariation和置信區(qū)間。置信區(qū)間為〔0.65-0.0663,0.65+0.0663〕即〔58.37%,71.63%〕精選ppt樣本量確實定(2.5.1)確定樣本量的主要考慮因素①樣本量與精度的關(guān)系估計量的精度要求高,意味著抽樣誤差小,樣本量大。②樣本量與實際調(diào)查運作的限制調(diào)查的經(jīng)費能支持多大的樣本?允許調(diào)查持續(xù)的時間有多長?需要多少調(diào)查人員?③由于大局部限制條件難以量化,確定樣本量的計算公式時往往只在抽樣精度與調(diào)查費用兩者之間權(quán)衡。確定樣本量的原那么-最優(yōu)設計①在總費用一定的條件下使精度最高;②在滿足一定精度要求的條件下使費用最小。精選ppt其他影響樣本量的因素

問題的重要性所研究問題的目標量個數(shù)參照同類調(diào)查調(diào)查表的回收率有效樣本精選ppt樣本量與精度精度的衡量:估計量的標準誤,一定概率保證下的絕對誤差d及相對誤差r變異系數(shù)cv等精選ppt考慮精度決定樣本量通常先計算出n的近似值n0,實際n比n0小。當n0<<N,兩者之比小于0.05時,那么可取n≈n0,否那么進行修正。精選ppt(1)絕對誤差上限d決定樣本量精選ppt舉例例:一批電子元件有1600只,為估計元件的平均壽命,先根據(jù)抽樣計算出樣本平均壽命為8400小時,標準差為760小時,如果要求估計的絕對誤差限為168小時,可靠程度在95%以上,問至少應抽取多少只元件?精選ppt具體例子從一個容量為100的總體中抽出樣本容量為10的簡單隨機樣本,要估計總體平均水平,并給出置信度為95%的置信區(qū)間。序號i12345678910yi4520466150895%的置信區(qū)間為[5-1.96×1.3115,5+1.96×1.3115]=[2.43,7.57]精選ppt上例中,如果現(xiàn)在要求以95%的把握保證相對誤差不超過10%,樣本量至少是多少?注意:不要忘了修正樣本量!!精選ppt練習:欲估計一個農(nóng)村的每月平均副業(yè)收入,該村共有1000戶農(nóng)戶,月副業(yè)收入的標準差不超過300元。〔1〕現(xiàn)要求置信度為95%,估計每戶月副業(yè)收入的誤差不超過50元,應抽取多少戶作為樣本?(2)假設每戶調(diào)查費用為15元,調(diào)查管理費用為800元,該項調(diào)查預計費用是多少?(3)要估計全村1000戶一月的副業(yè)總收入,允許總量的誤差為40000,置信度為95%,應抽取多少樣本?精選ppt小結(jié):簡單抽樣的公式一覽表均值總量Y1.估計公式2.均方誤差3.均方誤差的估計量4.1-α的置信區(qū)間精選ppt5.樣本容量確定給定絕對誤差限d給定相對誤差限r(nóng)

給定方差上限V給定變異系數(shù)上限C精選ppt習題1.為調(diào)查某地區(qū)1960個村新棉收購情況,以簡單不重復抽樣方式隨機抽取49個村進行調(diào)查,求得試以95%的可靠程度估計該地區(qū)平均每村收購多少斤?2.從5620個中學中抽出一個含有300個學校的簡單隨機樣本,其中有187個學校贊成一項提案,試估計贊成該提案的比例及總的學校數(shù)。3.對某問題進行調(diào)查,在總體中抽取容量為200的簡單隨機樣本,假設贊成,反對及不表態(tài)的人數(shù)分別為132,51,17,試給出贊成、反對及不答復比例的90%的近似置信區(qū)間。

精選ppt實踐題取一本厚的英漢字典,以一頁作為一個抽樣單元,從中抽取一個數(shù)量為30頁的簡單隨機樣本〔用隨機數(shù)表〕,計算每一樣本單元的收詞數(shù),用此樣本〔1〕估計全字典的單詞收詞總數(shù),并計算此估計的方差的估計值.〔2〕假設要求相對誤差不超過10%,應抽取多大的樣本量?精選ppt回憶精選ppt(1)具有某種屬性單位的個數(shù)N1的估計就是對總體總和的估計(2)對總體比例的估計就是對總體均值的估計精選ppt通常先計算出n的近似值n0,實際n比n0小。當n0<<N,兩者之比小于0.05時,那么可取n≈n0,否進行修正。精選ppt精選ppt練習:欲估計一個農(nóng)村的每月平均副業(yè)收入,該村共有1000戶農(nóng)戶,月副業(yè)收入的標準差不超過300元。〔1〕現(xiàn)要求置信度為95%,估計每戶月副業(yè)收入的誤差不超過50元,應抽取多少戶作為樣本?(2)要估計全村1000戶一月的副業(yè)總收入,允許總量的誤差為40000,置信度為95%,應抽取多少樣本?精選ppt估計總體比例時樣本量確實定通常先計算出n的近似值n0,實際n比n0小。當n0<<N,兩者之比小于0.05時,那么可取n≈n0,否那么進行修正。精選ppt(1)實際中P值通常是通過歷史數(shù)據(jù)或試調(diào)查的數(shù)據(jù)得到。由于n0與PQ成正比〔除了P或Q很接近0或1〕PQ值的變化都比較小。當P=0.5時即PQ=0.25時PQ取到最大值。當P不太大或不太小時,可以取p0=q0=0.5作為n0的一個保守估計。精選ppt當估計P<0.5,那么選取較大的P,如假設估計P為[0.3,0.4],那么選取P為0.4當估計P>0.5,那么選取較小的P,如假設估計P為[0.6,0.8],那么選取P為0.6假設對P一無所知,那么取P=0.5,此時用保守估計當P值很小,即事件為稀有事件,需要用其他方法來估計。霍丹〔Haldane〕1945年提出一種稱為逆抽樣的方法,專門用于小比例事件〔稀有事件〕的抽樣。

精選ppt例:在人口變動情況調(diào)查中,出生率P是一個重要指標。根據(jù)以前調(diào)查數(shù)據(jù),出生率P的估計可取為18‰。問在95%,的置信度下,實際調(diào)查估計P的絕對誤差限為0.5‰和相對誤差限5%,各需要多大的樣本量?(2)r=0.05由于上述數(shù)字均比實際人口小很多,故不考慮修正。注意不要忘了修正:首先要判斷是否需要修正哦!精選ppt例:某銷售公司希望了解全部3000家客戶對公司的滿意度,決定用調(diào)查一個簡單隨機樣本。這時銷售公司希望以95%的把握保證客戶滿意度比例P在樣本比例[p-10%,p+10%]范圍內(nèi),但對總體比例P無法給出一個大致范圍。這時調(diào)查多少個客戶,才能保證滿足要求?分析:總體的容量N=3000,絕對誤差限d=0.1置信度為0.95P的大致范圍沒有給出,最保守的估計是假設P=0.5,于是 由于97/3000=0.032<0.05,所以可以忽略。精選ppt練習:從一份共有3042人的人名錄中隨機抽取200人調(diào)查,發(fā)現(xiàn)38人的地址有變動,(1)估計這份人名錄中有多少人的地址需要修正;(2)給出置信度為95%的置信區(qū)間;(3)假設要求估計的相對誤差不超過10%,還需再抽查多少人?所以還需要再抽查1065-200=865人。精選ppt假設干問題的補充一、總體參數(shù)的預先估計預調(diào)查〔小型的試點調(diào)查〕一般說來:大型調(diào)查通常要預調(diào)查,原因如下:可以了解具體實施過程中會出現(xiàn)哪些問題問卷設計是否合理得到對總體均值、總體方差或者總體比例的估計從精度考慮:預調(diào)查的樣本量m通常比較小,當樣本量m到達精度要求時,那么調(diào)查完成。假設沒有到達精度要求,必須增添樣本。精選ppt利用以前調(diào)查的結(jié)果或經(jīng)驗現(xiàn)要對某問題進行簡單隨機抽樣,要求置信度為1-a,且要求估計的相對誤差為r,請估計樣本容量。千萬不要浪費有用的信息是我們抽樣調(diào)查的宗旨!通常做法:利用公式可近似計算本次所需要的樣本量。精選ppt在多于一個調(diào)查工程的情況下的樣本容量先具體確定調(diào)查中最重要的一些工程的誤差界限,對每個重要的工程分別估計并確定樣本容量。每個確定的n都很接近,而且最大的樣本量n在預算許可的范圍內(nèi),那么就選那個最大的n.每個確定的n相差非常大,通常不選最大的n,主要是處于預算考慮,或總的精度大大高于原先標準,這種情況下,某些工程的精確度可以降低,取稍小點的n值。精選ppt設計效應看一個抽樣方案的效果究竟如何,一個比較好的方法是將它與不放回簡單隨機抽樣在相同的樣本容量之下對精度作比較.基什(Kish)在1965年提出的設計效應(designeffect,簡記為deff):設計效應:指一個特定的抽樣設計估計量的方差對相同樣本量下不放回簡單隨機抽樣的估計量的方差之比。假設deff>1,說明所考慮的抽樣設計的效率不如簡單隨機抽樣;假設deff<1,說明該抽樣設計的效率比簡單隨機抽樣高。精選pptdeff的成效1:為了比較不同抽樣方案的效率或效果。deff的成效2:確定樣本量對于復雜抽樣,樣本量比較難確定。一定的精度要求下,簡單隨機抽樣的樣本量n’容易確定假設估計了該復雜抽樣的deff,那么在同樣精度要求下,樣本量為:精選ppt練習:在超市問卷調(diào)查中進行預調(diào)查,置

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論