




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
3.3常用的抽樣方法3.4
抽樣分布(一)(一個總體參數推斷時樣本統計量的抽樣分布)3.5抽樣分布(二)(兩個總體參數推斷時樣本統計量的抽樣分布)3.6
大數定理和中心極限定理第三章(第二部分)
抽樣與抽樣分布學習目標了解抽樣的概率抽樣方法理解抽樣分布的意義了解抽樣分布的形成過程理解中心極限定理理解抽樣分布的性質3.3
常用的抽樣方法一、簡單隨機抽樣二、分層抽樣三、系統抽樣四、整群抽樣抽樣方法一、簡單隨機抽樣
(simplerandomsampling)從總體N個單位中隨機地抽取n個單位作為樣本,使得總體中每一個元素都有相同的機會(概率)被抽中
抽取元素的具體方法有重復抽樣和不重復抽樣特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統計量對目標量進行估計比較方便局限性當N很大時,不易構造抽樣框抽出的單位很分散,給實施調查增加了困難沒有利用其他輔助信息以提高估計的效率二、分層抽樣
(stratifiedsampling)將總體單位按某種特征或某種規則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本優點保證樣本的結構與總體的結構比較相近,從而提高估計的精度組織實施調查方便既可以對總體參數進行估計,也可以對各層的目標量進行估計三、系統抽樣
(systematicsampling)將總體中的各單位按一定順序排列,在規定的范圍內隨機地抽取一個單位作為初始單位,然后按事先規定好的規則確定其他樣本單位先從數字1到k之間隨機抽取一個數字r作為初始單位,以后依次取r+k,r+2k…等單位優點:操作簡便,可提高估計的精度四、整群抽樣
(clustersampling)先將總體劃分為若干個群,然后再以群作為調查單位從中抽取部分群,然后對中選群中的所有單位全部實施調查。特點抽樣時只需群的抽樣框,可簡化工作量調查的地點相對集中,節省調查費用,方便調查的實施當群為總體的一個縮影時,抽樣估計誤差小,否則誤差較大。1.多階段抽樣(Multistagesampling):是指將抽樣過程分階段進行,每個階段使用的抽樣方法往往不同,即將各種抽樣方法結合使用,其在大型流行病學調查中常用。其實施過程為,先從總體中抽取范圍較大的單元,稱為一級抽樣單元,再從每個抽得的一級單元中抽取范圍更小的二級單元,依此類推,最后抽取其中范圍更小的單元作為調查單位。2.非概率抽樣:又稱為不等概率抽樣或非隨機抽樣,就是調查者根據自己的方便或主觀判斷抽取樣本的方法。它不是嚴格按隨機抽樣原則來抽取樣本,所以失去了大數定律的存在基礎,也就無法確定抽樣誤差,無法正確地說明樣本的統計值在多大程度上適合于總體。雖然根據其它抽樣方法介紹
樣本調查的結果也可在一定程度上說明總體的性質、特征,但不能從數量上推斷總體.非概率抽樣按抽樣特點可分為:方便抽樣、判斷抽樣、空間抽樣、滾雪球抽樣、配額抽樣等類型。3.方便抽樣:樣本限于總體中易于抽到的一部分。最常見的方便抽樣是偶遇抽樣,即研究者將在某一時間和環境中所遇到的每一總體單位均作為樣本成員。“街頭攔人法”就是一種偶遇抽樣。4.判斷抽樣又稱立意抽樣,研究人員從總體中選擇那些被判斷為最能代表總體的單位作樣本的抽樣方法。當研究者對自己的研究領域十分熟悉,對研究總體比較了解時采用這種抽樣方法,可獲代表性較高的樣本。5.空間抽樣:對非靜止的、暫時性的空間相鄰的群體的抽樣方法。例如,游行與集會沒有確定的總體,參參加者從一一地到另一一地,一些些人離去又又有一些人人進來,但但這些事件件是在一定定范圍內進進行的。對對這樣的總總體在同一一時間內抽抽樣十分重要,以便便樣本組成成不會經歷歷時間上的的太大變化化。6.滾雪球球抽樣:以以若干個具具有所需特特征的人為為最初的調調查對象,,然后依靠靠他們提供供認識的合合格的調查查對象,再再由這些人人提供第三三批調查對對象,………依次類推推,樣本如如同滾雪球球般由小變變大。滾雪雪球抽樣多多用于總體體單位的信信息不足或或觀察性研研究的情況況。7.配額抽抽樣也稱定定額抽樣,,是將總體體依某種標標準分層((群);然然后按照各各層樣本數數與該層總總體數成比比例的原則則主觀抽取取樣本。定定額抽樣與與分層概率率抽樣很接接近,最大大的不同是是分層概率率抽樣的各各層樣本是是隨機抽取取的,而定定額抽樣的的各層樣本本是非隨機機的。3.4抽樣樣分分布布((一一))(一一個個總總體體參參數數推推斷斷時時樣樣本本統統計計量量的的抽抽樣樣分分布布))一、、抽抽樣樣分分布布的的概概念念二、、樣樣本本均均值值的的抽抽樣樣分分布布三、、樣樣本本比比率率的的抽抽樣樣分分布布四、、樣樣本本方方差差的的抽抽樣樣分分布布樣本本統統計計量量的的概概率率分分布布,,是一一種種理理論論分分布布在重重復復選選取取容容量量為為n的樣樣本本時時,,由由該該統統計計量量的的所所有有可可能能取取值值形形成成的的相相對對頻頻數數分分布布。。隨機機變變量量是是樣本本統統計計量量樣本本均均值值,樣樣本本比比例例,,樣樣本本方方差差等等結果果來來自自容量量相相同同的所有有可能能樣樣本本一、、抽抽樣樣分分布布的的概概念念(samplingdistribution)抽樣樣分分布布的的形形成成過過程程(samplingdistribution)總體計算樣本統計量如:樣本均值、比例、方差樣本在重重復復選選取取容容量量為為n的樣樣本本時時,,由由樣樣本本均均值值的的所所有有可可能能取取值值形形成成的的相相對對頻頻數數分分布布一種種理理論論概概率率分分布布推斷斷總總體體均均值值的理理論論基基礎礎二、、樣樣本本均均值值的的抽抽樣樣分分布布1、、樣樣本本均均值值的的抽抽樣樣分分布布(例例題題分分析析)【例例】】設一一個個總總體體,,含有有4個個元元素素(個個體體),即即總總體體單單位位數數N=4。。4個個個體體分分別別為為x1=1,,x2=2,,x3=3,,x4=4。總總體體的的均均值值、、方方差差及及分分布布如如下下總體分布14230.1.2.3均值值和和方方差差樣本本均均值值的的抽抽樣樣分分布布(例例題題分分析析)現從從總總體體中中抽抽取取n=2的的簡簡單單隨隨機機樣樣本本,,在在重重復復抽抽樣樣條條件件下下,,共共有有42=16個個樣樣本本。。所所有有樣樣本本的的結結果果為為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)樣本本均均值值的的抽抽樣樣分分布布(例例題題分分析析)計算算出出各各樣樣本本的的均均值值,,如如下下表表。。并并給給出出樣樣本本均均值值的的抽抽樣樣分分布布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P
(x)1.53.04.03.52.02.5樣本本均均值值的的分分布布與與總總體體分分布布的的比比較較(例例題題分分析析)=2.5σ2=1.25總體體分分布布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x2、、樣樣本本均均值值的的抽抽樣樣分分布布與與中中心心極極限限定定理理=50
=10X總體分布n=4抽樣分布xn=16當總總體體服服從從正正態態分分布布N(μ,σ2)時,來自該總總體的所有容容量為n的樣本的均值值x也服從正態分分布,x的數學期望為為μ,方差為σ2/n。即x~N(μ,σ2/n)中心極限定理理(centrallimittheorem)當樣本容量足夠大時(n
30),樣本均值的抽樣分布逐漸趨于正態分布中心極限定理理:設從均值為,方差為2的一個任意總總體中抽取容容量為n的樣本,當n充分大時,樣樣本均值的抽抽樣分布近似似服從均值為為μ、方差為σ2/n的正態分布一個任意分布的總體x中心極限定理理(centrallimittheorem)x的分布趨于正正態分布的過過程樣本均值的數數學期望樣本均值的方方差重復抽樣不重復抽樣3、樣本均值抽樣樣分布的數學學特征(數學期望與與方差)樣本均值的抽抽樣分布(數學期望與與方差)比較及結論::1.樣本均均值的均值(數學期望)等于總體體均值2.樣本均均值的方差等等于總體方差差的1/n抽樣分布與總總體分布的關關系總體分布正態分布非正態分布大樣本小樣本正態分布正態分布非正態分布4、標準誤(standarderror)樣本統計量的的抽樣分布的的標準差,稱稱為統計量的的標準誤,也也稱為標準誤誤差,也稱抽抽樣標準差。。標準誤衡量的的是統計量的的離散程度,,它測度了用用樣本統計量量估計總體參參數的精確程程度以樣本均值的的抽樣分布為為例,在重復復抽樣條件下下,樣本均值值的標準誤為為4、標準差差的英文為::standarddeviation估計的標準誤誤(standarderrorofestimation)當計算標準誤誤時涉及的總總體參數未知知時,用樣本本統計量代替替計算的標準準誤,稱為估估計的標準誤誤以樣本均值的的抽樣分布為為例,當總體標準差差未知時,可用用樣本標準差差s代替,則則在重復抽樣條條件下,樣本均值的估估計標準誤為三、樣本比率率的抽樣分布布比率是指總體體(或樣本)中具有某種種屬性的單位位與全部單位位總數之比不同性別的人人與全部人數數之比合格品(或不不合格品)與與全部產品品總數之比總體比例可表表示為樣本比例可表表示為在重復選取容容量為n的樣本時,由由樣本比例的的所有可能取取值形成的相相對頻數分布布一種理論概率率分布當樣本容量很很大時,樣本本比例的抽樣樣分布可用正正態分布近似似推斷總體比例例的理論基礎樣本比例的抽抽樣分布樣本比例的數數學期望樣本比例的方方差重復抽樣不重復抽樣樣本比例的抽抽樣分布(數學期望與與方差)四、樣本方差差的抽樣分布布在重復選取容容量為n的樣本時,由由樣本方差的的所有可能取取值形成的相相對頻數分布布對于來自正態態總體的簡單單隨機樣本,,則比值的抽樣分布服服從自由度為為(n-1)的2分布,即由阿貝(Abbe)于1863年首先給出,,后來由海爾爾墨特(Hermert)和卡·皮爾遜(K·Pearson)分別于1875年和1900年推導出來設,,則則令,,則則Y服從自由度為為1的2分布,即當總體,,從中抽抽取容量為n的樣本,則2分布(2distribution)分布的變量值值始終為正分布的形狀取取決于其自由由度n的大小,通常常為不對稱的的正偏分布,,但隨著自由由度的增大逐逐漸趨于對稱稱期望為E(2)=n,方差為D(2)=2n(n為自由度)可加性:若U和V為兩個獨立的的服從2分布的隨機變變量,U~2(n1),V~2(n2),則U+V這一隨機變量量服從自由度度為n1+n2的2分布2分布(性質和特點)c2分布(圖示)選擇容量為n的簡單隨機樣本計算樣本方差s2計算卡方值2=(n-1)s2/σ2計算出所有的2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20ms總體3.5抽樣分布(二二)(兩個總體參參數推斷時樣樣本統計量的的抽樣分布))一、兩個樣本本均值之差的的抽樣分布二、兩個樣本本比例之差的的抽樣分布三、兩個樣本本方差比的抽抽樣分布兩個總體都為為正態分布,,即,,兩個樣本均值值之差的的抽樣分分布服從正態態分布,其分分布的數學期期望為兩個總總體均值之差差方差為各自的的方差之和一、兩個樣本本均值之差的的抽樣分布兩個總體都服服從二項分布布分別從兩個總總體中抽取容容量為n1和n2的獨立樣本,,當兩個樣本本都為大樣本本時,兩個樣樣本比例之差差的抽樣分布布可用正態分分布來近似分布的數學期期望為方差為各自的的方差之和二、兩個樣本本比例之差的的抽樣分布三、兩個樣本本方差比的抽抽樣分布兩個總體都為正正態分布,即X1~N(μ1,σ12),X2~N(μ2,σ22)從兩個總體中中分別抽抽取容量量為n1和n2的獨立樣樣本兩個樣本方方差比的的抽樣分分布,服服從分子子自由度度為(n1-1),,分母自自由度為為(n2-1)的的F分布,即即由統計學學家費希希爾(R.A.Fisher)提出的,,以其姓姓氏的第第一個字字母來命命名設若U為服從自自由度為為n1的2分布,即即U~2(n1),V為服從自自由度為為n2的2分布,即即V~2(n2),且U和V相互獨立立,則稱F為服從自由度度n1和n2的F分布,記為F分布(Fdistribution)F分布(圖示)不同自由度的的F分布F(1,10)(5,10)(10,10)一、大數定律律3.6大數定律與中中心極限定理理大數定律是闡闡述大量同類類隨機現象的的平均結果的的穩定性的一一系列定理的的總稱。1.獨立同分布大大數定律設X1,X2,…是獨立同分布布的隨機變量量序列,且存存在有限的數數學期望E(Xi)=μ和方差D(Xi)=σ2(i=1,2,……),則對任意意小的正數ε,有:該定理給出了了平均值具有有穩定性的科科學描述,從從而為使用樣樣本均值去估估計總體均值值(數學期望望)提供了理理論依據。2.伯努力大數定律設m是n次獨立重復試試驗中事件A發生的次數,,p是每次試驗中中事件A發生的概率,,則對任意的的ε>0,有::它表明,當重重復試驗次數數n充分大時,,事件A發生的頻率率m/n依概率收斂斂于事件A發生的概率率闡明了頻率率具有穩定定性,提供供了用頻率率估計概率率的理論依依據。二、中心極極限定理獨立同分布布的中心極極限定理(也稱列維維一林德伯伯格定理))設X1,X2,…是獨獨立同分布布的隨機變變量序列,且存在有有限的μ和方差σ2(i=1,2,…),當當n→∞∞時,或上述定理表表明獨立同分布布的隨機變變量序列不不管服從什什么分布,,其n項總和的分分布趨近于于正態分布布。可得出如下下結論:不論總體服服從何種分分布,只要要其數學期期望和方差差存在,對對這一總體體進行重復復抽樣時,,當樣本量量n充分大,就就趨于正態態分布。該定理為均均值的抽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45507-2025智能服務預測性維護績效評價方法
- 日用品銷售合同
- 企業股權轉讓協議合同
- 堤防工程施工合同
- 擋土墻工程勞務分包合同
- 房屋買賣居間協議和合同
- 承包合同公司承包合同
- 務工付款合同協議書
- 應屆畢業生簽合同協議書
- 買賣魚合同協議
- 2025年中國工業X射線檢測設備行業市場集中度、企業競爭格局分析報告-智研咨詢發布
- 職工維權知識培訓課件
- 《制作七巧板》教學設計-2024-2025學年五年級上冊勞動浙教版
- 2024銀行春招招聘解析試題及答案
- 第15課《青春之光》課件-2024-2025學年統編版語文七年級下冊
- 獨立儲能電站項目運維管理方案
- 青島市2025年高三語文一模作文題目解析及范文:成見與主見
- (二模)晉中市2025年高三高考二模 語文試卷(含A+B卷答案詳解)
- 2020年1月浙江省普通高校招生選考科目考試政治試題及答案
- 70歲老年人三力測試能力考試題庫及答案
- 慢性心功能不全護理查房
評論
0/150
提交評論