




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第六章抽樣調查第一節抽樣調查的意義第二節抽樣調查的基本概念第三節抽樣平均誤差第四節全及指標的推斷第五節抽樣方案設計第六節必要抽樣單位數的確定第七節假設檢驗第一節抽樣調查的意義一、抽樣調查的概念
抽樣調查是按隨機原則,從全部研究對象中抽取一部分單位進行觀察,并根據樣本的實際數據,對總體的數量特征做出具有一定可靠程度的估計和判斷其中心問題是如何根據已知的部分資料來推斷未知的總體情況。二、抽樣調查的特點1.抽樣調查是非全面調查。2.抽樣調查是用樣本的指標數值去推算總體的指標數值。3.抽樣調查是按隨機原則抽選調查單位。4.抽樣調查中產生的抽樣誤差,可以事先計算并加以控制。
第二節抽樣調查的基本概念
一、全及總體和抽樣總體二、抽樣方法1.重復抽樣分布2.不重復抽樣分布三、大數定理與中心極限定理一、全及總體和抽樣總體全及總體:即總體,所要調查觀察的全部事物。總體單位數用N表示。抽樣總體:即樣本,抽取出來調查觀察的單位。抽樣總體的單位數用n表示。
n≥30大樣本
n<30小樣本總體是唯一的、確定的,而樣本是不確定的、可變的、隨機的注全及指標和抽樣指標全及指標:反映總體數量特征的指標。其數值是唯一的、確定的。抽樣指標:根據樣本分布計算的指標。是隨機變量。全及指標和抽樣指標平均數標準差、方差成數全及指標、2P抽樣指標S、S2p總體樣本
變量總體和屬性總體變量總體各單位標志值可用數量表示總體成數P是指具有某種特征的單位在總體中的比重。成數是一種結構相對數,設總體單位總數目是N,總體中有該特征的單位數是N1。設x是0、1變量,則有:樣本成數現從總體中抽出n個單位,如果其中有相應特征的單位數是n1,則樣本成數是:P也是一個隨機變量,利用樣本平均數的分布性質結論,即有:樣本容量與樣本個數樣本容量:一個樣本中所包含的單位數,用n表示。樣本個數:又稱樣本可能數目,指從一個總體中所可能抽取的樣本的個數。對于有限總體,樣本個數可以計算出來。樣本個數的多少與抽樣方法有關。重復抽樣:又稱有放回抽樣。不重復抽樣:又稱不放回抽樣。例例二、抽樣方法重復抽樣例如從A、B、C、D、E五個字母中隨機抽取兩個作為樣本。N=5,n=2考慮順序時:樣本個數=Nn=52=25不考慮順序時:樣本個數=例如從A、B、C、D、E五個字母中隨機抽取兩個作為樣本。N=5,n=2考慮順序時:樣本個數不考慮順序時:樣本個數不重復抽樣三、大數定理當樣本容量n
充分大時,可以用樣本平均估計總體平均。當試驗次數n充分大時,可以用頻率代替概率。大數定理的意義:個別現象受偶然因素影響,但是,對總體的大量觀察后進行平均,就能使偶然因素的影響相互抵消,從而使總體平均數穩定下來,反映出事物變化的一般規律。
中心極限定理
中心極限定理:1.獨立同分布中心極限定理:2.德莫福-拉普拉斯中心極限定理:大樣本的平均數近似服從正態分布。第三節抽樣平均誤差
在統計調查中,調查資料與實際情況不一致,兩者的偏離稱為統計誤差。一、抽樣誤差的概念及其影響程度
抽樣誤差即指隨機誤差,這種誤差是抽樣調查固有的誤差,是無法避免的。二、抽樣平均誤差
抽樣平均誤差實際上是樣本指標的標準差。通常用μ表示。在N中抽出n樣本,從排列組合中可以有各種各樣的樣本組。
抽樣誤差是由于抽樣的隨機性而產生的樣本指標與總體指標之間的平均離差。
注按照定義:重復抽樣分布--樣本平均數的分布某班組5個工人的日工資為34、38、42、46、50元。=422=32現用重復抽樣的方法從5人中隨機抽2個構成樣本。共有52=25個樣本。如右圖。驗證了以下兩個結論:抽樣平均數的標準差反映所有的樣本平均數與總體平均數的平均誤差,稱為抽樣平均誤差,用表示。重置抽樣分布--樣本平均數的分布取得σ的途徑有:
1.用過去全面調查或抽樣調查的資料,若同時有n個σ的資料,應選用數值較大的那個;2.用樣本標準差S代替全及標準差σ;3.在大規模調查前,先搞個小規模的試驗性的調查來確定S,代替σ;4.用估計的方法。抽樣平均誤差的影響因素:
1.全及總體標志變異程度。2.抽樣單位數目的多少。3.不同的抽樣方式。4.不同的抽樣組織形式。——正比關系——反比關系隨機抽樣的抽樣平均誤差
(一)平均數的抽樣平均誤差重復抽樣
某燈泡廠從一天所生產的產品10,000個中抽取100個檢查其壽命,得平均壽命為2000小時(假設為重復抽樣),根據以往資料:σ=20小時,根據以往資料,產品質量不太穩定,若σ=200小時,例2.不重復抽樣:(二)成數的抽樣平均誤差
已知:成數的方差為p(1-p)
某玻璃器皿廠某日生產15000只印花玻璃杯,現按重復抽樣方式從中抽取150只進行質量檢驗,結果有147只合格,其余3只為不合格品,試求這批印花玻璃杯合格率(成數)的抽樣平均誤差。例抽樣誤差的作用1.
在于說明樣本指標的代表性大小。 誤差大,則樣本指標代表性低; 誤差小,則樣本指標代表性高; 誤差等于0,則樣本指標和總體指標一樣大。2.說明樣本指標和總體指標相差的一般范圍。第四節全及指標的推斷
一、優良估計無偏性一致性有效性二、點估計點估計的含義:直接以樣本指標作為相應全及指標的估計量。例三、全及指標估計概述設待估計的全及指標是,用以估計該參數的統計量是,抽樣估計的極限誤差是
,即:抽樣極限誤差是根據研究對象的變異程度和分析任務的性質來確定的在一定概率下的允許誤差范圍。四、區間估計區間估計的含義:根據樣本指標和抽樣誤差去推斷全及指標的可能范圍,它能說清楚估計的準確程度和把握程度。其中:1-α(0<α<1)稱為置信度;α是區間估計的顯著性水平,其取值大小由實際問題確定,經常取1%、5%和10%。參數估計的兩個要求:精度:估計誤差的最大范圍,通過極限誤差來反映。顯然,Δ越小,估計的精度要求越高,Δ越大,估計的精度要求越低。極限誤差的確定要以實際需要為基本標準。可靠性:估計正確性的一個概率保證,通常稱為估計的置信度。
根據中心極限定理,得知當n足夠大時,抽樣總體為正態分布,根據正態分布規律可知,樣本指標是以一定的概率落在某一特定的區間內,統計上把這個給定的區間叫抽樣極限誤差,也稱置信區間,即在概率F(t)的保證下:
抽樣極限誤差△=tμ,(t為概率度)68.27%的樣本當F(t)=68.27%時,抽樣極限誤差等于抽樣平均誤差的1倍(t=1);當F(t)=95.45%時,抽樣極限誤差等于抽樣平均誤差的2倍(t=2);當F(t)=99.73%時,抽樣極限誤差等于抽樣平均誤差的3倍(t=3);可見,抽樣極限誤差,即擴大或縮小了以后的抽樣誤差范圍。四、全及平均數和全及成數的推斷
某農場進行小麥產量的抽樣調查,該農場小麥播種面積為10000畝,采用不重復的簡單隨機抽樣從中選100畝作為樣本,進行實割實測,得到樣本的平均畝產量為400千克,樣本標準差為12千克。(1)求抽樣平均誤差;(2)以95.45%的概率保證,該農場平均畝產量的范圍;(3)以99.73%的概率保證,該農場平均畝產量的范圍。例1~
~
解:
某機械廠日產某種產品8000件,現采用純隨機重復抽樣方式,從中抽取400件進行觀察,其中有380件為一級品,試以概率95.45%的可靠程度推斷全部產品的一級品率的范圍。例2抽樣一級品率:~
解:第五節
抽樣方案設計
一、簡單隨機抽樣1.簡單隨機抽樣的含義簡單隨機抽樣又稱為純隨機抽樣,必須滿足下列兩條要求:①代表性,即要求樣本分布與總體分布相同;②獨立性,即要求樣本各個單位相互獨立。
簡單隨機的抽樣方法
(1)抽簽法。適合用于總體單位數較少的總體。
(2)隨機數表法。適合用于大規模的社會經濟調查。
(3)簡單隨機抽樣的平均誤差二、類型抽樣(分類抽樣)
先對總體各單位按一定標志加以分類(層),然后再從各類(層)中按隨機原則抽取樣本,組成一個總的樣本。
類型的劃分:必須有清楚的劃類界限;必須知道各類中的單位數目和比例;分類型的數目不宜太多。類型抽樣的好處是:
樣本代表性高、抽樣誤差小、抽樣調查成本較低。如果抽樣誤差的要求相同的話則抽樣數目可以減少。三、機械抽樣(等距抽樣)
先將全及總體的所有單位按某一標志順序排隊,然后按相等的距離抽取樣本單位。排列次序用的標志有兩種:1.選擇標志與抽樣調查所研究內容無關,稱無關標志排隊。2.選擇標志與抽樣調查所研究的內容有關,稱有關標志排隊。研究工人的平均收入水平時,按工號排隊。例研究工人的生活水平,按工人月工資額高低排隊。例機械抽樣按樣本單位抽選的方法不同,可分為三種:1.隨機起點等距抽樣kkkk+a2k+a(n-1)k+aak(k為抽取間隔)2.半距起點等距抽樣kkkk(k為抽取間隔)3.對稱等距抽樣kkk2k-a2k+a4k-a4k+aak(k為抽取間隔)機械抽樣的好處:
1.可以使抽樣過程大大簡化,減輕抽樣的工作量;2.如果用有關標志排隊,還可以縮小抽樣誤差,提高抽樣推斷效果。四、整群抽樣
整群抽樣即從全及總體中成群地抽取樣本單位,對抽中的群內的所有單位都進行觀察。
整群抽樣的好處:組織工作比較簡單方便,適用于一些特殊的研究對象。其不足之處是,一般比其它抽樣方式的抽樣誤差大。第六節
必要抽樣單位數的確定一、影響必要抽樣數目的因素(一)簡單隨機抽樣二、必要抽樣數目的計算公式
一家公司為估計壞帳而抽出了100個壞帳,這些壞帳的標準差為285.3。如今公司希望壞帳極限誤差不超過35元,置信度99.73%,則應抽取多少份壞帳?例
建筑工地打土方工人4000人,需測定平均每人工作量,要求誤差范圍不超過0.2M3,并需有99.73%保證程度。根據過去資料σ=1.5,求樣本數應是多少?例第7節假設檢驗小概率原理:即指概率很小的事件在一次試驗中實際上不可能出現。這種事件稱為“實際不可能事件”。例1:消費者協會接到消費者投訴,指控品牌紙包裝飲料存在容量不足,有欺騙消費者之嫌。包裝上標明的容量為250毫升。消費者協會從市場上隨機抽取50盒該品牌紙包裝飲品,測試發現平均含量為248毫升,小于250毫升。這是生產中正常的波動,還是廠商的有意行為?消費者協會能否根據該樣本數據,判定飲料廠商欺騙了消費者呢?消費者協會實際要進行的是一項統計檢驗工作。檢驗總體平均=250是否成立。這就是一個原假設(nullhypothesis),通常用表示,即::=250與原假設對立的是備選假設(alternativehypothesis),備選假設是在原假設被否定時另一種可能成立的結論。備選假設比原假設還重要,這要由實際問題來確定,一般把期望出現的結論作為備選假設。二、假設檢驗的步驟在例1中,按歷史資料,總體的標準差是4毫升。我們通過檢驗總體均值是否等于250毫升,來判斷飲料廠商是否欺騙了消費者。程序如下:第一步:確定原假設與備選假設。:=250;:<250以上的備選假設是總體均值小于250毫升,因為消費者協會希望通過樣本數據推斷出廠商的欺騙行為(大于250毫升
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025茶葉轉讓合同范本
- 2025標準員工合同協議書
- 二級經銷商合作合同
- 美術培訓安全協議書范本
- 2025購銷商品合同模板
- 壁畫文物買賣協議書
- 婚內股權財產協議書
- 2025年03月浙江溫州市平陽縣順溪鎮公開招聘編外人員1人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 2025年03月河南南陽市內鄉縣引進高層次及其他專業技術人才應試人員筆試(第3號)筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- Unit 10 Lending a Helping hand 第二課時Exploring the Topic(含答案)仁愛版2024七下英語日清限時練
- 2025年03月州省氣象部門第二批公開招聘應屆高校畢業生34人(第6號)筆試歷年參考題庫考點剖析附解題思路及答案詳解
- 圖書管理員的崗位技能要求與試題及答案
- 自體輸血管理制度與技術規范
- 2025年浙江省初中學校TZ8共同體中考數學一模試卷
- 酒店應知應會培訓
- XX鄉鎮履職事項清單表(1356項)
- 2025年高考作文備考:武漢市二調10篇范文+深圳一模4篇范文匯編
- 2025年中儲糧集團江蘇分公司招聘(73人)筆試參考題庫附帶答案詳解
- 2025年上海市高考英語熱點復習:閱讀理解詞義猜測題
- 2025年共青團入團考試測試題庫及答案
- 房屋建筑工程竣工驗收技術資料統一用表(2024 版)
評論
0/150
提交評論