抽樣調查原理_第1頁
抽樣調查原理_第2頁
抽樣調查原理_第3頁
抽樣調查原理_第4頁
抽樣調查原理_第5頁
已閱讀5頁,還剩130頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三講 抽樣調查原理 一、抽樣調查的概念和作用 二、抽樣中的幾個基本概念 三、抽樣調查方案設計 四、抽樣組織形式 五、參數估計 走進 Internet,我們按 抽樣調查 這個關鍵詞進行搜索,讓我們吃驚的是,幾萬條有關抽樣調查的信息看得眼花繚亂,我們摘錄部分如下: 1、國家統計局中國經濟景氣監測中心對北京、武漢、西安三城市的九百位常住居民進行的抽樣問卷調查顯示: -百分之二十九點五的人在受訪時對目前的中國鐵路客運服務滿意,百分之五十六點七的人基本滿意,滿意者合計百分之八十六點二;百分之十三點八的人表示不滿意。 -百分之二十九點三的人認為購票難; -百分之二十七點三的人認為服務態度還應該再提高; -百分之二十七點三的人認為某些路線乘車環境差強人意。 2、國家統計局城調總隊在北京、廣州等 10個城市開展的居民生活意向調查表明: -醫療衛生制度改革成為百姓關注的首要問題,關注率由 1996年的 47.92%上升為 87%。 -72%的人認為目前的醫療條件已經明顯改善,病人可以自主選擇醫生,看病很方便。 -59.1%的人認為部分藥品價格已經下降。醫藥管理制度的改革,已經使各種藥品的價格控制在比較合適的水平。 -95.5%的人認為政府部門應當重視醫藥費及醫療費合理收取問題; -55.3%的人把醫藥費及醫療費的合理收取作為需要政府重視和解決的首要問題。 3、全景網絡 2000年投資者盈虧情況調查 顯示: -有 54.35%的被調查者賺了錢,只有 31.86%的被調查者虧了錢,另有 8.39%的被調查者不賠也不賺。 4、另據華夏證券上海分公司對 4萬多客戶全年交易數據的隨機抽樣調查顯示: -2000年更是有 70%的中小散戶賺了錢。兩項統計都得出了趨勢性一致的結論。 5、華中師范大學日前一項抽樣調查顯示: -只有 21%的學生能記得全部老師, 18.4%老師記得全部學生。另外, 53.5%的學生記得絕大部分老師, 34%的老師記得大部分學生。 -在師生彼此熟悉程度上,單方面認識老師的學生比例為62%,認為彼此認識但交流不多的占 34%。 -74%的學生和老師認為朋友式的師生關系是最合適的師生關系。 6、據上海市統計局城調隊數據顯示, 2000年本市居民比以往更加注重生活質量的提高。教育、文化、交通通信、保健、住宅、旅游、服務性消費等方面繼續成為居民的消費熱點,支出明顯增加。 2000年末,本市居民人均居住面積達到 11.4平方米,比上年增加 .5平方米。在本市商品房的銷售中,個人購房的比重達 93。而在被調查的 500戶居民家庭中,一年中就有12.6居民家庭購買了商品房、二手房和部分產權房,這部分家庭戶均購建房支出 3.7萬元。其中,有 14.3居民家庭購買了商品房,戶均購房支出 15.4萬元。居民家庭購買上述住宅的戶數比上年增長 2.3倍,比 1998年增長 30.5倍。 7、國家統計局農調總隊對全國 30個省、自治區、直轄市的 800多個縣、 6萬多個農戶、約 18萬個農村勞動力進行了抽樣調查。調查結果表明: 1999年中國農村勞動力從第一產業向第二、三產業轉移速度又有所加快。 1999年中國農村有 6.4%的農村勞動力轉移到二、三產業,而這一年中從非農產業返回到農業的勞動力占農村勞動力總數的 0.5%,增減相抵,凈轉移勞動力占農村勞動力總數的 5.9%,比上年上升了 0.4個百分點。目前中國農村勞動力從第一產業向二、三產業轉移的特點是:在省內轉移就業的比重大幅度上升;東部地區仍是轉移的熱點,向西部轉移的人開始增加;小城鎮吸納轉移勞動力比重上升;轉移人員多為青壯年, 18至 40歲人員比重達 77.3%,其中 18至 30歲的比重為57.9%。 一、抽樣調查的基本問題 (一)抽樣調查的概念 抽樣是人們對事物的認識、生活的體驗、真理的追求,乃至科學試驗、社會調查中最常用的一種方法。 例如醫生為病人驗血,檢查病情; 居民到農貿市場購買大米,抓一把看看是否顆粒飽滿; 炒菜中嘗嘗咸淡; 車輛乘務員檢查車輪是否存在裂縫; 政府新政策出臺前的民意測驗等等,都是抽樣調查的常見例子。 抽樣的目的就是通過局部了解整體,一切先驗知識都以抽樣的經驗為基礎。 1、概念 抽樣調查是一種非全面調查,是指按照隨機原則,從調查對象中抽取一部分單位進行觀察登記,據以計算樣本指標,然后在一定把握程度上用樣本指標推斷總體指標的統計方法。 2、特點 隨機性 按照隨機原則抽取樣本,這是抽樣調查區別于其他非全面調查的特點。所謂隨機原則,就是使總體每個單位都有同等機會被抽中的原則,或者說是不受主觀意志決定抽中單位的原則。 推斷性 在數量上以樣本推斷總體,這是抽樣調查區別于其他調查方法的特點。根據大數定律的要求,按照隨機原則抽取足夠多的單位進行調查,樣本各單位之間的差異相互抵消而趨于穩定,以其平均結果推斷總體是完全可行的。 誤差可控性 抽樣調查是以樣本推斷總體,必然存在一定的誤差。依據中心極限定理,在樣本單位數足夠多的條件下,無論總體的分布如何,此時產生的誤差也趨于正態分布,因而可以利用正態分布通過有關資料事先計算出抽樣誤差的大小,并采取一定的方式把它控制在允許的范圍之內,保證抽樣推斷結果達到一定的可靠程度。 (二)抽樣調查的主要作用 1、優點 第一,省。與全面調查比較,抽樣調查可以節省人力物力和財力,提高調查的經濟效益。 第二,快。抽樣調查節約調查時間,加快工作進程,提高調查的時效性。例如,瞬息萬變的市場調查,收購季節的農產量調查,春運期間的客流調查等等,都可以抽樣調查及時獲得所需要的信息和資料。 第三,廣。抽樣調查可以增加調查項目,擴大調查范圍 第四,準。科學設計和嚴格實施的抽樣調查,能夠獲得精確、可靠的調查結果。 2、 作用 由于抽樣調查所具有的優點,一般在如下場合中廣泛使用; () .總體較大,而不需要了解每個單位的情況,只需要綜合資料或粗分組資料時; ()從調查單位取得多項的資料,而每調查一個單位,要花較長的時間,較多的人力和物力時,一般采用抽樣調查: ()總體各單位分布很廣很散,交通不發達,做不到普查時; ()調查項目難度大,資料必須派人調查才能取得,而又不能一時訓練出那么多人員時; ()調查單位一經調查,就會受到損壞或改變形態,也只采用抽樣調查;如燈泡壽命;罐頭質量調查等 ()抽樣調查在普查中的運用: (三)抽樣調查的理論基礎 概率論中的大數法則的一系列定理為抽樣理論其提供了數學基礎。 ( 1)正態分布定理 當總體分布為正態分布時,無論樣本單位數是多少,樣本平均數都服從正態 ( 2)中心極限定理 當樣本單位數足夠大時,無論總體是否是正態分布,其樣本平均數的分布趨近于正態分布。 (一)總體與樣本 1、總體 所謂總體,就是我們要調查或認識的研究對象,是由所研究范圍內具有某種共同性質的全體單位所組成集合體,通常用 “ N”來表示有限總體的單位數。對于一個特定的問題全及總體是唯一確定的。 二、抽樣調查中幾個基本概念 2、樣本 在總體中,被抽取出來的那一部分單位,叫做樣本總體,簡稱樣本,樣本單位是有限的。 通常用 “ n”來表示樣本的大小。對于總體單位數 “ N”來說, n是很小的數。如果說對于一個問題,全及總體是唯一確定的,那么樣本卻隨著抽樣的不同而變化,一個總體可能抽取若干個樣本,它不是唯一確定的,一個總體可能抽取樣本數目與樣本容量和抽取方法有關。 (二)總體參數與樣本統計量 1、總體參數 根據總體各個單位的數量標志值或標志特征計算的,反映總體特征的綜合指標為全及指標,指標是總體變量的函數,其指標數值是唯一確定的。所以稱為總體參數。 (1) 總體平均數和標準差 不同性質的總體需要計算不同的參數,對于總體的變量標志如工資等,常用的參數有總體平均數和總體標準差 (或總體方差 2 )。 設總體變量的數為 則: nYYY . . .21 .NYY 2)( NYY (2)總體成數和標準差 對于總體中的品質標志,由于各單位的標志值不能用數量來表示。因此,總體參數常以成數指標 P來表示總體中具有某種性質的單位數在總體全部單位中所占的比重。以 Q表示不具有某種性質的單位數在總體中的比重。 設總體 N個單位, N1個單位具有某種性質, N0個單位不具有某種性質,且 N N1 N0 則有: NNP 1 NNQ 01 QP 我們通常把 “ 是 ” 的標志值表示為,而 “ 非 ” 的標志值表示為 0,那么成數 P可以視為( 0.1)分布的平均數,并求出相應的平均數、方差為: PNNNY 01 01)1()1()1(01 PPNPNPN(3)總體比率 (R)和標準差 總體中兩個不同的總量指標或均值的比率。 XYXYR NRXYNiii122、樣本統計量 根據樣本數據計算的綜合指標稱為樣本指標。又叫統計量。統計量決定于樣本的單位標志值,是樣本變量函數。統計量是用于估計總體參數的,因此與常用的總體參數相對應,有樣本平均數、樣本成數和樣本方差等等,用小寫字母 表示。 設樣本變量的數值為 則: (1)樣本平均數和標準差為: 2spy 和、nyyy .21、niiyny111)(2nyys (2)樣本成數和標準差為: )1( ppspy(3) 樣本比率 (r)和標準差 niiniixyxyr11 112nrxysniii總體參數的特點 : 指標所反映的總體范圍是明確的,指標的計算方法是已知的,指標數值是唯一的,但調查前是未知的。因此,需要用抽樣來估計它。 樣本統計量的特點: 計算方法是確定的,但它的取值隨不同的樣本而發生變化。所以統計量一個隨機變量,用它來作為參數的估計值,有的誤差大些,有的小些,有的發生正誤差,有的是負誤差。情況各不相同。 (三)重復抽樣與不重復抽樣 從抽樣方法來看,通常有重復抽樣與不重復抽樣兩種; 1、重復抽樣 重復抽樣也稱為重置抽樣。設總體單位數為,而樣本容量為 n,它是這樣安排抽樣的 :一次只從總體中抽一個單位,連續抽 n次,得 n個單位,構成一個樣本。每次抽出一個單位把標志值登記下來后,即放回繼續參加下一次抽選。這樣,重復抽樣的樣本是由 n次連續抽取的結果組成的,每次結果是互相獨立和彼此不影響,而且每次抽取都在相同的條件進行。因此,每一單位可能中選的機會在每一次都是相同的。 2、不重復抽樣 不重復抽樣又稱不重置抽樣。它從個單位總體中抽取 n個單位構成樣本,樣本是由每次抽一個單位,連續抽 n次構成的。但每次抽出一個單位后,不再放回參加下一次抽選。因此,不重復抽樣連續抽 n次,實質上等于從總體中一次抽 n個單位構成樣本。 (四)樣本個數與樣本容量 樣本容量和樣本個數是兩個有聯系但又完全不同的概念。 1、樣本容量 樣本容量是指一個樣本所包含的單位數,一個樣本應該包含多少單位最合適,是抽樣設計必須認真考慮的問題。樣本容量的大小要結合調查任務的要求以及總體標志變動度的大小綜合考慮。 通常將樣本單位數不少于 30個的樣本稱為大樣本。社會經濟統計的抽樣調查多屬于大樣本調查。 2、樣本個數 樣本個數又稱樣本可能數目,是指從一個全及總體中可能抽取的樣本個數。一個總體可能抽取多少樣本,這和樣本容量以及抽樣方法等因素有關系。 抽樣方法與樣本個數的關系 ( 1) 考慮順序的重復抽樣 如果總體的大小為 N, 從中抽取容量為 n的樣本 , 由于是重復連續獨立抽樣 , 第一次抽選有 N種可能 , 第 n次抽選仍有 N種可能 。 因此 ,可能樣本數為 。 例如:從 N = 4個單位的總體中隨機抽取 2個 , 分別求出可能組合的樣本數及其演示圖 。 解:若為重復抽樣 , 則共有 4*4=16個可能樣本數 , 其樣本組合圖如下: aa、 ab、 ac、 ad da、 db、 dc、 dd ca、 cb、 cc、 cd ba、 bb、 bc、 bd ( 2) 不考慮順序的不重復抽樣 由于不考慮順序又不允許重復 , 其可能樣本數為從 N個中抽取 n 個的組合數 , 根據排列組合的原理共有 種可能的樣本數 。 如前例:若為不重復抽樣 , 則共有 = 6個可能樣本數 , 其樣本組合演示圖如下: nNC24Cbc、 bd ab、 ac、 ad cd ( 3) 不考慮順序的重復抽樣 一般地說 , 從 N個不同單位每次抽選個 的 允 許 重 復 的 組 合 數為 。 如前例:若為重復抽樣,則共有 = 10個可能樣本數,其樣本組合圖如下: nnNC 12124 Caa、 ab、 ac、 ad bb、 bc、 bd cc、 cd dd ( 4) 考慮順序的不重復抽樣 考慮順序的不重復抽樣 , 可以直觀地看 , 第一次抽取時有 N種可能 , 第二次抽取時有 N-1種可能 , .第 n次抽取時有 N-n+1種可能 。 因此可能樣本數為 ANn。 如前例:若為不重復抽樣 , 則共有 A42=4!/2!=12個可能樣本數 , 其樣本組合演示圖如下: 。 ab、 ac、 ad ba、 bc、 bd ca、 cb、 cd da、 db、 dc 在通常情況下,一般只用前面兩種方式 (五)抽樣框 抽樣框是指調查范圍內用來代表總體所有單位的名冊或表列,是從中抽選樣本單位的框架。 抽樣框的編制要求 ( 1)名冊必須完整,即每個可能要被調查的單位都必須包括在這份名單中,無一遺漏,即目標總體與抽樣總體一一對應; ( 2)框中的每個單位必須相互獨立; ( 3)框中每個單位必須毫無重復,不得出現兩次或兩次以上; ( 4)框中一定要盡可能多地收集和利用與調查標志有關的資料和輔助資料,尤其在等距抽樣和分層抽樣中按與調查標志比較緊密相關指標進行排隊組成抽樣框,然后使用輔助資料來改善抽樣框,以便計算等距抽樣的組距和分層的規模 。 ( 5)作框的資料為近三 -五年的平均資料,并說明制訂日期和資料來源。 抽樣框的具體形式 一覽表(即名冊或表列) 名冊:一覽表包括總體的全部單位及調查標志值部分組成; 表列:一覽表由主要調查標志值和輔助調查標志值等部分組成。 地圖 根據地圖上的自然(或人工)的標識等將調查區域分成可以進行抽樣的單位; 時間抽樣框 按時間過程劃分抽樣單位的框架。 在抽樣實踐中,大量使用一覽表式抽樣框 不完備抽樣框 ( A) O S 抽樣框中的抽樣總體小于抽樣目標總體 S (B) L S 一個抽樣單位對應兩個以上總體單位 ( C) L O 抽樣框中的抽樣總體大于抽樣目標總體 L ( D) S L 兩個以上的抽樣單位對應一個總體單位 解決辦法: a.如果已知這些問題比其他誤差要小,而且糾正花費太大的話,可以忽略。 b.重新定義總體一適應抽樣框。如一個單位工資表中可能不包括新報到職工,但這些人數很少,可以將他們排除在外。 c.盡可能將丟失的單位找回來。 三、抽樣調查方案設計 調查目的 調查對象和 調查單位 調查內容 抽樣設計 調查組織實施 (一)調查目的 調查目的就是通過抽樣調查需要解決什么問題。調查目的應根據上級領導掌握情況、制定決策的要求來確定的。 調查目的決定了調查對象、調查單位和調查內容,要使調查工作有的放矢,必須首先明確調查目的。 (二)調查對象與調查單位 調查對象就是抽樣調查的總體。確定調查對象,是根據調查目的和任務,確定在什么范圍內進行調查,也就是確定總體的范圍或界限。 調查單位就是總體單位。確定調查單位,是在確定的調查總體內,以何為基本單位進行調查的取得數據或資料。 作為一個調查對象或總體應包括四個基本要素: ( 1) 自然屬性 ( 自然人 、 法人 ) ( 2) 內在特征 ( 數量特征 、 品質屬性 ) ( 3) 位置 ( 空間:北京 、 沈陽等 ) ( 4) 日期 ( 調查時間 ) (三)調查內容 調查內容就是所要調查的項目,也即說明總體單位的基本標志(數量標志和品質標志),它是調查方案的核心部分。 擬定調查項目應注意的問題: ( 1) 所選擇的項目是調查目的任務所需要 ,并且能夠取得確切資料的 。 ( 2) 每個項目應該有確切的涵義和統一的解釋 。 ( 3) 各個調查項目之間盡可能做到相互聯系 、彼此銜接 。 (四)抽樣設計 抽樣設計是整個抽樣調查方案的關鍵部分 。 ( 1) 設計參數 這里主要包括總體的估計量的所要達到的精確程度 、 可靠程度和代表性誤差 。 A.精確程度稱為抽樣極限誤差 : B.可靠程度一般為置信度: 95%或 Z=1.96、 95.45%, 或 Z=2 zC.代表性誤差參數 , 即樣本指標與過去已掌握的總體同一指標的比值 , 通常不超過 3 -5 ( 97%-103%或 95 -105 ) 。 %100Yy( 2) 確定抽樣組織形式和方法 根據調查目的和對象的特點科學地選擇抽樣組織形式和方法 , 尤其要將各種組織形式和方法綜合運用 , 才能充分發揮抽樣技術的優勢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論