《統計學基礎》課件7-8章 統計抽樣技術相關關系分析技術_第1頁
《統計學基礎》課件7-8章 統計抽樣技術相關關系分析技術_第2頁
《統計學基礎》課件7-8章 統計抽樣技術相關關系分析技術_第3頁
《統計學基礎》課件7-8章 統計抽樣技術相關關系分析技術_第4頁
《統計學基礎》課件7-8章 統計抽樣技術相關關系分析技術_第5頁
已閱讀5頁,還剩54頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章統計抽樣估計

教學目的:1.了解統計抽樣的概念和特點;2.掌握抽樣平均誤差、抽樣極限誤差的計算;3.熟練掌握區間估計方法;4.掌握必要樣本單位數的確定方法。重點:簡單隨機抽樣組織形式的區間估計方法難點:區別抽樣誤差、抽樣平均誤差和抽樣極限誤差第一節統計抽樣概述一、統計抽樣的概念(一)統計抽樣的概念統計抽樣是抽樣調查和抽樣推斷的總稱,它是按照隨機原則從被研究現象總體中抽取部分單位進行調查,并根據對這部分單位的調查結果對總體的數量特征作出具有一定可靠性的估計和推斷,從而認識總體的一種統計方法。例如,在某地區100萬戶居民中,隨機抽取1000戶居民進行家庭收入情況調查,以此來推斷該地區100萬戶居民的家庭收入情況,這種方式就是統計抽樣。(二)抽樣調查的特點1.遵循隨機原則從調查總體中抽取調查單位2.以樣本的數量特征推斷總體的數量特征。3.抽樣誤差可以事先計算并加以控制。

4.運用了概率估計的方法二、抽樣調查的作用1.對某些不可能進行全面調查而又需要了解全面情況的社會經濟現象,可以用抽樣法來了解其全面情況。4.可用于生產過程中的質量控制。3.可以對全面調查的資料加以補充和修訂。2.對于需要及時了解情況的現象,也經常采用抽樣技術。三、統計抽樣的基本概念(一)全及總體和樣本總體1.全及總體,又稱總體或母體,是所要認識研究對象的全體,它是由具有某種共同性質的許多單位所組成的集合體。全及總體的單位數通常用N表示。如前例中,100萬戶居民就是全及總體,N=100萬。2.樣本總體,也稱樣本或子樣,是指從全及總體中按照隨機原則抽取的那部分個體所組成的集合體。樣本總體的單位數稱為樣本容量,通常用n表示。(二)全及指標和樣本指標1.全及指標,也稱總體指標或總體參數,是根據全及總體各單位標志值計算的反映總體數量特征的綜合指標。常用的全及指標有總體平均數()、總體成數(P)、總體標準差(σ)和總體方差(σ2)。總體中具有某一屬性的單位數占總體單位數的比重,一般用P表示,即;總體中不具有某一屬性的單位數占總體單位數的比重,一般用Q表示,即,,則有。統計中通常把這樣的兩種比重稱為成數。(三)抽樣的方法在抽樣調查中,從全及總體中抽取樣本單位的方法有兩種:重復抽樣和不重復抽樣。1.重復抽樣,又稱重置抽樣或回置抽樣,是指從總體中抽出一個單位后,把結果登記下來,再放回總體中參加下一次的抽選。重復抽樣每次都是從全部總體單位中抽選,每個單位被抽中的機會在各次中是完全相同的,且有多次被抽中的可能。ABCD

AAABACADBABBBCBD

CACBCCCD

DADBDCDDABCD(圖6-1)

其樣本數目用公式計算為:

=Nn=42=16(個)

2、不重復抽樣,考慮順序:樣本組合數目如圖2:

AAABACADBABBBCBDCACBCCCD

DADBDCDD

ABCDABCD(圖6-2)

其樣本數目用公式計算為:

===

=12(個)

3、重復抽樣,不考慮順序,樣本組合數目如圖3:AAABACADBABBBCBDCACBCCCDDADBDCDDABCDABCD(圖6-3)其樣本數目用公式計算為:

CnN+n-1

==

=10(個)

4、不重復抽樣,不考慮順序:樣本組合數目如圖4:

AAABACADBABBBCBDCACBCCCDDADBDCDDABCDABCD

(圖6-4)其樣本數目用公式計算為:

==6(個)

從以上樣本數目來看,重復抽樣個數大于不重復抽樣個數。=(五)抽樣的組織形式1.簡單隨機抽樣簡單隨機抽樣,又稱為純隨機抽樣,它是按照隨機原則直接從總體N個單位中抽取n個單位組成樣本,使總體中每個單位都有同等的被抽中的機會。⑴抽簽法⑵隨機數字表法2.分層抽樣分層抽樣,也稱分類抽樣或類型抽樣,它是先將總體各單位按某一標志分組,然后在各組中隨機抽取單位構成樣本的抽樣組織形式。3.等距抽樣等距抽樣,也稱機械抽樣或系統抽樣,它是先將總體各單位按某一標志排序,然后按相等的距離抽取單位構成樣本的抽樣組織形式。4.整群抽樣整群抽樣,也稱成組抽樣。前面介紹的三種抽樣組織形式都是一個一個地抽取樣本單位,故也稱為個體抽樣。第二節抽樣誤差一、抽樣誤差的概念要了解抽樣的概念,必須正確認識誤差的不同類型,準確地把握抽樣誤差的概念。1、計量誤差;2、記錄誤差;3、計算誤差;

4、抄錄誤差;5、匯總誤差;6、調查者、

被調查者有意虛報或瞞報造成的誤差。

1、偏差:破壞了隨機原則產生的偏差(系統性誤差)(1)實際誤差(絕對誤差)

|

||P-p|(2)抽樣平均誤差

,p2、抽樣隨機性誤差

登記誤差

抽樣代表性

統計誤差

(圖6-5),二、影響抽樣誤差大小的因素

抽樣誤差的大小受以下幾個因素的影響:1.樣本單位數(樣本容量n)的多少。2.總體各單位標志值的變異程度。3.抽樣方法。4.抽樣組織形式。三、抽樣平均誤差從一個總體中可以抽取許多個樣本,每個樣本指標與總體指標之間的離差稱為抽樣實際誤差。但是在實踐中總體指標數值往往是未知的,因此抽樣實際誤差是無法計算的。在實際工作中是以抽樣平均誤差來衡量抽樣誤差大小的==≈≈1.29(件)

從這里我們可以看出,復重抽樣的抽樣平均誤差大于不重復抽樣的抽樣平均誤差。用定義公式計算抽樣平均誤差很麻煩,在實際工作中,也是難以做到的。能不能將定義公式轉換成適用公式?數理統計研究證明,是可以的。因為:抽樣平均誤差就是所有可能出現的樣本指標和總體指標的平均離差,所有可能的抽樣平均數的平均數,就是總體平均數的數學期望,即:==

兩邊平方得:

=E(

-)2

=E[

-]2

=E[

]2

由于∑

=0,E

2=2,則上式:

=兩邊開方:

,這是重復抽樣的抽樣平均誤差公式。對于不重復抽樣,則要在根號內加乘修正系數:,當N>100時,1可忽略不計,則變成:=在小樣本條件(小于30)下,仍用系數

未知的情況下,也可以用S代替,計算

在結合6.1例,重復抽樣條件下:

首先,我們計算總體標準差:見表6-3:【例7-3】一批罐頭共60000桶,隨機抽查300桶,發現有6桶不合格,求合格率的抽樣平均誤差。已知:

在重復抽樣條件下,在不重復抽樣條件下,四、抽樣極限誤差概率與概率度如圖6-5表6-5:(圖6-6)【例7-4】已知某鄉糧食畝產量的標準差為公斤,總體單位數為畝,現重復隨機抽取400畝進行調查,求得其抽樣平均誤差為查《正態分布概率表》,當t=2時,置信度F(t)為95.45%。第三節總體指標推斷一、點估計點估計,也稱定值估計,它是直接以樣本指標的實際值作為相應總體指標的估計值。用公式表示為:二、區間估計【例7-6】某地區種植小麥4000畝,重復隨機抽取200畝進行試驗,測得結果:平均畝產量300千克,抽樣總體的標準差為6千克,試求在概率為95.45%的保證下,小麥的平均畝產量的可能范圍是多少?所以,小麥平均畝產量的可能范圍是300±0.84,即299.16~300.84千克。按重量分組/克/包包數/包xxf66~6868~7070~7272~7474~7626642676971737513441442629215028.8819.440.2419.3635.28合計20-1416103.20試以95.45%的概率保證程度推算:⑴這批食品的平均每包重量是否符合規定要求;⑵若每包食品重量低于70克為不合格,求合格率的范圍。這批食品平均每包重量的范圍是70.8±1.02,即69.78~71.82克。所以,這批食品平均每包重量不符合規定要求。所以,合格率的范圍是60%±21.91%,即38.09%~81.91%。第四節必要樣本數目的確定一、影響必要樣本單位數的因素一般地,在確定抽樣單位數時,必須考慮以下因素:1.總體方差的大小。2.抽樣極限誤差的大小。3.抽樣推斷的可靠程度。4.抽樣方法與組織形式。二、抽樣單位數的確定

抽樣必要單位數,可以根據抽樣允許(極限)誤差中的n來確定。在重復抽樣中:由于

,,方程兩邊平方:

在不重復抽樣中:兩邊平方,可得到則當N很大,例如大于100時,N-1約等于N,則

同理,成數的必要抽樣個數為:

-在小樣本時,則為:

由此可見,影響樣本容量n的因素主要有總體方差,允許誤差,概率度,總體單位數。【例7-8】某企業生產某種產品日產量為10000只標準件,根據以往經驗,產品的一級品率為90%,現在用重復抽樣的方法進行產品質量檢驗,要求一級品率的抽樣極限誤差不超過2%,而概率保證程度不低于95.45%,試計算應抽取多少產品?【例7-9】某市開展職工家計調查,根據歷史資料該市職工家庭平均每人每年收入的標準差為250元,而家庭消費的恩格爾系數為65%。現在用重復抽樣的方法,要求在95.45%的概率保證下,平均收入的極限誤差不超過20元,恩格爾系數的極限誤差不超過4%,求必要的樣本單位數。根據公式,在重復抽樣條件下,樣本平均數的單位數:第8章相關與回歸分析技術教學目標:本章的目的在于幫助學生了解相關關系的概念與種類,掌握判斷現象之間相關方向和相關程度的技能,理解相關分析與回歸分析之間的關系,掌握利用簡單直線回歸模型對經濟數據進行分析和預測的技能,會繪制相關散點圖,計算相關系數,建立回歸模型,利用回歸方程式對現象進行分析與預測。重點:1.相關系數的計算2.回歸方程式的確定3.利用相關與回歸分析的方法對現象進行分析與預測難點:回歸分析中兩個參數計算公式的推導第一節相關分析的意義

一、相關關系的概念與特點

(一)相關關系的概念(二)相關關系的特點現象之間的相關關系具有以下幾個特點。1.現象之間客觀存在著相互依存的數量關系2.具有相關關系的兩個變量之間的關系是對等的3.現象之間客觀存在的這種數量依存關系不確定、不唯一、不精確二、相關關系的種類(一)按相關關系的密切程度劃分,可以分為完全相關、不完全相關和不相關(二)按相關關系的方向來劃分,可以分為正相關與負相關(三)按相關關系的表現形式來劃分,可以分為線性相關與非線性相關(四)按相關關系影響因素的多少來劃分,可以分為單相關與復相關第二節相關分析一、相關表和相關圖(一)相關表(二)相關圖(一)相關系數的定義二、相關系數(二)相關系數的性質(三)相關密切程度劃分的標準(四)相關系數的計算企業編號n產品銷售額x/萬元銷售利潤y/萬元xyx2y21

26022

5720

67600

4842

31026

8060

96100

6763

3503010500

122500

9004

4203514700

5304021200

28090016006

7206244640

51840038447

8106552650

65610042258

9507571250

902500562591030808240010609006400101100869460012100007396合計6480521405720509140032375從表8-2可知:n=10,6480,521,405720,5091400,32375,將數據代入簡捷計算公式得:第三節直線回歸分析一、回歸分析的含義(一)回歸分析的概念(二)回歸分析的類型根據不同的標準,對回歸分析可以進行不同的分類。1.根據回歸分析中變量間的表現形態不同,可分為線性回歸(直線回歸)分析與非線性回歸(曲線回歸)分析。2.根據回歸分析中自變量數量的多少來分,可分為一元回歸分析與多元回歸分析。二、簡單線性回歸方程的建立(一)簡單線性回歸方程的確立(二)簡單線性回歸分析的特點(三)簡單線性回歸的應用序號年廣告費用/萬元年銷售量/萬臺1101222015330184403055037660407705088061990651010072要求:(1)計算廣告費用與銷售量之間的相關系數,并說明其相關程度。(2)對廣告費用與銷售量進行回歸分析,確定回歸方程,并解釋回歸系數的經濟含義。(3)進行預測,當廣告費用達到150萬元時,產品銷售量可以達到多少萬臺?解:(1)計算相關系數時不必區分自變量與因變量,而在進行簡單線性回歸分析時,需要區分自變量與因變量,因此,這里以年廣告費用為自變量x,年銷售量為因變量y。建立相關系數計算表,如下表8-4所示。序號n年廣告費用x/萬元年銷售量y/萬臺xyx2y21

10

12

120

100

1442

20

15

300

400

2253

30

18

540

900

3244

40

30

1200

1600

9005

50

37

1850

2500

1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論