統計學教程4ppt課件_第1頁
統計學教程4ppt課件_第2頁
統計學教程4ppt課件_第3頁
統計學教程4ppt課件_第4頁
統計學教程4ppt課件_第5頁
已閱讀5頁,還剩55頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 yc=a+bx+u 葉葉 思思 榮榮東東 南南 大大 學學經濟管理學院經濟管理學院第第 四四 章章第四章第四章 統計分析一統計分析一41 抽樣調查抽樣調查一抽樣調查任務中的概念一抽樣調查任務中的概念二抽樣誤差二抽樣誤差三總體參數估計三總體參數估計42 相關與回歸分析相關與回歸分析五五 抽樣設計抽樣設計 yc=a+bx+u 一一 普通概念普通概念二二 一元線性回歸方程一元線性回歸方程 三三 線性回歸方程線性回歸方程 分析分析四四 一元線性回歸預測一元線性回歸預測五五 多元線性回歸與相關分析多元線性回歸與相關分析四總體參數假設檢驗四總體參數假設檢驗六六 相關分析相關分析第四章第四章 抽樣調查與推

2、斷抽樣調查與推斷41 抽樣調查的根本概念抽樣調查的根本概念42 抽樣誤差抽樣誤差 yc=a+bx+u 43 總體參數估計總體參數估計一總體參數假設檢驗一總體參數假設檢驗二雙側檢驗與單側檢驗二雙側檢驗與單側檢驗44 總體參數檢驗總體參數檢驗三總體平均數的檢驗三總體平均數的檢驗四總體方差的檢驗四總體方差的檢驗五假設檢驗的兩類錯誤分析五假設檢驗的兩類錯誤分析45一抽樣組織設計一抽樣組織設計二抽樣單位數確實定二抽樣單位數確實定抽樣調查與推斷抽樣調查與推斷 按照隨機的原那么從統計總體按照隨機的原那么從統計總體中抽取一部分單位組成樣本,對樣本中抽取一部分單位組成樣本,對樣本進展調查,運用數理統計的原理,以

3、進展調查,運用數理統計的原理,以樣本目的數值為根據樣本目的數值為根據, ,對總體作出具對總體作出具有一定可靠性推斷的過程。有一定可靠性推斷的過程。 yc=a+bx+u 抽樣調查的特點:抽樣調查的特點:部分推斷總體部分推斷總體完全隨機原那么完全隨機原那么抽樣誤差抽樣誤差1.1.2.2.3.3.xX抽樣調查推斷認識 yc=a+bx+u 抽樣調查任務中的概念抽樣調查任務中的概念:總總體體全及總體全及總體抽樣總體抽樣總體Nn平平均均數數全及平均數全及平均數抽樣平均數抽樣平均數Xx成成數數全及成數全及成數P抽樣成數抽樣成數pxXpP01NNNNNP101nnnnnp1抽樣調查的目的抽樣調查的目的 yc=

4、a+bx+u 總體方差及規范差總體方差及規范差:全及總體全及總體平均數平均數成成 數數方方 差差規范差規范差NXX22NXX2樣樣 本本平均數平均數成成 數數方方 差差規范差規范差nxxS22)(P1P2)(P1PnxxS2)(p1pS2)(p1pS樣本方差及規范差樣本方差及規范差:p1p yc=a+bx+u 分分 組組具有某種標志具有某種標志不具有某種標志不具有某種標志取值取值10數量數量n1n001nnnfxfx0101nnn0n1nn1=pffxxs22010212nnnp0np1nnpnnp10212p1ppp122 pp1pp1 yc=a+bx+u xX pP統統計計誤誤差差登記誤差

5、登記誤差代表性誤差代表性誤差(抽樣調查抽樣調查)破壞了隨機原那破壞了隨機原那么么(系統偏向系統偏向)遵守了隨機原那遵守了隨機原那么么(隨機誤差隨機誤差)抽樣誤差抽樣誤差 在抽樣調查中排除了登記誤差和系統偏向以后的隨機誤差。在抽樣調查中排除了登記誤差和系統偏向以后的隨機誤差。1、普通概念、普通概念 yc=a+bx+u 1 、 2 、 3 、 4 、53X 1、2、3樣樣 本本樣本目的數值樣本目的數值 抽樣誤差抽樣誤差 21 1、2、4 2.330.67 1、2、5 2.670.33 1、3、5 30 2、3、4 30 3、4、5 4-1 yc=a+bx+u NnmnNCm321xxxx.0 1

6、2 3 4 5 6 7 8 m樣本樣本xxXx Pp 數理統計可以證明,在一切數理統計可以證明,在一切m個樣本中,其樣本目個樣本中,其樣本目的數值與全及目的數值存在如下關系:的數值與全及目的數值存在如下關系:1x2x8xmx3x4x5x6x7x2、抽樣平均誤差、抽樣平均誤差 yc=a+bx+u 抽抽樣樣平平均均誤誤差差抽樣平均數抽樣平均數mXx2x抽樣成數抽樣成數pmPp2xn2pnP1PxnS2pnp1p抽抽樣樣方方法法反復反復抽樣抽樣不反復不反復抽抽 樣樣1N12N13N1nN1xn2pnP1P123nN11N12N11nN1xNn1n2pNn1nP1P 某企業消費某企業消費2#電池,從電

7、池,從1000只電池中隨機只電池中隨機地抽取地抽取100只進展檢查,結果如下:只進展檢查,結果如下: yc=a+bx+u 例例數量數量Xxf 8.50 19.00267.75224.2518.756.75545.004.254.755.255.756.256.7524513931xx -1.2-0.7-0.20.30.81.32.881.962.043.511.921.69fxfx10000545. A455.ffxxS21000014. A3740. 有關目的計算有關目的計算fxx214.00電流強度電流強度6.5合合 計計10002250. yc=a+bx+u 反復反復抽樣抽樣抽樣平均數的

8、抽樣平均誤差抽樣平均數的抽樣平均誤差:xnS210037402. A03740.抽樣成數的抽樣平均誤差抽樣成數的抽樣平均誤差:不反復不反復抽抽 樣樣xNn1nS21000100110037402. A03550.國家規定,國家規定,2#電池的合格規范:電池的合格規范:那么抽樣合格率為:那么抽樣合格率為: A05.。940p.反復反復抽樣抽樣不反復不反復抽抽 樣樣pnp1p100060940.02370.或或 2.37%pNn1np1p90100060940. yc=a+bx+u xX pPxxXppP.0 1 2 3 4 5 6 7 8 m樣本樣本xx. . . . . . . . 數理統計可

9、以證明,不論總體的分布是一個什么樣的分布,抽數理統計可以證明,不論總體的分布是一個什么樣的分布,抽樣目的數值的分布是一個正態分布。樣目的數值的分布是一個正態分布。.x.3、抽樣極限誤、抽樣極限誤差差 yc=a+bx+u 數理統計可以證明,在一切數理統計可以證明,在一切m個樣個樣本中,其樣本目的數值與全及目的數值本中,其樣本目的數值與全及目的數值存在如下關系存在如下關系:xxXppP有有95.45%的樣本的樣本x2xXp2pP有有99.73%的樣本的樣本x3xXp3pP有有68.27%的樣本的樣本xxt ppt xxt ppt xxtxXpptpP yc=a+bx+u 樣本目的數值與全及目的數樣

10、本目的數值與全及目的數值之差落在某一個給定范圍內的值之差落在某一個給定范圍內的能夠性用概率來表示能夠性用概率來表示: tFP)t(ft168.27%295.45%399.73%1.9595.00%1.586.64%2.598.76%1.4485.00%ntt2xxnp1Pttpp精度精度可靠程度可靠程度t精度精度t可靠程度可靠程度精度精度t可靠程度可靠程度 yc=a+bx+u 精度精度可靠程度可靠程度nxnS210037402. A03740.pnp1p100060940.02370.要求在要求在95%的可靠程度下確定抽樣的精度的可靠程度下確定抽樣的精度 %95tf961t.xxt 03740

11、961. A07330.ppt 02370961.04650. 假設要求抽樣極限誤差的精度在假設要求抽樣極限誤差的精度在0.0561安培以內,確定其抽安培以內,確定其抽樣的保證程度樣的保證程度0374005610.xxt 51.51t. %.6486tf yc=a+bx+u xXpP優良性規范:優良性規范:1.1.2.2.3.3.一致性一致性nxX XxPnlim=1無偏性無偏性有效性有效性m321xxxxXxiXx 1、點估計、點估計 yc=a+bx+u xX pPxxXppPxxXxXppPpPxxXX,xxxx,xxxXxpppPp樣本樣本x0 1 2 3 4 5 m XxX xX 樣本

12、樣本x0 1 2 3 4 5 m xxx xx 2、區間估計、區間估計 yc=a+bx+u A455x.940p.在在95%的可靠程度下,抽樣極限誤差為:的可靠程度下,抽樣極限誤差為:xxt 03740961. A07330.02370961.04650.ppt 那么有:那么有:xxX07330455.=5.37675.5233(A)ppP04650940.=89.35% 98.65%在在99.73%的可靠程度下,抽樣極限誤差為:的可靠程度下,抽樣極限誤差為:xxt 0374003. A11220.0237003. 07110.那么有:那么有:xxX11220455.ppP07110940.p

13、pt =5.33785.5622(A)=86.89% 100.00% 要求這要求這1000只電池的平均電流強度只電池的平均電流強度在在5.35655.5435安培之間的可靠程度是安培之間的可靠程度是多少多少?xxt xXx 0374035655455.52.52t. %.7698tf yc=a+bx+u 要求這要求這1000只電池的合格率在只電池的合格率在90% 97%之間的可靠程度是之間的可靠程度是多少多少?pp1t102370900940.02370040.=1.69 2tFtF11290900.= 0.4545pp2t202370970940.02370030.=1.27 2tFtF22

14、279590.= 0.3980 tFtFtF213980045450.=0.8525 yc=a+bx+u 總體參數假設檢驗總體參數假設檢驗 利用樣本的實踐資料計算統計量的取利用樣本的實踐資料計算統計量的取值,并以此來檢驗事先對總體某些數量特值,并以此來檢驗事先對總體某些數量特征所作的假設能否可信,作為決策取舍根征所作的假設能否可信,作為決策取舍根據的一種統計分析方法。據的一種統計分析方法。xX 隨機性差別隨機性差別本質性差別本質性差別AA*aX*aXx由于樣本的緣由所引起的差別由于樣本的緣由所引起的差別由于總體產生了艱苦變化產生的差別由于總體產生了艱苦變化產生的差別1、建立假設建立假設原假設:

15、原假設: H0備擇假設:備擇假設:H12、決議檢驗的顯著性程度決議檢驗的顯著性程度3、確定檢驗統計量確定檢驗統計量4、進展比較,做出接受或回絕原假設的決策進展比較,做出接受或回絕原假設的決策1、根本概念、根本概念0 Z yc=a+bx+u 雙側檢驗雙側檢驗:;:00XXH01XXH:;:00PPH01PPH:1-2 /2 /2Z/2Z/假假設設:2ZZ/或或2ZZ/那么那么,回絕回絕H0,接受接受H1。左單側檢驗左單側檢驗:;:00XXH01XXH:;:00PPH01PPH:右單側檢驗右單側檢驗:;:00XXH01XXH:;:00PPH01PPH:-Z 02、雙側檢驗與單側檢驗、雙側檢驗與單側

16、檢驗例例 yc=a+bx+u 某汽車輪胎廠,根據歷史統計資料結果,某汽車輪胎廠,根據歷史統計資料結果,平均里程為平均里程為25000公里,規范差為公里,規范差為1900公里?,F公里?,F重新批量的輪胎中隨機抽取重新批量的輪胎中隨機抽取400個輪胎作實驗,個輪胎作實驗,求得樣本平均里程求得樣本平均里程 =25300公里,試按公里,試按5%的顯的顯著性程度判別新批量輪胎的平均耐用里程與通著性程度判別新批量輪胎的平均耐用里程與通常的耐用里程有沒有顯著的差別,或者它們屬常的耐用里程有沒有顯著的差別,或者它們屬于同一總體的假設能否成立于同一總體的假設能否成立x取取=0.05回絕區間的概率各為回絕區間的概率

17、各為/2=0.025即即:設立原假設。設立原假設。25000 xH0:備擇假設備擇假設25000 xH1:961Z0250.961Z0250.下臨界值下臨界值:上臨界值上臨界值:根據樣本信息,計算統計量根據樣本信息,計算統計量Z的實踐值:的實踐值:nXxZ040019002500025300 163.檢驗判別:檢驗判別:961Z163Z0250. 回絕回絕H0,接受接受H1。3、大樣本總體方差知、大樣本總體方差知例例 yc=a+bx+u 往年各屆的統計學平均成果為往年各屆的統計學平均成果為79分,今年分,今年從試卷中隨機地抽取從試卷中隨機地抽取30份檢查,結果如下:份檢查,結果如下:xxf成成

18、 績績人人 數數合合 計計30901347842157.562.567.572.577.582.587.592.5- 57.5125.0202.5507.5620.0412.5262.5 92.52280.0fxx2342.25364.50216.75 85.75 18.00211.25396.75272.251907.50 有關目的的計算有關目的的計算:fxfxffxxS2302280=76(分分)3051907 .=7.97(分分)1-2 /2 /2t/2t/4、小樣本、小樣本 總體方差未知總體方差未知建立假設建立假設 yc=a+bx+u 79xH0:79xH1:確定檢驗統計量確定檢驗統計

19、量nSXxt309777976.=-2.062 決策決策:在在=0.01的顯著性程度下的顯著性程度下,29t2=2.462t=-2.062所以,接受原假設所以,接受原假設H0,即本年,即本年成果在成果在80分左右。分左右。1、建立假設建立假設H0:H1:2、決議檢驗的顯著性程度決議檢驗的顯著性程度 普通取普通取0.01或或0.05)3、確定檢驗統計量確定檢驗統計量4、進展比較,做出接受或回絕原假設的決策進展比較,做出接受或回絕原假設的決策,202,202H0:H1:,202,202H0:H1:,202,202雙側檢驗雙側檢驗右側檢驗右側檢驗左側檢驗左側檢驗2022s1n其中其中:1nxxs22

20、為為2的檢驗量的檢驗量當原假設為真時,檢驗統計量服從自在度當原假設為真時,檢驗統計量服從自在度n-1的的2分布分布假假設設1n1n222221接受接受H0,回絕,回絕H1。1-1n221n2212 yc=a+bx+u 5、總體方差檢驗、總體方差檢驗 yc=a+bx+u 例例 某種產品的分量服從規范差某種產品的分量服從規范差 = 20 克的克的正態分布,現從消費線上隨機的抽取正態分布,現從消費線上隨機的抽取16包產包產品實測,樣本規范差品實測,樣本規范差 S=24克,請以克,請以0.02的顯的顯著性程度,檢查產品的分量能否有顯著的差著性程度,檢查產品的分量能否有顯著的差別。別。設立假設設立假設H

21、0:H1:400202400202 給定顯著性程度給定顯著性程度=0.02,自在度,自在度=16-1=15,查,查2分布表得:分布表得:15221 =5.2291522152010.=30.578152990.根據樣本信息,計算根據樣本信息,計算2統計量的實踐值:統計量的實踐值:222S1n40024152=21.6 檢驗判別檢驗判別:152990.=5.2292=21.6152010.=30.578 接受接受H0,回絕回絕H1。 yc=a+bx+u 組組織織方方式式純隨機抽樣純隨機抽樣等距抽樣等距抽樣類型抽樣類型抽樣整群抽樣整群抽樣階段抽樣階段抽樣限制:限制:編號困難編號困難調查困難調查困難

22、無法利用知的信息無法利用知的信息特點:特點:調查精度高調查精度高所需樣本單位少所需樣本單位少信息全面信息全面特點:特點:組織任務簡單組織任務簡單調查精度低調查精度低設購買某種零部件,要求合格率設購買某種零部件,要求合格率90%,現抽查,現抽查200件件第一階段第一階段8合格率合格率92.5%不確定不確定0時,y隨x增大而增大,闡明y與x的變化方向一樣:當bF(1,n-2)時時,那么回絕那么回絕H0,闡明兩變量之間線性關系是顯著的。闡明兩變量之間線性關系是顯著的。當當FF所以,回絕所以,回絕H0,接受,接受H1。闡明兩個變量之間的線性關系是顯著。闡明兩個變量之間的線性關系是顯著的。的。3、假設檢

23、驗、假設檢驗4、方差分析、方差分析yxyy y yc=a+bx+u 總偏向平方和:總偏向平方和:TSS誤差平方和:誤差平方和:ESS回歸平方和:回歸平方和:RSS2yyi2iiyy2yyi可以證明可以證明 SST= SSR+SSE 即即有:有:222yyyyyyiiii2yySSiR2xbabxai22xxbxxlb2xybl4、方差分析、方差分析yxyy ySSR與與SST的比值有以下結的比值有以下結果:果:TRSSSSyyxylblyyxyxxxyllllyyxxxylll22r yc=a+bx+u RSS方差自在度方差自在度方差方差TSS自在度自在度n-1ESSn-21所以:所以:TRS

24、SrSS2yylr2RTESSSSSSyyyylrl221 rlyy21nSSSSFER顯著性檢驗統計量顯著性檢驗統計量yyyylrnlr22122122nrr2r可決系數可決系數 yc=a+bx+u 以以68.27%的概率保證的概率保證 的預測區間為的預測區間為0yyxyxSyySy000 以以95.45%的概率保證的概率保證 的預測區間為的預測區間為0yyxyxSyySy22000 以以99.73%的概率保證的概率保證 的預測區間為的預測區間為0yyxyxSyySy33000 普通假設普通假設 為正態分布,當為正態分布,當n較大,并較大,并且且 不遠離不遠離 時,可以證明:時,可以證明:y

25、0 xxXYx0bxayyxSbxayyxSbxay0 yyxSy 0yxSy 0 yc=a+bx+u 當當n較小,通常較小,通常n30時,那么假設給定置時,那么假設給定置信概率即可靠程度信概率即可靠程度1-,可以證明,可以證明y0的的預測區間為:預測區間為:22020022020112112xxxxnSntyyxxxxnSntyiyxiyxXx0bxay0 yY yc=a+bx+u xy7157. 0427. 0千元247.0yxS 當我國城鎮居民人均可支配收入為當我國城鎮居民人均可支配收入為6千千元時,那么:元時,那么:67157.0427.0y=4.7212(千元千元)上限為上限為:5.

26、2152千元千元按按95.45%的可靠程度的可靠程度下限為下限為:4.2272千元千元 當我國城鎮居民人均可支配收入為當我國城鎮居民人均可支配收入為15千元時,那么:千元時,那么:按按95%的可靠程度,查的可靠程度,查t分布表分布表t0.025=2.05157157.0427.0y=11.1625(千元千元)22011xxxxni3194.1199035. 61531110488.1那么城鎮居民的消費性支出的預測區間那么城鎮居民的消費性支出的預測區間為為:10.631411.6936(千元千元) yc=a+bx+u 多元線性回歸模型的總體回歸函多元線性回歸模型的總體回歸函數的普通方式如下:數的

27、普通方式如下:tuktk2t21t10tXXXY式中:式中: Y變量變量Y的第的第t次察看值次察看值Xjt變量變量X的第的第t次察看值次察看值0,1,2,k總體回歸系數總體回歸系數j偏回歸系數。偏回歸系數。Ut隨機誤差項隨機誤差項tktk2t2t1t10teXXXY 假設:次察看值,同時,假設:次察看值,同時, 為總體回歸系數的為總體回歸系數的估計,那么多元線性回歸模型的樣本回歸函數如下:估計,那么多元線性回歸模型的樣本回歸函數如下:k210,式中:式中:etY與其估計值與其估計值 之間的離差之間的離差tY1、普通模型、普通模型多元線性回歸模型最小二乘法:多元線性回歸模型最小二乘法:tktkttYXXXn22110ttkttktttYXXXXXXXt112121101ttkttktttYXXXXXXXt122211202t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論