統(tǒng)計(jì)學(xué)第3章概率分布與抽樣分布ppt課件_第1頁
統(tǒng)計(jì)學(xué)第3章概率分布與抽樣分布ppt課件_第2頁
統(tǒng)計(jì)學(xué)第3章概率分布與抽樣分布ppt課件_第3頁
統(tǒng)計(jì)學(xué)第3章概率分布與抽樣分布ppt課件_第4頁
統(tǒng)計(jì)學(xué)第3章概率分布與抽樣分布ppt課件_第5頁
已閱讀5頁,還剩61頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第 3 章概率分布與抽樣分布1第 3 章 概率分布與抽樣分布3.1 隨機(jī)變量3.2 正態(tài)分布3.3 常用的抽樣方法3.4 抽樣分布3.5 中心極限定理的運(yùn)用23.1 隨機(jī)變量(random variables)對隨機(jī)事件的數(shù)值性描畫-例如:拋硬幣的結(jié)果,正面定義為1,反面定義為0普通用 X,Y,Z 來表示根據(jù)取值情況的不同分為離散型隨機(jī)變量:數(shù)軸上可列個(gè)孤立的點(diǎn)延續(xù)型隨機(jī)變量:數(shù)軸上一個(gè)或多個(gè)區(qū)間3離散型隨機(jī)變量隨機(jī)變量 X 取有限個(gè)值或一切取值都可以逐個(gè)列舉出來 x1 , x2,以確定的概率取這些不同的值離散型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查100個(gè)產(chǎn)品一家餐館營業(yè)一天電腦公司一

2、個(gè)月的銷售銷售一輛汽車取到次品的個(gè)數(shù)顧客數(shù)銷售量顧客性別0,1,2, ,1000,1,2, 0,1, 2,男性為0,女性為14延續(xù)型隨機(jī)變量延續(xù)型隨機(jī)變量可以取某一區(qū)間或整個(gè)實(shí)數(shù)軸上的恣意一個(gè)值它取任何一個(gè)特定的值的概率都等于0不能列出每一個(gè)值及其相應(yīng)的概率通常研討它取某一區(qū)間值的概率用概率密度函數(shù)和分布函數(shù)的方式來描畫試驗(yàn)隨機(jī)變量可能的取值抽查一批電子元件新建一座住宅樓測量一個(gè)產(chǎn)品的長度使用壽命(小時(shí))半年后工程完成的百分比測量誤差(cm)X 00 X 100X 05 定義 設(shè)X是一隨機(jī)變量,X是恣意實(shí)數(shù),那么實(shí)值函數(shù)F(x)P Xx, x(-,+)稱為隨機(jī)變量X的分布函數(shù)。 有了分布函數(shù)定

3、義,恣意x1,x2R, x1x2,隨機(jī)變量X落在(x1,x2里的概率可用分布函數(shù)來計(jì)算:P x1X x2PX x2PXx1 F(x2)F(x1). 在這個(gè)意義上可以說,分布函數(shù)完好地描畫了隨機(jī)變量的統(tǒng)計(jì)規(guī)律性,或者說,分布函數(shù)完好地表示了隨機(jī)變量的概率分布情況。 分布函數(shù)的定義6分布函數(shù)的性質(zhì) 1、單調(diào)不減性:假設(shè)x1x2, 那么F(x1)F(x2); 2、歸一 性:對恣意實(shí)數(shù)x,0F(x)1,且 3、右延續(xù)性:對恣意實(shí)數(shù)x,反之,具有上述三個(gè)性質(zhì)的實(shí)函數(shù),必是某個(gè)隨機(jī)變量的分布函數(shù)。故該三個(gè)性質(zhì)是分布函數(shù)的充分必要性質(zhì)。7例 設(shè)隨機(jī)變量X具分布律如下表解 X012P0.10.60.3試求出X

4、的分布函數(shù)。8延續(xù)型隨機(jī)變量與概率密度那么稱X是延續(xù)型隨機(jī)變量,f(X)稱為X的概率密度函數(shù),簡稱概率密度。留意f(x)不是概率 設(shè)X是隨機(jī)變量,假設(shè)存在定義在整個(gè)實(shí)數(shù)軸上的函數(shù)f(x),滿足條件9 概率密度函數(shù)的性質(zhì)1)2) 1這兩條性質(zhì)是斷定一個(gè)函數(shù) f(x)能否為某個(gè)隨機(jī)變量X的概率密度函數(shù)的充要條件3) X落入?yún)^(qū)間a,b內(nèi)的概率 10延續(xù)型隨機(jī)變量的期望和方差延續(xù)型隨機(jī)變量的數(shù)學(xué)期望方差113.2 正態(tài)分布(normal distribution)正態(tài)分布是最重要的一種概率分布。正態(tài)分布概念是由德國的數(shù)學(xué)家(Carl Friedrich Gauss,17771855)和天文學(xué)家Moiv

5、re于1733年初次提出的,但由于Gauss率先將其運(yùn)用于天文學(xué)家研討,故正態(tài)分布又叫高斯分布。描畫延續(xù)型隨機(jī)變量的最重要的分布許多景象都可以由正態(tài)分布來描畫 可用于近似離散型隨機(jī)變量的分布例如: 二項(xiàng)分布當(dāng)n越來越大,越近似服從正態(tài)分布經(jīng)典統(tǒng)計(jì)推斷的根底正態(tài)分布是許多統(tǒng)計(jì)方法的實(shí)際根底:如t分布、F分布、2分布都是在正態(tài)分布的根底上推導(dǎo)出來的,此外,t分布、二項(xiàng)分布、Poisson分布的極限為正態(tài)分布,在一定條件下,可以按正態(tài)分布原理來處置。 12 = 正態(tài)隨機(jī)變量X的均值 = 正態(tài)隨機(jī)變量X的方差 = 3.1415926; e = 2.71828x = 隨機(jī)變量的取值 (- x )那么稱X

6、服從參數(shù)為 、 的正態(tài)分布,記作XN( , )正態(tài)分布13正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對稱鐘形曲線,且峰值在x= 處均值和規(guī)范差一旦確定,分布的詳細(xì)方式也獨(dú)一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完好的“正態(tài)分布族 均值可取實(shí)數(shù)軸上的恣意數(shù)值,決議正態(tài)曲線的詳細(xì)位置;規(guī)范差決議曲線的“峻峭或“扁平程度。越大,正態(tài)曲線扁平;越小,正態(tài)曲線越高峻峭當(dāng)X的取值向橫軸左右兩個(gè)方向無限延伸時(shí),曲線的兩個(gè)尾端也無限漸近橫軸,實(shí)際上永遠(yuǎn)不會(huì)與之相交正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1 14正態(tài)概率密度函數(shù)的幾何特征151617 決議曲線的位置,決議曲線的“胖瘦正態(tài)

7、分布下的概率計(jì)算方法一:利用統(tǒng)計(jì)軟件計(jì)算方法二:轉(zhuǎn)化為規(guī)范正態(tài)分布查表計(jì)算19規(guī)范正態(tài)分布的概率密度表示為規(guī)范正態(tài)分布的分布函數(shù)表示為規(guī)范正態(tài)分布(standardize the normal distribution)20規(guī)范正態(tài)分布的圖形21查表規(guī)范正態(tài)分布函數(shù)表解例1 22解查規(guī)范正態(tài)分布表23正態(tài)分布的轉(zhuǎn)換任何一個(gè)普通的正態(tài)分布,可經(jīng)過下面的線性變換轉(zhuǎn)化為規(guī)范正態(tài)分布X-表示將普通正態(tài)分布的曲線平衡到規(guī)范正態(tài)分布的位置除以表示將普通正態(tài)分布的曲線外形轉(zhuǎn)換為規(guī)范正態(tài)分布24正態(tài)分布(例題分析)【例】定某公司職員每周的加班津貼服從均值為50元、規(guī)范差為10元的正態(tài)分布,那么全公司中有多少比

8、例的職員每周的加班津貼會(huì)超越70元,又有多少比例的職員每周的加班津貼在40元到60元之間呢? 解:設(shè)=50, =10,XN(50,102)25263.3 常用的抽樣方法3.3.1 簡單隨機(jī)抽樣3.3.2 分層抽樣3.3.3 系統(tǒng)抽樣3.3.4 整群抽樣27簡單隨機(jī)抽樣(simple random sampling)從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本,使得每一個(gè)總體單位都有一樣的時(shí)機(jī)(概率)被抽中 抽取元素的詳細(xì)方法有反復(fù)抽樣和不反復(fù)抽樣特點(diǎn)簡單、直觀,在抽樣框完好時(shí),可直接從中抽取樣本用樣本統(tǒng)計(jì)量對目的量進(jìn)展估計(jì)比較方便但是當(dāng)N很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查添加了困

9、難沒有利用其他輔助信息以提高估計(jì)的效率也稱純隨機(jī)抽樣,是運(yùn)用最多、最根本的抽樣方法之一28簡單隨機(jī)抽樣的優(yōu)缺陷優(yōu)點(diǎn):簡單隨機(jī)抽樣是最符合隨機(jī)原那么的抽樣方法,能保證總體的每個(gè)成員具有知的且同等的被選為樣本單位的時(shí)機(jī),因此,產(chǎn)生的樣本,不論其多大都是總體的一個(gè)有效代表。缺陷:不論運(yùn)用哪種抽樣方法,都需求預(yù)先設(shè)定每個(gè)總體成員,要為每個(gè)總體成員提供一個(gè)標(biāo)志值,而且要有一個(gè)完好的總體情況表,這往往是難以獲得的。29分層抽樣(stratified sampling)將總體單位按某種特征或某種規(guī)那么劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本優(yōu)點(diǎn)保證樣本的構(gòu)造與總體的構(gòu)造比較相近,從而提高估計(jì)的精

10、度組織實(shí)施調(diào)查更方便既可以對總體參數(shù)進(jìn)展估計(jì),也可以對各層的目的量進(jìn)展估計(jì)分層或分類時(shí),應(yīng)使層內(nèi)各單位的差別盡能夠小,而使各層之間的差別盡能夠大。30系統(tǒng)抽樣(systematic sampling)將總體中的一切單位(抽樣單位)按一定順序陳列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)那么確定其他樣本單位先從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位優(yōu)點(diǎn):操作簡便,可提高估計(jì)的精度缺陷:對估計(jì)量方差的估計(jì)比較困難也稱等距抽樣或機(jī)械抽樣31例3-1:從10000戶中抽取200戶進(jìn)展抽樣調(diào)查。把10000戶按一定標(biāo)志如家庭人口、收入程度

11、、地址等陳列編號(hào)110000號(hào);求出抽樣間隔kN/n10000/20050在第一個(gè)間隔1-50號(hào)內(nèi)恣意選取一個(gè)單位作為抽樣起點(diǎn),如38號(hào);從38號(hào)開場,每隔50戶抽取一戶38、88、1889988,共200戶。系統(tǒng)抽樣例題32整群抽樣(cluster sampling)將總體中假設(shè)干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對中選群中的一切單位全部實(shí)施調(diào)查特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡化任務(wù)量調(diào)查的地點(diǎn)相對集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺陷是估計(jì)的精度較差333.4 抽樣分布3.4.1 抽樣分布的概念3.4.2 樣本均值抽樣分布的方式3.4.3 樣本均值抽樣分布的特征3.4.4 樣本比率

12、的抽樣分布3.4.5 樣本方差的抽樣分布34 研討總體與所抽取的樣本之間的關(guān)系是統(tǒng)計(jì)學(xué)的中心內(nèi)容 。對這種關(guān)系的研討從兩方面著手: 一是從總體到樣本 ,這就是研討抽樣分布(sampling distribution)的問題; 二是從樣本到總體,這就是統(tǒng)計(jì)推斷(statistical inference)問題。抽樣分布 (sampling distribution)35抽樣分布 (sampling distribution) 從一個(gè)給定的總體中抽取不論能否有放回容量或大小為n的一切能夠的樣本,對于每一個(gè)樣本,計(jì)算出某個(gè)統(tǒng)計(jì)量如樣本均值或規(guī)范差的值,不同的樣本得到的該統(tǒng)計(jì)量的值是不一樣的,由此得到

13、這個(gè)統(tǒng)計(jì)量的概率分布,稱之為抽樣分布。 樣本統(tǒng)計(jì)量與總體參數(shù)之間的差別稱為抽樣誤差 sampling error。 36樣本統(tǒng)計(jì)量的概率分布,是一種實(shí)際分布在反復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的一切能夠取值構(gòu)成的相對頻數(shù)分布 隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值, 樣本比例,樣本方差等結(jié)果來自容量一樣的一切能夠樣本提供了樣本統(tǒng)計(jì)量長久而穩(wěn)定的信息,是進(jìn)展推斷的實(shí)際根底,也是抽樣推斷科學(xué)性的重要根據(jù) 抽樣分布 (sampling distribution)37抽樣分布例題分析某班組5個(gè)工人的日工資為34、38、42、46、50元。 = 422 = 32現(xiàn)用重置抽樣的方法從5人中隨機(jī)抽2個(gè)構(gòu)成樣本。共有

14、52=25個(gè)樣本。如右圖。總體單位數(shù)很大時(shí),難以一一列舉樣本數(shù),可經(jīng)過反復(fù)進(jìn)展抽樣,記錄下統(tǒng)計(jì)量取不同數(shù)值時(shí)的次數(shù)百分比,以得到一個(gè)統(tǒng)計(jì)量近似的抽樣分布38 設(shè)有一個(gè)總體 ,總體平均數(shù)為 ,方差為2,總體中各變數(shù)為 x, 將 此總體稱為原總體。現(xiàn)從這個(gè)總體中隨機(jī)抽取含量為n的樣本,樣本平均數(shù)記為 。 可以想象,從原總體中可抽出很多甚至無窮多個(gè)含量為n的樣本。由這些樣本算得的平均數(shù)有大有小,不盡一樣,與原總體平均數(shù)相比往往表現(xiàn)出不同程度的差別,即抽樣誤差(sampling error)。 一樣本均值的抽樣分布39樣本均值的抽樣分布 (例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體) ,即總體單位

15、數(shù)N=4。4 個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4 。總體分布、總體的均值、方差及分布如下總體分布14230.1.2.340樣本均值的抽樣分布 (例題分析) 現(xiàn)從總體中抽取n2的簡單隨機(jī)樣本,在反復(fù)抽樣條件下,共有42=16個(gè)樣本。一切樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)察看值第一個(gè)察看值一切能夠的n = 2 的樣本共16個(gè)41樣本均值的抽樣分布 (例題分析) 計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.5

16、42.542.03211.51.01第二個(gè)察看值第一個(gè)察看值16個(gè)樣本的均值xx樣本均值的抽樣分布1.000.10.20.3P ( x )1.53.04.03.52.02.542樣本均值的分布與總體分布的比較 的分布方式與原有總體和樣本容量n的大小有關(guān) 總體分布14230.1.2.3抽樣分布P ( x )1.00.1.2.31.53.04.03.52.02.5x = 2.5 2 =1.2543樣本均值的數(shù)學(xué)期望樣本均值的方差與抽樣方法有關(guān)反復(fù)抽樣不反復(fù)抽樣樣本均值的抽樣分布(數(shù)學(xué)期望與方差)修正系數(shù)對無限總體進(jìn)展不反復(fù)抽樣時(shí),修正系數(shù)趨向于1, 樣本均值的方差可按反復(fù)抽樣的公式計(jì)算對于有限總體

17、,當(dāng)N很大而很小時(shí),修正系數(shù)趨向于,樣本均值的方差可按反復(fù)抽樣的公式計(jì)算44樣本均值的抽樣分布(數(shù)學(xué)期望與方差)比較及結(jié)論:1. 樣本均值的均值(數(shù)學(xué)期望) 等于總體均值 2. 樣本均值的方差等于總體方差的1/n45總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比,例:不同性別的人與全部人數(shù)之比合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為二樣本比例的抽樣分布(proportion)46在反復(fù)選取容量為n的樣本時(shí),由樣本比例的一切能夠取值構(gòu)成的相對頻數(shù)分布一種實(shí)際概率分布當(dāng)樣本量很大時(shí),樣本比例p的抽樣分布可用正態(tài)分布近似 推斷總體比例的實(shí)際根底樣本比例的抽樣分布

18、47樣本比例的數(shù)學(xué)期望樣本比例的方差反復(fù)抽樣不反復(fù)抽樣樣本比例的抽樣分布(數(shù)學(xué)期望與方差)無限總體不反復(fù)抽樣時(shí),可按反復(fù)抽樣處置48三樣本方差的抽樣分布在反復(fù)選取容量為n的樣本時(shí),由樣本方差的一切能夠取值構(gòu)成的相對頻數(shù)分布對于來自正態(tài)總體XN(,2)的簡單隨機(jī)樣本,那么比值 的抽樣分布服從自在度為 (n -1) 的2分布,即49兩個(gè)總體都為正態(tài)分布,即 兩個(gè)樣本均值之差 的抽樣分布服從正態(tài)分布,其分布的數(shù)學(xué)期望為兩個(gè)總體均值之差方差為各自的方差之和 四兩個(gè)樣本均值之差的抽樣分布50五兩個(gè)樣本比率之差的抽樣分布獨(dú)立地從兩個(gè)二項(xiàng)分布的總體分別抽取容量為n 1和n2 的兩個(gè)樣本。當(dāng)兩個(gè)樣本都為大樣本

19、時(shí), 兩個(gè)樣本的比例差的抽樣分布近似服從正態(tài)分布,其分布的均值和方差為51六兩個(gè)樣本方差比的分布1. 兩個(gè)總體都為正態(tài)分布,即 X1N(1 ,12),X2N(2 ,22 )2. 從兩個(gè)總體中分別抽取容量為n1和n2的獨(dú)立樣本3. 兩個(gè)樣本方差比的抽樣分布,服從分子自在度為(n1-1),分母自在度為(n2-1) 的F分布,即 F分布523.6 中心極限定理(central limit theorem)中心極限定理: 設(shè)從均值為,方差為 2的一個(gè)恣意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí)樣本均值的抽樣分布近似服從均值為方差為2/n的正態(tài)分布53樣本均值的抽樣分布與中心極限定理 = 50 =10X總

20、體分布n = 4抽樣分布xn =16當(dāng)總體服從正態(tài)分布N(,2)時(shí),來自該總體的一切容量為n的樣本的均值x也服從正態(tài)分布,x 的數(shù)學(xué)期望為,方差為2/n。即xN(,2/n)54中心極限定理(central limit theorem)當(dāng)樣本容量足夠大時(shí)(n 30) ,樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為 2的一個(gè)恣意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布一個(gè)恣意分布的總體x55資料:統(tǒng)計(jì)量的參數(shù)符號(hào)名稱樣 本總 體定義從總體中抽出的部分單位數(shù)研究對象的全部單位總數(shù)特征統(tǒng) 計(jì) 量參 數(shù)符號(hào)樣本容量:n 樣本平均數(shù):樣本比例:p樣本標(biāo)準(zhǔn)差:s樣本方差:總體容量:N總體平均數(shù):總體比例:總體標(biāo)準(zhǔn)差:總體方差:56資料:2分布樣本方差的抽樣分布5758分布的變量值一直為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論