




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
目錄抽樣調查概述抽樣估計的原理抽樣分布SPSS在概率論中的應用當前1頁,總共106頁。5.1抽樣調查概述當前2頁,總共106頁。抽樣調查:按照一定的規(guī)則從總體中取出一部分單元組成一個樣本,并收集樣本的數據資料的過程,簡稱為抽樣。樣本:按照一定的抽樣規(guī)則從總體中抽取的一部分單位組成的集合。根據抽樣的原則不同,抽樣方法有隨機抽樣和非隨機抽樣兩種。隨機抽樣:根據一個已知的概率來抽取樣本單位,也稱隨機抽樣非隨機抽樣:研究人員有意識地選取樣本單位,樣本單位的選取不是隨機的。當前3頁,總共106頁。隨機抽樣的特點:按一定的概率以隨機原則抽取樣本;抽取樣本時,使每個單位都有一定的機會被抽中。每個單位被抽中的概率是已知的,或是可以計算出來的;當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率。當前4頁,總共106頁。5.1.1簡單隨機抽樣簡單隨機抽樣:從總體N個單位中抽取n個單位作為樣本時,使得每一個總體單位都有相同的機會(概率)被抽中也稱純隨機抽樣是抽樣調查中應用最多的方法之一也是最基本的抽樣方法之一當前5頁,總共106頁。簡單隨機抽樣抽取元素的具體方法有:重復抽樣:從總體中抽取一個單位并加以計量后,把這個單位放回到總體中再抽取第二個單位,直到抽取n個單位為止;不重復抽樣:一個單位被抽中后不再放回總體,然后再從所剩下的單位中抽取第二個單位,直到抽出n個單位為止。當前6頁,總共106頁。特點:簡單、直觀,在抽樣框完整時,可直接從中抽取樣本;用樣本統(tǒng)計量對目標量進行估計比較方便。局限性:當N很大時,不易構造抽樣框;抽出的單位很分散,給實施調查增加了困難;沒有利用其他輔助信息以提高估計的效率。當前7頁,總共106頁。5.1.2分層抽樣分層抽樣:在抽樣之前先將總體的單位按某種特征或某種規(guī)則劃分為若干層(類),然后從不同的層中獨立、隨機地抽取一定數量的單位組成一個樣本,也稱分類抽樣(stratifiedsampling)。在分層或分類時,應使層內各單位的差異盡可能小,而使層與層之間的差異盡可能大。當前8頁,總共106頁。分層抽樣的優(yōu)點:既可以對總體進行估計,也可以對各層的子總體進行估計;抽樣的組織和實施都比較方便;分層抽樣的樣本分布在各個層內,從而使樣本在總體中的分布比較均勻;估計的精度高。當前9頁,總共106頁。5.1.3系統(tǒng)抽樣系統(tǒng)抽樣:在抽樣中先將總體各單位按某種順序排列,并按某種規(guī)則在一定的范圍內隨機確定一個起點,然后每隔一定的間隔抽取一個單位,直到抽取n個單位為止,也稱等距抽樣或機械抽樣。從數字1到k之間隨機抽取一個數字r作為初始單位,然后依次取r+k,r+2k,…,r+(n-1)k優(yōu)點:簡便易行;系統(tǒng)抽樣的樣本在總體中的分布一般比較均勻,由此抽樣誤差通常要小于簡單隨機抽樣。缺點:對估計量方差的估計比較困難。當前10頁,總共106頁。5.1.4整群抽樣整群抽樣:調查時先將總體劃分成若干群,然后再以群作為調查單位從中抽取部分群,進而對抽中的各個群中所包含的所有個體單位進行調查和觀察。特點:抽樣時只需群的抽樣框,可簡化工作量;調查的地點相對集中,節(jié)省調查費用,方便調查的實施。缺點:估計的精度較差。當前11頁,總共106頁。5.2抽樣估計的原理當前12頁,總共106頁。抽樣估計:在抽樣調查的基礎上,利用樣本的數據資料計算樣本指標,以樣本特征值對總體特征值做出具有一定可靠程度的估計和判斷。是由部分推斷總體的一種認識方法,建立在隨機取樣的基礎上,主要運用不確定的概率估計方法(分布理論、大數定律、中心極限定理和抽樣分布理論),其誤差可以事先計算并加以控制。其目的是用樣本統(tǒng)計量來推斷總體參數。當前13頁,總共106頁。在簡單隨機重復抽樣中,每次抽樣都是獨立的。如果從總體N個單元中抽取容量為n的樣本,隨機變量Xi表示第i次抽樣的結果,則Xi服從在總體N個單元上均勻取值的多項分布,所以為獨立同分布隨機變量序列X1,X2,…,Xn和的一個取值,其中當前14頁,總共106頁。如果總體中具有性質的A單元的比率為π,隨機變量Yi=1表示第i次抽樣取得的樣本單元具有性質A,否則Yi=0,則Yi服從概率為π的兩點分布,所以np為獨立同分布隨機變量序列Y1,Y2,…,Yn和的一個取值,其中關于獨立同分布隨機變量和的概率分布,大數定律和中心極限定理給出了很好的解釋。當前15頁,總共106頁。5.2.1抽樣估計的基本理論概率與概率分布必然現象(確定性現象)變化結果是事先可以確定的,一定的條件必然導致某一結果;這種關系通常可以用公式或定律來表示。隨機現象(不確定現象)在一定條件下可能發(fā)生也可能不發(fā)生的現象;個別觀察的結果完全是偶然的、隨機會而定;大量觀察的結果會呈現出某種規(guī)律性(隨機性中寓含著規(guī)律性)——統(tǒng)計規(guī)律性。十五的夜晚能看見月亮?十五的月亮比初十圓!當前16頁,總共106頁。1.隨機試驗嚴格意義上的隨機試驗滿足三個條件:試驗可以在系統(tǒng)條件下重復進行;試驗的所有可能結果是明確可知的;每次試驗前不能肯定哪一個結果會出現。廣義的隨機試驗是指對隨機現象的觀察(或實驗)實際應用中多數試驗不能同時滿足上述條件,常常從廣義角度來理解。當前17頁,總共106頁。2.隨機事件隨機事件(簡稱事件):隨機試驗的某一個可能結果,常用大寫英文字母A、B、……來表示。基本事件(樣本點):不可能再分成為兩個或更多事件的事件。復合事件:由簡單事件組合而成的事件。樣本空間():基本事件的全體(全集)。當前18頁,總共106頁。兩個特例必然事件:在一定條件下,每次試驗都必然發(fā)生的事件。只有樣本空間才是必然事件不可能事件:在一定條件下,每次試驗都必然不會發(fā)生的事件。不可能事件是一個空集(Φ)當前19頁,總共106頁。3.隨機事件的概率概率:用來度量隨機事件發(fā)生可能性大小的數值。必然事件的概率為1,表示為P(
)=1不可能事件發(fā)生的可能性是零,P(
)=0隨機事件A的概率介于0和1之間,0≤P(A)
≤1概率的三種定義,給出了確定隨機事件概率的三條途經。當前20頁,總共106頁。概率的古典定義前提:古典概型定義(公式)【例】設有50件產品,其中有5件次品,現從這50件中任取2件,求抽到的兩件產品均為合格品的概率是多少?抽到的兩件產品均為次品的概率又是多少?當前21頁,總共106頁。概率的統(tǒng)計定義若在相同的條件下重復進行的n次試驗中,事件A發(fā)生了m次,當試驗次數n很大時,事件A發(fā)生頻率m/n穩(wěn)定地在某一常數p上下波動,而且這種波動的幅度一般會隨著試驗次數增加而縮小,則定義p為事件A發(fā)生的概率當n相當大時,可用事件發(fā)生的頻率m/n作為其概率的一個近似值——計算概率的統(tǒng)計方法(頻率方法)當前22頁,總共106頁?!纠扛鶕诺涓怕识x可算出,拋一枚質地均勻的硬幣,出現正面與出現反面的概率都是0.5。歷史上有很多人都曾經做過拋硬幣試驗。試驗者試驗次數正面出現的頻率蒲豐40400.5069K.皮爾遜120000.5016K.皮爾遜240000.5005羅曼諾夫斯基806400.4979當前23頁,總共106頁?!纠磕车貐^(qū)幾年來新生兒性別的統(tǒng)計資料如下表所示,由此可判斷該地區(qū)新生兒為男嬰的概率是多少?觀察年份新生兒數(個)男嬰數(個)男嬰比例(%)200016248270.509200112056220.516200215127740.512200314077150.508當前24頁,總共106頁。主觀概率有些隨機事件發(fā)生的可能性,既不能通過等可能事件個數來計算,也不能根據大量重復試驗的頻率來近似。主觀概率——依據人們的主觀判斷而估計的隨機事件發(fā)生的可能性大小。例如某經理認為新產品暢銷的可能性是80%人們的經驗、專業(yè)知識、對事件發(fā)生的眾多條件或影響因素的分析等等,都是確定主觀概率的依據。當前25頁,總共106頁。4.概率的性質非負性:對任意事件A,有P(A)≥0規(guī)范性:必然事件的概率為1,即:P()=1可加性:若A與B互斥,則P(A∪B)=P(A)+P(B)上述三條基本性質,也稱為概率的三條公理。當前26頁,總共106頁。概率的公理化定義概率的以上三種定義,各有其特定的應用范圍,也存在局限性,都缺乏嚴密性古典定義要求試驗的基本事件有限且具有等可能性統(tǒng)計定義要求試驗次數充分大,但試驗次數究竟應該取多大、頻率與概率有多么接近都沒有確切說明主觀概率的確定又具有主觀隨意性蘇聯數學家柯爾莫哥洛夫于1933年提出了概率的公理化定義通過規(guī)定應具備的基本性質來定義概率公理化定義為概率論嚴謹的邏輯推理打下了堅實的基礎當前27頁,總共106頁。5.條件概率條件概率:在某些附加條件下計算的概率在已知事件B已經發(fā)生的條件下A發(fā)生的條件概率——P(A|B)條件概率的一般公式:其中P(B)>0。乘法公式:
P(AB)
=P(A)·P(B|A)
或P(AB)=P(B)·P(A|B)當前28頁,總共106頁。P(A|B)=在B發(fā)生的所有可能結果中AB發(fā)生的概率。即在樣本空間?中考慮的條件概率P(A|B),就變成在新的樣本空間B中計算事件AB的概率問題了。一旦事件B已發(fā)生AB?ABBAB當前29頁,總共106頁。【例】某公司甲乙兩廠生產同種產品。甲廠生產400件,其中一級品為280件;乙廠生產600件,其中一級品有360件。若要從該廠的全部產品中任意抽取一件,試求:①已知抽出產品為一級品的條件下該產品出自甲廠的概率;②已知抽出產品出自甲廠的條件下該產品為一級品的概率。解:設A=“甲廠產品”,B=“一級品”,則:P(A)=0.4,P(B)=0.64,P(AB)=0.28①所求概率為事件B發(fā)生條件下A發(fā)生的條件概率P(A|B)=0.28/0.64②所求概率為事件A發(fā)生條件下B發(fā)生的條件概率P(B|A)=0.28/0.4當前30頁,總共106頁?!纠繉?-1中的問題(從這50件中任取2件產品,可以看成是分兩次抽取,每次只抽取一件,不放回抽樣)解:A1=第一次抽到合格品
A2=第二次抽到合格品
A1A2=抽到兩件產品均為合格品當前31頁,總共106頁。6.事件的獨立性兩個事件獨立一個事件的發(fā)生與否并不影響另一個事件發(fā)生的概率P(A|B)=P(A),或P(B|A)=P(B)獨立事件的乘法公式:
P(AB)
=P(A)·P(B)推廣到n個獨立事件,有:P(A1…An)=P(A1)P(A2)…P(An)當前32頁,總共106頁。7.隨機變量隨機變量——表示隨機試驗結果的變量取值是隨機的,事先不能確定取哪一個值一個取值對應隨機試驗的一個可能結果用大寫字母如X、Y、Z...來表示,具體取值則用相應的小寫字母如x、y、z…來表示根據取值特點的不同,可分為:離散型隨機變量——取值可以一一列舉連續(xù)型隨機變量——取值不能一一列舉當前33頁,總共106頁。8.離散型隨機變量的概率分布X的概率分布——X的有限個可能取值為xi與其概率pi(i=1,2,3,…,n)之間的對應關系概率分布具有如下兩個基本性質:
pi≥0,i=1,2,…,n;
當前34頁,總共106頁。離散型概率分布的表示概率函數:P(X=xi)=pi分布列:分布圖:X=xix1x2…xnP(X=xi)=pip1p2…pn當前35頁,總共106頁。離散型隨機變量的數字特征數學期望:方差:性質:當前36頁,總共106頁。伯努利試驗伯努利試驗:每次試驗有且僅有兩種可能結果。用“成功”代表所關心的結果,相反的結果為“失敗”。每次試驗中“成功”的概率都是p。n重伯努利試驗:將伯努利實驗獨立地重復進行n次。當前37頁,總共106頁。二項分布在n重伯努利試驗中,“成功”的次數X服從參數為n、p的二項分布,記為X~B(n,p)二項分布的概率函數:二項分布的數學期望和方差:n=1時,二項分布就成了二點分布(0-1分布)。當前38頁,總共106頁。二項分布圖形p=0.5時,二項分布是以均值為中心對稱p≠0.5時,二項分布總是非對稱的p<0.5時峰值在中心的左側p>0.5時峰值在中心的右側p=0.3p=0.5p=0.7二項分布圖示當前39頁,總共106頁。9.連續(xù)型隨機變量的概率分布連續(xù)型隨機變量的概率分布只能表示為:數學函數——概率密度函數f(x)和分布函數F(x)圖形——概率密度曲線和分布函數曲線概率密度函數f(x)的函數值不是概率連續(xù)型隨機變量取某個特定值的概率等于0只能計算隨機變量落在一定區(qū)間內的概率由x軸以上、概率密度曲線下方面積來表示當前40頁,總共106頁。對任意的實數x,函數F(x)=P{X<x}為隨機變量X的分布函數。分布函數滿足下述兩個條件:0≤F(x)≤1;F(x)是一個單調非減的函數。當前41頁,總共106頁。概率密度f(x)的性質概率密度函數f(x)為分布函數的導數。概率密度函數滿足下述兩個條件:f(x)≥0;
注意,對任意x,f(x)的值并不是一個概率。當前42頁,總共106頁。隨機變量X落在區(qū)間[a,b)上的概率:即軸上方,概率密度曲線下方,直線X=a和X=b之間的面積。fX(x)abx事件{a≤X≤b}Ω當前43頁,總共106頁。連續(xù)型隨機變量X的數字特征數學期望:方差:性質:當前44頁,總共106頁。正態(tài)分布X~N(μ,σ2
),其概率密度為:正態(tài)分布的均值和方差均值E(X)=μ方差D(X)=σ2當前45頁,總共106頁。正態(tài)曲線σ相同而μ不同的正態(tài)曲線
2xf(x)μ相同而σ不同的正態(tài)曲線f(x)σ較小σ較大x正態(tài)曲線的主要特性:關于x=μ對稱的鐘形曲線;參數μ決定正態(tài)曲線的中心位置;參數σ決定正態(tài)曲線的陡峭或扁平程度;以X軸為漸近線,即當x→±∞時,f(x)→0。當前46頁,總共106頁。標準正態(tài)分布μ=0、σ
=1的正態(tài)分布,記為N(0,1)。其概率密度φ(x),分布函數Ф(x)X~N(μ,σ2),則Z~N(0,1
)若Z~N(0,1
),則有:Ф(-a)=1-Ф(a)P(|Z|≤a)=2Ф(a)-1標準化標準正態(tài)曲線
-a0aφ(z)zΦ(a)當前47頁,總共106頁?!纠磕硰S生產的某種節(jié)能燈管的使用壽命服從正態(tài)分布,對某批產品測試的結果,平均使用壽命為1050小時,標準差為200小時。試求:使用壽命在500小時以下的燈管占多大比例?使用壽命在850~1450小時的燈管占多大比例?以均值為中心,95%的燈管的使用壽命在什么范圍內?當前48頁,總共106頁。解:X=使用壽命,X~N(1050,2002
)95%的燈管壽命在均值左右392(即658~1442)小時。當前49頁,總共106頁。3σ原則|X-μ|>3σ的概率很小,因此可認為正態(tài)隨機變量的取值幾乎全部集中在[μ-3σ,μ+3σ]區(qū)間內。廣泛應用:產品質量控制判斷異常情況……當前50頁,總共106頁。z分布的α分為點對于給定的α(0<α<1),稱滿足條件的點zα為z分布上的α分位點。由z分布概率密度函數的對稱性有【例】求z0.05和z0.95。當前51頁,總共106頁。正態(tài)分布最常用、最重要大千世界中許多常見的隨機現象服從或近似服從正態(tài)分布例如:測量誤差,同齡人的身高、體重,棉紗的抗拉強度,設備的使用壽命,農作物的產量…特點是“中間多兩頭少”由于正態(tài)分布特有的數學性質,正態(tài)分布在很多統(tǒng)計理論中都占有十分重要的地位正態(tài)分布是許多概率分布的極限分布統(tǒng)計推斷中許多重要的分布(如χ2分布、t分布、F分布)都是在正態(tài)分布的基礎上推導出來的當前52頁,總共106頁。10.χ2分布總體隨機變量X~N(μ,σ2),為該總體的個樣本值的樣本平均數x1,x2,…,xn,則樣本統(tǒng)計量
是自由度為n-1的卡方分布,記作χ2(n-1)
。注意:χ2整個是一個符號,并不是χ的平方。當前53頁,總共106頁。χ2分布的統(tǒng)計特性:χ2分布的變量值始終為正;χ2(n)分布的形狀取決于其自由度n的大小,通常為不對稱的右偏分布,但隨著自由度的增大逐漸趨于對稱;χ2分布的期望為:E(χ2(n))=n,方差為:D(χ2(n))=2n。χ2分布具有可加性。若U~χ2(n1),V~χ2(n2),則U+V~χ2(n1+n2)。當前54頁,總共106頁。不同自由度的χ2(n)分布當前55頁,總共106頁。對于給定的α(0<α<1),稱滿足條件的點為χ2(n)分布的α分為點。當前56頁,總共106頁。χ2分布α分為點的求法:對于n≤45的α分為點可查表求得;當n充分大(n>45)時,近似地有其中zα為標準正態(tài)分布上的α分為點當前57頁,總共106頁。例題分析
n=12,α=0.05,求
n=12,α=0.95,求
n=18,α=0.95,求和使得
n=50,α=0.05,求當前58頁,總共106頁。11.t分布總體隨機變量X~N(μ,σ2),x1,x2,…,xn為取自該總體的n個隨機樣本,當σ未知時,以樣本方差s替代,則是自由度為n-1的t分布,記為t(n-1)。當前59頁,總共106頁。t分布的統(tǒng)計特性:t(n-1)分布具有對稱性,且以t=0為對稱軸,其隨機變量取值范圍為(-∞,∞)t(n-1)分布期望值為0,方差為(n-1)/(n-3),即當前60頁,總共106頁。t(n-1)分布的形狀類似標準正態(tài)分布,但由于t(n-1)的方差大于1(當n>3時,(n-1)/(n-3)>1),所以t(n-1)分布比標準正態(tài)分布更分散。即t(n-1)的概率密度函數是中央部分較標準正態(tài)分布低,而兩尾部分則較標準正態(tài)分布高。當抽樣數目n增大時,t(n-1)的方差越來越接近1,同時t(n-1)分布的形狀也越來越接近標準正態(tài)分布。理論上,當n→∞時t(n-1)與標準正態(tài)分布完全一致。一般認為n≥30就說t(n-1)與標準正態(tài)分布非常接近。當前61頁,總共106頁。當前62頁,總共106頁。對于給定的α(0<α<1),稱滿足條件的點tα(n)為t分布上的α分為點。由t分布概率密度函數的對稱性有t分布α分為點的求法:對于n≤45的α分為點可查表求得;當n充分大(n>45)時,近似地有當前63頁,總共106頁。當前64頁,總共106頁。例題分析
n=9,α=0.05,求t0.05(9)
n=9,α=0.95,求t0.95(9)
n=18,求t0.025(18)及t0.975(18),使得P(t0.975(18)≤t≤t0.025(18))=0.95
n=50,α=0.05,求t0.05(50)當前65頁,總共106頁。12.F分布設隨機變量U~χ2(n1),V~χ2(n2),且U,V獨立,則隨機變量
服從自由度為(n1,n2)的F分布,記為F(n1,n2)。由定義可知,如果F~F(n1,n2),則1/F~F(n2,n1)。當前66頁,總共106頁。當前67頁,總共106頁。對于給定的α(0<α<1),稱滿足
的點Fα(n1,n2)為分布F(n1,n2)的α分位點。容易證明【例5.5】求F0.05(10,5)和F0.95(5,10)。當前68頁,總共106頁。當前69頁,總共106頁。二、大數定律與中心極限定理大數定律是闡述大量同類隨機現象的平均結果穩(wěn)定性的一系列定理的總稱獨立同分布大數定律——設X1,X2,…,Xn是獨立同分布的隨機變量序列,且存在有限的數學期望E(Xi)=μ(i=1,2,…),則對任意小的正數ε,有當前70頁,總共106頁。該定律表明:當n充分大時,相互獨立且服從同一分布的一系列隨機變量取值的算術平均數,與其數學期望μ的偏差任意小的概率接近于1。該定律給出了平均值具有穩(wěn)定性的科學描述,從而為使用樣本均值去估計總體均值(數學期望)提供了理論依據。當前71頁,總共106頁。伯努利大數定律設m是n次獨立重復試驗中事件A發(fā)生的次數,p是每次試驗中事件A發(fā)生的概率,則對任意的ε>0,有該定律表明,當重復試驗次數n充分大時,事件A發(fā)生的頻率m/n依概率收斂于事件A發(fā)生的概率。闡明了頻率具有穩(wěn)定性,提供了用頻率估計概率的理論依據。當前72頁,總共106頁。2.中心極限定理獨立同分布的中心極限定理——設X1,X2,…是獨立同分布的隨機變量序列,且存在有限的μ和方差σ2(i=1,2,…),當n→∞時,或當前73頁,總共106頁。上述定理表明:獨立同分布的隨機變量序列不管服從什么分布,其n項總和的分布趨近于正態(tài)分布??傻贸鋈缦陆Y論:不論總體服從何種分布,只要其數學期望和方差存在,對這一總體進行重復抽樣時,當樣本量n充分大,就趨于正態(tài)分布。該定理為均值的抽樣推斷奠定了理論基礎。當前74頁,總共106頁。例題分析【例】有一測繪小組對甲乙兩地之間的距離采用分段測量的方法進行了測量,將甲乙之間的距離分成為100段。設每段測量值的誤差(單位:cm)服從區(qū)間(-1,1)上的均勻分布。試問:對甲乙兩地之間距離的測量值的總誤差絕對值超過10cm的概率是多少?解:設Xi=第i段測量誤差(i=1,2,…),由于Xi服從均勻分布,E(Xi)=μ=0,D(Xi
)=σ2=[1-(-1)]2/12=1/3。根據上述中心極限定理,可得,總誤差Y=ΣXi~N(0,100/3)當前75頁,總共106頁。棣莫佛-拉普拉斯中心極限定理設隨機變量X服從二項分布B(n,p)的,那么當n→∞時,X服從均值為np、方差為np(1-p)的正態(tài)分布,即:該定理為用頻率估計概率奠定了基礎?;颍寒斍?6頁,總共106頁。為什么很多隨機現象呈正態(tài)分布自然界和社會經濟中,很多現象可以視為眾多獨立隨機變量之總和。例如:一個城市的居民生活用電總量是大量相互獨立居民戶用電量的總和。炮彈射擊的誤差,也可以看作是很多因素引起的小誤差之總和。由中心極限定理可知,即使各單個隨機變量的分布并不明確,但只要它們存在有限均值和方差,這個眾多獨立的隨機變量之總和的分布就趨近于正態(tài)分布。當前77頁,總共106頁。5.2.2抽樣估計的基本概念總體參數:總體的數量特征,簡稱為參數,一般是未知的常數。樣本統(tǒng)計量:根據樣本資料計算出來的,其值隨著樣本的不同而變化,是一個關于樣本的隨機變量??傮w參數樣本統(tǒng)計量總體平均數:μ樣本平均數:總體比率:π
樣本比率:p總體方差:σ2
樣本方差:s2
總體標準差:σ樣本標準差:s
當前78頁,總共106頁。抽樣誤差是指抽樣估計的過程中要重點控制的對象,主要分為三種:抽樣實際誤差:某一次具體抽樣中,樣本統(tǒng)計量的值與總體參數真實值之間的偏差。抽樣平均誤差:樣本統(tǒng)計量的所有可能取值與總體指標之間的平均差異程度。當樣本統(tǒng)計量的期望恰好等于被估計的總體參數時,其抽樣平均誤差就是該隨機變量的標準差,稱為抽樣標準差。抽樣極限誤差:一定概率下抽樣誤差的可能范圍,說明樣本統(tǒng)計量在總體參數周圍變動的范圍,記作Δ,又稱為允許誤差。當前79頁,總共106頁。5.3抽樣分布當前80頁,總共106頁。5.3.1總體分布總體中各元素的觀察值所形成的分布;分布通常是未知的;可以假定它服從某種分布??傮w當前81頁,總共106頁。5.3.2樣本分布一個樣本中各觀察值的分布也稱經驗分布當樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布樣本當前82頁,總共106頁。5.3.3抽樣分布抽樣分布:是由來自某總體樣本的n個觀測值計算的統(tǒng)計量的概率分布,是一種理論分布。從同一個總體中重復選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數分布。來自同一總體中容量相同的所有可能樣本。提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎,也是抽樣推斷科學性的重要依據。當前83頁,總共106頁。例題分析【例】設一個總體,含有4個元素(個體),即總體單位數N=4。4個個體分別為x1=1,x2=2,x3=3,x4=4。總體的均值、方差及分布如下:總體分布14230.1.2.3均值和方差當前84頁,總共106頁。現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結果為:所有可能的n=2的樣本(共16個)第一個觀察值第二個觀察值123411,11,21,31,422,12,22,32,433,13,23,33,444,14,24,34,4當前85頁,總共106頁。計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布:16個樣本的均值()第一個觀察值第二個觀察值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.0x樣本均值的抽樣分布1.000.10.20.3P(x)1.53.04.03.52.02.5當前86頁,總共106頁。的分布律1.01.52.02.53.03.54.0P()1/162/163/164/163/162/161/16比較及結論:樣本均值的均值(數學期望)等于總體均值樣本均值的方差等于總體方差的1/n當前87頁,總共106頁。
=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x當前88頁,總共106頁。抽樣分布的形成過程總體計算樣本統(tǒng)計量如:樣本均值、比例、方差樣本當前89頁,總共106頁。一、樣本均值的抽樣分布由獨立同分布中心極限定理,如果n充分大,當重復抽樣時,樣本均值服從均值為μ,方差為σ2的正態(tài)分布,即即一般認為,樣本容量n充分大的條件為n≥30。稱為樣本均值的抽樣標準差。當前90頁,總共106頁。的分布趨于正態(tài)分布的過程當前91頁,總共106頁。由標準正態(tài)分布的性質,有當前92頁,總共106頁。當不重復抽樣時,可以證明,樣本均值仍服從正態(tài)分布,其均值仍為總體均值μ,而方差變?yōu)槠渲?N-n)/(N-1)為修正系數。當N>>n時,修正系數可取近似值1,即(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 樂趣初二語文作文
- 滾動軸承加工工藝學考核試卷
- 上海高三語文二模作文青浦
- 彈射玩具企業(yè)生產工藝改進與創(chuàng)新考核試卷
- 稀土金屬壓延加工質量控制流程優(yōu)化實踐考核試卷
- 刨花板行業(yè)綠色采購與原材料供應鏈管理考核試卷
- 入院護理宣教 2
- 4-3鐘控電位觸發(fā)器
- 山東省滕州市實驗高級中學2024?2025學年高一下學期第一次調研考試 數學試題(含解析)
- 四川省自貢市高新區(qū)六校2025屆初三第三次聯考(浙江版)生物試題試卷含解析
- 試劑售后承諾書
- 小學校本課程-生活中的陌生人教學課件設計
- 榆陽區(qū)可可蓋煤礦礦山地質環(huán)境保護與土地復墾方案
- 滬教版三年級下冊數學第二單元 用兩位數乘除 測試卷及參考答案【培優(yōu)a卷】
- 中小型病理技術團隊崗位設置及績效分配現狀分析
- 防護棚驗收表
- 磁粉檢測試題庫
- 教科版-四年級下-第一單元-快樂讀書屋一:皎皎空中孤月輪 名師獲獎
- 2022-2023學年天津市部分區(qū)高二(下)期中數學試卷及答案解析
- 醫(yī)院侵害未成年人案件強制報告制度培訓課件
- 內蒙古曹四夭鉬礦床原生暈特征及深部找礦預測
評論
0/150
提交評論