概率分布和抽樣分布_第1頁
概率分布和抽樣分布_第2頁
概率分布和抽樣分布_第3頁
概率分布和抽樣分布_第4頁
概率分布和抽樣分布_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

概率分布和抽樣分布一、常用概率分布累積函數(shù)的命令:標(biāo)準(zhǔn)正態(tài)分布累積函數(shù)norm(X)t分布右側(cè)累積函數(shù)ttail(df,X),其中df是自由度2分布累積函數(shù)chi2(df,X),其中df是自由度2分布右側(cè)累積函數(shù)chi2tail(df,X),其中df是自由度F分布累積函數(shù)F(df1,df2,X),df1為分子自由度,df2為分母自由度F分布右側(cè)累積函數(shù)Ftail(df1,df2,X),df1為分子自由度,df2為分母自由度二、概率分布的臨界值計(jì)算的命令:1.正態(tài)分布的臨界值計(jì)算函數(shù)invnorm(P)2.t分布的臨界值計(jì)算函數(shù)invttail(df,P)3.2分布的臨界值計(jì)算函數(shù)invchi2(df,P)或invchi2tail(df,P)4.F分布的臨界值計(jì)算函數(shù)invF(df1,df2,P)或invFtail(df1,df2,P)三、應(yīng)用舉例:命令:displaynorm(X)/ttail(df,X)/chi2(df,X)/chi2tail(df,X)/F(df1,df2,X)/Ftail(df1,df2,X)/…注意:display可簡寫為di例1.正態(tài)分布計(jì)算X服從N(0,1),計(jì)算概率P(X<1.96).displaynorm(1.96).9750021即概率P(X<1.96)=0.9750021如果,計(jì)算概率P(X>1.96),則.di1-norm(1.96).0249979即概率P(X>1.96)=0.0249979X服從N(,2),則,因此對其他正態(tài)分布只要在函數(shù)括號中插入一個上述表達(dá)式就可以得到相應(yīng)概率。例如:X服從N(100,62),計(jì)算概率P(X<111.76),則操作如下:.dinorm((111.76-100)/6).9750021即:概率P(X<111.76)=0.9750021例2.2分布累積概率計(jì)算設(shè)X服從自由度為1的2分布,計(jì)算概率P(X>3.84),則操作如下:.di1-chi2(1,3.84).05004353概率P(X>3.84)=0.05004353例3.2分布右側(cè)累積概率計(jì)算設(shè)X服從自由度為1的2分布,計(jì)算概率P(X>3.84),則操作如下:.dichi2tail(1,3.84).05004353概率P(X>3.84)=0.05004353例4.t分布右側(cè)累積概率計(jì)算設(shè)t服從自由度為10的t分布,計(jì)算概率P(t>2.2),操作如下:.dittail(10,2.2).02622053概率P(t>2.2)=0.02622053(注意:這是右累積函數(shù))例5.F分布累積概率計(jì)算設(shè)F服從F(3,27),計(jì)算概率P(F<1),操作如下:.diF(3,27,1)注意這里的函數(shù)是大寫F,stata軟件中是區(qū)分大小寫的.59208514概率P(F<1)=0.59208514例6.F分布右側(cè)累積概率計(jì)算設(shè)F服從F(3,27),計(jì)算概率P(F<1),操作如下:.di1-Ftail(3,27,1)注意這里的函數(shù)是大寫F,stata軟件中是區(qū)分大小寫的.59208514概率P(F<1)=0.59208514例7.雙側(cè)U0.05(即:左側(cè)累積概率為0.975),操作如下:.diinvnorm(0.975)1.959964即U0.05=1.959964例8.計(jì)算自由度為28的右側(cè)累積概率為0.025的臨界值t28,,操作如下:.diinvttail(28,0.025)2.0484071臨界值t28,=2.0484071例9.計(jì)算自由度為1的2右側(cè)累積概率為0.05的臨界值20.05,操作如下:.diinvchi2(1,0.95)3.8414591臨界值20.05=3.8414591或者操作如下:.diinvchi2tail(1,0.05)3.8414591臨界值20.05=3.8414591例10.計(jì)算分子自由度為3和分母自由度27的右側(cè)累積概率為0.05的臨界值,操作如下:.diinvF(3,27,0.95)2.9603513臨界值F0.05(3,27)=2.9603513或者操作為:.diinvFtail(3,27,0.05)2.9603513臨界值F0.05(3,27)=2.9603513四、產(chǎn)生隨機(jī)數(shù)計(jì)算機(jī)所產(chǎn)生的隨機(jī)數(shù)是通過一串周期很長的序列數(shù)模擬隨機(jī)數(shù),這串?dāng)?shù)的序列是通過某種算法依次產(chǎn)生的,故稱為偽隨機(jī)數(shù)。在實(shí)際應(yīng)用這些隨機(jī)數(shù)時(shí),這些隨機(jī)數(shù)一般都能具有真實(shí)隨機(jī)數(shù)的所有概率性質(zhì)和統(tǒng)計(jì)性質(zhì),因此可以產(chǎn)生許許多多的序列偽隨機(jī)數(shù),一個序列的第一個隨機(jī)數(shù)對應(yīng)一個數(shù),這個數(shù)稱為種子數(shù)(seed),因此可以利用給定種子數(shù),使隨機(jī)數(shù)重復(fù)實(shí)現(xiàn)。設(shè)置種子數(shù)的命令為setseed。若每次設(shè)置同一種子數(shù),則產(chǎn)生的隨機(jī)序列是相同的。產(chǎn)生(0,1)區(qū)間上的均勻分布的隨機(jī)數(shù)uniform()例如產(chǎn)生種子數(shù)為100的20個在(0,1)區(qū)間上的均勻分布的隨機(jī)數(shù),則操作如下:clear清除內(nèi)存setseed100設(shè)置種子數(shù)為100setobs20設(shè)置樣本量為20genr=uniform()產(chǎn)生20個在(0,1)區(qū)間上均勻分布的隨機(jī)數(shù)。list顯示這些隨機(jī)數(shù)結(jié)果如下r1..71852962..16467283..92580414..18337365..00673276..74133617..35999438..16345439..44555310..648904911..379943112..596489513..025134614..216440215..684847916..127001817..646625818..186928819..452238420..067132應(yīng)用:1.利用均勻分布隨機(jī)數(shù)進(jìn)行隨機(jī)分組:例:某實(shí)驗(yàn)要把20只大鼠隨機(jī)分為2組,每組10只,請制定隨機(jī)分組方案和措施。第一步、把20只大鼠編號,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20。并且標(biāo)明。第二步、用Stata軟件制定隨機(jī)分組方案,操作如下:clear清除內(nèi)存setseed200設(shè)置種子數(shù)為200setobs20設(shè)置樣本量為20rangeno120建立編號1至20genr=uniform()產(chǎn)生在(0,1)均勻分布的隨機(jī)數(shù)gengroup=1設(shè)置分組變量group的初始值為1sortr對隨機(jī)數(shù)從小到大排序replacegroup=2in11/20設(shè)置最大的10個隨機(jī)數(shù)所對應(yīng)的記錄為第2組,即:最小的10個隨機(jī)數(shù)所對應(yīng)的記錄為第1組sortno按照編號排序list顯示隨機(jī)分組的結(jié)果結(jié)果如下:norgroup1.1.951200722.2.524987623.3.512998614.4.12643915.5.586616126.6.705920927.7.263328618.8.564468829.9.1171033110.10.954065211.11.4822863112.12.3347736113.13.5678902214.14.7994431215.15.1180503116.16.9834299217.17.2807874118.18.095245119.19.9446051220.20.34675241隨機(jī)分組整理如下第一組編號3479111215171820第二組編號1256810131416192.產(chǎn)生服從正態(tài)分布N(,2)的隨機(jī)數(shù)invnorm(uniform())*+例如:產(chǎn)生10個服從正態(tài)分布N(100,62)的隨機(jī)數(shù),操作如下:clear清除內(nèi)存setseed200設(shè)置種子數(shù)為200setobs10設(shè)置樣本量為10genx=invnorm(uniform())*6+100產(chǎn)生服從N(100,62)的隨機(jī)數(shù)list顯示隨機(jī)數(shù)結(jié)果如下:x1.109.93972.100.37613.100.19554.93.139685.101.31316.103.2497.96.20138.100.97399.92.8624410.110.11373.考察樣本均數(shù)的分布由于個體變異的原因,樣本均數(shù)的抽樣誤差(其定義為樣本均數(shù)與總體均數(shù)的差值)是不可避免的,并且樣本均數(shù)的抽樣誤差是呈隨機(jī)變化的。對于一次抽樣而言,無法考察樣本均數(shù)的抽樣誤差的規(guī)律性,但當(dāng)大量地重復(fù)抽樣,計(jì)算每次抽樣的樣本均數(shù),考察樣本均數(shù)的隨機(jī)分布規(guī)律性和統(tǒng)計(jì)特征。舉例如下:利用計(jì)算機(jī)模擬產(chǎn)生100000個服從正態(tài)分布N(100,62)的樣本,樣本量分別為n=4,n=9,n=16,n=36,每個樣本計(jì)算樣本均數(shù)。這里關(guān)鍵處是要清楚什么是樣本量(每次抽樣所觀察的對象個數(shù),也就是每個樣本的個體數(shù)n)、什么是樣本個數(shù)(指抽樣的次數(shù)),現(xiàn)以n=4為例,一條記錄存放一個樣本,樣本量n=4,也就是每個樣本的第1個數(shù)據(jù)放在第1列,第2個數(shù)據(jù)放在第2列,第3個數(shù)據(jù)放在第3列,第4個數(shù)據(jù)放在第4列,因此第1行是第一個樣本,第2行是第2個樣本,第100000行是第100000個樣本,計(jì)算樣本均數(shù)放在第5列,因此共有100000個樣本均數(shù)。具體操作如下:clear清除內(nèi)存setmemory60m擴(kuò)大虛擬內(nèi)存為60Msetobs100000設(shè)置記錄數(shù)為100000setseed200設(shè)置種子數(shù)為200genx1=invnorm(uniform())*6+100產(chǎn)生第1個隨機(jī)數(shù)據(jù)genx2=invnorm(uniform())*6+100產(chǎn)生第2個隨機(jī)數(shù)據(jù)genx3=invnorm(uniform())*6+100產(chǎn)生第3個隨機(jī)數(shù)據(jù)genx4=invnorm(uniform())*6+100產(chǎn)生第4個隨機(jī)數(shù)據(jù)genmean=(x1+x2+x3+x4)/4計(jì)算平均數(shù),并且存放在變量名為meansumean以樣本均數(shù)為數(shù)據(jù),計(jì)算其平均值和標(biāo)準(zhǔn)差結(jié)果:Variable|ObsMeanStd.Dev.MinMax-------------+-----------------------------------------------------mean|10000099.983883.00222587.97424112.0461現(xiàn)共有100000個樣本,每個樣本計(jì)算一個樣本均數(shù),因此有100000個樣本均數(shù),現(xiàn)在把一個樣本均數(shù)視為一個數(shù)據(jù),把100000個樣本均數(shù)視為一個樣本量為100000的新樣本(這個樣本里有100000個),計(jì)算這100000個的平均值和標(biāo)準(zhǔn)差:得到:這100000個的平均值=99.98388非常接近總體均數(shù)=100這100000個的標(biāo)準(zhǔn)差=3.002225(理論上可以證明樣本均數(shù)的總體均數(shù)與樣本所在的總體的總體均數(shù)相同,樣本均數(shù)的標(biāo)準(zhǔn)差=)再考察這100000個的頻數(shù)圖命令:graphmean,bin(50)xlabelylabelnorm可以發(fā)現(xiàn)正態(tài)分布的樣本均數(shù)仍呈正態(tài)分布,峰的位置在=100。再考察這100000個的百分位數(shù)命令:centilemean,centile(2.55509597.5)--Binom.Interp.--Variable|ObsPercentileCentile[95%Conf.Interval]-------------+-------------------------------------------------------------mean|1000002.594.1026294.0488294.15405|595.0349494.9922395.07704|5099.982999.95786100.0057|

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論