




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
二項分布與泊松分布二項分布與泊松分布二項分布與泊松分布第一節二項分布和總體率的估計一、二項分布(一)二項分布的概念在生命科學研究中,經常會遇到一些事物,其結果可分為兩個彼此對立的類型,如一個病人的死亡與存活、動物的雌與雄、微生物培養的陽性與陰性等,這些都可以根據某種性狀的出現與否而分為非此即彼的對立事件。這種非此即彼事件構成的總體,就稱為二項總體(binomialpopulation)。二項分布與泊松分布二項分布與泊松分布二項分布與泊松分布第一節1第一節二項分布和總體率的估計一、二項分布(一)二項分布的概念
在生命科學研究中,經常會遇到一些事物,其結果可分為兩個彼此對立的類型,如一個病人的死亡與存活、動物的雌與雄、微生物培養的陽性與陰性等,這些都可以根據某種性狀的出現與否而分為非此即彼的對立事件。這種非此即彼事件構成的總體,就稱為二項總體(binomialpopulation)。第一節二項分布和總體率的估計一、二項分布第一節二項分布和總體率的估計二項分布(binomialdistribution)就是對這種只具有兩種互斥結果的離散型隨機變量的規律性進行描述的一種概率分布。由于這一種分布規律是由瑞士學者貝努里(Bernoulli)首先發現的,又稱貝努里分布。
第一節二項分布和總體率的估計二項分二項分布有兩個基本假設:
1.各事件是相互獨立的,即任一事件的發生與否,不影響其它事件的發生概率;
2.各個隨機事件只能產生相互排斥的兩種結果。
二項分布有兩個基本假設:定理:幾個相互獨立事件同時發生的概率等于各獨立事件的概率之積。定理:在幾個互不相容的事件中,任一事件發生的概率等于這幾個事件的概率之和。抓中兩黑一白的概率:P(2)=3×0.125=0.375抓中三個黑球的概率:P(3)=0.5×0.5×0.5=0.125定理:幾個相互獨立事件同時發生的概率等于各獨立事件的概率之積二項分布與泊松分布課件二項分布與泊松分布課件
各種可能發生的結果對應的概率相當于展開后的各項數值,即:
前例:π=0.8,1-π=0.2,n=3各種可能發生的結果對應的概率相當于展開后的各二項分布的概率公式
如果一個事件A,在n次獨立試驗中,每次試驗都具有概率π
,那么,這一事件A將在n次試驗中出現x次的概率為:
式中:稱二項系數。二項分布的概率公式如果一個事件A,在n次獨立試(二)二項分布的應用條件
1.各觀察單位只能具有互相對立的一種結果,屬于二項分類資料;
2.已知發生某一結果的概率為π,其對立結果的概率則為1-π
。實際工作中要求π是從大量觀察中獲得的比較穩定的數值;3.n個觀察單位的觀察結果互相獨立,即每個觀察單位的觀察結果不會影響到其它觀察單位的結果。
(二)二項分布的應用條件1.各觀察單位只能具有互相對立的(三)二項分布的性質
1.二項分布的均數和標準差二項分布的平均數:μ=nπ
上式的意義:做n次獨立試驗,某事件平均出現的次數為nπ次,這一結果較為符合人們的直觀想法。如果,生男孩這一事件的概率是1/2,則100個新生兒中可期望有nπ=100×1/2=50個是男孩。當用率表示時,μ=π
(三)二項分布的性質1.二項分布的均數和標準差(三)二項分布的性質二項分布的標準差:標準差表示x取值的離散度或變異的大小。如n=5,π=5/6,1-π=1-5/6,則:(三)二項分布的性質二項分布的標準差:(三)二項分布的性質二項分布的標準誤
若以比值或百分數表示,則標準誤為
:
σp被稱為率的標準誤(standarderrorofrate),用來反映隨機抽樣獲得的樣本率p與總體π之間的抽樣誤差大小。
(三)二項分布的性質二項分布的標準誤(三)二項分布的性質二項分布的標準誤
若以比值或百分數表示,則標準誤為
:實際工作中常用p作為π
的估計值,得:(三)二項分布的性質二項分布的標準誤(三)二項分布的性質
2.二項分布的累計概率常用的有左側累計和右側累計2種方法。從陽性率為π
的總體中隨機抽取n個個體,則(1)最多有k例陽性的概率P(x≤k)=P(0)+P(1)+……+P(k)(2)最少有k例陽性的概率P(x≥k)=P(k)+P(k+1)+……+P(n)=1-P(x≤k-1)(三)二項分布的性質2.二項分布的累計概率(三)二項分布的性質
3.二項分布的圖形二項分布的圖形,取決于兩個方面,其一為事件發生的概率π
,其二為樣本含量n。當π
=1-π
=1/2時,二項分布的圖形是對稱的;當π
<1/2時,二項分布的圖形呈左偏態;當π
>1/2時,二項分布的圖形呈右偏態;當π與1-π不變時,即使π
≠1-π
,但隨著n的增大,二項分布的的偏態程度會逐漸降低而趨于對稱。
(三)二項分布的性質3.二項分布的圖形二項分布總體不同樣本例數時的抽樣分布
二項分布總體不同樣本例數時的抽樣分布二、二項分布的應用
(一)、總體率的估計
有點值估計和區間估計。1查表法:當n較小,如n≤50時,特別是p很接近于0或1時,可由附表6百分率的置信區間表直接查出。P709orp817例:某地對13名輸卵管結扎的育齡婦女經壺腹部吻合術后,觀察其受孕情況,發現有6人受孕,據此估計該吻合術婦女的受孕的95%可信區間此例:n=13,x=6
查表得95%CI為:19%~75%。二、二項分布的應用(一)、總體率的估計二、二項分布的應用
(一)、總體率的估計
1查表法:附表6百分率的置信區間表直接列出了X≤n/2的部分。其余部分可以查n-x的陰性部分的QL~QU再相減得PLand
pUPL=1-QL1-QU例:某地調查50名兒童蛔蟲感染情況,發現有10人大便中有蛔蟲卵,問兒童蛔蟲感染率的95%置信區間是多少?此例:n=50,x=10
查表得95%CI為:10%~34%。二、二項分布的應用(一)、總體率的估計二項分布的應用
2正態近似法:應用條件:np及n(1?p)均≥5p±uαsp
例:在某地隨機抽取329人,做HBsAg檢驗,得陽性率為8.81%,求陽性率95%置信區間。已知:p=8.81%,n=329,故:
95%CI:8.81±1.96×1.56;即5.75%~11.87%。二項分布的應用2正態近似法:應用條件:np及n(1二項分布下表是用P±Uasp時要求的P值與N的大小參考數字。PnnP0.530150.450200.380240.2200400.1600600.05140070二項分布下表是用P±Uasp時要求的P值與N的大小參二項分布的應用(二)差異的顯著性檢驗1直接法例某醫院用甲藥治療某病,其治愈率為70%,今用乙藥治療該病10人,治愈9人,問甲乙兩藥療效有無差別?已知:π=0.7,1-π=0.3,假設兩藥療效無差別,則治愈與非治愈的概率應符合二項分布,即:
二項分布的應用(二)差異的顯著性檢驗如果甲乙兩藥療效無差別,按甲藥的治愈率(70%)用乙藥治療10人應治愈7人,實際治愈9人,相差2人。雙側檢驗,計算相差±2人及2人以上的總概率,即x≥9和x≤5的概率之和:ΣP=0.000006+0.000138+0.001447+0.009002+0.036757+0.102919+0.121061+0.028248=0.299577或:ΣP=1-(0.200121+0.266828+0.233474)=0.299577如果甲乙兩藥療效無差別,按甲藥的治愈率(70%)用乙藥治療1
P=0.299577>0.05,差異無統計學意義,尚不能認為乙藥療效優于甲藥。
本例如采用單側檢驗,即要求判斷乙藥療效優于甲藥?此時只需計算相差2人及以上的總概率:ΣP=P(9)+P(10)=0.121061+0.028248=0.149309P>0.05,差異無統計學意義,尚不能認為乙藥療效優于甲藥。P=0.299577>0.05,差異無統計學意義,尚不3.研究疾病的家族聚集性
例某單位發生乙肝暴發流行,經調查4口之家共288戶,其中無病例的167戶,發生1例的51戶,2例的50戶,3例的17戶,全家發病的3戶,問乙肝的發病是否具有家族集聚性?
π=214/1152=0.1858,1-π=0.8142
計算發病數x=0,1,2,3,4時的理論概率和理論戶數。列表,比較實際戶數與理論戶數差別有無顯著性意義。
3.研究疾病的家族聚集性二項分布展開計算表發病人數展開式概率理論戶數實際戶數xCxnπ
x(1-π)n-xPT=P×288A0C04
(0.1858)0(0.8142)40.4395126.571671C14
(0.1858)1(0.8142)30.4011115.52
512C24
(0.1858)2(0.8142)20.1373
39.54
503C34
(0.1858)3(0.8142)10.0209
6.02
174C44
(0.1858)4(0.8142)00.0012
0.35
3二項分布展開計算表發病人數展開式概率理論戶數實際戶數xCxn二項分布擬合優度的χ2檢驗發病人數實際戶數理論戶數(A-T)2(A-T)2xATT0167126.571634.5812.911
51115.524162.8336.042
50
39.54
109.41
2.773
17
6.02
120.5620.034
3
0.35
7.0220.06χ2=91.81,按ν=組數-2=5-2=3查χ2界值表得:χ20.01(3)=11.345,故P<0.01,說明該疾病的家庭分布不符合二項分布,可以認為該病有家族集聚性。二項分布擬合優度的χ2檢驗發病人數實際戶數理論戶數(A-T)(五)群檢驗用于混合樣本分析:常見于陽性率很低或檢出率低的分析樣本根據二項分布的原理:1份混合樣本中含有k份陽性的概率為P(k)=(五)群檢驗用于混合樣本分析:常見于陽性率很低或檢出率低的分當k=0時P(0)是說混合樣品中沒有1陽性樣品的原始概率,反映的是混合樣品陰性的概率當k=0時P(0)是說混合樣品中沒有1陽性樣品的原始概率,反(五)群檢驗當收集的樣本數量很大時,全部檢驗費時費力可以用群檢驗的方法進行解決,若每個標本的陽性概率為π,則其陰性概率為Q=1-πQm便是某個群m個標本均為陰性的概率,一個群為陰性的群的概率,而1-Qm就為一個群陽性的概率。假設受檢的n個群中有X個陽性群,用x/n作為陽性群概率的估計值(五)群檢驗當收集的樣本數量很大時,全部檢驗費時費力(五)群檢驗
1-Qm=X/n從而Q=√P=1-Q(五)群檢驗1-Qm=X/n從而Q=√P=1-Q第四節泊松分布(Poissondistribution)
一、Poisson分布
(一)泊松分布的概念泊松分布(舊譯普哇松分布)是離散型隨機變量的另一重要分布,最早由S.D.Poisson于1837年提出。
定義:若離散型隨機變量x的取值為非負整數,且相應的概率函數為:
則稱隨機變量X服從泊松分布。第四節泊松分布(Poissondistribution泊松分布(Poissondistribution)
泊松分布的數學表達式:在n個取樣單位內,出現X=0,1,2,…,n個陽性事件的理論概率分別為下列公式的展開各項:
式中:P(X)為出現陽性事件例數為X的理論概率。實際應用時,可以用樣本均數作為總體均數μ的估計值。泊松分布(Poissondistribution)泊松分(二)Poisson分布的應用條件
在二項分布中,如果π很小,而試驗次數n很大,nπ趨向于一個常數μ時,則可以用參數為μ的泊松分布近似地表示。泊松分布還有其獨特的意義,它對于描述隨機現象在大面積(時間、空間)上的分布情況很有用。例如在單位面積的水中的細菌數的分布,計數室中細菌數的分布,放射性物質在單位時間內放射次數的分布等都屬于泊松分布。(二)Poisson分布的應用條件在泊松分布(Poissondistribution)
服從泊松分布的條件與二項分布一樣,其中之一是各事件相互獨立。例如,某一昆蟲是否落入,某人是否患某病與他人是否患病無關等。如果不符合這一條件就不呈泊松分布。因此,也可以用泊松分布來研究某些疾病是否有家族聚集性、傳染性等。泊松分布(Poissondistribution)(三)Poisson分布的性質
1.Poisson分布是一種單參數的離散型分布,其參數為μ,它表示單位時間或空間內某事件平均發生的次數,又稱強度參數。
(三)Poisson分布的性質1.Poisson分(三)Poisson分布的性質
2.Poisson分布的均數和方差相等對于符合泊松分布的資料,其n很大,而π很小,因此,泊松分布的平均數為:μ=nπ
當π→0,(1-π)→1時,泊松分布的標準差為:也就是說,泊松分布的平均數與它的方差相等:μ=σ2(三)Poisson分布的性質2.Poisson分(三)分布的性質
3.Poisson分布的累計概率常用的有左側累計和右側累計2種方法。累計概率為單位時間或空間內某事件發生的次數。(1)最多有k例陽性的概率P(x≤k)=P(0)+P(1)+……+P(k)(2)最少有k例陽性的概率P(x≥k)=P(k)+P(k+1)+……+P(n)=1-P(x≤k-1)(三)分布的性質3.Poisson分布的累計概率(三)分布的性質
4.Poisson分布的圖形泊松分布的圖形是由平均數μ來確定的,當μ較小時,泊松分布不對稱的程度較為顯著,通常呈左偏分布;隨著μ值逐漸增大,泊松分布逐漸趨向對稱,而且,和二項分布一樣,也逐漸趨向正態分布。一般說來,當平均數μ>50時(有人認為當μ>20),泊松分布就近似于正態分布。(三)分布的性質4.Poisson分布的圖形Poisson分布總體均數不同時的抽樣分布
Poisson分布總體均數不同時的抽樣分布(三)Poisson分布的性質當n很大,p很小,np=μ為一常數時,二項分布近似于泊松分布。p愈小,近似程度愈好。
例:據以往經驗,新生兒染色體異常率為1%,試分別用二項分布和泊松分布原理,求100名新生兒中發生x例(x=1,2,3......)染色體異常的概率。
(三)Poisson分布的性質當n很大二項分布與泊松分布的比較
由上表可見,二者計算結果非常接近,當n愈大其接近程度愈好,但泊松分布的P(X)計算較為簡便。
XP(X)
二項分布
泊松分布
0123456780.33600.36970.18490.06100.01490.00290.00050.00010.00000.36790.36790.18390.06130.01530.00310.00050.00010.0000合計1.0000
1.0000
二項分布與泊松分布的比較由上表可
5.Poisson分布的可加性如果相互獨立的k個隨機變量都服從泊松分布,則它們之和仍服從泊松分布,且其均數為k個隨機變量的均數之和。此稱為泊松分布的可加性。5.Poisson分布的可加性
例:已知某放射性物質每10分鐘放射脈沖數呈泊松分布,5次測量的結果分別為35、34、36、38、34次,那么,50分鐘總計的脈沖數177次,亦呈泊松分布。因此,泊松分布資料可利用可加性原理使μ>20,這樣就可以用正態近似法處理。
例:已知某放射性物質每10分鐘放射脈沖數呈泊松分布Poisson分布的應用
置信區間的估計對于小樣本資料的泊松分布置信區間估計,可以查附表7。p448
例由一份混合好的自來水中取1ml水樣,培養得細菌5個,請估計原水中每ml細菌數95%的置信區間。查附表7:樣本計數X=5,95%CI:1.6~11.7。Poisson分布的應用置信區間的估計Poisson分布的應用
置信區間的估計對于大樣本資料(X>50)的置信區間估計,可以近似地運用正態分布法進行,即:95%置信區間為:99%置信區間為:例同一份樣品分別用10個平皿進行培養,共數得菌落數1460個,試估計該樣品菌落數95%置信區間。本例:X=1460/10=146(個)95%CI:,即122.32~169.68。
Poisson分布的應用置信區間的估計Poisson分布的應用泊松分布的配合
例:將培養皿中的細菌稀釋液置于血球計上,數出小方格中的細菌數,共計128個方格,計數結果見下表。問此分布是否符合泊松分布?
表×
細菌在計數小方格中的分布
每小格細菌數(X)
觀察的方格數(f)
01234264038177Poisson分布的應用泊松分布的配合每小格細菌數(X)Poisson分布的應用計算過程:求出樣本均數以代替μ,按照泊松分布的概率公式求出X=0,1,2,3,4時的概率P(X)。本例μ=1.5234,代入公式得:
P(0)=e-μμx/x!=e-1.5234(1.5234)0/0!=0.2180P(1)=e-1.5234(1.5234)1/1!=0.3321P(2)=e-1.5234(1.5234)2/2!=0.2529P(3)=e-1.5234(1.5234)3/3!=0.1284P(3)=e-1.5234(1.5234)4/4!=0.0489Poisson分布的應用計算過程:也可按下面的遞推公式計算:也可按下面的遞推公式計算:
驗算:P(0)+P(1)+P(2)+……+P(n)=1
本例:0.2180+0.3321+0.2529+0.1284+0.0489=0.9803
以各組的概率P(X)乘以n即為X=0,1,2,3,4按泊松分布的理論頻數。
將理論頻數與實際頻數比較(χ2-test),判斷此分布是否符合泊松分布。
驗算:P(0)+P(1)+P(2)+……+P(n)=Poisson分布擬合優度檢驗計算表
χ2=Σ(A-T)2/T=1.3606
因擬合泊松分布時用了n和μ,故ν=組數-2=5-2=3。查χ2界值表得χ20.05(3)=7.81,故P>0.05
結論:實際分布與理論分布差別無統計學意義,可認為符合泊松分布。
xATA-T(A-T)2(A-T)2T0123426403817727.9042.5032.3716.446.26-1.90-2.505.630.560.743.61046.265131.64580.31380.54600.12940.14740.97750.01910.1872Poisson分布擬合優度檢驗計算表χ2=ΣPoisson分布資料的差異顯著性檢驗例:某種生物制劑的異常反應發生率一般在1/萬左右,今試用該生物制劑新制品,在受試者100人中發現1人有異常反應,問該生物制劑的異常反應率是否高于一般?假設新制品反應率與一般反應率相同,則100人中反應的平均數為:H0:π=π0μ=100×1/10000=0.01本例π=0.0001,很小,n=100,很大,可用泊松分布作近似計算,100人中1例異常反應也不出現的概率為:
Poisson分布資料的差異顯著性檢驗例:某種Poisson分布資料的差異顯著性檢驗100人中1例異常反應也不出現的概率為:
出現1例及1例以上的概率:P(x≥1)=1-P(0)=1-0.990050=0.009950
P<0.01,差異有高度顯著性意義,說明新制品的異常反應率高于一般。
Poisson分布資料的差異顯著性檢驗100人中1例異常反應Poisson分布資料的差異顯著性檢驗例:用甲乙兩種培養基對水樣進行細菌培養,在相同的條件下,用甲培養基的菌落為100,用乙培養基的菌落為150,問兩培養基菌落數的差別有無顯著性?本例平均數μ>50,可用正態近似法進行泊松分布的檢驗。
H0:兩種培養基的菌落數相同,
H1:兩種培養基的菌落數不同。
α=0.05。
Poisson分布資料的差異顯著性檢驗例:用甲乙兩種培養基Poisson分布資料的差異顯著性檢驗在對泊松分布資料進行顯著性檢驗時,如兩樣本觀察單位數相同,則采用下式:
Σx1、Σx2分別為兩樣本各觀察單位的計數之和。如兩樣本觀察單位數不等,則檢驗時用下式:
Poisson分布資料的差異顯著性檢驗在對泊松分布Poisson分布資料的差異顯著性檢驗本例是在相同條件下培養計數菌落數,因此可認為觀察單位數相等。ΣX1=100、ΣX2=150,則:
u0.01=2.58,故P<0.01,說明甲乙兩種培養基細菌培養結果有極顯著性意義。
Poisson分布資料的差異顯著性檢驗本例應用Poisson分布應注意的問題
Poisson分布的X雖為樣本計數,由于觀察單位(時間、面積、容積等)是固定的,可看成n=1,故均數為率的含義,按泊松分布特性:μ=σ2,而標準誤=,在n=1時,標準差與標準誤相等,故式中樣本標準誤的平方等于均數X。當觀察單位不同時,標準誤=,因此,與前面的兩均數(或率)之差的標準誤是一致的。
當利用正態近似法時,要滿足μ>20的條件。為此,可利用泊松分布的可加性,把若干個觀察單位合并。應用Poisson分布應注意的問題Poi應用Poisson分布應注意的問題
兩均數比較時,要注意觀察單位(時間、面積、容積、人口基數等)是否相同,若不相同,須化為相同的觀察單位后再作比較。而且,只能將大單位化為小單位,不能將小單位化為大單位。例如,將人口基數不足10萬查得的結果,按比例把基數擴大為10萬的結果是不合適的。再者以10萬人口為觀察單位時,兩樣本均數的差別有顯著性,不等于以1萬人口為觀察單位時,兩樣本均數的差別亦有顯著性。所以,確定泊松分布的觀察單位是很重要的。二項分布用于描述二項分類變量兩種觀察結果的出現頻率,泊松分布是二項分布的特例,常用于分析小概率事件的發生規律。
應用Poisson分布應注意的問題作業1.根據已往經驗,用一般療法治療某疾病的治愈率為60%。今用某種新藥治療該病病人11例,其中9例治愈。問該種新藥的療效是否優于一般療法??
作業1.根據已往經驗,用一般療法治療某疾病的治愈率為60%。作業2.用某種新藥治療某寄生蟲病,50例病人在服藥后有1人出現某種精神癥狀,該精神癥狀在此病患者中也曾有發生,過去普查結果發生率約為千分之一。問該藥病人出現精神癥狀是否與服藥有關?
作業2.用某種新藥治療某寄生蟲病,50例病人在服藥后有1人 謝謝大家! 謝謝大家!61二項分布與泊松分布二項分布與泊松分布二項分布與泊松分布第一節二項分布和總體率的估計一、二項分布(一)二項分布的概念在生命科學研究中,經常會遇到一些事物,其結果可分為兩個彼此對立的類型,如一個病人的死亡與存活、動物的雌與雄、微生物培養的陽性與陰性等,這些都可以根據某種性狀的出現與否而分為非此即彼的對立事件。這種非此即彼事件構成的總體,就稱為二項總體(binomialpopulation)。二項分布與泊松分布二項分布與泊松分布二項分布與泊松分布第一節62第一節二項分布和總體率的估計一、二項分布(一)二項分布的概念
在生命科學研究中,經常會遇到一些事物,其結果可分為兩個彼此對立的類型,如一個病人的死亡與存活、動物的雌與雄、微生物培養的陽性與陰性等,這些都可以根據某種性狀的出現與否而分為非此即彼的對立事件。這種非此即彼事件構成的總體,就稱為二項總體(binomialpopulation)。第一節二項分布和總體率的估計一、二項分布第一節二項分布和總體率的估計二項分布(binomialdistribution)就是對這種只具有兩種互斥結果的離散型隨機變量的規律性進行描述的一種概率分布。由于這一種分布規律是由瑞士學者貝努里(Bernoulli)首先發現的,又稱貝努里分布。
第一節二項分布和總體率的估計二項分二項分布有兩個基本假設:
1.各事件是相互獨立的,即任一事件的發生與否,不影響其它事件的發生概率;
2.各個隨機事件只能產生相互排斥的兩種結果。
二項分布有兩個基本假設:定理:幾個相互獨立事件同時發生的概率等于各獨立事件的概率之積。定理:在幾個互不相容的事件中,任一事件發生的概率等于這幾個事件的概率之和。抓中兩黑一白的概率:P(2)=3×0.125=0.375抓中三個黑球的概率:P(3)=0.5×0.5×0.5=0.125定理:幾個相互獨立事件同時發生的概率等于各獨立事件的概率之積二項分布與泊松分布課件二項分布與泊松分布課件
各種可能發生的結果對應的概率相當于展開后的各項數值,即:
前例:π=0.8,1-π=0.2,n=3各種可能發生的結果對應的概率相當于展開后的各二項分布的概率公式
如果一個事件A,在n次獨立試驗中,每次試驗都具有概率π
,那么,這一事件A將在n次試驗中出現x次的概率為:
式中:稱二項系數。二項分布的概率公式如果一個事件A,在n次獨立試(二)二項分布的應用條件
1.各觀察單位只能具有互相對立的一種結果,屬于二項分類資料;
2.已知發生某一結果的概率為π,其對立結果的概率則為1-π
。實際工作中要求π是從大量觀察中獲得的比較穩定的數值;3.n個觀察單位的觀察結果互相獨立,即每個觀察單位的觀察結果不會影響到其它觀察單位的結果。
(二)二項分布的應用條件1.各觀察單位只能具有互相對立的(三)二項分布的性質
1.二項分布的均數和標準差二項分布的平均數:μ=nπ
上式的意義:做n次獨立試驗,某事件平均出現的次數為nπ次,這一結果較為符合人們的直觀想法。如果,生男孩這一事件的概率是1/2,則100個新生兒中可期望有nπ=100×1/2=50個是男孩。當用率表示時,μ=π
(三)二項分布的性質1.二項分布的均數和標準差(三)二項分布的性質二項分布的標準差:標準差表示x取值的離散度或變異的大小。如n=5,π=5/6,1-π=1-5/6,則:(三)二項分布的性質二項分布的標準差:(三)二項分布的性質二項分布的標準誤
若以比值或百分數表示,則標準誤為
:
σp被稱為率的標準誤(standarderrorofrate),用來反映隨機抽樣獲得的樣本率p與總體π之間的抽樣誤差大小。
(三)二項分布的性質二項分布的標準誤(三)二項分布的性質二項分布的標準誤
若以比值或百分數表示,則標準誤為
:實際工作中常用p作為π
的估計值,得:(三)二項分布的性質二項分布的標準誤(三)二項分布的性質
2.二項分布的累計概率常用的有左側累計和右側累計2種方法。從陽性率為π
的總體中隨機抽取n個個體,則(1)最多有k例陽性的概率P(x≤k)=P(0)+P(1)+……+P(k)(2)最少有k例陽性的概率P(x≥k)=P(k)+P(k+1)+……+P(n)=1-P(x≤k-1)(三)二項分布的性質2.二項分布的累計概率(三)二項分布的性質
3.二項分布的圖形二項分布的圖形,取決于兩個方面,其一為事件發生的概率π
,其二為樣本含量n。當π
=1-π
=1/2時,二項分布的圖形是對稱的;當π
<1/2時,二項分布的圖形呈左偏態;當π
>1/2時,二項分布的圖形呈右偏態;當π與1-π不變時,即使π
≠1-π
,但隨著n的增大,二項分布的的偏態程度會逐漸降低而趨于對稱。
(三)二項分布的性質3.二項分布的圖形二項分布總體不同樣本例數時的抽樣分布
二項分布總體不同樣本例數時的抽樣分布二、二項分布的應用
(一)、總體率的估計
有點值估計和區間估計。1查表法:當n較小,如n≤50時,特別是p很接近于0或1時,可由附表6百分率的置信區間表直接查出。P709orp817例:某地對13名輸卵管結扎的育齡婦女經壺腹部吻合術后,觀察其受孕情況,發現有6人受孕,據此估計該吻合術婦女的受孕的95%可信區間此例:n=13,x=6
查表得95%CI為:19%~75%。二、二項分布的應用(一)、總體率的估計二、二項分布的應用
(一)、總體率的估計
1查表法:附表6百分率的置信區間表直接列出了X≤n/2的部分。其余部分可以查n-x的陰性部分的QL~QU再相減得PLand
pUPL=1-QL1-QU例:某地調查50名兒童蛔蟲感染情況,發現有10人大便中有蛔蟲卵,問兒童蛔蟲感染率的95%置信區間是多少?此例:n=50,x=10
查表得95%CI為:10%~34%。二、二項分布的應用(一)、總體率的估計二項分布的應用
2正態近似法:應用條件:np及n(1?p)均≥5p±uαsp
例:在某地隨機抽取329人,做HBsAg檢驗,得陽性率為8.81%,求陽性率95%置信區間。已知:p=8.81%,n=329,故:
95%CI:8.81±1.96×1.56;即5.75%~11.87%。二項分布的應用2正態近似法:應用條件:np及n(1二項分布下表是用P±Uasp時要求的P值與N的大小參考數字。PnnP0.530150.450200.380240.2200400.1600600.05140070二項分布下表是用P±Uasp時要求的P值與N的大小參二項分布的應用(二)差異的顯著性檢驗1直接法例某醫院用甲藥治療某病,其治愈率為70%,今用乙藥治療該病10人,治愈9人,問甲乙兩藥療效有無差別?已知:π=0.7,1-π=0.3,假設兩藥療效無差別,則治愈與非治愈的概率應符合二項分布,即:
二項分布的應用(二)差異的顯著性檢驗如果甲乙兩藥療效無差別,按甲藥的治愈率(70%)用乙藥治療10人應治愈7人,實際治愈9人,相差2人。雙側檢驗,計算相差±2人及2人以上的總概率,即x≥9和x≤5的概率之和:ΣP=0.000006+0.000138+0.001447+0.009002+0.036757+0.102919+0.121061+0.028248=0.299577或:ΣP=1-(0.200121+0.266828+0.233474)=0.299577如果甲乙兩藥療效無差別,按甲藥的治愈率(70%)用乙藥治療1
P=0.299577>0.05,差異無統計學意義,尚不能認為乙藥療效優于甲藥。
本例如采用單側檢驗,即要求判斷乙藥療效優于甲藥?此時只需計算相差2人及以上的總概率:ΣP=P(9)+P(10)=0.121061+0.028248=0.149309P>0.05,差異無統計學意義,尚不能認為乙藥療效優于甲藥。P=0.299577>0.05,差異無統計學意義,尚不3.研究疾病的家族聚集性
例某單位發生乙肝暴發流行,經調查4口之家共288戶,其中無病例的167戶,發生1例的51戶,2例的50戶,3例的17戶,全家發病的3戶,問乙肝的發病是否具有家族集聚性?
π=214/1152=0.1858,1-π=0.8142
計算發病數x=0,1,2,3,4時的理論概率和理論戶數。列表,比較實際戶數與理論戶數差別有無顯著性意義。
3.研究疾病的家族聚集性二項分布展開計算表發病人數展開式概率理論戶數實際戶數xCxnπ
x(1-π)n-xPT=P×288A0C04
(0.1858)0(0.8142)40.4395126.571671C14
(0.1858)1(0.8142)30.4011115.52
512C24
(0.1858)2(0.8142)20.1373
39.54
503C34
(0.1858)3(0.8142)10.0209
6.02
174C44
(0.1858)4(0.8142)00.0012
0.35
3二項分布展開計算表發病人數展開式概率理論戶數實際戶數xCxn二項分布擬合優度的χ2檢驗發病人數實際戶數理論戶數(A-T)2(A-T)2xATT0167126.571634.5812.911
51115.524162.8336.042
50
39.54
109.41
2.773
17
6.02
120.5620.034
3
0.35
7.0220.06χ2=91.81,按ν=組數-2=5-2=3查χ2界值表得:χ20.01(3)=11.345,故P<0.01,說明該疾病的家庭分布不符合二項分布,可以認為該病有家族集聚性。二項分布擬合優度的χ2檢驗發病人數實際戶數理論戶數(A-T)(五)群檢驗用于混合樣本分析:常見于陽性率很低或檢出率低的分析樣本根據二項分布的原理:1份混合樣本中含有k份陽性的概率為P(k)=(五)群檢驗用于混合樣本分析:常見于陽性率很低或檢出率低的分當k=0時P(0)是說混合樣品中沒有1陽性樣品的原始概率,反映的是混合樣品陰性的概率當k=0時P(0)是說混合樣品中沒有1陽性樣品的原始概率,反(五)群檢驗當收集的樣本數量很大時,全部檢驗費時費力可以用群檢驗的方法進行解決,若每個標本的陽性概率為π,則其陰性概率為Q=1-πQm便是某個群m個標本均為陰性的概率,一個群為陰性的群的概率,而1-Qm就為一個群陽性的概率。假設受檢的n個群中有X個陽性群,用x/n作為陽性群概率的估計值(五)群檢驗當收集的樣本數量很大時,全部檢驗費時費力(五)群檢驗
1-Qm=X/n從而Q=√P=1-Q(五)群檢驗1-Qm=X/n從而Q=√P=1-Q第四節泊松分布(Poissondistribution)
一、Poisson分布
(一)泊松分布的概念泊松分布(舊譯普哇松分布)是離散型隨機變量的另一重要分布,最早由S.D.Poisson于1837年提出。
定義:若離散型隨機變量x的取值為非負整數,且相應的概率函數為:
則稱隨機變量X服從泊松分布。第四節泊松分布(Poissondistribution泊松分布(Poissondistribution)
泊松分布的數學表達式:在n個取樣單位內,出現X=0,1,2,…,n個陽性事件的理論概率分別為下列公式的展開各項:
式中:P(X)為出現陽性事件例數為X的理論概率。實際應用時,可以用樣本均數作為總體均數μ的估計值。泊松分布(Poissondistribution)泊松分(二)Poisson分布的應用條件
在二項分布中,如果π很小,而試驗次數n很大,nπ趨向于一個常數μ時,則可以用參數為μ的泊松分布近似地表示。泊松分布還有其獨特的意義,它對于描述隨機現象在大面積(時間、空間)上的分布情況很有用。例如在單位面積的水中的細菌數的分布,計數室中細菌數的分布,放射性物質在單位時間內放射次數的分布等都屬于泊松分布。(二)Poisson分布的應用條件在泊松分布(Poissondistribution)
服從泊松分布的條件與二項分布一樣,其中之一是各事件相互獨立。例如,某一昆蟲是否落入,某人是否患某病與他人是否患病無關等。如果不符合這一條件就不呈泊松分布。因此,也可以用泊松分布來研究某些疾病是否有家族聚集性、傳染性等。泊松分布(Poissondistribution)(三)Poisson分布的性質
1.Poisson分布是一種單參數的離散型分布,其參數為μ,它表示單位時間或空間內某事件平均發生的次數,又稱強度參數。
(三)Poisson分布的性質1.Poisson分(三)Poisson分布的性質
2.Poisson分布的均數和方差相等對于符合泊松分布的資料,其n很大,而π很小,因此,泊松分布的平均數為:μ=nπ
當π→0,(1-π)→1時,泊松分布的標準差為:也就是說,泊松分布的平均數與它的方差相等:μ=σ2(三)Poisson分布的性質2.Poisson分(三)分布的性質
3.Poisson分布的累計概率常用的有左側累計和右側累計2種方法。累計概率為單位時間或空間內某事件發生的次數。(1)最多有k例陽性的概率P(x≤k)=P(0)+P(1)+……+P(k)(2)最少有k例陽性的概率P(x≥k)=P(k)+P(k+1)+……+P(n)=1-P(x≤k-1)(三)分布的性質3.Poisson分布的累計概率(三)分布的性質
4.Poisson分布的圖形泊松分布的圖形是由平均數μ來確定的,當μ較小時,泊松分布不對稱的程度較為顯著,通常呈左偏分布;隨著μ值逐漸增大,泊松分布逐漸趨向對稱,而且,和二項分布一樣,也逐漸趨向正態分布。一般說來,當平均數μ>50時(有人認為當μ>20),泊松分布就近似于正態分布。(三)分布的性質4.Poisson分布的圖形Poisson分布總體均數不同時的抽樣分布
Poisson分布總體均數不同時的抽樣分布(三)Poisson分布的性質當n很大,p很小,np=μ為一常數時,二項分布近似于泊松分布。p愈小,近似程度愈好。
例:據以往經驗,新生兒染色體異常率為1%,試分別用二項分布和泊松分布原理,求100名新生兒中發生x例(x=1,2,3......)染色體異常的概率。
(三)Poisson分布的性質當n很大二項分布與泊松分布的比較
由上表可見,二者計算結果非常接近,當n愈大其接近程度愈好,但泊松分布的P(X)計算較為簡便。
XP(X)
二項分布
泊松分布
0123456780.33600.36970.18490.06100.01490.00290.00050.00010.00000.36790.36790.18390.06130.01530.00310.00050.00010.0000合計1.0000
1.0000
二項分布與泊松分布的比較由上表可
5.Poisson分布的可加性如果相互獨立的k個隨機變量都服從泊松分布,則它們之和仍服從泊松分布,且其均數為k個隨機變量的均數之和。此稱為泊松分布的可加性。5.Poisson分布的可加性
例:已知某放射性物質每10分鐘放射脈沖數呈泊松分布,5次測量的結果分別為35、34、36、38、34次,那么,50分鐘總計的脈沖數177次,亦呈泊松分布。因此,泊松分布資料可利用可加性原理使μ>20,這樣就可以用正態近似法處理。
例:已知某放射性物質每10分鐘放射脈沖數呈泊松分布Poisson分布的應用
置信區間的估計對于小樣本資料的泊松分布置信區間估計,可以查附表7。p448
例由一份混合好的自來水中取1ml水樣,培養得細菌5個,請估計原水中每ml細菌數95%的置信區間。查附表7:樣本計數X=5,95%CI:1.6~11.7。Poisson分布的應用置信區間的估計Poisson分布的應用
置信區間的估計對于大樣本資料(X>50)的置信區間估計,可以近似地運用正態分布法進行,即:95%置信區間為:99%置信區間為:例同一份樣品分別用10個平皿進行培養,共數得菌落數1460個,試估計該樣品菌落數95%置信區間。本例:X=1460/10=146(個)95%CI:,即122.32~169.68。
Poisson分布的應用置信區間的估計Poisson分布的應用泊松分布的配合
例:將培養皿中的細菌稀釋液置于血球計上,數出小方格中的細菌數,共計128個方格,計數結果見下表。問此分布是否符合泊松分布?
表×
細菌在計數小方格中的分布
每小格細菌數(X)
觀察的方格數(f)
01234264038177Poisson分布的應用泊松分布的配合每小格細菌數(X)Poisson分布的應用計算過程:求出樣本均數以代替μ,按照泊松分布的概率公式求出X=0,1,2,3,4時的概率P(X)。本例μ=1.5234,代入公式得:
P(0)=e-μμx/x!=e-1.5234(1.5234)0/0!=0.2180P(1)=e-1.5234(1.5234)1/1!=0.3321P(2)=e-1.5234(1.5234)2/2!=0.2529P(3)=e-1.5234(1.5234)3/3!=0.1284P(3)=e-1.5234(1.5234)4/4!=0.0489Poisson分布的應用計算過程:也可按下面的遞推公式計算:也可按下面的遞推公式計算:
驗算:P(0)+P(1)+P(2)+……+P(n)=1
本例:0.2180+0.3321+0.2529+0.1284+0.0489=0.9803
以各組的概率P(X)乘以n即為X=0,1,2,3,4按泊松分布的理論頻數。
將理論頻數與實際頻數比較(χ2-test),判
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年證券從業資格證考試中的常見經濟學理論試題及答案
- 二年級下冊心理健康教育表格式教案-第5課我愛我的家 長春版
- 用戶經驗在項目管理考試知識中的重要性試題及答案
- 課題申報書如何裝訂
- 微生物檢驗技師職業資格考試試題及答案
- 注冊會計師實務要點解析試題及答案
- 微生物檢驗實驗室管理考題試題及答案
- 2025年銀行資格證考試重要日程規劃試題及答案
- 證券從業資格證難點試題及答案特集
- 高風險微生物的防范措施試題及答案
- 管道完整性管理培訓
- 小學全體教師安全工作培訓
- 19G522-1鋼筋桁架混凝土樓板圖集
- 律師事務所薪酬分配制度
- 馬克思主義誕生與傳播課件
- 2025年高考語文一輪復習:文言斷句(新高考)
- 北師大版數學八年級下冊全冊教案及反思
- 幸福心理學智慧樹知到答案2024年浙江大學
- 五年級數學下冊期末測試卷及答案【可打印】
- 《教育心理學(第3版)》全套教學課件
- 聯合體施工雙方安全生產協議書范本
評論
0/150
提交評論