概率分布與統計圖表_第1頁
概率分布與統計圖表_第2頁
概率分布與統計圖表_第3頁
概率分布與統計圖表_第4頁
概率分布與統計圖表_第5頁
已閱讀5頁,還剩58頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2023/10/231

第二講概率分布與統計圖表

2023/10/232

一、正態分布的概念

第一節正態分布

正態分布是自然界最常見的一種分布,若指標X的頻率分布曲線對應于數學上的正態分布曲線,則稱該指標服從正態分布。2023/10/2332023/10/234正態分布的概率密度函數(即縱向的曲線高度)

-∞<X<+∞

圖3.2正態曲線位置、形狀與μ、σ的關系2023/10/235

均數為0,標準差為1的正態分布,這種正態分布稱為標準正態分布。-∞<Z<+∞

標準正態分布的密度函數:

對于任意一個服從正態分布N(μ,σ2)的隨機變量,可作如下的標準化變換,也稱Z變換,2023/10/236正態分布的特征

1.關于對稱。即正態分布以均數為中心,左右對稱。

2.

在處取得概率密度函數的最大值,在處有拐點,表現為鐘形曲線。即正態曲線在橫軸上方均數處最高。

2023/10/237

3.

正態分布有兩個參數,即均數μ和標準差σ。μ是位置參數,σ是變異度參數(形狀參數)。常用N(μ,σ2)表示均數為μ,標準差為σ的正態分布;用N(0,1)表示標準正態分布。

4.正態曲線下面積分布有一定規律。橫軸上正態曲線下的面積等于1(也常寫作100%)。

2023/10/238

二、正態曲線下面積的分布規律正態方程的積分式(分布函數):

F(X)為正態變量X的累計分布函數,反映正態曲線下,橫軸尺度自-∞到X的面積,即下側累計面積。標準正態分布方程積分式(分布函數):Φ(Z)為標準正態變量Z的累計分布函數,反映標準正態曲線下,橫軸尺度自-∞到Z的面積,即下側累計面積。2023/10/239標準正態分布累積概率2023/10/2310

用查表代替計算必須注意:

1)表中曲線下面積為-∞到Z的面積。

2)當μ,σ和X已知時,先求出Z值,

再用Z值查表,得所求區間占總面積的比例。當μ和σ未知時,要用樣本均數和樣本標準差S來估計Z值。

3)曲線下對稱于0的區間,面積相等。

4)曲線下橫軸上的面積為1(即100%)。

三、標準正態分布表2023/10/2311

正態分布是一種對稱分布,其對稱軸為直線X=μ,即均數位置,理論上:

μ±1σ范圍內曲線下的面積占總面積的68.27%

μ±1.96σ范圍內曲線下的面積占總面積的95%

μ±2.58σ范圍內曲線下的面積占總面積的99%

實際應用中:

±1S范圍內曲線下的面積占總面積的68.27%

±1.96S范圍內曲線下的面積占總面積的95%

±2.58S范圍內曲線下的面積占總面積的99%

2023/10/2312正態分布曲線下的面積

μ±σ0.6827μ±1.64σ0.9090μ±1.96σ0.9500μ±2.58σ

0.99002023/10/2313標準正態分布的μ=0,σ=1,則μ±σ相當于區間(-1,1),μ±1.96σ相當于區間(-1.96,1.96),μ±2.58σ的區間相當于區間(-2.58,2.58)。區間(-1,1)的面積:1-2Φ(-1)=1-2×0.1587=0.6826=68.26%

區間(-1.96,1.96)的面積:1-2Φ(-1.96)=1-2×0.0250=0.9500=95.00%

區間(-2.58,2.58)的面積:1-2Φ(-2.58)=1-2×0.0049=0.9902=99.02%

2023/10/2314

正態曲線下面積對稱,則區間(1.96,∞)的面積也是0.025。Z取值于(-1.96,1.96)的概率為1-2×0.025=0.95,即X取值在區間上的概率為95%。

例1X服從均數為μ

,標準差為的正態分布,試估計(1)X取值在區間上的概率;(2)X取值在區間上的概率;先做標準化變換:2023/10/2315例2已知某地1986年120名8歲男童身高均數,S=4.79cm,估計(1)該地8歲男孩身高在130cm以上者占該地8歲男孩總數的百分比;(2)身高界于120cm~128cm者占該地8歲男孩總數的比例;(3)該地80%男孩身高集中在哪個范圍?先做標準化變化:

理論上該地8歲男孩身高在130cm以上者占該地8歲男孩總數的7.21%。2023/10/2316(2)2023/10/2317(3)查附表1,標準正態分布曲線下左側面積為0.10所對應的Z值為-1.28,所以80%的8歲男孩身高值集中在區間內,即116.9cm~129.2cm查附表,求標準正態分布曲線下的面積。(-∞,-1.96),(-∞,-2.58),(-1.96,1.96),(-1,1),(-∞,0.00)。練習:2023/10/2319(一)制定醫學參考值范圍參考值范圍:指特定的“正常”人群的解剖、生理、生化、免疫等各種數據的波動范圍。制定參考值范圍的步驟:

1.選擇足夠數量的正常人作為調查對象。

2.樣本含量足夠大。

3.確定取單側還是取雙側正常值范圍。

4.選擇適當的百分界限。

5.選擇適當的計算方法。四、

正態分布的應用2023/10/2320估計醫學參考值范圍的方法:

1.正態近似法:適用于正態分布或近似正態分布的資料。

2.百分位數法:適用于偏態分布資料。過低異常過低異常過高異常過高異常2023/10/2321

例3某地調查120名健康女性血紅蛋白,直方圖顯示,其分布近似于正態分布,得均數為117.4g/L,標準差為10.2g/L,試估計該地正常女性血紅蛋白的95%醫學參考值范圍。

分析:正常人的血紅蛋白過高過低均為異常,要制定雙側正常值范圍。

該指標的95%醫學參考值范圍為2023/10/2322

例4某地調查110名正常成年男子的第一秒肺通氣量,得均數為4.2L,標準差為0.7L,試估計該地正常成年男子第一秒肺通氣量的95%參考值范圍。

該地正常成年男子第一秒肺通氣量的95%參考值范圍為:不低于3.052L。分析:正常人的第一秒肺通氣量近似正態分布,且只以過低為異常,要制定單側下限。2023/10/2323

例5某年某市調查了200例正常成人血鉛含量(μg/100g)如下,試估計該市成人血鉛含量的95%醫學參考值范圍。2023/10/2324

分析:血鉛的分布為偏峰分布,且血鉛含量只以過高為異常,要用百分位數法制定單側上限。2023/10/2325(二)質量控制

為了控制實驗中的檢測誤差,常用±2S作上下警戒線,以±3S作為上下控制線。這里的2S和3S可視為1.96S和2.58S的約數。其依據是正常情況下檢測誤差是服從正態分布的。

2023/10/2326判斷異常的8種情況是:有一個點距中心線的距離超過3個標準差(控制限以外)在中心線的一側連續有9個點連續6個點穩定地增加或減少連續14個點交替上下連續3個點中有兩個點距中心線距離超過2個標準差(警戒限以外)2023/10/2327連續5個點中有4個點距中心線距離超過1個標準差中心線一側或兩側連續15個點距中心線距離都在1個標準差以內中心線一側或兩側連續8個點距中心線距離都超出1個標準差范圍。2023/10/2328

五、統計處理方法的理論基礎如統計描述中計算算術平均數、標準差、統計推斷中進行總體均數置信區間估計、

t檢驗、F檢驗、相關與回歸等分析2023/10/2329(一)成敗型實驗(Bernoulli實驗)

在醫學衛生領域的許多實驗或觀察中,人們感興趣的是某事件是否發生。如用白鼠做某藥物的毒性實驗,關心的是白鼠是否死亡;某種新療法臨床實驗觀察患者是否治愈;觀察某指標的化驗結果是否呈陽性等。將我們關心的事件A出現稱為成功,不出現稱為失敗,這類試驗就稱為成-敗型實驗。第二節二項分布

一、二項分布的概念與特征2023/10/2330

成-敗型(Bernoulli)實驗序列:滿足以下三個條件的n次實驗構成的序列稱為成-敗型實驗序列。

1)每次實驗結果,只能是兩個互斥的結果之一(A或非A)。

2)相同的實驗條件下,每次實驗中事件A的發生具有相同的概率π。(非A的概率為1-π)。實際工作中要求π是從大量觀察中獲得的較穩定的數值。

3)各次實驗獨立。各次的實驗結果互不影響。2023/10/2331(二)二項分布的概率函數二項分布是指在只能產生兩種可能結果(如“陽性”或“陰性”)之一的n次獨立重復實驗中,當每次試驗的“陽性”概率保持不變時,出現“陽性”的次數X=0,1,2,…,n的一種概率分布。若從陽性率為π的總體中隨機抽取大小為n的樣本,則出現“陽性”數為X的概率分布即呈現二項分布,記作B(n,π)。2023/10/2332舉例設實驗白鼠共3只,要求它們同種屬、同性別、體重相近,且他們有相同的死亡概率,即事件“白鼠用藥后死亡”為A,相應死亡概率為π。記事件“白鼠用藥后不死亡”為,相應不死亡概率為1-π。設實驗后3只白鼠中死亡的白鼠數為X,則X的可能取值為0,1,2和3,則死亡鼠數為X的概率分布即表現為二項分布。2023/10/2333獨立事件的乘法定理互不相容事件的加法定理2023/10/23342023/10/2335

構成成-敗型實驗序列的n次實驗中,事件A出現的次數X的概率分布為:

其中X=0,1,2…,n。

n,π是二項分布的兩個參數。

對于任何二項分布,總有

2023/10/2336例6臨床上用針灸治療某型頭疼,有效的概率為60%,現以該療法治療3例,其中2例有效的概率是多大?分析:治療結果為有限和無效兩類,每個患者是否有效不受其他病例的影響,有效概率均為0.6,符合二項分布的條件。2例有效的概率是0.4322023/10/2337有效數不少于1例的概率為:或2023/10/2338(三)二項分布的特征1.二項分布的圖形特征

n,π是二項分布的兩個參數,所以二項分布的形狀取決于n,π。可以看出,當π=0.5時分布對稱,近似對稱分布。當π≠0.5時,分布呈偏態,特別是n較小時,π偏離0.5越遠,分布的對稱性越差,但只要不接近1和0時,隨著n的增大,分布逐漸逼近正態。因此,π或1-π不太小,而n足夠大,我們常用正態近似的原理來處理二項分布的問題。2023/10/23392023/10/23402023/10/2341

2.二項分布的均數和標準差對于任何一個二項分布B(n,π),如果每次試驗出現“陽性”結果的概率均為π

,則在n次獨立重復實驗中,出現陽性次數X的總體均數為方差為標準差為2023/10/2342例7實驗白鼠3只,白鼠用藥后死亡的死亡概率π=0.6,則3只白鼠中死亡鼠數X的總體均數

=3×0.6=1.8(只)方差為標準差為2023/10/2343

如果以率表示,將陽性結果的頻率記為,則p的總體均數總體方差為總體標準差為式中是頻率p的標準誤,反映陽性頻率的抽樣誤差的大小。2023/10/2344例8如果某地鉤蟲感染率為6.7%,隨機觀察當地150人,樣本鉤蟲感染率為p,求p的抽樣誤差。2023/10/2345

二、二項分布的應用(一)

概率估計例9如果某地鉤蟲感染率為13%,隨機觀察當地150人,其中有10人感染鉤蟲的概率有多大?2023/10/2346

(二)單側累計概率計算

二項分布出現陽性次數至少為k次的概率為陽性次數至多為k次的概率為2023/10/2347例10如果某地鉤蟲感染率為13%,隨機觀察當地150人,其中至多有2人感染鉤蟲的概率有多大?至少有2人感染鉤蟲的概率有多大?至少有20人感染鉤蟲的概率有多大?至多有2名感染的概率為:2023/10/2348至少有2名感染的概率為:至少有20名感染的概率為:2023/10/2349

第三節Poisson分布的概念與特征

一、Poisson分布的概念

Poisson分布也是一種離散型分布,用以描述罕見事件發生次數的概率分布。Poisson分布也可用于研究單位時間內(或單位空間、容積內)某罕見事件發生次數的分布,如分析在單位面積或容積內細菌數的分布,在單位空間中某種昆蟲或野生動物數的分布,粉塵在觀察容積內的分布,放射性物質在單位時間內放射出質點數的分布等。Poisson分布一般記作。2023/10/2350

Poisson分布可以看作是發生的概率π

很小,而觀察例數很大時的二項分布。除要符合二項分布的三個基本條件外,Poisson分布還要求π或1-π接近于0和1。有些情況π和n都難以確定,只能以觀察單位(時間、空間、容積、面積)內某種稀有事件的發生數X等來表示,如每毫升水中大腸桿菌數,每個觀察單位中粉塵的計數,單位時間內放射性質點數等,只要細菌、粉塵、放射性脈沖在觀察時間內滿足以上條件,就可以近似看為Poisson分布。Poisson分布作為二項分布的一種極限情況2023/10/2351

二、Poisson分布的特征1.Poisson分布的概率函數為:式中為Poisson分布的總體均數,X為觀察單位時間內某稀有事件的發生次數;e為自然對數的底,為常數,約等于2.71828。2023/10/2352

如某地20年間共出生短肢畸形兒10名,平均每年0.5名。就可用代入Poisson分布的概率函數來估計該地每年出生此類短肢畸形兒的人數為0,1,2…的概率P(X)。2023/10/23532023/10/23542.Poisson分布的特性:(1)Poisson分布的的總體均數與總體方差相等,均為。(2)Poisson分布的觀察結果有可加性。即對于服從Poisson分布的m個互相獨立的隨機變量X1,X2…Xm,它們之和也服從Poisson分布,其均數為這m個隨機變量的均數之和。2023/10/2355

從總體均數為的服從Poisson分布總體中隨機抽出一份樣本,其中稀有事件的發生次數為X1,再獨立地從總體均數為的Poisson分布總體中隨機抽出另一份樣本,其中稀有事件的發生次數為X2,則他們的合計發生數T=X1+X2也服從Poisson分布,總體均數為。2023/10/2356Poisson分布的這些性質還可以推廣到多個Poisson分布的情形。例如,從同一水源獨立地取水樣5次,進行細菌培養,每次水樣中的菌落數分別為,均服從Poisson分布,分別記為,把5份水樣混合,其合計菌落數也服從Poisson分布,記為,其均數為。

醫學研究中常利用Poisson分布的可加性,將小的觀察單位合并以增大發生次數X,以便用正態近似法進行統計推斷。2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論