




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
一、常見數據類型在正式的解釋分布之前,我們先來看一看平時碰到的數據。數據可大致分為離散型數據和持續型數據。離散型數據離散型數據顧名思義就是只取幾個特定的值。例如:當你擲骰子的時候,成果只有1,2,3,4,5,6,不會出現類似1.5,2.5。持續型數據在一種給定的范疇內,持續型數據能夠取任意值。這個范疇能夠是有限的或者是無窮的。例如:一種人的體重或者身高,能夠取值54kg,54.4kg,54.33333kg等等都沒有問題。下面就開始介紹分布的類型。二、分布類型伯努利分布(BernoulliDistribution)首先從最簡樸的分布開始,伯努利分布事實上是一種聽起來最容易理解的分布。伯努利分布一次實驗有兩個可能的成果,例如1代表success及0代表failure。隨機變量XX一種取值為1并代表成功,成功概率為pp,一種取值為0表達失敗,失敗概率為qq或者說1?p1?p。這里,概率分布函數為px(1?p)1?xpx(1?p)1?x,其中x∈(0,1)x∈(0,1),我們也能夠寫成以下形式:P(x)={1?p,p,x=0x=1P(x)={1?p,x=0p,x=1成功和失敗的概率沒必要相似,也就是沒必要都是0.5,但是這倆概率加和應當為1,例如能夠是下面的圖:這個圖就是p(success)=0.15,p(failure)=0.85p(success)=0.15,p(failure)=0.85。下面說一下隨機變量的盼望,一種分布的盼望就是這個分布的均值。服從伯努利分布的隨機變量XX的盼望值就是:E(X)=1?p+0?(1?p)=pE(X)=1?p+0?(1?p)=p服從伯努利分布的隨機變量的方差是:V(X)=E(X2)?[E(X)]2=p?p2=p(1?p)V(X)=E(X2)?[E(X)]2=p?p2=p(1?p)尚有許多伯努利分布的例子,例如闡明天與否會下雨,今天會不會去健身,明天乒乓球比賽是不是會贏。均勻分布(UniformDistribution)當你擲骰子的時候,成果出現1到6中的任何一種,而任何一種成果出現的概率都是相似的,這就是均勻分布最原始的雛形。你可能看出來了,與伯努利分布不同的是,這nn個出現的成果的概率都是相似的。一種隨機變量XX為均勻分布是指密度函數以下:f(x)=1b?a?∞<a≤b<∞f(x)=1b?a?∞<a≤b<∞下圖為均勻分布的密度圖的樣子:咱們能夠看出來均勻分布的密度圖是個矩形,這也就是為啥均勻分布的昵稱是矩形分布。對于均勻分布來說aa和bb都是參數,分布的參數。例子:如果花店每日銷售的花束數量均勻分布,最多40只,最少10只。我們來嘗試計算每日賣花數量在15到30之間的概率。由于隨機變量全部可能發生的事件的概率和為1,并且賣花數量是均勻分布,全部在15到30之間的概率為(30?15)?1(40?10)=0.5(30?15)?1(40?10)=0.5。類似的對于每日賣花數量不不大于20發生的概率就是1?(20?10)?1(40?10)=231?(20?10)?1(40?10)=23。若隨機變量XX服從均勻分布,那么它的均值和方差分別為:Mean->E(X)=(a+b)2E(X)=(a+b)2Variance->V(X)=(b?a)212V(X)=(b?a)212原則的均勻分布的密度參數為a=0a=0和b=0b=0,因此對于原則的均勻分布的密度函數為:f(x)={1,0,0≤x≤1otherwisef(x)={1,0≤x≤10,otherwise二項分布(BinomialDistribution)我們假定一種隨機變量,例如XX,表達你贏得比賽的次數。
XX可能的值是什么?它能夠是任何數字,贏得比賽的次數。如果就兩個可能的成果。成功,失敗。因此,成功概率=0.5,失敗的概率能夠容易地計算為:q=p?1=0.5q=p?1=0.5。只有兩種成果是可能的分布,如成功或失敗,以及全部實驗的成功和失敗概率相似的狀況稱為二項分布。發生成果的可能性不同時,前面的例子如果實驗成功的概率是0.2,那么失敗的概率能夠很容易地計算出來,q=1?0.2=0.8q=1?0.2=0.8。每次實驗都是獨立的,由于之前的成果并不決定或影響現在的成果。只有兩次重復n次的可能成果的實驗稱為二項式。二項分布的參數是nn和pp,其中nn是實驗的總數,pp是每個實驗中成功的概率。基于上述解釋,二項分布的性質是:每次實驗獨立實驗中只有兩種可能的成果-成功或失敗。共進行了nn次相似的實驗。全部實驗的成功和失敗的概率是相似的。(實驗是相似的。)二項分布的數學體現式由下式給出:P(x)=n!(n?x)!x!pxqn?xP(x)=n!(n?x)!x!pxqn?x一種二項分布圖,其中成功的概率不等于失敗的概率長這樣:成功概率與失敗概率相等,長這樣:二項分布均值和方差:Mean->
μ=n?pμ=n?pVariance->
Var(X)=n?p?qVar(X)=n?p?q正態分布(NormalDistribution)正態分布能夠表達宇宙中大多數的事件發生狀況。如果任何分布含有下列特性,則稱為正態分布:均值、中位數、眾數在一種分布中取相似的值;分布曲線有關x=μx=μ對稱;曲線下面的面積總和為;中心位置的左半邊和右半邊對應位置的概率取值相似。正態分布與二項分布有很大的不同。但是,如果實驗次數靠近無窮大,則形狀將非常相似。服從正態分布的隨機變量XX的密度函數為:f(x)=12πσ???√e{?12(x?μσ)2}?∞<x<∞f(x)=12πσe{?12(x?μσ)2}?∞<x<∞服從均勻分布的隨機變量XX的均值和方差,以下:Mean->
E(X)=μE(X)=μ
Variance->
Var(X)=σ2Var(X)=σ2這里μμ(mean)和σσ(standarddeviation)是兩個參數,隨機變量X~N(μ,σ)X~N(μ,σ)的不同取值的變化圖以下:原則正態分布的均值為0,方差為1,密度圖以下:f(x)=12π??√e?x22∞<x<∞f(x)=12πe?x22∞<x<∞泊松分布(PoissonDistribution)假設你在一種呼喊中心工作,大概一天能接受到多少個電話?它能夠是任何數字。呼喊數量就能夠用泊松分布建模,下面是別的例子:
1.每天在醫院統計的緊急呼喊數量。
2.每天在一種地區報告的盜竊數量。
3.一小時內達成沙龍的客戶數量。
4.一種特定都市報告的自殺人數。
5.書每頁的打印錯誤數量。泊松分布合用于事件發生在任意隨機時間點或者空間的狀況,其中我們的愛好僅在于事件的發生次數。當下列假設有效時,分布稱為泊松分布:任何成功的事件都不應當影響另一種成功事件的成果。在較短的時間間隔內成功的概率必須等于在較長的時間間隔內成功的概率。隨著間隔變小,間隔內成功的概率靠近零。現在,如果任何分充滿足上述假設,那么它是一種泊松分布。泊松分布中使用的某些符號是:λλ是事件發生的速率tt是時間間隔的長度XX是在時間間隔tt內事件發生的次數這里XX叫做泊松隨機變量,同時XX的概率分布就叫做泊松分布。我們用μμ表達時間tt內時間發生的平均次數也就是均值,因此μ=λ?tμ=λ?t。服從泊松分布的隨機變量XX的PMF為:P(X=x)=e?uμxx!x=0,1,2,......P(X=x)=e?uμxx!x=0,1,2,......均值μμ是分布的參數,μμ也被定義為在一種時間段內發生λλ次。泊松分布圖以下:下圖顯示了均值增加而造成的曲線移動:能夠感覺到,隨著平均值的增加,曲線向右移動。
服從泊松分布的隨機變量XX的均值和方差:Mean->
E(X)=μE(X)=μVariance->
Var(X)=μVar(X)=μ指數分布(ExponentialDistribution)我們再來考慮一下呼喊中心的例子。想想通話間的時間間隔是多少?指數分布來解決我們的問題。指數分布對呼喊之間的時間間隔建模。其它例子:
1.兩站地鐵達成之間的時間長度
2.達成加油站的時間長度
3.空調的使用壽命指數分布廣泛用于生存分析。從機器的預期壽命到人的預期壽命,指數分布可用來傳遞這些成果。隨機變量XX服從指數分布,它的PDF為:f(x)=λeλx,x≥0f(x)=λeλx,x≥0參數λ>0λ>0也叫做速率。對于生存分析,λλ被稱為設備在任何時間tt的故障率,假設它存活到t。服從指數分布的隨機變量XX的均值和方差:Mean->
E(X)=1λE(X)=1λVariance->
Var(X)=(1λ)2Var(X)=(1λ)2另外,速率越大,曲線越下降快,速率越低,曲線越平滑。下圖顯示了這一點:為了簡化計算,下面給出了某些公式。P{X≤x}=1?e?λxP{X≤x}=1?e?λx對應于xx左邊密度曲線下的面積。P{X>x}=1?e?λxP{X>x}=1?e?λx對應于xx右側密度曲線下的面積。P{x1<X≤x2}=e?λx1?e?λx2P{x1<X≤x2}=e?λx1?e?λx2對應于x1x1和x2x2之間密度曲線下的面積。三、分布之間的關系伯努利分布和二項分布伯努利分布是二項分布的一種特例,只有一次實驗。伯努利和二項分布只有兩種可能的成果,即成功和失敗。泊松分布和二項分布泊松分布是二項分布的極限分布,條件以下:
1.實驗次數足夠多或者說nn
->
∞∞
2.每次實驗成功的概率相似,無窮小或者pp
->0
3.
np=λnp=λ,有限。正態分布和二項分布&正態分布和泊松分布正態分布是在下列條件下二項分布的另一種極限形式,條件以下:
1.實驗次數無限大nn
->
∞∞
2.
pp和qq都不是無限小的。正態分布也是參數λλ->
∞
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 聚焦五化教育智慧學校培訓
- 擺攤鹵味加盟合同范本
- 20253月份混合辦公模式下網絡設備采購質量保證協議
- 租車合同范本文庫
- 認知障礙護理科普
- 專職教師聘用合同
- 研究生聯合培養協議書二零二五年
- 報廢設備回收合同范本
- 購苗栽植合同范本
- 腹部帶蒂皮瓣護理
- 德能勤績廉個人總結的
- 二年級美術上冊課件 《3.我的手印畫》 贛美版 (共18張PPT)
- Q∕SY 126-2014 油田水處理用緩蝕阻垢劑技術規范
- GB∕T 3216-2016 回轉動力泵 水力性能驗收試驗 1級、2級和3級
- 電子電氣評估規范-最新
- 全國青少年機器人技術等價考試三級全套課件
- 適老化改造培訓課件(PPT 31頁)
- 黑布林繪本 Dad-for-Sale 出售爸爸課件
- 腹腔鏡下肝葉切除術(實用課件)
- 三菱M70數控系統以太網應用
- 光伏并網逆變器調試報告正式版
評論
0/150
提交評論