數學分布泊松分布二項分布正態分布均勻分布指數分布生存分析貝葉斯概率公式全概率公式_第1頁
數學分布泊松分布二項分布正態分布均勻分布指數分布生存分析貝葉斯概率公式全概率公式_第2頁
數學分布泊松分布二項分布正態分布均勻分布指數分布生存分析貝葉斯概率公式全概率公式_第3頁
數學分布泊松分布二項分布正態分布均勻分布指數分布生存分析貝葉斯概率公式全概率公式_第4頁
數學分布泊松分布二項分布正態分布均勻分布指數分布生存分析貝葉斯概率公式全概率公式_第5頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數學期望:隨機變量最基本的數學特征之一。它反映隨機變量平均取值的大小。又稱期望或均值。它是簡單算術平均的一種推廣。例如某城市有10萬個家庭,沒有孩子的家庭有1000個,有一個孩子的家庭有9萬個,有兩個孩子的家庭有6000個,有3個孩子的家庭有3000個,則此城市中任一個家庭中孩子的數目是一個隨機變量,記為X,它可取值0,1,2,3,其中取0的概率為0.01,取1的概率為0.9,取2的概率為0.06,取3的概率為0.03,它的數學期望為0X0.01+1X0.9+2X0.06+3X0.03等于1.11,即此城市一個家庭平均有小孩1.11個,用數學式子表示為:E(X)=1.11。也就是說,我們用數學

2、的方法分析了這個概率性的問題,對于每一個家庭,最有可能它家的孩子為1.11個。可以簡單的理解為求一個概率性事件的平均狀況。各種數學分布的方差是:1、 一個完全符合分布的樣本2、 這個樣本的方差概率密度的概念是:某種事物發生的概率占總概率(1)的比例,越大就說明密度越大。比如某地某次考試的成績近似服從均值為80的正態分布,即平均分是80分,由正態分布的圖形知x=80時的函數值最大,即隨機變量在80附近取值最密集,也即考試成績在80分左右的人最多。下圖為概率密度函數圖(F(x)應為f(x),表示概率密度):離散型分布:二項分布、泊松分布連續型分布:指數分布、正態分布、X2分布、t分布、F分布抽樣分

3、布抽樣分布只與自由度,即樣本含量(抽樣樣本含量)有關二項分布(binomialdistribution):例子拋硬幣伯努利試1、重復試驗(n個相同試驗,每次試驗兩種結果,每種結果概率恒定驗)2、P(X=0),P(X=1),P(X=3),所有可能的概率共同組成了一個分布,即二項分布泊松分布(possiondistribution):1、一個單位內(時間、面積、空間)某稀有事件2、此事件發生K次的概率3、P(X=0),P(X=1),P(X=3),所有可能的概率共同組成了一個分布,即泊松分布二項分布與泊松分布的關系:二項分布在事件發生概率很小,重復次數n很大的情況下,其分布近似泊松分布均勻分布(un

4、iformdistribution):分為連續型均勻分布和離散型均勻分布離散型均勻分布:1、 n種可能的結果2、 每個可能的概率相等(1/n)連續型均勻分布:1、 可能的結果是連續的-q2、 每個可能的概率相等("一")連續型均勻分布概率密度函數如下圖:指數分布(exponentialdistribution):用來表示獨立隨機事件發生的時間問隔,比如旅客進機場的時間問隔、中文維基百科新條目出現的時間間隔等等。指數分布常用于各種“壽命”分布的近似1、連續型分布,每個點的概率:2、無記憶性。已經使用了s小時的元件,它能再使用t小時的概率,與一個從未使用過的元件使用t小時的概率

5、相同。即它對已經使用過的s小時沒有記憶。指數分布的概率密度函數如下圖:正態分布(normaldistribution):又稱高斯分布。1、 描述一個群體的某個指標。2、 這個指標是連續的。P為均數3、 每個特定指標在整個群體中都有一個概率(口為5池基)。4、 所有指標概率共同組成了一個分布,這個分布就是正態分布。正態分布的概率密度函數如下圖:中心極限定理:不論總體的分布形式如何(正態或非正態),只要樣本(抽樣樣本)含量n足夠大時,樣本均數的分布就近似正態分布,且均數與總體均數相等,標準差為(總體標準差)/(n的開方)。中心極限定理使得t分布、F分布和X2分布在抽樣樣本含量很大時不需要對總體樣本

6、是否正態有要求。t分布(studenttdistribution):1、t分布是以0為中心的一簇曲線,每個自由度決定一個曲線2、自由度是一個抽樣小樣本中的具體觀測值的個數(抽樣樣本含量)-13、總體樣本呈正態分布(抽樣樣本含量較小時,要求總體樣本呈正態分布,如果抽樣樣本含量很大(eg.n>=100),由中心極限定理可知抽樣樣本均數也近似正態分布,因而“差值”的概率也呈正態分布,而t分布的每一條曲線實際上都是正態分布曲線)4、從一個總體樣本中抽取很多個小樣本抽樣5、每個小樣本都有一個均值6、每個小樣本的均值與總體樣本均值有一個差值,這個差值用t估計7、可能有多個小樣本的差值估計都是t,t出

7、現的次數占所有小樣本的比例可以用一個概率衡量8、所有t值的概率組成一個分布,就是t分布的一個曲線9、另外做一個抽樣,每個小樣本包含的觀測值不同,則形成t分布的另外一個曲線10、自由度越大,則曲線越接近于標準正態分布11、t分布只與自由度相關t分布的概率密度函數如下圖(v為自由度):X2分布(chisquaredistribution):1、X2分布也是一簇曲線,每個自由度決定一個曲線2、自由度是一個抽樣小樣本中的具體觀測值的個數(抽樣樣本含量)-12、總體樣本呈正態分布(抽樣樣本含量(n)較小時,要求總體樣本呈正態分布)3、從總體樣本中抽取n個觀測值:Zi,Z2,Z3抽樣4、將它們平方后求和,

8、這個和用一個新變量表示,即X25、重復抽樣并獲得多個X2:X2,X2,X2,X26、可能有多次抽樣的X2值相同,同一個父值的抽樣次數占總次數的比例可以用一個概率表小7、所有的概率值共同組成一個分布,就是X2分布的一條曲線8、另外做一次,只要從總體中選取觀測值數目n不同,得到的就是另外一條曲線10、自由度越大,則曲線越接近于標準正態分布11、X2分布只與自由度相關X2分布的概率密度函數如下圖(n在這里為自由度):F分布(F-distribution):1、F分布也是一簇曲線,每對自由度決定一個曲線2、自由度是一個抽樣小樣本中的具體觀測值的個數(抽樣樣本含量)-12、兩總體樣本方差比的分布3、總體

9、樣本呈正態分布(抽樣樣本含量(n)較小時,要求總體樣本呈正態分布)4、從總體樣本中抽取兩個樣本,兩個樣中的觀測值數目可相同也可不同,分別記為n1和n25、分別計算出X2:Xi,“6、構建一個新變量F:7、重復抽取樣本,計算多個F值:Fi,F2,F3.8、可能有多次抽樣的F值相同,同一個F值的抽樣次數占總次數的比例可以用一個概率表不9、所有的概率值共同組成一個分布,就是F分布的一條曲線10、另外做一次,只要從總體中選取觀測值數目n不同,得到的就是另外一條曲線10、兩個自由度越大,則曲線越接近于標準正態分布11、F分布只與自由度相關F分布的概率密度函數如下圖(m,n在這里為自由度):【在推估總體平均值時,基于樣本平均數的抽樣分布】一一t分布【在用樣本方差來推估總體方差時,必須知道樣本方差的抽樣分布】一X2分布【比較兩個總體的方差是否相等時,必須知道樣本方差的聯合抽樣分布】一F分布生存分析(survivalanalysis):1、多種影響慢性疾病的因素(不同手術方法、不同藥物)2、隨訪一群患者3、一段時間后統計生存和死亡3、最終給出的結果是一個評價各種因素對生存時間的影響(生存時間、生存率有無差異)貝葉斯公式(bayesformula):1、 描述兩個條件概率之間的關系P(Bi|A)與P(A|Bi),A為事

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論