第三章理論分布與抽樣分布_第1頁
第三章理論分布與抽樣分布_第2頁
第三章理論分布與抽樣分布_第3頁
第三章理論分布與抽樣分布_第4頁
第三章理論分布與抽樣分布_第5頁
已閱讀5頁,還剩28頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三章理論分布與抽樣分布統計概率得概念當n充分大時,事件A得頻率作為該事件概率得近似值,稱為統計概率。概率得基本性質:任一事件得概率不可能大于1,也不可能小于0[0≤P(A)≤1];必然事件得概率等于1[P(A)=1];不可能事件得概率等于0[P(A)=0]假設檢驗假設檢驗就就是根據總體得理論分布和小概率原理,對未知或不完全知道得總體提出兩種彼此對立得假設,然后由樣本得實際結果,經過一定得計算、作出在一定概率意義上應該接受得那種假設得推斷。如果抽樣結果使小概率發生。則拒絕假設、如抽樣結果沒有使小概率發生,則接受假設。一般認為小于0、05或0、01得概率為小概率。通過假設檢驗,可以正確分析處理效應和隨機誤差,作出可取得結論。隨機事件得概率表示了隨機事件在一次試驗中出現得可能性大小。若隨機事件得概率很小,例如小于0、05、0、01、0、001,稱之為小概率事件。小概率事件實際不可能性原理小概率事件雖然不就是不可能事件,但在一次試驗中出現得可能性很小,不出現得可能性很大,以至于實際上可以看成就是不可能發生得。在統計學上,把小概率事件在一次試驗中看成就是實際不可能發生得事件稱為小概率事件實際不可能性原理,亦稱為小概率原理。小概率事件實際不可能性原理就是統計學上進行假設檢驗(顯著性檢驗)得基本依據。假設檢驗得步驟1、提出假設無效假設(nullhypothesis):備選假設(alternativehypothesis):“無效”指處理效應與總體參數之間沒有真實得差異,試驗結果中得差異乃誤差所致。引進一醋的新曲種,以原生產標準為對照,已知原生產標準醋酸含量為=9.75%,采用新曲種釀造10個樣本的醋酸含量平均數為11.99%,標準差S為1.3%,試分析采用新曲種是否提高了醋酸的含量。假設:

即:是來自隨機誤差2、確定顯著水平以多大概率接受或否定無效假設?通常規定5%()和1%()為測試差異是否顯著的概率標準,稱為檢驗水平或顯著標準,一般以a表示。3、推斷就是否接受假設當時,認為差異顯著,標記為“*”,否定;當時,便認為差異非常顯著,標記“**”號;當時,則認為其差異不顯著,其差值為零,差值是來自誤差,接受9大家應該也有點累了,稍作休息大家有疑問的,可以詢問和交流二、概率得運算法則1、概率得加法定理:互斥事件。某種產品得正品率與次品率。2、概率得乘法定理:互不排斥或相容得事件。某生產流水線上第一道工序產品與第二道工序產品得正品率。第二節二項分布有些總體得各個個體得某種性狀,只有兩種結果,非此即彼,此和彼就是對立事件。這種由非此即彼事件構成得總體,叫做二項總體。這些資料得理論分布為二項分布。二項分布得概念

如某實驗中小白鼠染毒后死亡概率P為0、8,則生存概率為=1-P=0、2,故對一只小白鼠進行實驗得結果為:死(概率為P)或生(概率為1-P)

對二只小白鼠(甲乙)進行實驗得結果為:甲乙均死(概率為P2)、甲死乙生[概率為P(1-P)]、乙死甲生[概率為(1-P)P]或甲乙均生[概率為(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]2

依此類推,對n只小白鼠進行實驗,所有可能結果得概率相加得Pn+cn1P(1-P)n-1+、、、+cnxPx(1-P)n-x+、、、+(1-P)x=[P+(1-P)]n其中n為樣本含量,即事件發生總數,x為某事件出現次數,cnxPx(1-P)n-x為二項式通式,cnx=n!/x!(n-x)!,P為總體率。

因此,二項分布就是說明結果只有兩種情況得n次實驗中發生某種結果為x次得概率分布。其概率密度為:

,x=0,1,、、、n。

二項分布得應用條件每次實驗只有兩類對立得結果;n次事件相互獨立;每次實驗某類結果得發生得概率就是一個常數。二項分布得形狀(1)二項分布圖形得形狀取決于P和n得大小;(2)當P=0、5時,無論n得大小,均為對稱分布;(3)當P<>0、5,n較小時為偏態分布,n較大時逼近正態分布。二項分布得參數平均數和標準差二項分布得平均數μ=np,二項分布得標準差為np(1-p)得算術平方根。正態分布

1、正態分布也稱高斯(Gauss)分布,就是一種連續型隨機變量得理論分布。她得分布狀態就是多數變量都圍繞在平均值左右,由平均值到分布得兩側,變量數減少。正態分布的概率函數為:

為正態分布得概率密度函數,表示某一定x值出現得概率密度。表示總體平均數,表示總體方差。

正態分布就是一種在統計理論和應用上最重要得分布。試驗誤差得分布一般服從于這種分布,許多生物現象得計量資料均近似服從這種分布。正態分布記為N(,)。

當時,f(x)值最大,所以正態分布曲線就是以平均數為中心分布。當得絕對值相等時,f(x)值也相等,所以正態分布就是以為中心向左右兩側對稱得分布。標準離差u=得絕對值越大,f(x)值就越小,但f(x)永遠不會等于0,所以正態分布以x軸為漸近線,x得取值區間為。正態分布曲線完全由位置參數和形態參數來決定。確定正態分布曲線在x軸上得中心位置,確定正態分布得變異度。正態分布具有以下特征:

值不同,值相同的三條正態分布曲線值相同,值不同的三條正態分布曲線標準正態分布記為N(0,1)

標準正態分布為了方便,令即可將的正態分布轉化為的標準正態分布。欲求一定區間標準正態分布曲線下得面積只需查附表1即可。有一批面包,重量平均為100g,標準差為1、2g,試求其單個面包重量從100g到102g得概率就是多少?根據公式得:查表得當u=1、66時,對應得概率P=0、451,從100g到102g得面包占總面包數量得45、1%t分布

當樣本容量較大(),用樣本方差估計。但當樣本容量不大()時,如果仍用估計,這時標準離差就不呈正態分布,而就是服從自由度為得t分布。

t分布具有以下特征:

t分布曲線也是左右對稱的,以0為中心向兩側遞降。t分布受自由度df=n-1的制約,每個自由度都有一條t分布曲線。和正態分布相比,t分布的頂部偏低,尾部偏高,自由度df>30時,其曲線就比較接近正態分布曲線,當時則和正態分布曲線重合。抽樣誤差系統誤差和隨機誤差系統誤差就是指測定值得數學期望與真值之差用ε表示。

ε=x∞-x真值

隨機誤差就是指n次測量中各次測量值x與測量數學期望之差。用σi表示:

σi=xi-x∞

數學期望:指當測量次數n趨向無窮大(n→∞)時算術平均值得極限。用x∞表示:

x真值、x∞和xi關系得示意圖。從圖中得知,隨機誤差σi說明各次測量值與x∞得離散程度,即精密度,σi越小說明數據得重復性好、精密度高;而系統誤差ε可做為x∞與真值x真值偏離得尺度,ε越小,即準確度越高。平均誤差與標準誤差平均誤差可用下式表示:

其中:;用平均誤差表示測量誤差,計算方便,但由于采用平均值得方法,容易掩蓋個別質量不高得測量。

標準誤差σ又稱均方根誤差。通常真值x就是未知得,而且測量次數n有限,這時可以用貝塞爾(Bessel)式得出在有限次測量情況下,單次測量值得標準離差S,且把測量得標準離差(S)作為標準誤差(σ)得估計,σ≈S,這樣標準誤差σ就表示為:

絕對誤差與相對誤差絕對誤差就是測量值與真值之間得偏差,某次實驗得絕對誤差可用下式計算:

絕對誤差=測量值-真值

視測量值與真值相比較大小不同,絕對誤差可以就是正值,也可以就是負值,她得單位與測量得單位相同。

相對誤差就是絕對誤差與真值得比值(百分數表示),某次實驗得相對誤差可用下式計算:樣本異常值得判斷和處理

1、概念

樣本異常值就是指樣本中得個別值,其數值明顯偏離她所在樣本得其余觀測值。

異常值可能僅僅就是數據中固有得隨機誤差得極端表現,也可能就是過失誤差。異常值檢驗得顯著性水平

,推薦得

值為1%。2、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論