《統計學-基于R》(第4版)課件:隨機變量的概率分布_第1頁
《統計學-基于R》(第4版)課件:隨機變量的概率分布_第2頁
《統計學-基于R》(第4版)課件:隨機變量的概率分布_第3頁
《統計學-基于R》(第4版)課件:隨機變量的概率分布_第4頁
《統計學-基于R》(第4版)課件:隨機變量的概率分布_第5頁
已閱讀5頁,還剩22頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

賈俊平2024/1/30StatisticswithR統計學R語言

賈俊平2024/1/304.1什么是概率4.2隨機變量的概率分布4.3樣本統計量的概率分布

隨機變量的概率分布推斷理論經典概率分布統計量概率分布方法估計檢驗統計推斷的內容——基本框架思維導圖隨機變量的概率分布—本章概要概率分布經典概率分布離散型概率分布二項分布連續型概率分布正態分布卡方分布T分布F分布統計量的概率分布樣本均值的分布中心極限定理樣本比例的分布樣本方差的分布概率分布——基本框架

4.1

什么是概率概率

4.2

隨機變量的概率分布隨機變量的概括性度量——隨機變量事先不知道會出現什么結果,一般用

X,Y,Z

來表示投擲兩枚硬幣出現正面的數量一座寫字樓,每平方米的出租價格一個消費者對某一特定品牌飲料的偏好離散型隨機變量隨機變量X取有限個值或所有取值都可以逐個列舉出來以確定的概率取這些不同的值連續型隨機變量可以取一個或多個區間中任何值所有可能取值不可以逐個列舉出來,而是取數軸上某一區間內的任意點

4.2

隨機變量的概率分布隨機變量的概括性度量——離散型——期望值和方差

【例】一家手機制造商聲稱,它們所生產的手機100個中擁有次品的個數及相應的概率如下表所示。求該手機次品數的期望值和標準差次品數X=xi0123概率P(X=xi)

pi0.750.120.080.05example4_1<-read.csv("C:/example/ch4/example4_1.csv")mymean<-sum(example4_1$次品數*example4_1$概率)mymean

myvar<-sum((example4_1$次品數-mymean)^2*example4_1$概率)myvarsqrt(myvar)

4.2

隨機變量的概率分布隨機變量的概括性度量——連續型——期望值和方差期望值方差

EE

4.2

隨機變量的概率分布隨機變量的概率分布——離散型

4.2

隨機變量的概率分布隨機變量的概率分布——離散型——二項分布

4.2

隨機變量的概率分布隨機變量的概率分布——離散型——二項分布二項分布Binomial(5,b)圖

4.2

隨機變量的概率分布隨機變量的概率分布——離散型——二項分布——概率計算【例4-2】已知一批產品的次品率為6%,從中任意有放回地抽取5個。求5個產品中(1)沒有次品的概率(2)恰好有1個次品的概率(3)有3個及以下次品的概率沒有次品的概率恰好有1個次品的概率3個及3個以下次品的概率dbinom(0,5,0.06)dbinom(1,5,0.06)pbinom(3,5,0.06)

4.2

隨機變量的概率分布隨機變量的概率分布——連續型——正態分布連續型隨機變量可以取某一區間或整個實數軸上的任意一個值它取任何一個特定的值的概率都等于0不能列出每一個值及其相應的概率通常研究它取某一區間值的概率用概率密度函數的形式和分布函數的形式來描述正態分布由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對頻數分布的模型而提出描述連續型隨機變量的最重要的分布許多現象都可以由正態分布來描述可用于近似離散型隨機變量的分布,如二項分布經典統計推斷的基礎概率密度函數

4.2

隨機變量的概率分布隨機變量的概率分布——連續型——正態分布正態分布圖形是關于x=

對稱鐘形曲線,且峰值在x=

處均值

和標準差

一旦確定,分布形式也惟一確定,不同參數正態分布構成一個完整的“正態分布族”均值

可取實數軸上的任意數值,決定正態曲線的具體位置;標準差決定曲線的“陡峭”或“扁平”程度。

越大,正態曲線扁平;

越小,正態曲線越高陡峭X的取值向橫軸左右兩個方向無限延伸,曲線的兩個尾端也無限漸近橫軸,理論上永遠不會與之相交在特定區間上的取值概率由正態曲線下的面積給出,而且其曲線下的總面積等于1不同均值和標準差對應的正態曲線

4.2

隨機變量的概率分布隨機變量的概率分布——連續型——正態分布標準正態分布隨機變量具有均值為0,標準差為1的正態分布任何一個一般的正態分布,可通過下面的線性變換轉化為標準正態分布標準正態分布的概率密度函數常用區間的正態概率

4.2

隨機變量的概率分布隨機變量的概率分布——連續型——正態分布——概率計算

#計算正態分布的概率和分位數(1)pnorm(40,mean=50,sd=10)pnorm(40,mean=50,sd=10)-pnorm(30,mean=50,sd=10)(2)pnorm(2.5,mean=0,sd=1)pnorm(2,mean=0,sd=1)-pnorm(-1.5,mean=0,sd=1)(3)qnorm(0.025,mean=0,sd=1)

4.2

隨機變量的概率分布隨機變量的概率分布——連續型——卡方分布

不同自由度的的卡方分布的圖像

4.2

隨機變量的概率分布隨機變量的概率分布——連續型——卡方分布——例題分析

#計算卡方分布的概率和分位數pchisq(10,df=15)1-pchisq(20,df=15)qchisq(0.95,df=15)

4.2

隨機變量的概率分布隨機變量的概率分布——連續型——t分布

T分布與標準正態分布曲線的比較【例4—5】計算:(1)自由度為10,t值小于-2的概率;(2)自由度為10,t值大于3的概率;(3)自由度為10,t分布雙尾概率為0.05時的t值pt(-2,df=10)1-pt(3,df=15)qt(0.975,df=25)

4.2

隨機變量的概率分布隨機變量的概率分布——連續型——F分布

【例4—6】計算:(1)分子自由度為10,分母自由度為8,F值小于3的概率;(2)分子自由度為18,分母自由度為15,F值大于2.5的概率;(3)分子自由度為25,分母自由度為20,F分布累積概率為0.95時的F值pf(3,df1=10,df2=8)1-pf(2.5,df1=10,df2=8)qf(0.95,df1=10,df2=8)不同自由度的F分布

4.3

樣本統計量的概率分布統計量及其分布——參數和統計量——概率分布

統計量的概率分布樣本統計量的概率分布,也稱抽樣分布,是一種理論分布在重復選取容量為n的樣本時,由該統計量的所有可能取值形成的相對頻數分布隨機變量是樣本統計量樣本均值,樣本比例,樣本方差等結果來自容量相同的所有可能樣本提供樣本統計量長遠而穩定的信息,進行推斷的理論基礎

4.3

樣本統計量的概率分布統計量及其分布——樣本均值的概率分布與中心極限定理樣本均值的分布在重復選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數分布一種理論概率分布推斷總體均值

的理論基礎中心極限定理從均值為

,方差為

2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態分布樣本均值的分布與總體分布及樣本量的關系

4.3

樣本統計量的概率分布統計量及其分布——中心極限定理的模擬來自卡方分布總體的樣本均值的抽樣分布來自北京AQI數據的樣本均值的抽樣分布

4.3

樣本統計量的概率分布統計量及其分布——樣本比例的概率分布樣本比例的分布統計量的抽樣分布的標準差,簡稱標準誤差衡量統計量的離散程度,測度了用樣本統計量估計總體參數的精確程度當計算標準誤時涉及的總體參數未知時,用樣本統計量代替計算的標準誤,稱為估計的標準誤以樣本均值為例:當總體標準差

未知時,可用樣本標準差s代替,則在重復抽樣條件下,樣本均值的估計標準誤為樣本均值和樣本比例的標準誤分別為

4.3

樣本統計量的概率分布統計量及其分布——樣本方差的概率分布

來自正態總體的樣本方差的分布模擬

4.3

樣本統計量的概率分布統計量及其分布——統計量分布的標準誤統計量的抽樣分布的標準差,簡稱標準誤差衡量統計量的離散程度,測度了用樣本統計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論