概率分布和參數估計_第1頁
概率分布和參數估計_第2頁
概率分布和參數估計_第3頁
概率分布和參數估計_第4頁
概率分布和參數估計_第5頁
已閱讀5頁,還剩11頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

概率分布和參數估計

連續性變量的概率分布根據樣本數據對總體的客觀規律性作出合理估計的過程被稱為統計推斷(StatisticalInference),它可以被分為參數估計和假設檢驗兩大類。正態分布一、正態分布的定義若連續性隨機變量X的概率分布密度函數為則稱隨機變量X服從正態分布(NormalDistribution)二、正態分布的特征(1)正態分布是一條對稱曲線,關于均數對稱,因此均數被稱為正態分布的位置參數。(2)曲線是單峰,在均值出達到最高點。(3)正態分布曲線的尖削與標準差有關。因此標準差被稱為正態分布曲線的尺度參數。(4)曲線無論向左或向右延伸,都越來越接近橫軸,但不會與橫軸相交,以橫軸為漸近線。(5)約68%的個體的取值與平均數在距離一個標準差之內。(6)約95%的個體取值與平均數的距離在1.96個標準差之內。(7)99%個體的取值與平均數的距離在2.58個標準差。三、標準正態分布

(StandardNormalDistribution)將原來的正態分布轉換為標準正態分布。在SPSS中的Descriptive過程可以將原變量轉換為標準正態分布的得分,只需要選中主對話框左下角的Savestandardizedvaluesasvariables復選框即可。四、偏度和峰度(1)偏度(Skewness):偏度是用來描述變量取值分布形態的統計量,指分布不對稱的方向和程度。樣本偏度系數:偏態的方向指的應當是長尾的方向,而不是高峰的位置。(2)峰度(Kurtosis):峰度用來描述變量取值分布形態陡緩的統計量,是指分布圖形的的尖削程度或峰凸程度。樣本的峰度系數:

參數的點估計參數的點估計就是選定一個適當的樣本統計量作為參數的估計量,并計算出估計值。對于所選統計量是否適于作參數估計量,有無偏性、一致性和有效性三個評選標準。無偏性是指雖然估計量的值不全等于參數,但應在真實值附近擺動。一致性是指樣本容量越大,估計值離真實值的差異應當越小。有效性是指如果兩個統計量都符合上述要求,則應當選取誤差更小的一個作為估計值。在許多種情況下,樣本統計量本身往往就是相應的總體參數的最佳估計,此時就可以直接取相應的樣本統計量作為總體參數的點估計。一、矩法二、極大似然估計法該方法的原理是在已知總體的分布,但未知其參數值時,在待估參數的可能取值范圍內進行搜索,使似然函數值最大的那個數值為極大似然估計值。三、穩健估計值穩健估計值的是該統計量具有穩健性,當數據存在異常值時受影響較小,而且對大部分的分布而言都很好。穩健估計有M估計、R估計等不同方法。SPSS中數出的M估計量有4種,它們分別是Huber、Andrews、Hampel和Tukey所提出的,實際上就是所用的函數不同。一般而言,Huber適用于數據接近正態分布的情況,另外三種則適用于數據中許多異常值的情況。如果M估計量里平均數和中位數較遠,則數據中可能存在異常值。此時,應該用M估計量替代平均數以反映集中趨勢。。

參數的區間估計一、標準誤標準誤就是用來描述參數估計值可能離真實值究竟有多遠的統計量。二、區間估計的計算結合樣本統計量和標準誤可以確定一個具有較大的可信度包含總體參數的區間,該區間稱為總體參數的1-a可信區間或置信區間(ConfidenceInterval)。對于任意可信度的區間情況,總體均值在100(1-a)%可信區間為:

分類變量的概率分布二項分布的參數估計一、二項分布二項分布又稱為貝努里(Bernoulli)分布,是一種具有廣泛應用的離散型隨機變量的概率分布。二項分布研究的是試驗僅有兩種結果的分布(這種試驗稱為貝努里試驗),如某產品質量合格與不合格等。其定義為:設有n次試驗,各次試驗是相互獨立的,每次試驗某事件出現的概率都是p,某事件不出現的概率都是1-p,記為q,則對于某事件出現k(k=0,1,2,?,n)次的概率分布為:二、二項分布檢驗(BinomialTest)當研究對象屬于二項總體時,可以用二項分布來檢驗假設,判斷所抽取的樣本是否來自具有既定值的總體。其檢驗步驟如下:1、提出假設2、計算統計量值和p值3、根據p值作出統計判斷。[例]擲一枚球類比賽用的挑邊器40次,出現A面和B面在上的次數。如表所示,試問這枚挑邊器是否均勻?解:(1)在SPSS中輸入表中的數據(變量名為Y)。選擇主菜單的[Analyze]=>[NonparametricTests]=>[BinomialTest]。(2)顯示如圖所示的[BinomialTest(二項檢驗)]主對話框,把Y選入[TestVariable],其它選項采用默認值。(3)單擊主對話框中的[OK]按鈕,輸出結果如下:從結果可以看出,p=0.017<α=0.05,認為該挑邊器不是均勻的。二、總體比例的區間估計顯著性水平α下,P在1-α置信水平下的置信區間:本章小結概率分布是參數

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論