參數估計假設檢驗_第1頁
參數估計假設檢驗_第2頁
參數估計假設檢驗_第3頁
參數估計假設檢驗_第4頁
參數估計假設檢驗_第5頁
已閱讀5頁,還剩70頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

會計學1參數估計假設檢驗主要內容:抽樣分布與抽樣誤差總體均數的估計總體率的估計第1頁/共75頁幾個重要概念的回顧:總體:樣本:統計量:參數:統計分析統計描述:統計指標、統計圖表

統計推斷:參數估計、假設檢驗第2頁/共75頁第一節

抽樣分布與抽樣誤差第3頁/共75頁一、樣本均數的抽樣分布與標準誤

了解總體特征的最好方法是對總體的每一個體進行觀察、試驗,但這在醫學研究實際中往往不可行。對無限總體不可能對所有個體逐一觀察,對有限總體限于人力、財力、物力、時間或個體過多等原因,不可能也沒必要對所有個體逐一研究。借助抽樣研究。第4頁/共75頁抽樣研究按照隨機化原則采用正確的抽樣方法從總體中抽取有代表性的一部分組成樣本用樣本信息推斷總體特征的研究統計推斷第5頁/共75頁

例:欲了解某地2000年正常成年男性血清總膽固醇的平均水平,隨機抽取該地200名正常成年男性作為樣本。由于存在個體差異,抽得的樣本均數不太可能恰好等于總體均數。由個體變異和抽樣造成的樣本統計量與總體參數的差異,稱為抽樣誤差。第6頁/共75頁

這些來自同一總體的若干樣本統計量間,也存在抽樣誤差。在抽樣研究中,抽樣誤差是不可避免的。由于其產生的根本原因是生物個體的變異性,故抽樣誤差分布具有一定的規律性。第7頁/共75頁抽樣誤差從總體均數為155.4cm,標準差為5.3cm的正態分布總體中隨機抽樣。樣本大小為30。n=30…

….第8頁/共75頁從正態總體抽樣得到的1000個樣本,將1000個樣本均數看成新變量,構成新的分布,這1000個樣本均數的頻數分布(ni=30)如下:第9頁/共75頁Mean=155.426Std=0.966第10頁/共75頁樣本均數的分布特點:各樣本均數不一定等于總體均數樣本均數間存在差異樣本均數的分布規律:樣本均數的分布為中間多,兩邊少,圍繞總體均數上下波動,左右基本對稱樣本均數的變異較之原變量的變異大大減小,(這1000個樣本均數的均數為155.4、標準差為0.966),由樣本均數的標準差描述

在非正態分布總體中可進行類似抽樣。第11頁/共75頁樣本均數的規律性隨機的在概率意義下是有規律的---抽樣分布通過大量重復抽樣,借助頻數表描述樣本均數的變異規律(抽樣分布)與個體觀察值變異規律有關即使只有一個樣本資料,也可由樣本資料的個體觀察值的變異規律間接得到樣本均數的變異規律抽樣分布第12頁/共75頁小結:抽樣誤差抽樣誤差Samplingerror由于個體差異和抽樣引起的樣本統計量與總體參數之間的差異或各樣本統計量之間的差異。來源:個體變異抽樣表現樣本統計量與總體參數間的差異樣本統計量間的差異第13頁/共75頁

的總體均數為;而的標準差比原個體值的標準差要小,為區別兩者,的標準差用表示。樣本均數的標準差稱均數的標準誤(standarderrorofmean,SEM),簡稱標準誤(SE)。標準誤意義:反映樣本均數抽樣誤差的大小,SE越大,均數的抽樣誤差越大,說明樣本均數與總體均數間的變異越大。標準誤第14頁/共75頁可證明均數標準誤

在實際工作中常未知,用S來估計。均數標準誤估計值

均數標準誤大小與標準差大小成正比,與樣本含量n的平方根成反比。第15頁/共75頁標準誤含義:樣本均數的標準差計算:(標準誤的估計值)P23例4-1:某地120名正常成人血清銅含量資料,其X

=14.46umol/L,s=2.26umol/L,求其標準誤注意:X

、SX均為樣本均數的標準誤(標準誤的理論值)第16頁/共75頁標準誤與標準差的關系標準誤與標準差成正比;標準誤與樣本含量n的平方根成反比(說明增大樣本含量可以減少抽樣誤差);標準誤與標準差的意義不同(標準差反映了變量值的離散程度,標準誤則反映了均數的離散程度)。注意區別:小結第17頁/共75頁標準誤的應用反映抽樣誤差的大小(樣本均數的離散程度;樣本均數與總體均數的接近程度;均數的代表性如何。)說明樣本均數推論總體均數的可靠性。(標準誤越小,可靠性越好;反之,標準誤越大,可靠性越差)估計總體均數的可信區間(參數估計)。用于均數的假設檢驗。減小抽樣誤差的方法增大樣本含量n

;選擇標準差較小的指標。第18頁/共75頁由中心極限定理可得到如下結論:

若服從正態分布

~

則服從正態分布若不服從正態分布

n大:則近似服從正態分布

n小:則為非正態分布第19頁/共75頁標準差和標準誤的區別標準差標準誤意義描述觀察值的變異程度。其值越小,觀察值的變異程度越小,均數的代表性越好…描述樣本均數的變異程度,說明抽樣誤差的大小。其值越小,估計總體均數的可靠性越大…計算……用途描述資料的頻數分布狀況,可用于制定醫學參考值范圍,計算變異系數和標準誤用于表示抽樣誤差大小、總體均數的區間估計和均數的假設檢驗等第20頁/共75頁二、t分布及其應用若某一隨機變量X服從總體均數為、總體標準差為的正態分布N(,2)由于樣本均數服從總體均數為、總體標準差為的正態分布N(,)第21頁/共75頁n為計算某一統計量用到的數據個數,m為計算該統計量用到其它獨立統計量的個數。第22頁/共75頁t分布最早由英國統計學家W.S.Gosset于1908年以“Student”筆名發表,故又稱Student'st-distribution。它的發現,開創了小樣本統計推斷的新紀元。

第23頁/共75頁

總體為N的m個樣本(樣本大小為n)的t值第24頁/共75頁t分布的特征:以0為中心的對稱分布;與U分布比,曲線低平;t分布是一簇曲線,形態與自由度(n-1)有關。第25頁/共75頁t分布與標準正態分布的比較1.二者都是單峰分布,以0為中心左右對稱。

2.自由度v較小時,t分布與標準正態分布相差較大,并且t分布曲線的尾部面積大于標準正態分布曲線的尾部面積。

3.當逐漸增大時,t分布逐漸逼近標準正態分布,當=時,t分布完全成為標準正態分布。第26頁/共75頁t分布的界值

給定自由度v,t分布曲線的雙側尾部面積為時對應的t值,記為并稱其為t的雙側界值單側界值:一側尾部面積為時對應的t值對稱性得:單側曲線下面積=2*雙側曲線下面積給定曲線下面積對應的界值與自由度有關同樣的尾部面積,t分布的界值要大于標準正態分布的界值第27頁/共75頁t分布的界值

t分布界值示意圖,表示陰影的面積

第28頁/共75頁01-12-2-33f(t)第29頁/共75頁t分布曲線下的面積規律:中間95%的t值:-t0.05/2,t0.05/2,中間99%的t值:-t0.01/2,

t0.01/2,單尾概率:一側尾部面積雙尾概率:雙側尾部面積(1)自由度(υ)一定時,p與t成反比;(2)概率(p)一定時,υ與t成反比;第30頁/共75頁32三、樣本率的抽樣分布與標準誤

樣本率與總體率存在著抽樣誤差,其大小用率的標準誤來描述,用σp表示。

例:某醫院用某方劑治療慢性肝炎160例,有效率為86.25%,求其標準誤。第31頁/共75頁第二節總體均數的估計第32頁/共75頁計量資料統計推斷一般包括以下兩個方面:

參數估計:用樣本指標估計總體指標

(1)點估計:用樣本統計量直接作為總體參數的估計值優點:簡單缺點:沒有考慮抽樣誤差

(2)區間估計:按預先給定的概率確定一個包含未知總體參數的范圍,稱為參數的可信區間或置信區間(confidenceinterval,CI),常用95%的可信區間

假設檢驗

第33頁/共75頁

總體均數的區間估計可信區間的含義:按一定的可信度由樣本均數計算的總體均數可能所在的范圍,這個范圍稱為總體均數的可信區間。

95%可信區間表示該區間包含總體均數μ的概率為95%。若作100次抽樣算得100個可信區間,平均有

95個可信區間包含μ(估計正確),有5個可信區間不包含μ(估計錯誤)。第34頁/共75頁總體均數可信區間的計算計算方法:σ已知,按u分布。σ未知,但n足夠大,按u分布。σ未知,且n較小,按t分布。第35頁/共75頁1.σ已知時,總體均數雙側可信區間為:2.σ未知但n較大時,按u分布計算總體均數的可信區間3.σ未知且n較小時,按t分布計算總體均數的可信區間第36頁/共75頁

例:某地抽取正常成年人200名,測得其血清膽固醇均數為3.64mmol/L,標準差為1.20mmol/L,估計該地正常成年人血清膽固醇均數95%可信區間。

本例=3.64、S=1.20、n=200、

=0.0849,

=(3.47,3.81)(mmolL)

該地正常成年人血清膽固醇均數雙側95%可信區間為(3.47,3.81)mmolL。第37頁/共75頁第38頁/共75頁區間估計的準確度:說對的可能性大小,用(1-)來衡量。99%的可信區間好于95%的可信區間(n,S一定時)。

區間估計的精確度:指區間范圍的寬窄,范圍越寬精確度越差。99%的可信區間差于95%的可信區間(n,S一定時)

準確度與精確度的關系:在準確度確定的情況下,增加樣本含量可提高精確度。可信區間的要素

第39頁/共75頁第40頁/共75頁總體均數可信區間與參考值范圍的區別總體均數可信區間參考值范圍含義按預先給定的概率,確定未知參數

的可能范圍。實際上一次抽樣算得的可信區間要么包含總體均數,要么不包含。95%CI估計錯誤的概率≤0.05.總體均數的波動范圍“正常人”的解剖,生理,生化某項指標的波動范圍。個體值的波動范圍計算公式未知:

已知或未知但n﹥60:或正態分布偏態分布

PX~P100X用途總體均數的區間估計絕大多數(如95%)觀察對象某項指標的分布范圍第41頁/共75頁第三節總體率的估計點估計:樣本率作為總體率的估計值區間估計:按一定概率α,以樣本率來估計總體率的1-α可信區間。1.正態近似法:當n足夠大,且np和n(1-p)均大于5時:

p±uα.sp

例4-10:某醫師用自擬中藥方治療高血壓患者107例,有效69例,有效率為64.69%,試估計其總體有效率的95%CI。第42頁/共75頁2.查表法:n≤50查百分率的可信區間表(P114附表3)例:某醫院用中藥治療腦血管梗塞患者40例,其中33例治療有效,有效率為82.5%,試估計其總體有效率的95%CI。n=40x=7時無效率的95%CI為(8%,33%)n=40x=33時有效率的95%CI為(67%,92%)第43頁/共75頁第五章假設檢驗概述第44頁/共75頁

由樣本信息推斷總體特征,除了參數估計外,還會遇到這樣的問題:某一樣本均數是否來自于已知均數總體?兩個不同樣本均數是否來自均數相同的總體等?要回答這類問題,更多的是用統計推斷的另一方面假設檢驗(hypothesistest)。第一節假設檢驗的分類、思維方法與步驟第45頁/共75頁例:已知健康成年男子的脈搏均數為72次/分。某醫生在某山區隨機調查30名健康男子,求得脈搏均數為74.2次/分,標準差6.5次/分。能否認為該山區成年男子脈搏均數高于一般成年男性的脈搏均數(72次/分)?第46頁/共75頁觀測到的樣本均數與總體均數間或兩樣本均數間差異的可能原因:1.總體均數不同(即兩者來自不同的總體)2.總體均數相同,差別由抽樣造成。需要通過統計學假設檢驗來判斷。假設檢驗是用來推斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。第47頁/共75頁假設檢驗的基本思想

小概率反證法思想小概率思想:指小概率事件(P<0.01或P<0.05)在一次試驗中基本上不會發生。反證法思想:先提出假設(檢驗假設H0),再用適當的統計方法確定假設成立的可能性大小,如可能性小,則認為假設不成立,若可能性大,則還不能認為假設不成立。第48頁/共75頁

假設檢驗的基本思想

假設檢驗亦稱顯著性檢驗,就是對所估計的總體先提出一個假設,再通過樣本數據計算某種統計量(t、U、F等)來判斷假設成立的可能性大小,如果假設成立的可能性大,就接受這個假設;反之,則拒絕這個假設。第49頁/共75頁第一步:建立假設、確定檢驗水準檢驗假設H0:(無效假設、零/原假設)。即認為差異僅由抽樣誤差引起;備擇假設H1:存在本質差異。確定單、雙側檢驗

;H0與H1相關且對立,二者都是對總體特征的假設假設檢驗的基本步驟第50頁/共75頁第51頁/共75頁確定檢驗水準:顯著性水準判斷應當拒絕或不拒絕H0的水準,即預先規定的小概率事件的標準,為允許結果出現錯誤的概率,或出現假陽性的概率;常取0.05或0.01。

本例:H0:,即山區成年男子脈搏與一般成年男子相等。H1:,即山區成年男子脈搏高于一般人群。單側=0.05第52頁/共75頁根據資料的類型和研究目的,選擇合適的統計檢驗方法,計算相應的統計量值。例如:本例選用t檢驗,則計算t值,若u檢驗則計算u值。第二步:選定統計方法,計算統計量第53頁/共75頁第三步:確定P值、做出推斷結論(包括統計結論和專業結論)根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小。

P值含義:在由H0所規定的總體中做隨機抽樣時,獲得等于及大于(或等于及小于)現有樣本獲得的統計量值的概率。第54頁/共75頁若檢驗統計量≥現有統計量,則P≤,結論為按所取的檢驗水準,拒絕H0,接受H1,有統計學意義(統計結論)。可認為不同或不等(專業結論)若檢驗統計量<現有統計量,則P>,結論為按檢驗水準,不拒絕H0,無統計學意義(統計結論)。尚不能認為不同或不等(專業結論)

第55頁/共75頁結合小概率原理,若P≤α,則按α檢驗水準,拒絕H0,接受H1;若P>α,則不拒絕H0;

注意:假設檢驗的結論是概率性推斷!不拒絕H0,不代表H0一定成立;同理,拒絕H0

,也不能認為H0一定不成立。第56頁/共75頁0-1.9601.96095%2.5%2.5%接受域拒絕域拒絕域假設檢驗第57頁/共75頁一、假設檢驗的兩類錯誤

假設檢驗采用小概率反證法的思想,根據樣本統計量作出的推斷結論具有概率性,因此其結論不可能完全正確,可能發生下面兩類錯誤:Ⅰ型錯誤:拒絕了實際上是成立的H0,犯“棄真”的錯誤。其概率大小用表示,可取單側亦可取雙側。Ⅱ型錯誤:不拒絕實際上是不成立的H0,其概率大小用β表示。只取單側,其大小一般未知,只有在已知兩總體差值,

及n

時,才能估算出來。

第二節假設檢驗的兩類錯誤和注意事項第58頁/共75頁

Ⅰ型錯誤與Ⅱ型錯誤的定義如下表:第59頁/共75頁

引申的幾個概念:Ⅰ型錯誤與Ⅱ型錯誤的關系:愈小,愈大;反之愈大,愈小。若要同時減小以及,唯一的方法就是增加n。若重點減少,一般取=0.05或0.01;若重點減少,一般取=0.10或0.20。

檢驗效能:1稱為檢驗效能,是指兩總體確有差異,按規定檢驗水準能夠發現該差異的能力如1=0.90,意味著若兩總體確有差別,則理論上在100次檢驗中,平均有90次能夠得出有統計學意義的結論。

第60頁/共75頁二、假設檢驗的注意事項1、要有嚴密的抽樣設計2、選用的假設檢驗的方法應符合其應用條件3、單側檢驗和雙側檢驗(單側檢驗更容易得出有差別的結論,因為單側t界值<雙側t界值)4、結論不能絕對化,有無差別是相對的(Ⅰ型和Ⅱ型錯誤)5、正確理解P值,實際差別大小與統計學意義的區別6、假設檢驗和可信區間的關系第61頁/共75頁例如:當α=0.05,u=2.1時,

P<0.05,拒絕H0,接受H1。當α=0.01,u=2.1時,

P>0.01,不拒絕H0。當α不同時,得出的結論可能是相反的。第62頁/共75頁

可信區間與假設檢驗有各自不同的作用,要結合使用:一方面,可信區間亦可回答假設檢驗的問題若算得的可信區間若包含了H0,則按水準,不拒絕H0;若不包含H0,則按水準,拒絕H0,接受H1。第63頁/共75頁另一方面,可信區間可提示差別有無實際的專業意義。

即可信區間不但能回答差別有無統計學意義,而且還能比假設檢驗提供更多的專業信息。第64頁/共75頁可信區間比假設檢驗提供更多信息(1)(2)(3)(4)(5)有統計意義無統計意義有實際意義可能有實際意義無實際意義樣本太小可接受H0有實際意義的值H0附圖可信區間在統計推斷上提供的信息可信區間第65頁/共75頁

雖然可信區間亦可回答假設檢驗的問題,并能提供更多的信息,但并不意味著可信區間能夠完全代替假設檢驗。可信區間只能在預先規定的概率檢驗水準的前提下進行計算,而假設檢驗能夠獲得一較為確切的概率P值。第66頁/共75頁對數變換平方根變換平方根反正弦變換倒數變換第三節正態性檢驗與數據變換

正態性檢驗:

W檢驗(n<50)、D檢驗(n≥50)

數據變換:第67頁/共75頁練習題一、是非判斷:1.標準誤是一種特殊的標準差,其表示抽樣誤差的大小。2.N一定時,測量值的離散程度越小,用樣本均數估計總體均數的抽樣誤差就越小。3.假設檢驗的目的是要判斷兩個樣本均數的差別有多大。第68頁/共75頁二、選擇題:1.按α=0.10水準做t檢驗,P>0.10,不能認為兩總體均數不相等,此時若推斷有錯,其錯誤的概率為()。A.大于0.10B.β,而β未知C.小于0.10D.1-β,而β未知2.某地正常成年男子紅細胞的普查結果,均數為480萬/mm3,標準差為41.0萬/mm3,后者反映()A.個體變異B.抽樣誤差C.總體均數不同D.均數間變異3.兩個樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論