統計推斷原理_第1頁
統計推斷原理_第2頁
統計推斷原理_第3頁
統計推斷原理_第4頁
統計推斷原理_第5頁
已閱讀5頁,還剩53頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統計推斷原理第一頁,共五十八頁,2022年,8月28日本章主要介紹統計推斷的意義、原理,統計推斷與抽樣分布的關系,統計推斷的思路和一般步驟,兩尾檢驗和一尾檢驗,統計推斷可能犯的兩類錯誤及防止方法第二頁,共五十八頁,2022年,8月28日生物統計學的一個重要任務是要知道所研究總體的特征值(參數)但是總體特征值一般難以知道:一方面是由于總體很大,即N

大,有時是無限的(無限總體,N∞),因此不可能逐一調查清楚另一方面,有時所要研究的總體目前并不存在,或者只能說是虛擬存在(總體是虛的),無法進行調查作某一試驗時更是如此

第三頁,共五十八頁,2022年,8月28日但不管是何種類型的總體,我們總是可以通過隨機抽樣(抽樣調查)的方法獲得該總體的隨機樣本通過統計推斷來定性或定量地分析所研究總體的特征值統計推斷就是用樣本的特征值(統計量)在一定的概率保證下推斷相應總體的特征值(參數)即:隨機抽樣隨機樣本隨機樣本特征值總體特征值(統計量)(參數)

計算估計第四頁,共五十八頁,2022年,8月28日第一節統計推斷的意義和內容第五頁,共五十八頁,2022年,8月28日所謂統計推斷(statisticalinference),就是根據統計量的分布和概率理論,由樣本統計量來推斷總體的參數實際工作中,一次試驗或一次調查所獲得的數據資料,通常是一個樣本的結果,而我們真正需要知道的是抽取樣本的總體特征第六頁,共五十八頁,2022年,8月28日即:統計分析的結論是針對總體參數而言的,因此,統計推斷是科研工作中一個十分重要的工具,對試驗設計也有很大的指導意義統計推斷包括:統計假設檢驗(hypothesistest)參數估計(parametricestimation)這樣兩部分內容第七頁,共五十八頁,2022年,8月28日統計假設檢驗又稱顯著性檢驗(significancetest)其原理和過程是:對未知的或不完全知道的總體參數提出一些假設(hypothesis

這些假設通常構成完全事件系),然后在某一基本假設的基礎上,計算樣本的統計量,并分析這一統計量的分布規律最后根據這一統計量作出在一定概率意義下應當接受何種假設的結論第八頁,共五十八頁,2022年,8月28日這里有一個定量轉化為定性的過程:經計算所得到的統計量一般是呈連續分布的(定量),但最后的檢驗結論只有兩種:接受何種假設(定性)即:存在一個臨界值,統計量未達到臨界值,應當接受一種假設統計量超過臨界值,應當接受另一種假設第九頁,共五十八頁,2022年,8月28日參數估計包括兩部分內容:參數的點估計(pointestimation)參數的區間估計(intervalestimation)第十頁,共五十八頁,2022年,8月28日第二節統計量的抽樣分布與統計推斷的關系第十一頁,共五十八頁,2022年,8月28日前面已經講過,由樣本的統計量組成的總體分布(抽樣分布)其參數與原總體的相應參數有著很密切的關系同時抽樣的結果還告訴我們,樣本統計量與總體相應參數之間存在著一定的抽樣誤差因此,用樣本來推斷總體的準確性與抽樣誤差的大小有關,抽樣誤差的大小用標準誤來衡量第十二頁,共五十八頁,2022年,8月28日標準誤不僅反映了抽樣誤差的大小,而且反映了樣本統計量與總體相應參數間的差異程度也反映了用某個樣本統計量來估計總體參數的準確程度第十三頁,共五十八頁,2022年,8月28日第三節統計假設檢驗第十四頁,共五十八頁,2022年,8月28日一、統計假設檢驗的基本思路為了說明問題,我們舉幾個例子進行討論例1、隨機抽取一批小鼠,隨機分為兩組,一組注射催產素,一組作為對照(即不注射催產素),半小時后檢查這兩組小鼠的血糖含量,得:注射催產素組為:=106.88

對照組平均值為:=109.17

同時我們也發現,同一組內的小鼠其血糖含量也是不同的兩組小鼠的平均血糖含量之間有個差:那么我們是否可以認為這個差值就是由于催產素注射與否的結果?顯然僅憑這一差值-2.29

是不能說明問題的第十五頁,共五十八頁,2022年,8月28日例2、比較不同日齡(d)正常白化小鼠血漿含N量,得如下一批數據:日齡血漿含N

量35d()0.980.830.940.900.990.920.870.860.8190d()1.001.080.970.931.030.941.111.10對這兩組數據進行計算,得:35d組小鼠的90d組小鼠的發現兩組小鼠的血漿含N

量有差異:那么我們能否僅憑這一差異就認為日齡的不同,其血漿含N量就有差異呢?35d

的小鼠中也有含N

量高的(如0.990.980.94)90d

的小鼠中也有含N

量低的(如0.930.94)即:同一組內的小鼠其血漿含N

量之間也是有差異的第十六頁,共五十八頁,2022年,8月28日例3、某藥廠宣傳說該廠生產的治魚鏈球菌病的新藥其療效為90%,我們能輕易相信嗎?是否需要做一個試驗?如果試驗結果是100

尾魚僅康復了88

尾(p=0.88),我們就能對該廠的宣傳效果進行否定嗎?如果我們再做一次呢?我們能一直不斷地做下去嗎?例4、試驗某種治療魚豎鱗病的新藥,將其與常規藥物相比較,對400尾魚施用常規藥物,康復了340尾(康復率),相應的,對500尾魚施用新藥,有435尾康復了(康復率),我們是否就可以認為新藥一定好于常規藥物?第十七頁,共五十八頁,2022年,8月28日以上幾個例題提醒我們,有以下幾個問題是需要我們加以注意的:a.我們不可能用總體來做試驗,各方面的條件不許可我們這樣做,也沒有必要這樣做b.我們只能用樣本來做試驗,且由于時間、經費、人力等因素的限制,一般同一個試驗只能做一次,通過一次試驗就希望能得到一個比較可靠的結果c.試驗結束以后,用什么來作為檢驗的對象?那就是樣本的平均值:第十八頁,共五十八頁,2022年,8月28日用樣本的平均值來檢驗總體平均值用兩個樣本平均值的差異來檢驗相應兩個總體平均值的差異用樣本平均值作為檢驗對象的理由是:1、我們已經證明了為最小,這說明樣本平均值與各變量的差異最小,因此是樣本資料最好的代表2、在抽樣分布中,我們已經證明了樣本平均值是總體平均值的無偏估計量,即的數學期望是3、中心極限定理告訴我們:樣本平均值服從或近似服從正態分布

第十九頁,共五十八頁,2022年,8月28日上述三點,說明樣本平均值可以作為檢驗的對象但是我們又不能僅憑樣本平均值的大小就貿然下結論,認為試驗有效或試驗無效我們必須通過檢驗(test)為什么?因為任何一次試驗都存在誤差,即同一組內的觀測值都不會完全相同,在正常試驗條件下,同一組內的數據之間的差異,一般就是誤差第二十頁,共五十八頁,2022年,8月28日每一個觀測值都是試驗的表觀效應,每一個數據都可以分成兩個部分,即試驗(處理)效應和誤差(各種偶然因素引起的差異)同一總體中的個體所受到的各種偶然因素是不等的每一個數據中所包含的偶然因素是獨立的就總體而言,這種偶然因素的影響是相互抵消的用統計學自己的語言來講,就是:每一個觀測值都有自己獨立的試驗誤差第二十一頁,共五十八頁,2022年,8月28日因此,我們有以下公式存在:觀測值(表觀效應)=處理效應+誤差效應即:進行樣本平均,得:同樣,兩個樣本平均值的差異也可以這樣分解:實際上,我們感興趣的、即我們關心的重點是:我們試驗所得到的表觀效應主要是由處理效應所引起、還是由抽樣誤差所引起?應當進行權衡第二十二頁,共五十八頁,2022年,8月28日結合上面的實例:兩組小鼠的平均血糖含量之間的差異是否的確由催產素的注射與否所引起?不同日齡正常白化小鼠血漿含N量的差異是否的確由于小鼠的日齡不同而引起?實際試驗中魚鏈球菌病的治愈率與廠家宣傳之間的差異的確是真實差異嗎?即廠家是否真的言過其實了?還是的確是試驗時的抽樣誤差?新藥和常規藥之間的差異是否的確由偶然因素所引起?第二十三頁,共五十八頁,2022年,8月28日為了使得這種比較和權衡所得到的結論更可靠、更科學、更合理、更可信、更正確,必須對試驗和統計分析提出如下要求:1、合理地進行試驗設計,正確地進行試驗操作,無誤地進行抽樣,仔細地進行記錄,認真地進行校對,以有效地降低試驗誤差,盡可能避免系統誤差,杜絕人為錯誤,使樣本真正代表總體,對試驗效應和試驗誤差作出無偏的估計2、合理地、正確地分析試驗結果,以得出有關總體參數假設的統計推斷第二十四頁,共五十八頁,2022年,8月28日二統計假設檢驗的一般步驟我們以大樣本資料或樣本雖小但總體方差為已知的情況(u-test)來說明統計假設檢驗的一般步驟統計假設檢驗的基本原理和思路是這樣的:首先根據具體的試驗目的提出一個假設(hypothesis)(然后在假定這一假設成立(或正確)的前提下進行試驗,并取得數據)然后同樣在這一假設成立(或正確)的前提下,對這些數據或資料進行統計分析,獲得該假設成立(或正確)的概率值第二十五頁,共五十八頁,2022年,8月28日最后根據所獲得概率的大小判斷所作假設是否成立:a、如果所得概率較大,就表明我們沒有足夠的理由來否定所作的假設,即我們必須接受這一假設;b、如果所得概率很小,就表示這一假設不大可能成立,應予以否定,從而接受這一假設的對立假設,即接受備擇假設上面的a和

b

必有一條被否定,另一條被接受第二十六頁,共五十八頁,2022年,8月28日盡管所計算的概率值是連續變化的,但我們往往設定一個概率臨界值(如p=0.05、p=0.01等等),根據所得概率值是大于p=0.05、還是小于p=0.05來決定所作假設是否成立(或正確)因此,概率值是連續分布的(定量),但假設的接受與否只有兩類(定性)第二十七頁,共五十八頁,2022年,8月28日這里我們首先復習一下u的概念:在這一式子中,顯然與的距離越小,u值就越小,查標準正態分布表,得到的概率值越大,表明出現的概率越大;反之,與的距離越大,u值就越大,查標準正態分布表,得到的概率值就越小,表明出現的概率就越小當這一概率小到一定程度時,我們就可以認為這一似乎不大可能在一次試驗中出現,亦即這一所在總體的平均值與設定總體的平均值不等,即兩個總體不是同一個總體第二十八頁,共五十八頁,2022年,8月28日反之,我們就沒有理由認為所在總體與所設定的總體不是同一個總體在統計檢驗中所設定的、用以作為資料分析和最終判斷基礎的假設稱為無效假設,無效假設又稱為解消假設(nullhypothesis),用表示第二十九頁,共五十八頁,2022年,8月28日所謂無效假設可以這樣理解:我們的試驗是無效的,即試驗結束以后,所得到的樣本平均值并沒有超出設定的總體范圍,即試驗后得到的樣本平均值其效果不見得好于原定的效果,即樣本平均值所在總體與原設定的總體其實是同一個總體,兩者的平均值和并沒有本質的差異,兩者之間的差異是由抽樣誤差引起的無效假設的寫法:無效假設的含義就是:試驗后所得到的樣本平均值與原設定的已知總體的平均值之間的差異是由誤差所引起的第三十頁,共五十八頁,2022年,8月28日即樣本平均值所在總體與已知總體是同一總體無效假設在統計分析后有可能被接受,也有可能被否定為了在無效假設被否定后有可以被接受的假設,我們還應當在無效假設設立的同時設立一個后備假設,這一后備假設稱為備擇假設,用表示即備擇假設是無效假設被否定后必須被接受的一個假設(下標A

是alternative

之意)備擇假設和無效假設是一對對立的假設,兩者構成了一個完全事件系第三十一頁,共五十八頁,2022年,8月28日在根據所得到的概率值進行判斷時:接受了無效假設,就自然摒棄了備擇假設否定無效假設的同時,就必須接受備擇假設備擇假設的含義是:樣本所在總體與已知總體不是同一個總體,即:所得樣本并不來自于這一已知總體將兩個假設寫完全:既可以是,也可以是第三十二頁,共五十八頁,2022年,8月28日在設立假設以后,研究樣本平均數的抽樣分布,分析試驗或調查所得樣本平均值出現的概率我們會發現,樣本平均值一般不會剛好等于已知總體的平均值,兩者之間會有一定的差異,這一差異,有可能是抽樣誤差,也有可能是真實性差異,對此,我們需要借助概率原理來進行判斷進行這種判斷可以從兩個角度,即有兩種方法:一是假定是正確的,在此前提下計算出現的概率值,我們可以通過查表的方式來完成:如果所得u

值出現的概率較大,我們就必須接受第三十三頁,共五十八頁,2022年,8月28日如果所得u值出現的概率較小,我們就應當放棄而

接受這里的概率大小,以=0.05

和=0.01作為兩個臨界值二是在假定為正確的前提下,對的抽樣劃出一個區間,這一區間稱為接受區間,這一區間是有一定的概率保證的這一區間之外的部分稱為否定區間倘若落在接受區間內,我們就接受反之,倘若落在接受區間外,我們就否定而接受

第三十四頁,共五十八頁,2022年,8月28日下面的是接受區間示意圖:第三十五頁,共五十八頁,2022年,8月28日設這一接受區間的概率保證為95%,由于而即將其變換,得:為接受區間,其概率為95%而和為否定區間,其概率之和為5%同樣,為99%接受區間而和為1%的否定區間第三十六頁,共五十八頁,2022年,8月28日在u-test中以為水平上否定無效假設的兩個界限以為水平上否定無效假設的兩個界限最后,根據小概率事件實際不可能性原理接受或否定無效假設小概率事件實際不可能性原理是指在一次試驗中,概率很小的事件實際上是不可能發生的第三十七頁,共五十八頁,2022年,8月28日因此當與之間的差異其概率小于時(我們以作為小概率的第一臨界值),就可以認為這不是抽樣誤差,而是實質性差異,從而否定無效假設第三十八頁,共五十八頁,2022年,8月28日現在我們將假設檢驗的幾個步驟歸納一下:提出假設,進行試驗,并計算樣本平均數抽樣分布的離差u

值查相關附表,查出所得u值出現的概率值,并考察其是否大于預先設定的值由小概率原理作出接受或否定無效假設的推斷,并結合專業知識給出合理、科學的解釋需要注意的是,當所得概率小于=0.05

以后,還需根據具體情況繼續考察其是否小于=0.01

第三十九頁,共五十八頁,2022年,8月28日我們以一個實例來系統地說明假設檢驗的步驟:某品種正常鯉魚每100ml血清中鎂離子含量為(數據已經過轉換)今抽查某漁場20

尾3

齡鯉魚的血清鎂離子,得如下數據(數據已經過轉換):2.42.32.22.02.72.12.32.82.52.62.12.32.52.12.02.52.22.42.32.8試問,這批鯉魚的血清鎂離子含量是否正常由于該例中已有總體方差,因此雖然樣本較小,但仍應使用u-test進行檢驗第四十頁,共五十八頁,2022年,8月28日該例的核心問題是希望知道:這批鯉魚在血清鎂離子這一性狀上是否正常或:這批鯉魚與正常鯉魚在血清鎂離子這一性狀上是否有所區別或:這批鯉魚在血清鎂離子這一性狀上是否屬于這一鯉魚品種因此,需要知道這批鯉魚的平均血清鎂離子量與總體鯉魚之間是否有區別因此,應檢查樣本鯉魚群的血清鎂離子含量與總體鯉魚群之間的差異是由抽樣誤差所引起,還是屬于真實性差異第四十一頁,共五十八頁,2022年,8月28日需要注意的是,樣本越小,抽樣就越要有代表性,否則,所得到的結論就可能發生很大的偏差首先設立無效假設,即設:樣本所在的總體鯉魚群與原總體無差異vs

:樣本所在的總體鯉魚群與原總體不是一個總體即設該假設可以簡化為其次在無效假設已設立的基礎上,計算樣本平均值,并計算u

值第四十二頁,共五十八頁,2022年,8月28日當然我們也可以計算樣本的標準差,但這一標準差在本例中不起作用,因此可以不管它經計算,得:查附表1,即標準正態分布的分布函數表,得:u=1.49的概率為:這一概率值大于即:因此,我們應當接受無效假設,即接受在接受無效假設的同時,就自動放棄了備擇假設這表示這一鯉魚樣本其血清鎂離子是正常的對這一結果我們可以從專業的角度進行合理的解釋第四十三頁,共五十八頁,2022年,8月28日下面我們將這一例題系統歸置一下:某品種正常成年鯉魚每100ml血清中鎂離子含量為今抽查某漁場20尾三齡鯉魚的血清鎂離子,得如下數據:2.42.32.22.02.72.12.32.82.52.62.12.32.52.12.02.52.22.42.32.8試問,這批鯉魚的血清鎂離子含量是否正常經計算,得:設查附表1

,u=1.49的概率為

p=0.14>0.05接受無效假設,即:這批鯉魚的血清鎂離子屬正常范圍第四十四頁,共五十八頁,2022年,8月28日該題也可以這樣完成:設立無效假設(同前)計算接受區間:由于處于這一接受區間內,因此,應接受無效假設即:這批鯉魚的血清鎂離子在正常范圍以內當接受無效假設時,就說樣本平均數與已知總體平均數間差異不顯著,如果否定了無效假設而接受備擇假設時,我們就說差異顯著,如果在水平上否定無效假設,就說差異極顯著第四十五頁,共五十八頁,2022年,8月28日三、一尾檢驗和兩尾檢驗從上面的例子我們可以看出,鯉魚血清鎂離子的樣本平均值有可能大于總體平均值,也有可能小于總體平均值即所得u

值可能會是負值,在左邊判斷是接受或否定無效假設這u

值也有可能是正值,在右邊判斷是接受或否定無效假設這種既要考慮左邊否定區,又要考慮右邊否定區,即須考慮分布曲線兩邊(即兩尾)的檢驗稱為兩尾檢驗第四十六頁,共五十八頁,2022年,8月28日這是由于事先我們并不知道所得樣本平均數是否肯定大于總體平均值,還是肯定小于總體平均值在大多數情況下,一種措施有可能其效應是正向的,也有可能是負向的,即事先我們并不固定抽樣或試驗的結果會朝向哪個方向,因此我們的備擇假設只能是:這里,既包含了,又包含了這種兩尾檢驗是應用最廣泛的一種檢驗方法但有的時候,我們的目的非常明確,即所抽樣本只可能是大于總體平均值,或只可能是小于總體平均值例如:某種新型藥劑只可能好于常規藥劑第四十七頁,共五十八頁,2022年,8月28日某些有毒物質只能對被試動物產生毒害作用,等等這一類試驗的數據假設檢驗其備擇假設只有一種情況,即只有一個否定區間(一尾)這樣的假設檢驗就稱為一尾檢驗一尾檢驗比兩尾檢驗更容易否定無效假設,因此應用一尾檢驗必須有非常充分的理由在常用的假設檢驗中,我們一般采用兩尾檢驗,而對一尾檢驗應謹慎使用第四十八頁,共五十八頁,2022年,8月28日兩尾檢驗和一尾檢驗的比較:第四十九頁,共五十八頁,2022年,8月28日四、假設檢驗的兩類錯誤在假設檢驗中,接受或否定無效假設的理論依據是小概率事件的實際不可能性原理因此,所得結論并不是百分之百的正確的事實上,統計假設檢驗有可能犯兩類錯誤:如果是正確的,即為真,但檢驗的結論由于差異顯著而被我們否定掉了(此時,我們須冒5%下錯結論的風險),或由于差異極顯著而被我們否定掉了(須冒1%下錯結論的風險),因而犯了錯,這一類錯誤就稱為Ⅰ型錯誤,或稱型錯誤,犯Ⅰ型錯誤的概率不超過顯著水平值

第五十頁,共五十八頁,2022年,8月28日犯Ⅰ型錯誤的實質就是把非真實性差異錯判為真實性差異,即棄真如果無效假設是錯誤的,即為假,檢驗結果卻發現差異不顯著而被接受,同時摒棄了正確的備擇假設在統計學中,所謂的差異不顯著,其真實含義是沒有充分的理由否定,但也沒有理由接受

但我們所執行的是非此即彼原則,因此,既然差異不顯著,就必須接受這一類錯誤稱為Ⅱ型錯誤,或稱為型錯誤,Ⅱ型錯誤的概率用表示第五十一頁,共五十八頁,2022年,8月28日這里的差異不顯著,有兩種含義:一是樣本所在總體與已知總體間的確沒有差異,樣本平均值與已知總體平均值間的差異純屬抽樣誤差二是樣本所在總體與已知總體間有差異,但由于試驗誤差大而掩蓋掉了這種差異Ⅱ型錯誤就是把真實性差異錯判為非真實性差異,即雖然是假的,但通過檢驗卻被接受了,同時摒棄了真的,這稱為存偽第五十二頁,共五十八頁,2022年,8月28日不同時的值第五十三頁,共五十八頁,2022年,8月28日在統計推斷中,我們作出一個判斷,有兩個方向的錯誤可能存在,這說明我們不能絕對地肯定,也不應絕對地否定某一假設因此,有一定的把握,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論