




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 在前面的討論中,我們總假定總體的分在前面的討論中,我們總假定總體的分 布形式是已知的。例如,假設總體分布為正布形式是已知的。例如,假設總體分布為正 態分布態分布 n( , 2), 總體分布為區間總體分布為區間 (a, b) 上的上的 均勻分布,等等。均勻分布,等等。 然而,在實際問題中,然而,在實際問題中,我們所遇到的總我們所遇到的總 體服從何種分布往往并不知道體服從何種分布往往并不知道。需要我們先。需要我們先 對總體的分布形式提出假設,如:總體分布對總體的分布形式提出假設,如:總體分布 是正態分布是正態分布n( , 2),總體分布是區間總體分布是區間(a, b) 上均勻分布等,然后利用數據
2、上均勻分布等,然后利用數據 (樣本樣本) 對這一對這一 假設進行檢驗,看能否獲得通過。假設進行檢驗,看能否獲得通過。 8.4 擬合優度檢擬合優度檢 驗驗 這是一項非常重要的工作這是一項非常重要的工作, 許多學者視它為近代統計學的許多學者視它為近代統計學的 開端。開端。 解決這類問題的方法最早由英國統計學解決這類問題的方法最早由英國統計學 家家 k. pearson (皮爾遜皮爾遜) 于于1900年在他發表的年在他發表的 一篇文章中給出一篇文章中給出, 該方法后被稱為該方法后被稱為 pearson 2 檢驗法,簡稱檢驗法,簡稱 2檢驗檢驗。 設設f(x)為一已知的分布函數,現有樣本為一已知的分布
3、函數,現有樣本 x1, x2, , xn,但我們并不知道樣本的總體,但我們并不知道樣本的總體 分分 布是什么。現在試圖檢驗布是什么。現在試圖檢驗 h0:總體:總體 x 的分布函數為的分布函數為f(x) ; (1) 對立假設為對立假設為 h1:總體:總體 x 的分布函數非的分布函數非f(x)。 如果如果 f(x) 形式已知,但含有未知參數形式已知,但含有未知參數 或參或參 數向量數向量 =(1, 2, r ) ,則記其為則記其為f(x, )。 這種檢驗通常稱為這種檢驗通常稱為擬合優度檢驗擬合優度檢驗。 不妨設總體不妨設總體 x 是連續型分布。檢驗思想是連續型分布。檢驗思想 與步驟如下與步驟如下:
4、 (1). 將總體將總體 x 的取值范圍分成的取值范圍分成 k 個互不重疊的個互不重疊的 小區間小區間 i1, i2, , ik, . ( ( ( 1210 1212101 kk kkk aaaaa aaiaaiaai , (2). 計算各子區間計算各子區間 ii 上的理論頻數。上的理論頻數。 如果總體的分布函數為如果總體的分布函數為f(x, ),那么每個,那么每個 點落在區間點落在區間 ii 上的概率均為上的概率均為 ,k.,iafafp iii 21 ),(),()( 1 ) ( i np n 個點中,個點中,理論上理論上有有n pi ( )個點落在個點落在 ii 上上, (稱為理論頻數稱
5、為理論頻數)。當分布函數中含有未知。當分布函數中含有未知 參數參數 時,理論頻數也未知,要用時,理論頻數也未知,要用 來估計來估計 n pi ( ),其中,其中 為為 的極大似然估。的極大似然估。 (3). 計算各子區間計算各子區間 ii 上的實際頻數上的實際頻數 fi 。 fi = x1, x2, , xn ii , i=1, 2, , k . 計數符號,取集計數符號,取集 合中元素的個數合中元素的個數 )2( ) ( ) ( 1 2 2 , k i i ii np npf (4). 計算理論頻數與實際頻數的偏差平方和。計算理論頻數與實際頻數的偏差平方和。 可以證明:在可以證明:在 h0 成
6、立,且成立,且 n時時, 和和式式中中的的影影響響力力。頻頻數數比比較較大大的的那那些些項項在在 理理論論去去除除的的其其目目的的是是:縮縮小小每每一一項項用用 ) ( i np )3( 2 1 2 , k-r- 1 2 2 是是參參數數個個數數。是是子子區區間間數數,分分布布,的的 由由度度為為統統計計量量的的分分布布收收斂斂到到自自即即 rk rk (5). h0 的顯著性水平為的顯著性水平為 的檢驗的拒絕域為的檢驗的拒絕域為 )4( )( 2 1 2 , k-r- 注意注意:該檢驗方法是在:該檢驗方法是在 n 充分大時使用充分大時使用 的,因而,使用時要注意的,因而,使用時要注意 n 必
7、須足夠地大必須足夠地大, 以及以及 npi 不能太小不能太小這兩個條件。這兩個條件。 在實用上,在實用上,一般要求一般要求 n 50,以及所有以及所有 npi 5。如果初始子區間劃分不滿足后一個如果初始子區間劃分不滿足后一個 條件條件, 則適當地將某些子區間合并,可使則適當地將某些子區間合并,可使 npi 滿滿足上述要求。足上述要求。 例例1:為檢驗棉紗的拉力強度為檢驗棉紗的拉力強度 x (單位單位: 千克千克) 服服 從正態分布,從一批棉紗中隨機抽取從正態分布,從一批棉紗中隨機抽取300條進條進 行拉力試驗,結果列在表行拉力試驗,結果列在表8.2中。給定中。給定 = 0.01, 檢驗假設檢驗
8、假設 h0:拉力強度:拉力強度 x n(, 2) . 解:解:本例中,并未給出各觀測值本例中,并未給出各觀測值 xi 的具體值的具體值, 只給出了各觀測值的取值范圍,這樣的數據只給出了各觀測值的取值范圍,這樣的數據 稱為區間數據。稱為區間數據。樣本均值樣本均值與與樣本方差樣本方差可通過可通過 下列式計算:下列式計算: . 21 1 2 1 1 2 2 1 2 1 1 k i ii i k i ii i xn aa n n s aa n n x, .26. 0 1 41. 1 ),( 222 22 s n n x n , 為為極大似然估計極大似然估計的的和和,對正態總體對正態總體 (1). 先將
9、數據先將數據 xi 分成分成13組,每組落入一個區組,每組落入一個區 間,區間的端點為:間,區間的端點為: . 18. 2 78. 0 64. 0 13122 10 aaa aa , , (2). 計算數據落入各子區間的理論頻數。計算數據落入各子區間的理論頻數。 因分布中含有兩個未知參數,所以,理論因分布中含有兩個未知參數,所以,理論 頻數只能近似地估計。落入第頻數只能近似地估計。落入第 i 個子區間個子區間ii 的理論頻數的估計為的理論頻數的估計為 , 其中其中 .13 2 1 26. 0 41. 1 26. 0 41. 1 ) ( 1 2 , , i aa pp ii ii i p n ,
10、因因0.46 1.85 1.85 0.46 131221 pnpnpnpn 。見見表表最最后后兩兩組組合合并并成成一一組組 我我們們將將前前兩兩組組和和所所以以,均均大大于于,而而 8.3)( 5 113 pnpn (3). 計算數據落入各子區間上的實際頻數計算數據落入各子區間上的實際頻數 fi 。 fi = x1, x2, , xn ii , i=1, 2, , 10 . .15.22 1 2 2 k i i ii pn pnf (4). 計算檢驗統計量的值計算檢驗統計量的值 因為因為 k =10,r =2,所以上述,所以上述 2分布的自分布的自 由度為由度為 k- -r- -1=7。由由
11、.48.18)(15.22 2 1 2 rk (5). h0 的顯著性水平為的顯著性水平為 的檢驗的檢驗 于是,拒絕原假設,即認為棉紗拉力強于是,拒絕原假設,即認為棉紗拉力強 度不服從正態分布。度不服從正態分布。 孟德爾在關于遺傳問題的研孟德爾在關于遺傳問題的研 究中,用豌豆做實驗。豌豆有黃究中,用豌豆做實驗。豌豆有黃 和綠兩種顏色,在對它們進行兩和綠兩種顏色,在對它們進行兩 代雜交之后,發現一部分雜交豌代雜交之后,發現一部分雜交豌 豆呈黃色,另一部分呈綠色。其豆呈黃色,另一部分呈綠色。其 數目的比例大致是數目的比例大致是 3:1。 2檢驗的一個著名應用例子是孟德爾豌豆檢驗的一個著名應用例子是
12、孟德爾豌豆 實驗。奧地利生物學家孟德爾在實驗。奧地利生物學家孟德爾在1865年發表的年發表的 論文,事實上提出了基因學說,奠定了現代遺論文,事實上提出了基因學說,奠定了現代遺 傳學的基礎。他的這項偉大發現的過程有力地傳學的基礎。他的這項偉大發現的過程有力地 證明了統計方法在科學研究中的作用。因此,證明了統計方法在科學研究中的作用。因此, 我們有必要在這里將這一情況介紹給大家。我們有必要在這里將這一情況介紹給大家。 這只是一個表面上的統計規律。但它啟這只是一個表面上的統計規律。但它啟 發孟德爾去發展一種理論,以解釋這種現象。發孟德爾去發展一種理論,以解釋這種現象。 他大膽地假定存在一種實體,即現
13、在我們稱他大膽地假定存在一種實體,即現在我們稱 為為“基因基因”的東西,決定了豌豆的顏色。這的東西,決定了豌豆的顏色。這 基因有黃綠兩個狀態,一共有四種組合:基因有黃綠兩個狀態,一共有四種組合: 孟德爾把他的實驗重復了多次,每次都孟德爾把他的實驗重復了多次,每次都 得到類似結果。得到類似結果。 (黃黃, 黃黃),(黃黃, 綠綠),(綠綠, 黃黃),(綠綠, 綠綠). (黃黃, 黃黃),(黃黃, 綠綠),(綠綠, 黃黃),(綠綠, 綠綠). 孟德爾認為孟德爾認為, 前三種配合使豆子呈黃色前三種配合使豆子呈黃色, 而第四種配合使豆子呈綠色。從古典概率的而第四種配合使豆子呈綠色。從古典概率的 觀點看
14、,黃色豆子出現的概率為觀點看,黃色豆子出現的概率為3/4,綠色豆,綠色豆 子出現的概率為子出現的概率為1/4。這就解釋了黃綠顏色豆。這就解釋了黃綠顏色豆 子之比為什么總是接近子之比為什么總是接近 3:1 這個觀察結果。這個觀察結果。 孟德爾這個發現的深遠意義是他開辟了孟德爾這個發現的深遠意義是他開辟了 遺傳學研究的新紀元。下面的例子就是用遺傳學研究的新紀元。下面的例子就是用 2 檢驗來檢驗孟德爾提出黃綠顏色豌豆數目之檢驗來檢驗孟德爾提出黃綠顏色豌豆數目之 比為比為 3:1的論斷。的論斷。 例例2:孟德爾豌豆試驗中,發現黃色豌豆為孟德爾豌豆試驗中,發現黃色豌豆為25 粒粒, 綠色豌豆綠色豌豆11
15、粒,試在粒,試在 =0.05下下, 檢驗豌豆檢驗豌豆 黃綠之比為黃綠之比為3:1。 解:解:定義隨機變量定義隨機變量 x . , 0 , 1 豌豌豆豆為為綠綠色色 豌豌豆豆為為黃黃色色, x 我們要檢驗我們要檢驗,記記 . 01 21 xppxpp . 4/14/3 210 pph,: (1). 將將 (- -, ) 分成兩個區間分成兩個區間 . 0.5 ( ) 0.5( 21 ,ii (2). 計算每個區間上的理論頻數,這里計算每個區間上的理論頻數,這里 n = 25+11=36, 不存在要估計的未知參數不存在要估計的未知參數, 故故 . 94)/1 (36 274)/3(36 21 npn
16、p, (3). 實際頻數為,實際頻數為,f1=25, f2=11 . (4). 計算統計量的值計算統計量的值 .592. 0 9 )911( 27 )2725( 22 2 1 2 2 i i ii np npf .841. 3)05. 0()( 0.592 0.05 2 2 1 2 1 2 k- k,因因為為 (5). h0 的顯著性水平為的顯著性水平為 的檢驗的檢驗 所以,接受原假設,即認為豌豆的黃綠所以,接受原假設,即認為豌豆的黃綠 之比為之比為 3:1 。 例例3:某醫院一年中出生的嬰兒共計某醫院一年中出生的嬰兒共計1521人人, 其中男嬰其中男嬰802人,女嬰人,女嬰719人。給定人。
17、給定 =0.05, 試問:能否認為男嬰、女嬰出生概率相同?試問:能否認為男嬰、女嬰出生概率相同? 解:解:用用 x 表示服從兩點分布的隨機變量表示服從兩點分布的隨機變量, x 取取 0, 1兩個值,兩個值,x=1表示男嬰,表示男嬰, x=0表是女嬰。表是女嬰。 則問題就是檢驗假設則問題就是檢驗假設 h0:p1 = px=0=0.5. (1). 將將 (- -, ) 分成兩個區間分成兩個區間 . ) 0.5( 0.5 ( 21 ,ii (2). 計算每個區間上的理論頻數。因為兩個計算每個區間上的理論頻數。因為兩個 區區 間上的理論概率間上的理論概率 p1= p2=0.5, 而而 n=1521, 故故 . 5 .6075 . 01521 21 npnp (3). 各區間上實際頻數:各區間上實際頻數:f1=802, f2=719 . (4). 計算統計量的值計算統計量的值 .529. 4 5 .760 )5 .760719( 5 .760 )5 .760802( 22 2 .841. 3)05. 0()(529. 4 0.05 2 2 1 2 1 2 k- k,因為因為 (5). h0 的顯著性水平為的顯著性水平為 的檢驗的檢驗 所以,拒絕原假設,即認為男嬰女嬰出所以,拒絕原假設,即認為男嬰女嬰出 生概率有顯著差異。生概率有顯著差異。 . 473. 01
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權】 IEC 60092-376:2025 RLV EN Electrical installations in ships - Part 376: Cables for control and instrumentation circuits 150/250 V (300 V)
- 2025年信息化管理專業考試試卷及答案
- 2025年體育競技與科學研究試題及答案
- 2025年安全工程師執業資格考試卷及答案
- 2025年環境工程基礎課程考試試卷及答案
- 2025年氣象學專業考試題及答案
- 一級建造師的試題及答案
- 燒烤學徒合同協議書模板
- 2025年Β-內酰胺類抗菌藥物合作協議書
- 思修第五章遵守道德規范錘煉高尚品格
- 2025年山東省泰安市新泰市中考二模化學試題(原卷版+解析版)
- 2025年雞蛋市場調查報告
- 農村小學教師信息技術應用能力提升策略研究:數字化教學資源與實踐應用
- 2025-2030中國學生校服行業市場發展分析及前景趨勢與投資研究報告
- 2025年職業技能競賽(計算機程序員賽項)參考試題(附答案)
- DB11 T 411.8-2007 體育場館等級劃分及評定 第8部分:籃球館
- 滴滴管理制度
- 2025年全國中小學生百科知識競賽題庫及答案(480題)
- 貨車掛靠協議合同
- 規模化養豬場非洲豬瘟生物安全防控策略研究
- 2025年度專業技術人員繼續教育公需科目考試題(附答案)
評論
0/150
提交評論