




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數理統計在化學中的應用 Chapter 12 卡方檢驗卡方檢驗也是一種非參數檢驗卡方檢驗也是一種非參數檢驗v(復習)非參數統計是一種不要求變量值為某種特(復習)非參數統計是一種不要求變量值為某種特定分布和不依賴某種特定理論的統計方法,或者是定分布和不依賴某種特定理論的統計方法,或者是在不了解總體分布及其全部參數的情況下的統計方在不了解總體分布及其全部參數的情況下的統計方法。非參數統計方法開始于法。非參數統計方法開始于20世紀中期,早期的符世紀中期,早期的符號檢驗可以追溯到號檢驗可以追溯到18世紀。實際工作中,有許多資世紀。實際工作中,有許多資料常不能確定或假設其總體變量值的分布,因此參料常不能
2、確定或假設其總體變量值的分布,因此參數統計不宜使用,不知道總分布,就不能比較參數,數統計不宜使用,不知道總分布,就不能比較參數,而只能比較非參數。所謂非參數,即指數據的正負而只能比較非參數。所謂非參數,即指數據的正負符號,大小順序號,綜合判斷所劃分的名次、嚴重符號,大小順序號,綜合判斷所劃分的名次、嚴重程度、優劣等級等,利用直接說明或比較兩個或幾程度、優劣等級等,利用直接說明或比較兩個或幾個樣本的非參數的方法均屬于非參數統計法。個樣本的非參數的方法均屬于非參數統計法。參數檢驗和非參數檢驗參數檢驗和非參數檢驗v參數檢驗參數檢驗:指總體分布服從正態分布或總體指總體分布服從正態分布或總體 分布已知條
3、下的統計檢驗。分布已知條下的統計檢驗。v非參數檢驗非參數檢驗:指總體分布不要求服從正態分指總體分布不要求服從正態分布或總體分布情況不明時,用來檢驗數據資布或總體分布情況不明時,用來檢驗數據資料是否來自同一個總體的統計檢驗方法。料是否來自同一個總體的統計檢驗方法。v通常非參數統計方法適用于以下幾種情通常非參數統計方法適用于以下幾種情況況未知分布型,或樣本數太少未知分布型,或樣本數太少(n 6)而使得分而使得分布狀況尚未顯示出來布狀況尚未顯示出來非參數性,只能以嚴重程度、優劣等級、非參數性,只能以嚴重程度、優劣等級、效果大小、名次先后以及綜合判斷等方式效果大小、名次先后以及綜合判斷等方式記錄其符號
4、或等級記錄其符號或等級分布程度偏態分布程度偏態組內個別隨機變量偏離過大。組內個別隨機變量偏離過大。非參數檢驗的優點和缺點:非參數檢驗的優點和缺點:v優點:優點:n不受總體分布的限制,適用范圍廣。不受總體分布的限制,適用范圍廣。n適宜定量模糊的變量和等級變量。適宜定量模糊的變量和等級變量。n方法簡便易學。方法簡便易學。a.缺點:缺點:當測量的數據能夠滿足參數統計的所有假設當測量的數據能夠滿足參數統計的所有假設時,非參數檢驗方法雖然也可以使用,但效果遠不時,非參數檢驗方法雖然也可以使用,但效果遠不如參數檢驗方法。由于當數據滿足假設條件時,參如參數檢驗方法。由于當數據滿足假設條件時,參數統計檢驗方法
5、能夠從其中廣泛地充分地提取有關數統計檢驗方法能夠從其中廣泛地充分地提取有關信息。非參數統計檢驗方法對數據的限制較為寬松,信息。非參數統計檢驗方法對數據的限制較為寬松,只能從中提取一般的信息,相對參數統計檢驗方法只能從中提取一般的信息,相對參數統計檢驗方法會浪費一些信息。會浪費一些信息。Pearsons X2 (chi-square) test (擬合檢驗擬合檢驗)I:概論:概論v卡方檢驗:可以用來比較稱名變量(范疇型卡方檢驗:可以用來比較稱名變量(范疇型或是或是-非型的)的次數或頻率的分布是否存在非型的)的次數或頻率的分布是否存在顯著性的差異。如冠詞,介詞,連詞等在某顯著性的差異。如冠詞,介詞
6、,連詞等在某文本中出現的次數,并比較次數的分布是否文本中出現的次數,并比較次數的分布是否存在顯著性差異。(注意:在計算存在顯著性差異。(注意:在計算X2 時,只時,只能用次數(能用次數(20),不能用比例(),不能用比例(20%或或0.2,教材教材P153)v沒有嚴格的使用條件,只要樣本為隨機樣本沒有嚴格的使用條件,只要樣本為隨機樣本即可。即可。如果檢驗的參數是一個特定值,比如產品的不合格率,由于產品的合格與不合格問題屬于二項式分布,此時還可以用: 22222()()(1) =(1)()= (1)(1)YnpYnpnYnpnpnpnpYnpvnppX觀察值np: 觀察值的期望值第一節:卡方分布
7、v正偏態分布,形狀取決于自由度的大小:自正偏態分布,形狀取決于自由度的大小:自由度越小,偏斜度越大,隨著自由度的增大,由度越小,偏斜度越大,隨著自由度的增大,它逐漸接近正態分布,當自由度趨于無限大它逐漸接近正態分布,當自由度趨于無限大時,它就與正態分布相同。(時,它就與正態分布相同。(P152, from our textbook)v第二節:卡方檢驗v用途:比較稱名變量的次數,具體來講,就是比較實際次數用途:比較稱名變量的次數,具體來講,就是比較實際次數與期望次數(或理論次數)(見下頁)之間是否有相助差異。與期望次數(或理論次數)(見下頁)之間是否有相助差異。或需要研究的對象或者實驗的結果是否
8、與預期的原假設之間或需要研究的對象或者實驗的結果是否與預期的原假設之間有顯著性的差異,也就是檢驗觀察值與理論值之間的緊密程有顯著性的差異,也就是檢驗觀察值與理論值之間的緊密程度。度。X2擬合檢驗就是用來確定事件出現的頻數分布與某一理擬合檢驗就是用來確定事件出現的頻數分布與某一理論分布之間的差別是否是隨機性的。論分布之間的差別是否是隨機性的。vX2定義:221() (1)mkkkkOTvmTX理論頻數的期望值實測值或觀察值頻數m2221()mkkx 2221(0.5)kkkkOTTX試驗結果只有兩個,且頻數較小v期望次數是根據某種理論模式,或根據某種期望次數是根據某種理論模式,或根據某種特征的分
9、布所作的假設而期望得到或應該得特征的分布所作的假設而期望得到或應該得到的次數。到的次數。v實際次數就是觀測次數。實際次數就是觀測次數。v計算卡方時,只能用次數,不能用比例。計算卡方時,只能用次數,不能用比例。v一般是雙尾檢驗。如果需要,也能進行單尾一般是雙尾檢驗。如果需要,也能進行單尾檢驗,只要把雙位檢驗的想著水平減半即可。檢驗,只要把雙位檢驗的想著水平減半即可。 (from PP152153, our textbook)第三節第三節:卡方檢驗的用途卡方檢驗的用途v適合性檢驗適合性檢驗v正態性檢驗正態性檢驗v獨立性檢驗獨立性檢驗一、適合性檢驗v適合性檢驗為單樣本卡方檢驗,它只是記一適合性檢驗為
10、單樣本卡方檢驗,它只是記一個變量,但數據要分成若干相互排斥的組和個變量,但數據要分成若干相互排斥的組和范疇。其目的是檢驗時間次數與期望次數是范疇。其目的是檢驗時間次數與期望次數是否吻合。否吻合。見教材P153ki 12理論頻數理論頻數)(實測頻數2統計量統計量kiiiinpnpn122)(實質是實質是 (From other sources) 1. 適合性檢驗適合性檢驗 適合性檢驗適合性檢驗是用樣本提供的信息去推斷總體分布是否適合某是用樣本提供的信息去推斷總體分布是否適合某種已知的規律。種已知的規律。 例例4 某地區某地區1993年新生嬰兒年新生嬰兒1284個,其中男嬰個,其中男嬰692個,試
11、問嬰個,試問嬰兒的性別比是否正常?兒的性別比是否正常?( =0.01) 解解 檢驗假設為檢驗假設為 H0:男:男:女女=1:1 , H1:男:男:女女1:1 當當H0為真時,有為真時,有7882. 7642)642592(642)642692(22212i理論頻數理論頻數)(實測頻數2635. 6) 1 () 1(201. 02k)1(22k 選講內容:選講內容: 1. 適合性檢驗適合性檢驗對于對于 0.01,查表得臨界值,查表得臨界值由于由于所以拒絕所以拒絕H0,即認為該地區,即認為該地區1993年新生嬰兒性別的比例失調。年新生嬰兒性別的比例失調。3125.10613399189Av 例例5
12、 按孟德爾遺傳學說,將兩種豌豆雜交后,可產出數量之按孟德爾遺傳學說,將兩種豌豆雜交后,可產出數量之比為比為 9:3:3:1 的的 A、B、C、D 四種不同的種子。今在一試驗中四種不同的種子。今在一試驗中共收了共收了189粒種子,粒種子,A、B、C、D各類型的分別為各類型的分別為102粒、粒、30粒、粒、42粒和粒和5粒。問在粒。問在 =0.01下,該結果是否符合孟德爾遺傳學說的下,該結果是否符合孟德爾遺傳學說的結果結果? 選講內容:選講內容: 1. 適合性檢驗適合性檢驗 解解 檢驗假設為檢驗假設為H0:A:B:C:D=9:3:3:1,即試驗結果適合孟德爾學說,即試驗結果適合孟德爾學說實測頻數為
13、實測頻數為102,30,42和和15,且當,且當H0成立時理論頻數為成立時理論頻數為 同樣可計算出同樣可計算出B、C、D型種子的理論頻數依次為型種子的理論頻數依次為vB=35.4375,vC=35.4375,vD=11.8125.3125.106)3125.106102()(24122i理論頻數理論頻數實測頻數0846.38125.11)8125.1115(4375.35)4375.3542(4375.35)4375.3530(222345.11)3() 1(201. 02k) 1(201. 02k由由 =0.01得臨界值得臨界值由于由于于是有于是有故接受故接受H0,即認為試驗結果與孟德爾學說
14、的結果相符合。,即認為試驗結果與孟德爾學說的結果相符合。 選講內容:選講內容: 1. 適合性檢驗適合性檢驗X2擬合檢驗的步驟n把觀察到的不同類別的頻數分別歸入把觀察到的不同類別的頻數分別歸入k類,這類,這些頻數之和應是獨立觀察到總頻數之和。些頻數之和應是獨立觀察到總頻數之和。n假設假設H0,即確定出,即確定出每一類每一類應有的期望數應有的期望數Tk(或(或np)。如)。如k2,只要有,只要有20%的的Tk(或(或np)5,就要合并相鄰精度類別以減少,就要合并相鄰精度類別以減少k值,以值,以此來增加某些此來增加某些Tk值。如值。如k=2,只有當,只有當Tk都都 5時,才能應用式時,才能應用式5-
15、1來進行來進行X2檢驗,否則就需檢驗,否則就需要應用修正式來檢驗。要應用修正式來檢驗。n 計算計算X2。n 根據給定的置信概率,查根據給定的置信概率,查X2分布表,如果分布表,如果計算值小于表值,則接受計算值小于表值,則接受H0,反之則拒絕。,反之則拒絕。例一試劑公司按現行生產工藝生產的化學試劑,其優品率要占到10%。現從一批產品中抽取100個進行檢驗,結果發現優級品僅5個。問是否優級品率出現了下降的變化(=0.05)?222222()(51000.1)951000.9 =1000.11000.9()(51000.1)2.781000.10.9(1)YnpnpYnpnppX20.05,1CHI
16、INV(0.05,1)3.84X因為X2 Y),則如果,則如果X與與Y屬于同一總體的話,屬于同一總體的話,P(XY)=0.52 符號檢驗的步驟n編符號:一對一比較,如果前者大于后者,編符號:一對一比較,如果前者大于后者,或者前者較優,記以符號或者前者較優,記以符號”+”,否則記以,否則記以”-”,如二者相等或不能判明優劣,就記為,如二者相等或不能判明優劣,就記為”0”。n建立假設:建立假設:nH0: P(X1X2) = P(X2X1) = 0.5nH1: P(X1X2) P(X2X1) 0.5n 清點清點“+”、“-”、“0”各有幾個,分別記為各有幾個,分別記為n+、n-、n0n 進行顯著性檢
17、驗進行顯著性檢驗n 查符號檢驗表(表中查符號檢驗表(表中N=n+n-):r = min(n+, n-),查表,如查表,如r表值,差異不顯著,表值,差異不顯著,r 表值,差異表值,差異顯著。(講義附錄的表是錯的)顯著。(講義附錄的表是錯的)$5.3.2 符號檢驗的步驟n2檢驗:如2 2/2,1,接受H0,否則拒絕H0。nN25:Z-檢驗,查t檢驗表(雙側),如|Z|z/2,接受H0,否則拒絕H0。22(|1) (1)nnvnn /2,0.5(0.5)/2 /2,0.5/2rNrrNZrNrNrnn或$5.3.2 符號檢驗的步驟nX2檢驗:如X2 2/2,v,接受H0,否則拒絕H0。n在樣本數比較
18、小的情況下,查符合檢驗表檢驗并不是很靈敏。221() (1)mkkkkOTvmTX2221(0.5) =1kkkkOTvTX二、正態檢驗二、正態檢驗v第五章學過的正態檢驗有哪些?第五章學過的正態檢驗有哪些?v繪制直方圖或多邊圖;繪制直方圖或多邊圖;v比較理論分布與實際分布中各標準差之間比較理論分布與實際分布中各標準差之間的面積或概率;的面積或概率;v計算數據分布的偏態之和峰值(通過計算計算數據分布的偏態之和峰值(通過計算公式);公式);1.比較算術平均數眾數和中數(三數據完全比較算術平均數眾數和中數(三數據完全相同)。相同)。v用卡方檢驗進行正態性檢驗其實也是一種適用卡方檢驗進行正態性檢驗其實
19、也是一種適合性檢驗,即檢驗實際次數分布與期望次數合性檢驗,即檢驗實際次數分布與期望次數分布是否有顯著性差異。分布是否有顯著性差異。v期望次數計算步逐詳見教材期望次數計算步逐詳見教材P155。三、列聯表的獨立性檢驗三、列聯表的獨立性檢驗v獨立性檢驗就是檢驗兩個特征或兩個分類標獨立性檢驗就是檢驗兩個特征或兩個分類標準是互相獨立還是互相有聯系的,用于獨立準是互相獨立還是互相有聯系的,用于獨立性檢驗的數據一般整理成性檢驗的數據一般整理成“列聯表列聯表”的形式,的形式,即一個分類標準把數據分成若干列,另一個即一個分類標準把數據分成若干列,另一個分類標準把數據分成若干行行列交叉形成一分類標準把數據分成若干行行列交叉形成一個個方格,每一行和每一列都有一個總計,個個方格,每一行和每一列都有一個總計,書寫在一行或一列的末尾,稱為書寫在一行或一列的末尾,稱為“邊際總邊際總和和”。所有邊際總和加起來就是全部數據的。所有邊際總和加起來就是全部數據的個數或樣本容量。詳見教材個數或樣本容量。詳見教材P158.獨立性檢驗是對兩個總體,或兩組資料,或一總體的兩種指獨立性檢驗是對兩個總體,或兩組資料,或一總體的兩種指標(分類、特性、特征)等之間的獨立性所進行的檢驗。因此,標(分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《職場生涯規劃》課件
- 臨床痛風性腎病分類、病理特征、病因、發病機制、診斷特征、鑒別診斷及病理圖譜
- 《親愛的寵物樂園:動物主題課件》
- 《中英飲食文化差異》課件
- 2025衛浴設備購貨合同范本
- 2025標準土石方工程承包合同模板
- 2025新款電子產品采購銷售合同范本
- 珍愛生命 呵護心靈-青少年生命教育指南
- Unit 3 Exploring the topic-Thinking skills教學設計 2024-2025學年仁愛科普版英語七年級上冊
- 筑牢安全防線:企業安全生產知識培訓體系
- 2024無人機測評規范
- 魯班造橋課件
- 結腸鏡檢查的護理
- 危重癥患者護理
- 2025年山東省春季高考語文模擬試卷試題(含答案解析)
- 2024版《糖尿病健康宣教》課件
- DB11∕T 686-2023 透水磚路面施工與驗收規范
- 山東虛擬電廠商業模式介紹
- 醫療技術臨床應用管理培訓課件
- 敏捷開發管理咨詢合同
- 病區安全管理新護士上崗前培訓課件
評論
0/150
提交評論