第二章 誤差及分析數據統計處理_第1頁
第二章 誤差及分析數據統計處理_第2頁
第二章 誤差及分析數據統計處理_第3頁
第二章 誤差及分析數據統計處理_第4頁
第二章 誤差及分析數據統計處理_第5頁
已閱讀5頁,還剩43頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

一、

誤差的表示從理論上說,樣品中某一組分的含量必有一個客觀存在的真實數據,稱之為“真值”。測定值(x)與真實值(μ)之差稱為誤差(絕對誤差)。

誤差

E=x-μ誤差的大小反映了測定值與真實值之間的符合程度,也即測定結果的準確度。誤差有正負,

測定值>真實值,誤差為正;測定值<真實值,誤差為負。

分析結果的準確度也常用相對誤差表示。

相對誤差

Er

=E/μ×100%=(x-μ)/μ

×100%用相對誤差表示測定結果的準確度更為確切。

二、誤差的分類根據誤差的性質與產生原因,可將誤差分為:系統誤差、隨機誤差和過失誤差三類。(一)系統誤差

系統誤差也稱可定誤差、可測誤差或恒定誤差。系統誤差是由某種固定原因引起的誤差。1、產生的原因(1)方法誤差:是由于某一分析方法本身不夠完善而造成的。如滴定分析中所選用的指示劑的變色點與化學計量點不相符;又如分析中干擾離子的影響未消除等,都系統地影響測定結果偏高或偏低。(2)儀器誤差:是由于所用儀器本身不準確而造成的。如滴定管刻度不準(1ml刻度內只有9個分度值),天平兩臂不等長等。(3)試劑誤差:是由于實驗時所使用的試劑或蒸餾水不純造成的。例如配制標準溶液所用試劑的純度要求在99.9%;再如:測定水的硬度時,若所用的蒸餾水含Ca2+、Mg2+等離子,將使測定結果系統偏高。(4)操作誤差:是由于操作人員一些主觀上的原因而造成的。比如,某些指示劑的顏色由黃色變到橙色即應停止滴定,而有的人由于視覺原因總是滴到偏紅色才停止,從而造成誤差。2、特點:(1)單向性:使測定結果系統偏高或系統偏低,其大小也有一定規律;(2)重現性:當重復測量時,它會重復出現;(3)可測性:一般說來,產生系統誤差的具體原因都是可以找到的,因此也就能夠設法加以測定,從而消除它對測定結果的影響。2、特點隨機誤差的出現表面極無規律,忽大忽小,忽正忽負,但在同樣條件下進行多次測定,則可發現隨機誤差的分布符合正態分布曲線,具有如下特點:(1)、對稱性:大小相等的正負誤差出現的機會(即幾率)相等,而且彼此對稱,因而可以互相補償,使誤差的總和為零。這點可以說明為什么多次測定的平均值更接近真實值。(2)、單峰性:小誤差出現的幾率大,大誤差出現的幾率小,個別特大誤差出現的幾率極少。誤差有明顯的集中趨勢,誤差分布曲線只有一個峰值。(3)、有界性:小誤差測量值出現的機會大,大誤差測量值出現的機會小,極大誤差的測定值出現的機會更小。實際測定的結果總是被限制在一定的范圍內波動。

(4)、抵償性:誤差的算術平均值的極限為零。

有關隨機誤差分布規律的正態分布曲線將在后面詳細介紹。(三)過失誤差這種誤差不同于上面討論的兩類誤差,它是由于操作者粗心大意或操作失誤造成的。在分析工作中應避免這類誤差的發生。三、偏差

(一)、偏差、平均偏差、相對平均偏差前已指出:誤差是測定值與真實值之間的差值。在實際工作中,往往并不知道真實值,一般是用多種方法進行多次平行分析所得到的平均值代替真實值,將某次測定結果與其平均值的差值稱為偏差。

偏差

di=xi(個別測定結果)-(平均值)

因此,偏差與誤差不同,不能直接衡量測量的準確度的高低,它反映測量結果的符合程度,即精密度的高低。

誤差

準確度,偏差

精密度精密度通常用偏差、平均偏差、相對平均偏差或標準偏差的大小來度量。

平均偏差

相對平均偏差

從平均偏差和相對平均偏差的定義式可以看出:平均偏差和相對平均偏差都為正值。顯然,平行測定的數據相互越接近,平均偏差或相對平均偏差就越小,分析的精密度越高;反之,平行測定的數據越分散,平均偏差或相對平均偏差就越大,分析的精密度越低。

(二)、標準偏差在引出標準偏差之前,先看下列例題:例:用碘量法測定某銅合金中的銅的百分含量第一批測定結果、第二批測定結果見下表:例:用碘量法測定某銅合金中的銅的百分含量如下第一批測定結果及第二批測定結果:(見下表)∑(Xi-)2=0.99第一批測定值第二批測定值Xi|Xi-|(Xi-

)2Xi|Xi-

|(Xi-

)210.30.30.0910.000.009.80.20.0410.10.10.019.60.40.169.30.7*0.4910.20.20.0410.20.20.0410.10.10.019.90.10.0110.40.40.169.80.20.0410.00.00.0010.50.5*0.259.70.30.099.80.20.0410.20.20.0410.30.30.099.70.30.099.90.10.01=10.0∑|Xi-|=2.4∑(Xi-)2=0.72=10.0∑|Xi-|=2.4=0.24=0.24第一批測定結果及第二批測定結果:(見下表)∑(Xi-)2=0.99第一批測定值第二批測定值Xi|Xi-|(Xi-

)2Xi|Xi-

|(Xi-

)210.30.30.0910.000.009.80.20.0410.10.10.019.60.40.169.30.7*0.4910.20.20.0410.20.20.0410.10.10.019.90.10.0110.40.40.169.80.20.0410.00.00.0010.50.5*0.259.70.30.099.80.20.0410.20.20.0410.30.30.099.70.30.099.90.10.01=10.0∑|Xi-|=2.4∑(Xi-)2=0.72=10.0∑|Xi-|=2.4=0.24=0.24

第一批測定值第二批測定值Xi|Xi-|(Xi-

)2Xi|Xi-

|(Xi-

)210.30.30.0910.000.009.80.20.0410.10.10.019.60.40.169.30.7*0.4910.20.20.0410.20.20.0410.10.10.019.90.10.0110.40.40.169.80.20.0410.00.00.0010.50.5*0.259.70.30.099.80.20.0410.20.20.0410.30.30.099.70.30.099.90.10.01=0.24s1=0.28=0.24s2=0.33∑|Xi-|=2.4=10.0

∑(Xi-)2=0.72

∑|Xi-|=2.4=10.0

∑(Xi-)2=0.99

從這兩批數據的個別測定值的偏差來看,第二批較分散,因為其中有兩個較大的偏差(上角標*者)。所以用平均偏差反映不出這兩批數據的好壞。從表中第三列的計算可以看出:將偏差平方后再加和,所得結果分別為0.72、0.99,清楚看出兩批數據的差異。

總體標準偏差(均方根偏差)

μ為無限多次測定的平均值,稱為總體平均值。即

顯然,在校正系統誤差的情況下,μ即為真值。在一般的分析工作中,只做有限次測量,此時的標準偏差表達式為:

標準偏差(樣本標準差)

式中n-1稱為獨立偏差數,也稱為自由度。采用偏差的平方求和來計算,可以使大偏差能更顯著地反映出來,更好地反映測定數據的精密度。例如:上例中s1=0.28,s2=0.33,可見第一批數據的精密度好。在許多情況下也使用相對標準偏差(亦稱變異系數)來說明數據的精密度:

(周一、四)相對標準偏差RSD(%)

(變異系數CV)四、準確度和精密度準確度和精密度的關系可以下例予以說明:

鐵含量(%)測定結果示意圖

上圖為甲乙丙丁四人分析同一標準試樣中鐵含量的結果。甲所得結果的準確度精密度均好,結果可靠。乙測得的精密度很好,但準確度太低,說明它的測定存在較大的系統誤差。丙測定的準確度與精密度都很差,結果當然不可靠。丁測定的精密度很差,但其平均值卻很接近真值。但并不能說丁的分析結果很可靠,因為丁的平均值接近真值只是由于較大的正負誤差恰好相互抵消才形成的。丁如果少取一次測定值或多做一次測定,都會顯著影響其平均值的大小。

可見,高精密度是獲得高準確度的必要條件,準確度高的一定要求精密度高。但是精密度高的卻不一定準確度高,只有消除了系統誤差之后,精密度高,準確度才高。五、隨機誤差的正態分布當測定值連續變化時,其隨機誤差的分布特性可用正態分布(又稱高斯分布)的正態概率密度函數來表示。

此表達式又稱為高斯方程,

是總體平均值,函數y表示x出現的概率密度,也可以理解為在無限多次測量中,測量值x在某一范圍內出現的頻率。是總體標準偏差,自變量x表示個別測定值,以x值表示橫坐標,y值表示縱坐標,就得到測定值的正態分布曲線(p12,圖2-2)。若求在x1~x2這個范圍內測量值出現的概率,只需對y在此范圍內積分

這里的P就是在x1~x2這個范圍內測量值出現的概率,在正態分布曲線圖上表現為曲線下x=x1和x=x2兩條直線之間所夾的面積。

由于高斯方程的表達式較復雜,積分計算無法得到它的解析解。在實用中,通常都是采用數值計算的方法,把每個區間積分結果計算出來,列成積分表,再通過查表解決具體的積分計算問題。

正態分布曲線的形狀和位置要受到μ值和值大小的影響,不同的μ值和值就會有不同的正態分布,各種不同的正態分布的數目將是無限多的,顯然不可能給每一個正態分布都準備一個積分表。

為了把一個普通的正態分布轉換為標準正態分布,

x為測定值,μ為總體平均值,σ總體標準偏差。

設u稱為標準正態變量此時高斯方程就轉化為只有變量u的函數表達式,

即此式就是標準正態分布曲線方程,從形式上看,標準正態分布與的正態分布完全相同,所以標準正態分布記作N(0,1)。各種不同的正態分布都可以通過上述變化而轉換成標準正態分布。以u值為橫坐標,誤差出現的概率為縱坐標,當測定次數無限多時,得到隨機誤差標準正態分布曲線,如p12,圖2-2。由數值計算的方法可計算出u在不同的取值范圍與誤差出現的概率有如下關系,p13,表2-1。

u=±1(即測定值在μ±σ區間內),曲線所包圍的面積為68.3%,誤差出現的幾率為68.3%;

u=±2(即測定值在μ±2σ區間內),誤差出現的幾率為95.5%;

u=±3(即測定值在μ±3σ區間內),誤差出現的幾率為99.7%,即誤差大于3σ的幾率僅為0.3%(一千次測量中誤差大于3σ的只有3次)。

標準正態分布曲線與橫坐標從-∞至+∞之間所包圍面積為所有隨機誤差出現的概率的總和為100%。六、有限次測定中隨機誤差的t分布曲線

在有限次測定中無法計算總體標準差和總體平均值,其隨機誤差并不完全符合正態分布,而是服從于t分布。

(與u相比,用s代替σ)

t分布曲線如P14,圖2-3。t分布曲線的特點:(1)(2)t在不同的自由度f(f=n-1)下,t分布曲線具有不同的形狀。

f對t分布的影響實質上反映的是測量次數n對t分布的影響。

從圖3-6可以看出:t分布曲線一般總要比標準正態分布曲線“矮胖”,這表明有限次測量的分布要更分散。

與u的區別在于用有限次測量的標準偏差s代替了總體標準偏差時,s才趨于t分布曲線才與標準正態分布曲線完全吻合,因此也可以把標準正態分布看成是t分布的一個特例。

這個式子表明:真實值μ可能存在于

這個區間之中,此區間稱為置信區間。決定置信區間大小的t值,對應著一定的置信概率,這個置信概率稱為置信度,也即真值位于該置信區間內的把握。由P14表2-2的t值表可以看出:t值與置信度及測定次數n有關。

首先,當測定次數相同時,置信度越大,t值越大,則置信區間就較寬,測量的精確度下降。反之,置信度越小,t值越小,置信區間就越窄。此時盡管置信區間的準確度提高了,但其可靠性卻降低了(見P15,例3)。置信區間的準確性與可靠性是兩個相互矛盾、相互制約的因素,為了兼顧這兩個方面,通常都將置信度定為90%或95%。在相同置信度下,n越大,置信區間就越小,平均值與真值就越接近,測定的準確性就越高。但當n大于20后,t值的變化不大,再增加測定次數對提高測定結果的準確度已經沒有什么意義了。例:分析Fe%,求:(1)置信度為95%時平均值的置信區間

=39.16%,s=0.05%,n=5

解:先查表找出相應的t值,查表(2)如果置信區間為(39.16±0.05)%,問至少測定幾次?

由所以

n=2,,t=12.706

n=3,,t=4.303

n=4,,t=3.182

n=5,2.236,t=2.776

n=6,2.449,t=2.571,所以至少需平行測定六次,才能使置信區間為(39.16±0.05)%§2-2分析結果的數據處理

在一組平行測定值中常常出現某一、兩個測定值比其余測定值明顯地偏大或偏小,我們稱之為可疑值(離群值)。比如四次平行測定值為0.1010,0.1012,0.1014和0.1024,其中0.1024與其他三個數據相差較遠,究竟應該舍去還是保留?由于可疑值的取舍對結果的平均值影響較大,所以對可疑數值的取舍必須十分慎重,尤其當數據較少時,可疑數據的取舍對結果影響更大,不能為了單純追求實驗結果的精密度高,而隨便舍棄可疑數值。必須用統計的方法對可疑數據先進行判斷,以決定是否應該舍去。一、可疑測定值的取舍

常用的方法有格魯布斯(Grubbs)檢驗法(G檢驗法)、

Q值檢驗法等。1、格魯布斯檢驗法(G檢驗法)G檢驗法適用于測定次數為3-20次。具體步驟如下:

(1)、設有n個測定值,其遞增順序為:其中或可能是可疑數值。(4)、若x1為可疑值時,統計量G算式為:

為可疑值)

(若為可疑值時,統計量G算式為:(為可疑值)

(2)、求出可疑值與平均值之差(3)、求出標準偏差s

查G值表,P17,表2-3,根據測量次數n和測定置信度P查得相應的G

p,n,如果則可疑數據應棄去,否則應保留。

2、Q值檢驗法Q檢驗法適用于測定次數為3-10次。具體步驟如下:1.將測得的數據由小到大排列為:其中

或為可疑數值;

2.求出最大與最小數據之差(極差)

;3.求出可疑數據與其最鄰近數據之差

或:4.求出舍棄商Q計

(可疑)

(

可疑)5.查Q值表,p18,表2-4,可得相應n值和置信度下的Q表值,若Q計>Q表,則應將極端值舍棄,否則應保留。如果出現Q計=Q表,最好再補測一、二次,再用Q檢驗法決定取舍。此外如果需對一個以上可疑值決定取舍時,首先檢驗最小值,然后再檢驗最大值。

例題:用Na2CO3標定HCl溶液的濃度,測定六次(n=6),結果如下:

0.5050,0.5042,0.5086,0.5063,0.5051,0.5064mol/L問:用Q檢驗法判斷0.5086

是否應舍去?

解:(1)按由小到大排列:

0.5042,0.5050,0.5051,0.5063,0.5064,0.5086

(2)xn-xn-1=0.5086-0.5064=0.0022

(3)xn–x1=0.5086-0.5042=0.0044

(4)

(5)查Q值表,當置信度P=90%,n=6時,Q表=0.56Q計<Q表,所以該值應該保留

Q檢驗法的優點是設定了一定的置信度(通常為90%)因此判斷的確定性較高。缺點是:數據的離散性(xn–x1)越大,Q計反而越小,可疑數據越不能舍去。

例:測定氯化物中氯的百分含量,共測定了8次,所得結果分別為:59.83%,60.04%,60.45%,59.88%,60.33%,60.24%,60.28%,59.77%,試用Grubbs檢測法對上述數據作出判斷(置信度取95%)

解:將數據按遞增順序排列為:59.77,59.83,59.88,60.04,60.24,60.28,60.33,60.45(%)求出其平均值和標準偏差s為:,s=0.26%

根據Grubbs檢驗法

查G值表,當n=8和置信度為95%時,,故59.77%和60.45%均應保留。因此,上述8個數據的平均值仍為60.10%

,所以該氯化物中氯的真實含量為:二、平均值與標準值的比較(檢查方法的準確度或方法是否可行,顯著性檢驗,t檢驗)

在分析工作中為了檢查某一分析方法是否存在較大的系統誤差,可用標準樣品作n次測定,然后利用上述檢驗法,檢測測定結果的平均值

與標準值

之間是否存在顯著性差異,從而判定某一分析方法是否可靠。作t檢驗時,先將標準值

與平均值

代入下式,計算t值:

根據所要求的置信度P(通常取95%)和測量次數n,由t值表查出相應的t表值。若t計<t表,說明

沒有顯著性差異,表示該方法沒有系統誤差存在,所得結果可靠。若t計>t表,

說明與

存在顯著性差異,表示該方法有系統誤差存在,所得結果不可靠。例題:采用一種新的方法分析標準鋼樣中的鉻含量

5次測定結果為1.12,1.15,1.13,1.16和1.14%,問這種新方法是否可靠?解:

=1.14,s=0.016,n=5,故

查表:P=0.95,n=5時,t表=2.78由于

,因此認為

之間存在顯著差異,此種新方法不可靠。§2-3有效數字及其運算規則一、有效數字

在分析測定工作中,不僅要注意在實驗中減少誤差,力求準確,還應正確記錄和計算實驗結果。也就是說表示實驗結果的數值即要表示數量的大小,同時也要反映出測量的準確程度。例如,用一般的分析天平稱得某物體的質量為0.5180g,這一數值中,0.518是準確的,最后一位數值“0”是估讀的,可能有上下一個單位的誤差,即其實際質量是0.5180±0.0001g范圍內的某一數值。此時稱量的絕對誤差為±0.0001g,相對誤差為

若將上述稱量結果寫成0.518g,則該物體的實際質量將為0.518±0.001g范圍內的某一數值,即絕對誤差為±0.001g,而相對誤差則為±0.2%。可見記錄時多寫一位或少寫一位“0”數字,從數學角度看關系不大,但是所反映的測量精確度無形中被擴大或縮小了10倍。在分析測定工作中,通常用有效數字來體現測定值的大小及精度。

所謂有效數字,就是指實際上能測量到的數字,通常包括全部準確數字和一位不確定的可疑數字。記錄數據和計算結果時,所保留的有效數字只有最后一位是可疑的數字。例如:用感量為百分之一克的臺秤稱物體的重量,由于儀器本身能準確稱到±0.01g,所以物體的重量如果是10.4g,就應寫成10.40g,不能寫成10.4。如果用萬分之一的分析天平稱,由于其可稱量準至±0.0001g,所以上述重量應寫為10.4000g。

從前面的例子中可以看出:有效數字的位數直接與測定的相對誤差有關。因此,記錄測量數據時,決不要因為最后一位的數字是零而隨便舍去。

數據中的“0”要作具體分析,數字中間的0,都是有效數字;數字前的0,都不是有效數字;數字后面的0是有效數字,但要注意進行單位換算時,數字后面用來定位的零不是有效數字,這時最好采用指數形式表示,否則,容易引起有效數字位數的誤解。例如:質量為25.0g若換算為毫克,寫成25000mg,容易誤解為五位有效數字,若寫成2.50×104

mg就比較準確的反映有效數字的位數。

(1)分析化學中常遇到的pH、pKa等對數值,其有效數字的位數僅取決于小數部分的位數,其整數部分只說明該數的方次。例如:[H+]=2.1×10-13,pH=12.68,其有效數字為兩位,而不是四位。

(2)若第一位有效數字大于或等于8,則有效數字的位數可多算一位。如8.37雖三位但可看做四位有效數字。

(3)定量分析實驗數據一般保留四位(例如:求百分含量、濃度、硬度等)

(4)表示誤差時,取一位至多兩位有效數字即可。

0.2098%0.21%

要注意的幾點:

二、有效數字的修約和運算規則1、有效數字的修約規則

數字修約規則和實例

修約規則修約前修約后(小數點后保留一位)

四要舍12.343212.3六要入25.474225.5五后有數要進位2.05212.1五后無數看前方前為奇數就進位0.55000.6前為偶數全舍光0.65000.6

2.05002.0(0視為偶數)

2.545462.5不論舍去多少位都要一次修停當(不要

)2、運算規則(一)加減法運算有效數字的位數應以參加運算的各數據中小數點后位

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論