




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四章、水文統計學隨機變量及其分布參數水文中常用的概率分布曲線統計參數估計方法相關分析水文時間序列分析第四章、水文統計學隨機變量及其分布參數1學習要求:(1)了解概率、隨機變量及其概率分布的基本概念;
(2)了解水文頻率曲線常用的線型,要掌握P-III型分布曲線和經驗頻率曲線的性質和計算方法;
(3)掌握水文頻率計算適線法的具體步驟和方法,特別是參數對頻率曲線的影響;
(5)了解相關分析的基本概念和方法,特別要掌握兩變量直線相關、曲線相關的方法和具體步驟;(6)水文過程的隨機模擬。
學習要求:
2水文現象具有二重性:水文現象包含著必然性水文現象也包含著偶然性,對水文的偶然現象(或稱隨機現象)所遵循的規律一般稱做統計規律。物理成因分析法概率論和數理統計分析方法水文現象具有二重性:水文現象也包含著偶然性34.1.1概率的基本概念與定理1.事件:是指隨機試驗的結果。事件有兩種屬性:
數量性質:直接測量的量或計算的量,如年降雨量,年徑流量...
屬性性質:
直接觀測到的現象,如天氣的雨天和晴天,嬰兒性別,錢幣的正面和背面...4.1.隨機變量及其分布參數4.1.1概率的基本概念與定理4.1.隨機變量及其分41)必然事件2)不可能事件3)隨機事件事件可以分為三種類型:2.概率
為了比較某隨機事件出現(或不出現)的可能性大小,必然賦予一種量化的(以數量表示)指標,這個數量指標就是事件的概率。1)必然事件事件可以分為三種類型:2.概率5
式中,P(A):一定條件下隨機事件A的概率;
n:試驗中所有可能的出現的結果數;
m:出現隨機事件A的結果數。簡單(古典)的隨機事件的概率定義用下式表示:古典的隨機試驗是指所有試驗的可能結果都是等可能的,而且試驗的可能結果的總數是有限的。但水文事件不一定符合這種性質。 式中,P(A):一定條件下隨機事件A的概6對于不是古典概型事件,只能通過多次重復試驗來估計事件的概率。設事件A在n次隨機試驗中出現了m次,則稱:3.頻率為事件A在n次試驗中出現的頻率。注意:n
不是所有可能的結果總數,僅是隨機試驗的次數。對于不是古典概型事件,只能通過多次重復試驗來估計事件7頻率:
頻率是通過若干次試驗后才能求得的經驗值,事先不能確定,當試驗次數n愈大,即當n趨于無窮大時,理論上,n變成試驗中所有可能的結果總數,則頻率愈接近概率。概率和頻率的區別:概率:
在等可能條件下,表達事件客觀上出現的可能性大小,是一個理論值。頻率:概率和頻率的區別:概率:
在等可能條件81.隨機變量
用以表示隨機試驗結果的一個數量(事先是未知的),由于它事先不能確定,是隨機的,稱為隨機變量。水文現象中的隨機變量,一般指某個水文特征值(如年徑流量、年降雨量、洪峰流量等)。4.1.2.隨機變量及其分布參數1.隨機變量4.1.2.隨機變量及其分布參數9
總體
在統計數學中,把某種隨機變量所取數值的全體,稱為總體。如年徑流量的總體數是無窮的。統計學中幾個概念:
樣本
從總體中不帶主觀成分任意抽取的一部分,稱為樣本。樣本所包含的項數,稱為樣本容量。如實測的水文資料是有限的,是一樣本。總體統計學中幾個概念:樣本10
它是指隨機試驗結果的一個數量。在水文學中,常用大寫字母表示,記作X,而隨機變量的可能取的值記作x,即:
X=x1,X=x2,
X=xn
一般稱之為隨機系列或隨機數列。
隨機變量的表示:它是指隨機試驗結果的一個數量。在水文學中,常用大寫字11離散型隨機變量
隨機變量僅取得區間內某些間斷的離散值,則稱為離散型隨機變量。如洪峰次數,只能取0,1,2…,不能取相鄰兩數值之間的任何值。隨機變量的分類:連續型隨機變量
隨機變量可以取得一個有限區間內的任何數值,則稱為連續型隨機變量。如某河流斷面的流量可以取0~極限值之間的任何實數值。離散型隨機變量隨機變量的分類:連續型隨機變量12對于離散型隨機變量:
隨機變量的取某一可能值的機會有的大有的小,即隨機變量取值都有一定的概率與之相對應,可表示為:2.隨機變量的概率分布
上式中P1,P2,…Pn
表示隨機變量X
取值x1,x2,…xn
所對應的概率。對于離散型隨機變量:2.隨機變量的概率分布13
x1x2x3x4……xnXP
離散型隨機變量概率分布圖一般將這種對應關系稱作隨機變量的概率分布規律,簡稱為分布律。可以用以下的分布圖形表示:x1x2x3x4…14
由于它的所有可能取值有無限個,而取個別值的概率為零,故無法研究個別值的概率。水文學上習慣研究隨機變量的取值等于或大于某個值的概率,表示為:
它是x的函數,稱作隨機變量X的分布函數,記作F(x),即F(x)=P(Xx)
表示隨機變量X大于或等于值
x的概率,其幾何曲線稱作隨機變量的概率分布曲線(水文學上通常稱累計頻率曲線,簡稱頻率曲線)。
對于連續型隨機變量:由于它的所有可能取值有無限個,而取個別值的概15
由圖中可知,X=900,相應的P(Xx)=0.15,說明大于900mm降雨的可能性為15%;同理,大于500mm降雨的可能性為60%00.20.40.60.81.0500900年降雨量(mm)某站年雨量概率分布曲線
P(Xx)由圖中可知,X=900,相應的P(Xx)=16
P(Xx)=P(X>x+x)+P(x+x>Xx)
P(x+x>Xx)=P(Xx)-P(X>x+x)=F(x)-F(x+x)
(8-1)由概率的加法定理:則,降雨量落在900和500mm的可能性為:60%-15%=45%
x
x+
x
PXP(Xx)P(X>x+x)隨機變量X落在(x,x+x)
的概率可用下式表示:
P(Xx)=P(X>x+x)+17平均概率密度:
隨機變量落在區間(x,x+x)的概率與該區間長度的比值稱作隨機變量落在區間(x,x+x)平均概率。概率密度函數:平均概率密度:隨機變量落在區間(x,x+x)18稱f(x)為概率密度函數,簡稱密度函數。而密度函數的幾何曲線稱作密度曲線。當x
0,取極限得:稱f(x)為概率密度函數,簡稱密度函數。當x019f(x)f(xi)F(x)xi密度曲線分布曲線xxdxf(x)f(xi)F(x)xi密度曲線分布曲線xxdx20通過密度函數f(x)可求出隨機變量X落在(x~x+dx)區間即dx上的概率=f(x)dx,稱之為概率元素,即為圖中的陰影面積;通過密度函數f(x)可求出隨機變量X概率分布函數F(x),其與密度函數f(x)有如下的數學關系:通過密度函數f(x)可求出隨機變量X落在(x~x+dx21
F(x)分布函數,反映隨機變量X超過某個值x的概率。這兩個函數能完整地描述隨機變量的分布規律。
f(x)密度函數,反映隨機變量X落入dx區間的平均概率;可見,隨機變量的二個函數:
F(x)分布函數,反映隨機變量X超過某個值x的22
在實際問題中,隨機變量的分布函數不易確定,或有時不一定需要用完整的形式來說明隨機變量,而只要知道其主要特征就可以。隨機變量的分布函數和密度函數中都包含一些參數(如均值、變差系數、偏態系數),而這些參數能反映隨機變量分布的特點:如有的分布集中,有的分布分散,有的分布對稱,有的分布非對稱,等等。在統計學中用以表示隨機變量這些分布特征的某些數值,稱之為隨機變量統計參數。3.隨機變量統計參數在實際問題中,隨機變量的分布函數不易確定,或有時不一23平均數/數學期望離散型隨機變量的平均數是以概率為權重的加權平均值。a.反映位置特征參數
對于離散型隨機變量:平均數/數學期望離散型隨機變量的平均數是以24
式中,a、b分別為隨機變量X取值的上下限。
數學期望或平均數代表整個隨機變量的總水平的高低,它為分布的中心。
對于連續的隨機變量:式中,a、b分別為隨機變量X取值的上下限。25
表示概率密度分布峰點所對應的數。對于離散型隨機變量:
M0(x)
是使概率P(=xi)等于最大時所相應的xi值。M0(x)=xiPi-1PiPi+1
Px離散型隨機變量的眾數眾數,記為M0(x)表示概率密度分布峰點所對應的數。M0(x)=26M0(x)是概率密度函數f(x)等于最大時所對應的xi值M0(x)f(x)x連續的隨機變量的眾數對于連續型隨機變量:M0(x)是概率密度函數f(x)等于最大27把概率密度分布分為二個相等部分的數。對于離散型的隨機變量:
將所有變量的可能取值按大小次序排列,位置居中的數字。中位數,記為Me(x)把概率密度分布分為二個相等部分的數。中位28對于連續的隨機變量中位數滿足:式中,a,b分別為隨機變量X取值的上下限Me(x)xf(x)1/21/2ab對于連續的隨機變量式中,a,b分別為隨機變量X29
該參數用以反映隨機變量分布離散程度(相對于隨機變量分布中心即平均值的差距)的指標,通常有以下幾種:b.反映離散特征參數
值愈大,分布愈分散;值愈小,分布愈集中。
標準差(均方差)
(Standarddeviation)(8-6)122>1f(x)x標準差對密度函數的影響該參數用以反映隨機變量分布離散程度(相對于隨30變差系數(離差系數,離勢系數〕CV1CV2CV2>CV1f(x)x變差系數對密度函數的影響CV值愈大,分布愈分散;CV
值愈小,分布愈集中。對于均值不同的二個系列,用均方差來比較其離散程度就不合適,則要采用均方差和均值的比來表示:變差系數(離差系數,離勢系數〕CV1CV2CV2>CV31f(x)x偏態系數對密度函數的影響Cs=0Cs>0Cs<0若不對稱:CS
>0,稱為正偏;CS
<0,稱為負偏。c.反映對稱特征的參數:
偏態系數(偏差系數)f(x)x偏態系數對密度函數的影響Cs=0Cs>0Cs<0若324.2.水文中常用的概率分布曲線1.正態分布(8-9)式中,:平均數;
:標準差。
許多隨機變量如水文測量誤差、抽樣誤差等一般服從正態分布。4.2.水文中常用的概率分布曲線1.正態分布(8-9)式中,33f(x)
a.單峰,只有一個眾數;b.對于平均數對稱,Cs=0;c.曲線二端趨于±∞,并以x軸為漸近線;d.正態分布曲線的特點:f(x)a.單峰,只有一個眾數;正態分布曲線的特點:34概率密度函數表達式:
2.皮爾遜Ⅲ型分布式中,()~的伽瑪函數,,,a
0:三個參數,它們與三個統計參數有一定的關系,其表達式為:可見,當以上三個參數確定后,P-III型密度函數亦完全確定。概率密度函數表達式: 2.皮爾遜Ⅲ型分布式中,(35f(x)皮爾遜Ⅲ型概率密度曲線
a0M0(x)Me(x)xPxP-III型曲線的特點:一端有限另一端無限的不對稱單峰正偏曲線f(x)皮爾遜Ⅲ型概率密度曲線a0M0(x)Me(x)x36在水文計算中,一般要求出指定概率P所相應的隨機變量的取值xP,即求出的xP滿足下列等式:按上式計算相當復雜,故實用中,采用標準化變換:取標準變量(離均系數),即代入上式,,
,a0以相應的和關系式表示,簡化后得:在水文計算中,一般要求出指定概率P所相應370.031.302.473.384.160.20.021.292.403.233.940.10.001.282.333.093.720.0501010.10.01P(%)pCsP-III型曲線離均系數
P值表注:詳表見附表1,p266被積函數含有參數,Cs,而包含在
中,制成對應關系表:0.031.302.473.384.160.20.021.238因此,由給定的CS
及P,從P-III型曲線離均系數
值表,查出P,再由下式求:
即求出指定概率P所相應的隨機變量的取值xP因此,由給定的CS及P,從P-III型曲線39已知:某地年平均降雨量
=1000mm,CV=0.5,CS=1.0,若年降雨量符合P-III型分布試求:P=1%
的年降雨量。【算例】求解:由CS=1.0及P=1%,查附表1得p=3.02已知:某地年平均降雨量=1000mm,CV=40引入模比系數:
另一種求解方法:由由此建立的對應數值關系[P-III型曲線模比系數KP
值表(見附表2)]上例的解法:由CV=0.5,CS
=1.0=2
CV
,P=1%查附表2得:引入模比系數:另一種求解方法:由由此建立的41P-III型曲線模比系數KP值表(附表2,P266)
P(%)CV0.010.10.20.330.512510205075909599(一)
CS=CV0.051.191.161.151.141.131.121.111.091.071.041.000.970.940.920.89……………………………………1.5011.68.858.027.366.876.005.113.923.002.040.64-0.10-0.53-0.70-0.89(二)CS=1.5CV0.05(三)CS=2CV。。。。。。(三)CS=6CVP-III型曲線模比系數KP值表(附表2,P266)42
水文隨機變量的總體是無限的,這就需要在總體不知道的情況下,靠抽出的樣本(觀測的系列)去估計總體參數。4.3.隨機變量系列統計參數的估計估算方法有:
矩法;
適線法;
極大似然法;
權函數法;………水文隨機變量的總體是無限的,這就需要在總體不知道的情43現行水文頻率計算方法~配線法(適線法)是以經驗頻率點據為基礎,在一定的適線準則下,求解與經驗點據擬合最優的頻率曲線參數,這是一種較好的參數估計方法,是我國估計洪水頻率曲線統計參數的主要方法。現行水文頻率計算方法~配線法(適線法)是以經44有關的概念介紹:1)經驗頻率及經驗頻率曲線:【例】已知某地年降雨量的觀測資料(n=12),并由大到小排列,按計算頻率。式中,P:大于或等于某一變量值x的經驗頻率;m:x由大到小排列的序號,即在n次觀測資料中出現大于或等于某一值x的次數。有關的概念介紹:1)經驗頻率及經驗頻率曲線:【例】已知45經驗頻率計算表:n=12經驗頻率計算表:n=1246其反映年降雨量(Xx)的經驗頻率P(Xx)和x的關系。隨著樣本容量n的增加,頻率P就非常接近于概率,而該經驗分布曲線就非常接近于總體的分布曲線。由此得到經驗分布曲線:P(Xx)x其反映年降雨量(Xx)的經驗頻率P(Xx)和x的47注意:樣本的每一項的經驗頻率用公式P=m/n進行計算,當m=n時,P=100%,說明樣本的最末項為總體的最小值,這是不合理的。故必須進行修正,中國常采用下面的公式進行計算:經驗頻率的計算公式:這樣,當m=n=12
時,該公式在水文計算中通常稱為期望公式注意:樣本的每一項的經驗頻率用公式P=m/n進行計算,當m=48
所謂的重現期是指某一隨機事件在很長時期內平均多長時間出現一次(水文學中常稱為“多少年一遇”)。即在許多試驗中,某一隨機事件重復出現的時間間隔的平均數,即平均的重現間隔期。在水文分析中,重現期可以等效地替代頻率。2)重現期所謂的重現期是指某一隨機事件在很長時期內平49a.當研究洪水或暴雨問題
水文上關心的是大于某洪水或某暴雨量發生的頻率,因此,重現期指在很長時期N年內,出現大于某水文變量XP事件的平均重現的間隔期T:式中,T:重現期,以年計;
P:大于某水文變量XP事件的頻率,頻率P與重現期T關系的兩種表示法:a.當研究洪水或暴雨問題式中,T:重現期,以年計;頻率P50
水文上關心的是小于xP的事件出現的頻率及相應的重現期。重現期指在很長的時期內(N年)出現小于某水文變量xP事件的平均重現間隔期。若水文變量大于xP的頻率為P
,則小于xP事件的頻率應為1-P,在N年內小于xP事件出現的次數應為N(1-P),因此其重現期為:b.當研究枯水問題水文上關心的是小于xP的事件出現的頻率及相應51具體求解步驟:a
根據實測樣本資料進行點繪[縱坐標為隨機變量X=x,橫坐標為對應的經驗頻率P(Xx)],經驗頻率計算公式為:b
假定一組參數
,可選用矩法的估值作為的初始值,一般不求CS,假定,K為比例系數,可選K=1.5,2,2.5,3...3)適線法(配線法)的步驟已知:經驗頻率分布,求:總體分布參數具體求解步驟:b假定一組參數,可選用矩法52d根據選定的參數,由P-III型曲線離均系數值(附表1)或P-III型曲線模比系數KP值表(附表2),求出xP~P
的頻率曲線,將其繪在有經驗點據的同一張圖上,看它們的配合好壞,若不理想,則修改有關的參數(主要調整CV及K=CS/CV),重復以上的步驟,重新配線;c選定線型,對于水文的隨機變量,一般選P-III型;e根據配合的情況,選出一配合最佳的頻率曲線作為采用曲線,則相應的參數作為總體參數的估值。d根據選定的參數,由53PxP
適線法的實質是通過樣本經驗分布來推求總體分布,適線法的關鍵在于“最佳配合”的判別。經驗點據理論頻率曲線PxP適線法的實質是通過樣本經驗分布來推求總體分布,適線54為避免修改參數的盲目性,要了解參數對頻率曲線形狀的影響:a)值愈大,頻率曲線位置愈高;xPPPxPPxPc)CS值愈大,頻率曲線上段變陡,下段變緩,中部向左偏。b)CV值愈大,頻率曲線愈陡;為避免修改參數的盲目性,要了解參數556.5.1相關關系的概念
水文現象中許多變量不是孤立的,相互之間存在聯系,則分析研究二個或二個以上隨機變量之間的關系,稱作相關關系。6.5相關分析6.5.1相關關系的概念6.5相關分析56
如果兩個變量x,y,其中變量x的每一個值,變量y都有一個或多個確定值與之對應,而且x,y成函數關系,即x,y的關系點完全落在直線或曲線上,則稱這二個變量是完全相關的。完全相關yx完全相關(函數關系〕直線關系曲線關系二個隨機變量之間的關系有以下三種情況:如果兩個變量x,y,其中變量x的每一個值57零相關YXb.零相關(沒有關系)如果兩個變量x,y之間互不影響互不相關,則稱這二個變量沒有關系或零相關。即x,y的關系點毫無規律,十分分散。零相關YXb.零相關(沒有關系)如果兩個58yx如果兩個變量x,y之間關系介于以上二者之間,x,y的關系點雖有點分散,但有明顯的趨勢,數學上可以用一定的表達式進行擬合。則稱這二個變量關系為:
統計相關或相關關系。統計相關c.統計相關(相關關系〕yx如果兩個變量x,y之間關系介于以上二者59a.確定二個變量間相關關系的數學表達式,以相關方程或回歸方程表示,用以由已知變量推求未知變量;b.判斷二個變量間相關關系的密切程度,用一稱為相關系數的參數來表示。水文計算中的相關分析的主要任務:a.確定二個變量間相關關系的數學表達式,60水文計算中,一般處理兩個變量間的相關關系,稱簡相關,有時也要處理三個或三個以上變量關系,稱為復相關。簡相關可分為直線相關和曲線相關。曲線相關直線相關6.5.2
簡相關水文計算中,一般處理兩個變量間的相關關系,稱61圖解法:根據實測值,將對應點繪于方格紙上,如果點群分布平均趨勢為一直線,則可以直線來近似代表這種相關關系。通過點群中心目估繪出一條直線,然后在圖上量出直線的斜率a和截距b,則直線方程:
y=a+bx即為所求的相關方程。該方法簡便實用,而且一般情況下精度可以保證。1)回歸方程及其誤差分析圖解法:1)回歸方程及其誤差分析62相關分析法:若相關點分布較散,目估定線有一定任意性,為保證一定精確性,最好采用分析法來確定相關線的方程。設該直線方程形式為:
y=a+bx式中,x:自變量y:倚變量a,b:分別為一常數,待定。則相關點與直線在縱軸方向必然存在離差。相關分析法:若相關點分布較散,目估定線有一定任意性,為保63配合曲線與觀測點在縱軸方向的離差為:xiy配合曲線與觀測點在縱軸方向的離差為:xiy64要求配合曲線與所有的觀測點能“最佳”擬合,即滿足所有的觀測點的離差y的平方和為最小,即:分別對a,b求一階偏導數,并令其為零:要求配合曲線與所有的觀測點能“最佳”擬合,即65求解上列兩聯立方程式,可得求解上列兩聯立方程式,可得66式中,:分別為x,y系列的均方差/標準差; :分別為x,y系列的平均值; :x,y系列的變差系數(按不偏估計公式計算):
:相關系數;Kxi,Kyi:分別為xi,yi系列的模比系數:式中,:分別為x,y系列的均67為回歸線的斜率,稱y為x倚的回歸系數(8-37)式即為y倚x的回歸方程,其曲線稱為回歸線/相關線(僅是對點據擬合最佳一條線),亦可表示為:將
,
代入y=a+bx中得:為回歸線的斜率,稱y為x倚的回歸系數(8-37)式即68注意:由于x,y并非確定性關系,對于x=x0,無法知道其相應的真正值y0,通過回歸方程求到:僅僅是真正值y0的一個估計值。故其與真正值y0存在偏差。根據統計學的研究,由于隨機因素的影響,y0在估計值上下波動呈正態分布,其均方誤差可用公式表示。注意:由于x,y并非確定性關系,對于x=x69式中,Sy:y倚x回歸線的均方誤;
yi
:觀測點的縱坐標值;y:由回歸方程求到的縱坐標值;n:觀測項的數目
y倚x回歸線的均方誤估算公式:如前所述,可以用均方誤進行誤差分析,即對于任一固定的x=x0值,若以作為y的估值,其誤差不超過Sy的可能性為68.3%;其誤差不超過3Sy的可能性為99.7%。式中,Sy:y倚x回歸線的均方誤; y倚x回歸線的均方誤70另外,可以證明回歸線的均方誤與系列標準差及相關系數
有以下關系:式中,為y系列的標準差(無偏估計量)根據均方誤公式,也可以用
2來判斷相關程度:
若
2=1,Sy=0,則y=yi
,屬函數關系;
若
2=0,Sy=y,誤差最大,屬零相關;
若0<
2<1,為統計相關,
2
1,x,y關系愈密切。可知,均方誤Sy值愈大,則回歸方程的誤差愈大。另外,可以證明回歸線的均方誤與系列標準差及相71相關系數的均方誤可用下式來估算:式中,為相關系數;n為觀測項數。相關系數是根據有限的實測資料(樣本)計算出來的,故相關系數也不免帶有抽樣誤差
故水文上為了推斷二個變量的相關性,必須對樣本相關系數作統計檢驗。相關系數的均方誤:相關系數的均方誤可用下式來估算:式中,為相關系數;72相關系數的統計檢驗的思路---反證法:
檢驗二個變量是否相關,先假定二個變量不相關,由此如果導致“不合理的現象”發生,則表明原先的假定不成立,拒絕“不相關”的假定,如果沒有導致“不合理現象”發生,則原假定成立,稱原假定是相容的。這里所謂的“不合理”不是指形式邏輯上的絕對矛盾,而是基于實踐中廣泛采用的一個原則:
"小概率事件在一次觀測中是不可能發生的"。相關系數的統計檢驗:相關系數的統計檢驗的思路---反證法:相關系數的統計檢驗73-
α0+
αf(r)樣本相關系數密度曲線示意圖具體的檢驗步驟:
假設兩變量X,Y在總體上不相關;
從不相關的兩變量總體中抽出大量的樣本(如n個),進行相關分析,并分別計算各樣本的相關系數1,2,…n,由于假設總體不相關,可以判斷1,2,…n,為較小值的可能性大,而較大值的可能性小,其概率分布密度曲線f(r)~r如右圖所示:-α0+αf(r)樣本相關系數74
選定一個衡量事件發生可能性(概率)很小的指標(水文統計學中稱顯著性水平),對于容量為n的樣本,則有一相應的臨界值(為較大值),樣本相關系數(根據原先假定
應為很小的值)
超過±的可能性(概率)應為較小值(水文上一般選
=0.05或0.01作為小概率),即:由于
值很小,故≥為一小概率事件.選定一個衡量事件發生可能性(概率)很小的指標(水文統計學75
取某一個具體的樣本所計算的
與作比較,以判斷總體是否相關:
若≥,說明樣本相關系數絕對值較大,且超過了臨界值,說明“小概率事件”發生了,則原先的假定是不能接受的,總體很大可能性是相關的。
若≤,說明樣本相關系數絕對值較小,未超過臨界值,則原先的假定可以成立,即總體很大可能性是不相關的。實用上,可查n~~(表8-7,p158)求取某一個具體的樣本所計算的與作比較,以判斷76不同顯著性水平下所需相關系數最低值n-2(n為樣本容量)0.10.050.020.0180.54940.63190.71550.764690.52140.60210.68510.7348100.49730.57600.65810.7079……………120.45750.53240.61200.6614……………1000.16380.19460.23010.2540不同顯著性水平下所需相關系數最低值n-20.10.0577則上式可寫成:
----直線關系故可按直線相關的方法求Y與X的回歸方程,再還原成y與x的函數關系。6.5.3
曲線相關1)冪函數方程二邊取對數:令:則上式可寫成:故可按直線相關的方法求Y與X的回歸方程,再還原78故可按直線相關的方法求Y倚X的回歸方程,再還原成y與x的函數關系則上式可寫成----直線關系2)指數函數方程二邊取對數:令故可按直線相關的方法求Y倚X的回歸方程,再還原成y79End!End!80第四章、水文統計學隨機變量及其分布參數水文中常用的概率分布曲線統計參數估計方法相關分析水文時間序列分析第四章、水文統計學隨機變量及其分布參數81學習要求:(1)了解概率、隨機變量及其概率分布的基本概念;
(2)了解水文頻率曲線常用的線型,要掌握P-III型分布曲線和經驗頻率曲線的性質和計算方法;
(3)掌握水文頻率計算適線法的具體步驟和方法,特別是參數對頻率曲線的影響;
(5)了解相關分析的基本概念和方法,特別要掌握兩變量直線相關、曲線相關的方法和具體步驟;(6)水文過程的隨機模擬。
學習要求:
82水文現象具有二重性:水文現象包含著必然性水文現象也包含著偶然性,對水文的偶然現象(或稱隨機現象)所遵循的規律一般稱做統計規律。物理成因分析法概率論和數理統計分析方法水文現象具有二重性:水文現象也包含著偶然性834.1.1概率的基本概念與定理1.事件:是指隨機試驗的結果。事件有兩種屬性:
數量性質:直接測量的量或計算的量,如年降雨量,年徑流量...
屬性性質:
直接觀測到的現象,如天氣的雨天和晴天,嬰兒性別,錢幣的正面和背面...4.1.隨機變量及其分布參數4.1.1概率的基本概念與定理4.1.隨機變量及其分841)必然事件2)不可能事件3)隨機事件事件可以分為三種類型:2.概率
為了比較某隨機事件出現(或不出現)的可能性大小,必然賦予一種量化的(以數量表示)指標,這個數量指標就是事件的概率。1)必然事件事件可以分為三種類型:2.概率85
式中,P(A):一定條件下隨機事件A的概率;
n:試驗中所有可能的出現的結果數;
m:出現隨機事件A的結果數。簡單(古典)的隨機事件的概率定義用下式表示:古典的隨機試驗是指所有試驗的可能結果都是等可能的,而且試驗的可能結果的總數是有限的。但水文事件不一定符合這種性質。 式中,P(A):一定條件下隨機事件A的概86對于不是古典概型事件,只能通過多次重復試驗來估計事件的概率。設事件A在n次隨機試驗中出現了m次,則稱:3.頻率為事件A在n次試驗中出現的頻率。注意:n
不是所有可能的結果總數,僅是隨機試驗的次數。對于不是古典概型事件,只能通過多次重復試驗來估計事件87頻率:
頻率是通過若干次試驗后才能求得的經驗值,事先不能確定,當試驗次數n愈大,即當n趨于無窮大時,理論上,n變成試驗中所有可能的結果總數,則頻率愈接近概率。概率和頻率的區別:概率:
在等可能條件下,表達事件客觀上出現的可能性大小,是一個理論值。頻率:概率和頻率的區別:概率:
在等可能條件881.隨機變量
用以表示隨機試驗結果的一個數量(事先是未知的),由于它事先不能確定,是隨機的,稱為隨機變量。水文現象中的隨機變量,一般指某個水文特征值(如年徑流量、年降雨量、洪峰流量等)。4.1.2.隨機變量及其分布參數1.隨機變量4.1.2.隨機變量及其分布參數89
總體
在統計數學中,把某種隨機變量所取數值的全體,稱為總體。如年徑流量的總體數是無窮的。統計學中幾個概念:
樣本
從總體中不帶主觀成分任意抽取的一部分,稱為樣本。樣本所包含的項數,稱為樣本容量。如實測的水文資料是有限的,是一樣本。總體統計學中幾個概念:樣本90
它是指隨機試驗結果的一個數量。在水文學中,常用大寫字母表示,記作X,而隨機變量的可能取的值記作x,即:
X=x1,X=x2,
X=xn
一般稱之為隨機系列或隨機數列。
隨機變量的表示:它是指隨機試驗結果的一個數量。在水文學中,常用大寫字91離散型隨機變量
隨機變量僅取得區間內某些間斷的離散值,則稱為離散型隨機變量。如洪峰次數,只能取0,1,2…,不能取相鄰兩數值之間的任何值。隨機變量的分類:連續型隨機變量
隨機變量可以取得一個有限區間內的任何數值,則稱為連續型隨機變量。如某河流斷面的流量可以取0~極限值之間的任何實數值。離散型隨機變量隨機變量的分類:連續型隨機變量92對于離散型隨機變量:
隨機變量的取某一可能值的機會有的大有的小,即隨機變量取值都有一定的概率與之相對應,可表示為:2.隨機變量的概率分布
上式中P1,P2,…Pn
表示隨機變量X
取值x1,x2,…xn
所對應的概率。對于離散型隨機變量:2.隨機變量的概率分布93
x1x2x3x4……xnXP
離散型隨機變量概率分布圖一般將這種對應關系稱作隨機變量的概率分布規律,簡稱為分布律。可以用以下的分布圖形表示:x1x2x3x4…94
由于它的所有可能取值有無限個,而取個別值的概率為零,故無法研究個別值的概率。水文學上習慣研究隨機變量的取值等于或大于某個值的概率,表示為:
它是x的函數,稱作隨機變量X的分布函數,記作F(x),即F(x)=P(Xx)
表示隨機變量X大于或等于值
x的概率,其幾何曲線稱作隨機變量的概率分布曲線(水文學上通常稱累計頻率曲線,簡稱頻率曲線)。
對于連續型隨機變量:由于它的所有可能取值有無限個,而取個別值的概95
由圖中可知,X=900,相應的P(Xx)=0.15,說明大于900mm降雨的可能性為15%;同理,大于500mm降雨的可能性為60%00.20.40.60.81.0500900年降雨量(mm)某站年雨量概率分布曲線
P(Xx)由圖中可知,X=900,相應的P(Xx)=96
P(Xx)=P(X>x+x)+P(x+x>Xx)
P(x+x>Xx)=P(Xx)-P(X>x+x)=F(x)-F(x+x)
(8-1)由概率的加法定理:則,降雨量落在900和500mm的可能性為:60%-15%=45%
x
x+
x
PXP(Xx)P(X>x+x)隨機變量X落在(x,x+x)
的概率可用下式表示:
P(Xx)=P(X>x+x)+97平均概率密度:
隨機變量落在區間(x,x+x)的概率與該區間長度的比值稱作隨機變量落在區間(x,x+x)平均概率。概率密度函數:平均概率密度:隨機變量落在區間(x,x+x)98稱f(x)為概率密度函數,簡稱密度函數。而密度函數的幾何曲線稱作密度曲線。當x
0,取極限得:稱f(x)為概率密度函數,簡稱密度函數。當x099f(x)f(xi)F(x)xi密度曲線分布曲線xxdxf(x)f(xi)F(x)xi密度曲線分布曲線xxdx100通過密度函數f(x)可求出隨機變量X落在(x~x+dx)區間即dx上的概率=f(x)dx,稱之為概率元素,即為圖中的陰影面積;通過密度函數f(x)可求出隨機變量X概率分布函數F(x),其與密度函數f(x)有如下的數學關系:通過密度函數f(x)可求出隨機變量X落在(x~x+dx101
F(x)分布函數,反映隨機變量X超過某個值x的概率。這兩個函數能完整地描述隨機變量的分布規律。
f(x)密度函數,反映隨機變量X落入dx區間的平均概率;可見,隨機變量的二個函數:
F(x)分布函數,反映隨機變量X超過某個值x的102
在實際問題中,隨機變量的分布函數不易確定,或有時不一定需要用完整的形式來說明隨機變量,而只要知道其主要特征就可以。隨機變量的分布函數和密度函數中都包含一些參數(如均值、變差系數、偏態系數),而這些參數能反映隨機變量分布的特點:如有的分布集中,有的分布分散,有的分布對稱,有的分布非對稱,等等。在統計學中用以表示隨機變量這些分布特征的某些數值,稱之為隨機變量統計參數。3.隨機變量統計參數在實際問題中,隨機變量的分布函數不易確定,或有時不一103平均數/數學期望離散型隨機變量的平均數是以概率為權重的加權平均值。a.反映位置特征參數
對于離散型隨機變量:平均數/數學期望離散型隨機變量的平均數是以104
式中,a、b分別為隨機變量X取值的上下限。
數學期望或平均數代表整個隨機變量的總水平的高低,它為分布的中心。
對于連續的隨機變量:式中,a、b分別為隨機變量X取值的上下限。105
表示概率密度分布峰點所對應的數。對于離散型隨機變量:
M0(x)
是使概率P(=xi)等于最大時所相應的xi值。M0(x)=xiPi-1PiPi+1
Px離散型隨機變量的眾數眾數,記為M0(x)表示概率密度分布峰點所對應的數。M0(x)=106M0(x)是概率密度函數f(x)等于最大時所對應的xi值M0(x)f(x)x連續的隨機變量的眾數對于連續型隨機變量:M0(x)是概率密度函數f(x)等于最大107把概率密度分布分為二個相等部分的數。對于離散型的隨機變量:
將所有變量的可能取值按大小次序排列,位置居中的數字。中位數,記為Me(x)把概率密度分布分為二個相等部分的數。中位108對于連續的隨機變量中位數滿足:式中,a,b分別為隨機變量X取值的上下限Me(x)xf(x)1/21/2ab對于連續的隨機變量式中,a,b分別為隨機變量X109
該參數用以反映隨機變量分布離散程度(相對于隨機變量分布中心即平均值的差距)的指標,通常有以下幾種:b.反映離散特征參數
值愈大,分布愈分散;值愈小,分布愈集中。
標準差(均方差)
(Standarddeviation)(8-6)122>1f(x)x標準差對密度函數的影響該參數用以反映隨機變量分布離散程度(相對于隨110變差系數(離差系數,離勢系數〕CV1CV2CV2>CV1f(x)x變差系數對密度函數的影響CV值愈大,分布愈分散;CV
值愈小,分布愈集中。對于均值不同的二個系列,用均方差來比較其離散程度就不合適,則要采用均方差和均值的比來表示:變差系數(離差系數,離勢系數〕CV1CV2CV2>CV111f(x)x偏態系數對密度函數的影響Cs=0Cs>0Cs<0若不對稱:CS
>0,稱為正偏;CS
<0,稱為負偏。c.反映對稱特征的參數:
偏態系數(偏差系數)f(x)x偏態系數對密度函數的影響Cs=0Cs>0Cs<0若1124.2.水文中常用的概率分布曲線1.正態分布(8-9)式中,:平均數;
:標準差。
許多隨機變量如水文測量誤差、抽樣誤差等一般服從正態分布。4.2.水文中常用的概率分布曲線1.正態分布(8-9)式中,113f(x)
a.單峰,只有一個眾數;b.對于平均數對稱,Cs=0;c.曲線二端趨于±∞,并以x軸為漸近線;d.正態分布曲線的特點:f(x)a.單峰,只有一個眾數;正態分布曲線的特點:114概率密度函數表達式:
2.皮爾遜Ⅲ型分布式中,()~的伽瑪函數,,,a
0:三個參數,它們與三個統計參數有一定的關系,其表達式為:可見,當以上三個參數確定后,P-III型密度函數亦完全確定。概率密度函數表達式: 2.皮爾遜Ⅲ型分布式中,(115f(x)皮爾遜Ⅲ型概率密度曲線
a0M0(x)Me(x)xPxP-III型曲線的特點:一端有限另一端無限的不對稱單峰正偏曲線f(x)皮爾遜Ⅲ型概率密度曲線a0M0(x)Me(x)x116在水文計算中,一般要求出指定概率P所相應的隨機變量的取值xP,即求出的xP滿足下列等式:按上式計算相當復雜,故實用中,采用標準化變換:取標準變量(離均系數),即代入上式,,
,a0以相應的和關系式表示,簡化后得:在水文計算中,一般要求出指定概率P所相應1170.031.302.473.384.160.20.021.292.403.233.940.10.001.282.333.093.720.0501010.10.01P(%)pCsP-III型曲線離均系數
P值表注:詳表見附表1,p266被積函數含有參數,Cs,而包含在
中,制成對應關系表:0.031.302.473.384.160.20.021.2118因此,由給定的CS
及P,從P-III型曲線離均系數
值表,查出P,再由下式求:
即求出指定概率P所相應的隨機變量的取值xP因此,由給定的CS及P,從P-III型曲線119已知:某地年平均降雨量
=1000mm,CV=0.5,CS=1.0,若年降雨量符合P-III型分布試求:P=1%
的年降雨量。【算例】求解:由CS=1.0及P=1%,查附表1得p=3.02已知:某地年平均降雨量=1000mm,CV=120引入模比系數:
另一種求解方法:由由此建立的對應數值關系[P-III型曲線模比系數KP
值表(見附表2)]上例的解法:由CV=0.5,CS
=1.0=2
CV
,P=1%查附表2得:引入模比系數:另一種求解方法:由由此建立的121P-III型曲線模比系數KP值表(附表2,P266)
P(%)CV0.010.10.20.330.512510205075909599(一)
CS=CV0.051.191.161.151.141.131.121.111.091.071.041.000.970.940.920.89……………………………………1.5011.68.858.027.366.876.005.113.923.002.040.64-0.10-0.53-0.70-0.89(二)CS=1.5CV0.05(三)CS=2CV。。。。。。(三)CS=6CVP-III型曲線模比系數KP值表(附表2,P266)122
水文隨機變量的總體是無限的,這就需要在總體不知道的情況下,靠抽出的樣本(觀測的系列)去估計總體參數。4.3.隨機變量系列統計參數的估計估算方法有:
矩法;
適線法;
極大似然法;
權函數法;………水文隨機變量的總體是無限的,這就需要在總體不知道的情123現行水文頻率計算方法~配線法(適線法)是以經驗頻率點據為基礎,在一定的適線準則下,求解與經驗點據擬合最優的頻率曲線參數,這是一種較好的參數估計方法,是我國估計洪水頻率曲線統計參數的主要方法。現行水文頻率計算方法~配線法(適線法)是以經124有關的概念介紹:1)經驗頻率及經驗頻率曲線:【例】已知某地年降雨量的觀測資料(n=12),并由大到小排列,按計算頻率。式中,P:大于或等于某一變量值x的經驗頻率;m:x由大到小排列的序號,即在n次觀測資料中出現大于或等于某一值x的次數。有關的概念介紹:1)經驗頻率及經驗頻率曲線:【例】已知125經驗頻率計算表:n=12經驗頻率計算表:n=12126其反映年降雨量(Xx)的經驗頻率P(Xx)和x的關系。隨著樣本容量n的增加,頻率P就非常接近于概率,而該經驗分布曲線就非常接近于總體的分布曲線。由此得到經驗分布曲線:P(Xx)x其反映年降雨量(Xx)的經驗頻率P(Xx)和x的127注意:樣本的每一項的經驗頻率用公式P=m/n進行計算,當m=n時,P=100%,說明樣本的最末項為總體的最小值,這是不合理的。故必須進行修正,中國常采用下面的公式進行計算:經驗頻率的計算公式:這樣,當m=n=12
時,該公式在水文計算中通常稱為期望公式注意:樣本的每一項的經驗頻率用公式P=m/n進行計算,當m=128
所謂的重現期是指某一隨機事件在很長時期內平均多長時間出現一次(水文學中常稱為“多少年一遇”)。即在許多試驗中,某一隨機事件重復出現的時間間隔的平均數,即平均的重現間隔期。在水文分析中,重現期可以等效地替代頻率。2)重現期所謂的重現期是指某一隨機事件在很長時期內平129a.當研究洪水或暴雨問題
水文上關心的是大于某洪水或某暴雨量發生的頻率,因此,重現期指在很長時期N年內,出現大于某水文變量XP事件的平均重現的間隔期T:式中,T:重現期,以年計;
P:大于某水文變量XP事件的頻率,頻率P與重現期T關系的兩種表示法:a.當研究洪水或暴雨問題式中,T:重現期,以年計;頻率P130
水文上關心的是小于xP的事件出現的頻率及相應的重現期。重現期指在很長的時期內(N年)出現小于某水文變量xP事件的平均重現間隔期。若水文變量大于xP的頻率為P
,則小于xP事件的頻率應為1-P,在N年內小于xP事件出現的次數應為N(1-P),因此其重現期為:b.當研究枯水問題水文上關心的是小于xP的事件出現的頻率及相應131具體求解步驟:a
根據實測樣本資料進行點繪[縱坐標為隨機變量X=x,橫坐標為對應的經驗頻率P(Xx)],經驗頻率計算公式為:b
假定一組參數
,可選用矩法的估值作為的初始值,一般不求CS,假定,K為比例系數,可選K=1.5,2,2.5,3...3)適線法(配線法)的步驟已知:經驗頻率分布,求:總體分布參數具體求解步驟:b假定一組參數,可選用矩法132d根據選定的參數,由P-III型曲線離均系數值(附表1)或P-III型曲線模比系數KP值表(附表2),求出xP~P
的頻率曲線,將其繪在有經驗點據的同一張圖上,看它們的配合好壞,若不理想,則修改有關的參數(主要調整CV及K=CS/CV),重復以上的步驟,重新配線;c選定線型,對于水文的隨機變量,一般選P-III型;e根據配合的情況,選出一配合最佳的頻率曲線作為采用曲線,則相應的參數作為總體參數的估值。d根據選定的參數,由133PxP
適線法的實質是通過樣本經驗分布來推求總體分布,適線法的關鍵在于“最佳配合”的判別。經驗點據理論頻率曲線PxP適線法的實質是通過樣本經驗分布來推求總體分布,適線134為避免修改參數的盲目性,要了解參數對頻率曲線形狀的影響:a)值愈大,頻率曲線位置愈高;xPPPxPPxPc)CS值愈大,頻率曲線上段變陡,下段變緩,中部向左偏。b)CV值愈大,頻率曲線愈陡;為避免修改參數的盲目性,要了解參數1356.5.1相關關系的概念
水文現象中許多變量不是孤立的,相互之間存在聯系,則分析研究二個或二個以上隨機變量之間的關系,稱作相關關系。6.5相關分析6.5.1相關關系的概念6.5相關分析136
如果兩個變量x,y,其中變量x的每一個值,變量y都有一個或多個確定值與之對應,而且x,y成函數關系,即x,y的關系點完全落在直線或曲線上,則稱這二個變量是完全相關的。完全相關yx完全相關(函數關系〕直線關系曲線關系二個隨機變量之間的關系有以下三種情況:如果兩個變量x,y,其中變量x的每一個值137零相關YXb.零相關(沒有關系)如果兩個變量x,y之間互不影響互不相關,則稱這二個變量沒有關系或零相關。即x,y的關系點毫無規律,十分分散。零相關YXb.零相關(沒有關系)如果兩個138yx如果兩個變量x,y之間關系介于以上二者之間,x,y的關系點雖有點分散,但有明顯的趨勢,數學上可以用一定的表達式進行擬合。則稱這二個變量關系為:
統計相關或相關關系。統計相關c.統計相關(相關關系〕yx如果兩個變量x,y之間關系介于以上二者139a.確定二個變量間相關關系的數學表達式,以相關方程或回歸方程表示,用以由已知變量推求未知變量;b.判斷二個變量間相關關系的密切程度,用一稱為相關系數的參數來表示。水文計算中的相關分析的主要任務:a.確定二個變量間相關關系的數學表達式,140水文計算中,一般處理兩個變量間的相關關系,稱簡相關,有時也要處理三個或三個以上變量關系,稱為復相關。簡相關可分為直線相關和曲線相關。曲線相關直線相關6.5.2
簡相關水文計算中,一般處理兩個變量間的相關關系,稱141圖解法:根據實測值,將對應點繪于方格紙上,如果點群分布平均趨勢為一直線,則可以直線來近似代表這種相關關系。通過點群中心目估繪出一條直線,然后在圖上量出直線的斜率a和截距b,則直線方程:
y=a+bx即為所求的相關方程。該方法簡便實用,而且一般情況下精度可以保證。1)回歸方程及其誤差分析圖解法:1)回歸方程及其誤差分析142相關分析法:若相關點分布較散,目估定線有一定任意性,為保證一定精確性,最好采用分析法來確定相關線的方程。設該直線方程形式為:
y=a+bx式中,x:自變量y:倚變量a,b:分別為一常數,待定。則相關點與直線在縱軸方向必然存在離差。相關分析法:若相關點分布較散,目估定線有一定任意性,為保143配合曲線與觀測點在縱軸方向的離差為:xiy配合曲線與觀測點在縱軸方向的離差為:xiy144要求配合曲線與所有的觀測點能“最佳”擬合,即滿足所有的觀測點的離差y的平方和為最小,即:分別對a,b求一階偏導數,并令其為零:要求配合曲線與所有的觀測點能“最佳”擬合,即145求解上列兩聯立方程式,可得求解上列兩聯立方程式,可得146式中,:分別為x,y系列的均方差/標準差; :分別為x,y系列的平均值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 干濕循環下離石黃土強度與結構變化研究
- EUS-FNA取樣標本的不同檢驗方式在胰腺癌診斷中的應用價值
- 陜旅版五年級英語上冊教學計劃學期目標設定
- 河西走廊長城傳說研究
- 發射光譜診斷低氣壓容性耦合氬-甲烷等離子體放電特性
- ELP2通過NLRP3-GSDMD-GSDME調控炎癥誘導的成骨細胞焦亡和成骨分化抑制
- 糕點與面包的職業培訓周記
- 人防工程施工的質量控制措施
- 小學數學期末復習小組合作計劃
- 大學心理咨詢中心服務計劃
- 小型設備購買協議書
- 難點02:總集篇·十六種陰影部分面積法【十六大考點】-2024年小升初數學典型例題系列(解析版)
- 廠房設備拆除協議書
- 2025屆高三高考押題預測卷 數學(新高考Ⅱ卷02) 含解析
- 智能家居安裝與調試協議
- 擔保貸款免責協議書
- 租金折抵欠款協議書
- 第五版-FMEA培訓教材-新版
- NB-T32036-2017光伏發電工程達標投產驗收規程
- 食品安全與日常飲食智慧樹知到期末考試答案章節答案2024年中國農業大學
- PE袋化學品安全技術說明書MSDS(聚乙烯塑膠袋)
評論
0/150
提交評論