空間內插方法比較_第1頁
空間內插方法比較_第2頁
空間內插方法比較_第3頁
空間內插方法比較_第4頁
空間內插方法比較_第5頁
已閱讀5頁,還剩1頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

一、空間數據的插值用各種方法采集的空間數據往往是按用戶自己的要求獲取的采樣觀測值,亦既數據集合是由感興趣的區域的隨機點或規則網點上的觀測值組成的。但有時用戶卻需要獲取未觀測點上的數據,而已觀測點上的數據的空間分布使我們有可能從已知點的數據推算出未知點的數據值。在已觀測點的區域估算未觀測點的數據的過程稱為插;在已觀測點的區域外估算未觀測點的數據的過程稱為外推。空間數據的插和外推在GIS中使用十分普遍。一般情況下,空間位置越靠近的點越有可能獲得與實際值相似的數據,而空間位置越遠的點則獲得與實際值相似的數據的可能性越小。下面介紹一些常用的插方法。1、邊界插使用邊界插法時,首先要假定任何重要的變化都發生在區域的邊界上,邊界的變化則是均勻的、同質的。邊界插的方法之一是泰森多邊形法。泰森多邊形法的基本原理是,未知點的最佳值由最鄰近的觀測值產生。如圖4-6-1所示。泰森多邊形的生成算法見§ 5.7。2、趨勢面分析趨勢面分析是一種多項式回歸分析技術。多項式回歸的基本思想是用多項式表示線或面,按最小二乘法原理對數據點進行擬合,擬合時假定數據點的空間坐標X、Y為獨立變量,而表示特征值的Z坐標為因變量。當數據為一維時,可用回歸線近似表示為:其中,a0、a1為多項式的系數。當n個采樣點方差和為最小時,則認為線性回歸方程與被擬合曲線達到了最佳配準,如圖4-6-2左圖所示,即:當數據以更為復雜的方式變化時,如圖 4-6-2右圖所示。在這種情況下,需要用到二次或高次多項式:(二次曲線)在GIS中,數據往往是二維的,在這種情況下,需要用到二元二次或高次多項式:(二次曲面)多項式的次數并非越高越好,超過3次的多元多項式往往會導致奇異解,因此,通常使用二次多項式。趨勢面是一種平滑函數,難以正好通過原始數據點,除非數據點數和多項式的系數的個數正好相同。這就是說,多重回歸中的殘差屬正常分布的獨立誤差,而且趨勢面擬合產生的偏差幾乎都具有一定程度的空間非相關性。3、局部插在GIS中,實際的連續空間表面很難用一種數學多項式來描述,因此,往往使用局部插技術,即利用局部圍的已知采樣點的數據插出未知點的數據。常用的有線性插、雙線性多項式插、雙三次多項式(樣條函數)插。、線性插線性插的多項式函數為:只要將插點周圍的 3個數據點的數據值帶入多項式,即可解算出系數

a0、a1、a2。(2)、雙線性多項式插雙線性多項式插的多項式函數為:只要將插點周圍的 4個數據點的數據值帶入多項式,即可解算出系數

a0、a1、a2、a3。如果數據是按正方形格網點布置的(如圖 4-6-3),則可用簡單的公式即可計算出存點的數據值。設正方形的四個角點為A、B、C、D,其相應的特征值為ZA、ZB、ZC、ZD,P點相對于A點的坐標為dX、dY,則插值點的特征值Z為:(3)、雙三次多項式(樣條函數)插雙三次多項式是一種樣條函數。樣條函數是一種分段函數,對于 n次多項式,在邊界處其數連續。因此,樣條函數每次只用少量的數據點,故插速度很快;樣條函數通過所有的數據點,故可用于精確的插,可以保留微地貌特征;樣條函數的 n-1階導數連續,故可用于平滑處理。雙三次多項式插的多項式函數為:

n-1

階導將插點周圍的 16個點的數據帶入多項式,可計算出所有的系數。4、移動平均法在未知點X處插變量Z的值時,最常用的方法之一是在局部圍 (或稱窗口)計算個數據點的平均值。既:對于二維平面的移動平均法也可用相同的公式,但位置 Xi應被坐標矢量 Xi代替。窗口的大小對插的結果有決定性的影響。小窗口將增強近距離數據的影響;大窗口將增強遠距離數據的影響,減小近距離數據的影響。當觀測點的相互位置越近, 其數據的相似性越強;當觀測點的相互位置越遠, 其數據的相似性越低。因此,在應用移動平均法時,根據采樣點到插點的距離加權計算是很自然的。這就是加權移動平均法,即:其中,λi 是采樣點i對應的權值,常取的形式有:加權平均插的結果隨使用的函數及其參數、采樣點的分布、窗口的大小等的不同而變化。通常使用的采樣點數為6—8點。對于不規則分布的采樣點需要不斷地改變窗口的大小、形狀和方向,以獲取一定數量的采樣點。空間插方法比較(空間統計學)摘要:空間插可以分為幾何方法、統計方法、空間統計方法、函數方法、隨機 模擬方法、物理模型模擬方法和綜合方法。介紹了每一種方法的適用圍、算法和優缺點。指出沒有絕對最優的空間插方法,必須對數據進行空間探索分析,根據數據的特點,選擇最優方法;同時,應對插結果做嚴格的檢驗。開發通用空間插軟件、智能化插以及加強相關基礎研究將是空間插研究的重點。空間插根據已知地理空間的特性探索未知地理空間的特性是許多地理研究的第一步,也是地理學的 基本問題。常規方法無法對空間中所有點進行觀測,但是我們可以獲得一定數量的空間樣本,這些樣本反映了空間分布的全部或部分特征, 并可以據此預測未知地理空間的特征。 在這 一意義上,空間插可以被定義為根據已知的空間數據估計(預測)未知空間的數據值。其目標可以歸納為:①缺值估計:估計某一點缺失的觀測數據,以提高數據密度;②插等值線:以等值線的形式直觀地顯示數據的空間分布;③數據格網化:把無規則分布的空間數據插為規則分布的空間數據集,如規則矩形格網、三角網等。空間插對于觀測臺站十分稀少,而臺站分布又非常不合理的地區具有十分重要的實際意義 。這些地區的常規觀測常常不能滿足要求,在這種情況下,利用有限的常規觀測估計合理的空間分布,或盡可能地提高數據密度就成為迫切要求。在這些方面,缺值估計和數據格網化 將發揮重要的作用。(1) 缺值估計。各種科學考察中形式多樣的短期觀測是提高數據觀測密度的重要方式, 無形中起到了加密臺站的作用;而且由于這些考察常常到達人跡罕至的高海拔和極地等區域 ,有助于了解區域觀測變量的完整空間分布。但是,這些觀測序列往往很短,短則數十天,長不過幾年。如何利用周圍臺站的長序列觀測資料和短期觀測本身的信息,將觀測變量插 補到長序列是一個重要問題。數據格網化。規則格網能夠更好地反映連續分布的空間現象,并對他們的變化作出模擬。現代地球科學模型和氣候模型,如GCM(一般環流模型),都要求與GIS數據模型和遙感數據高度兼容的空間數據集。格網化的數據,尤其是規則矩形格網,已成為目前地學模型的主要數據形式。因此,對已知觀測臺站的觀測數據進行空間插,得到格網化數據是模型的第一步。空間插一般包括這樣幾個過程:①插方法(模型)的選擇;②空間數據的探索分析,包括對數據的均值、方差、協方差、獨立性和變異函數的估計等;③插方法評價;④重新選擇插方法,直到合理;⑤插。因此,通過比較而選擇一個合用的、適合于數據空間分布特點的插方法是空間插的關鍵。本文將空間插分類為幾何方法、統計方法、空間統計方法、函數方法、隨機模擬方法、物理模型模擬方法和綜合方法,通過比較研究,指出每一種方法的適用圍、算法和優缺點。空間插方法比較空間插可依據:①確定或隨機;②點與面;③全局或局部等標準分類。本文依據插方法的基本假設和數學本質,把空間插分類為以下幾種方法。2.1幾何方法是最簡單的空間插方法。 幾何方法基于“地理學第一定律”的基本假設, 即鄰近的區域比距離遠的區域更相似。幾何方法的優點是計算開銷少,具有普適性,不需要根據數據的特點對方法加以調整。當樣本數據的密度足夠大時,幾何方法一般能達到滿 意的精度。幾何方法的最大問題是,無法對誤差進行理論估計。最常用的幾何方法有泰森多邊形(最近距離法)和反距離加權方法。 泰森多邊形(最近距離法)泰森多邊形用于生成“領地”或控制區域。實際上,盡管泰森多邊形產生于氣候學領域,它卻特別適合于專題數據的插,因為它生成專題與專題之間明顯的邊界,不會有不同級別之間的中間現象。泰森多邊形的算法非常簡單,未采樣點的值等于與它距離最近的 采樣點的值。 反距離加權方法反距離加權法是最常用的空間插方法之一。 它認為與未采樣點距離最近的若干個 點對未采樣點值的貢獻最大,其貢獻與距離成反比。可用下式表示:式中,Z是估計值,Zi是第i(i=1,?,n)個樣本,Di是距離,p是距離的冪,它顯著影響插的結果,它的選擇標準是最小平均絕對誤差。Husar等的研究結果表明,冪越高,插結果越具有平滑的效果。2.2統計方法其基本假設是,一系列空間數據相互相關,預測值的趨勢和周期是與它相關的其它變量的函數。 統計方法的優點是計算開銷不大,有一定的理論基礎,能夠對誤差作出整體上的估計。 但是,其前提是一定要有好的采樣設計,如果采樣過程不能反映出表面變化的重要因素,如周期性和趨勢,則插一定不能取得好的效果。常用的統計方法有趨勢面方法和多元回歸方法。 趨勢面趨勢面根據有限的觀測數據擬合曲面,進行插。它適用于:①能以空間的視點詮釋趨勢和殘差;②觀測有限,插也基于有限的數據。 當趨勢和殘差分別能與區域和局部尺度的空間

過程相聯系時,趨勢面分析最有用。趨勢面方法可以被定義為:

y=Aθ+e(2)式中,y是n×1維矩陣,對應于

n個樣本;A是n個樣本的坐標矩陣;θ

是趨勢面參數矩陣。

A和θ依賴于趨勢面的次數。趨勢面的次數是它最重要的特征。是殘差,通常是一個獨立隨機變量。當殘差是隨機獨立時,統計檢驗有效;但實際上,趨勢面中的殘差常是自相關(特別是趨勢面的次數較低時),因此,檢驗是顯著有偏差的。殘差的空間自相關可以用隨機過程模型模擬。由于趨勢面的以上特性,它的目標有時并非最佳擬合,而是把數據分成區域趨勢組分和局部的殘差。 多元回歸在各種統計方法中,使用較多的是回歸分析,其特點是不需要分布的先驗知識。多元回歸在數學形式上與趨勢面很相似,但是,它們又有著顯著的不同。首先,在趨勢面分析中, A是坐標矩陣,而在回歸分析中,它可以是任意變量。其次,在趨勢面方法中,模 型的擬合嚴格地遵從自常數、一次、二次、立方等的順序,主要的問題是確定模型的次數, 因此,趨勢面分析有在的多重共線性問題;而在多元回歸中,盡管也存在多重共線性,但它并非在的,可以通過逐步回歸解決,因此,相對于趨勢面的選擇次數,多元回歸的核心 問題是選擇變量(主成分分析等方法有助于選擇變量)和區分模型。2.3空間統計(Geostatistics )方法空間統計又稱地質統計學,于 20世紀50年代初開始形成, 60年代在 法國統計學家 Matheron的大量理論研究工作基礎上逐漸趨于成熟。其基本假設是建立在空間相關的先驗模型之上的。假定空間隨機變量具有二階平穩性,或者是服從空間統計的本征假設( intrinsic hypothesis 。則它具有這樣的性質:距離較近的采樣點比距離遠的采樣點更相似,相似的程度、或空間協方差的大小,是通過點對的平均方差度量的。點對差異的方差大小只與采樣點間的距離有關, 而與它們的絕對位置無 關。空間統計插的最大優點是以空間統計學作為其堅實的理論基礎,可以克服插中誤差難以分析的問題, 能夠對誤差做出逐點的理論估計;它也不會產生回歸分析的邊界效應。缺點是復雜,計算量大,尤其是變異函數(

variogram

)是幾個標準變異函數模型的組合時,計算量很大;另一

個缺點是變異函數需要根據經驗人為選定。空間統計方法以Kriging

及其各種變種(

Cokriging

等)為代表。

插(1)Kriging

插的公式

Kriging

插由南非地質學家

Krige

發明,并因此而命名。Matheron

給出了

Kriging的一般公式。Kriging

插的公式為:式中,z(xi)為觀測值,它們分別位于區域xi位置;x0是一個未采樣點;λi為權,并且其和等于1。即(4) 選取λi,使 z⌒(x0)的估計無偏,并且使方差 σ[DD(-*2]⌒[][DD)] 2 e小于任意觀測值線形組合的方差。最小方差由下式給定:它由下式得到:(6) 式中,γ(xi

,xj)

是z在采樣點

xi和xj

之間的半方差(

semi-variance

),γ(xj,x0)

是z在采樣點

xi

和未知點

x0之間的半方差,這些量都從適宜的變異函數得到。φ

是極小化處理時的拉格朗日乘數。估計半方差是一個較為復雜的過程,這一過程稱為空間數據探索分析( ESDA)。(2) 空間數據探索分析( ESDA)對于Kriging插而言,空間數據探索分析的目標是建立半方差γ(h)和點對之間的空間距離h之間的關系,即變異函數。由于空間統計的本征假設可以表示為以下兩個公式:·任意兩個距離為h的兩點間的差值的數學期望為0:EZ(x)-Z(x+h)〕=0(7)·任意兩個距離為h的兩點間的差值的方差最小:Var〔Z(x)-Z(x+h)〕=E{ε'(x)-ε'(x+h)〕2}=2γ(h)(8)因此,由下式估計半方差γ(h):(9)這一關系即變異函數。它提供了插、優化采樣的有用信息。Kriging插的第一步是根據樣本找到適合的變異函數理論模型。最常用的變異函數模型有:nugget、球面、指數、高斯、阻尼正弦、冪和線形模型。其中,前幾種模型在一定的圍達到極大方差,而線形模型的方差增長沒有極限。以下是幾種基本變異函數的形式,這些變異函數的特性分別是:·Nugget模型缺乏空間相關。·球面模型空間相關隨距離的增長逐漸衰減,當距離>θ后,空間相關消失。·指數模型空間相關隨距離的增長以指數形式衰減,相關性消失于無窮遠。θ表示距離,在此距離上95%的變量的可變性趨于穩定。·高斯模型空間相關隨距離的增長而衰減,相關性消失于無窮遠。曲線起始一段的形狀是拋物線,表示變量的空間變化非常平滑。 ·阻尼正弦模型阻尼正弦模型適宜于周期性變化的空間變量, 但其變化強度隨距離的增長而衰減。θ 表示周期。·線性模型空間可變性隨距離的增長而呈線性地增長,不會在某一距離穩定下來。變異函數的形式是插質量的關鍵。需要注意的是,由于不同的區域有不同的空間模式,因而也就有不同的變異函數。而空間插都有一個隱含的假定,即空間是連續的,因此,在選擇變異函數模型之前,檢查數據以確定空間連續性是十分必要的。 插Cokriging (共協kriging )插的基本原理與 Kriging 相同,但它通過考慮一個以上變量而優化估計;插由于考慮了變量之間的關系而得到改善。例如,在估計溫度、降水等氣候變

量時,海拔高度是附加的重要變量。Cokriging

插包括以下過程:①確定多個觀測值之間

空間相關的特征;②借助于變異函數和交叉變異函數(

cross

variogram

),對相關建模;

③利用這些函數估計插值。除公式(7)

、(8)

外,Cokriging

引入一個新的假定,即兩個變量之間差值的方差最小。Var〔Z(x)-Zk(x)

〕=2γk(h)

(10)式中,Zk(x)

是與估計值

Z(x)

相關的第

k個變量。Cokriging

中引入交叉變異函數, 它是兩個不同變量之間的相關隨距離變化的函數。

它與簡單

變異函數不同,前者的形式是方差,因此總為正或零;而后者的形式為協方差,因此可以為 正、負或零。如果兩個變量向相反的方向變化,交叉變異函數為負;如果兩個變量的變化相獨立,交叉變異函數為零。交叉變異函數的形式為: (11)Cokriging 插的關鍵是估計交叉變異函數, 以分析變量自身以及變量之間的空間相關。 Cokriging 的其它過程都是與Kriging 一致的。2.4函數方法是使用函數逼近曲面的一種方法。函數方法在空間插領域大多用于一些特殊場合,如利用 高密度的高程數據產生等高線、為提高格網數據的空間分辨率而插數據等。對于利用有限的觀測數據進行缺值預測和插格網,函數方法多不適合,因為它難以滿足插的精度,也 難以估計誤差。函數方法的特點是不需要對空間結構的預先估計、不需要做統計假設。缺點是難以對誤差進行估計,點稀時效果不好。常用的函數方法有:傅里葉級數、樣條函數、雙線性插、立方卷積法等。 傅里葉級數對于周期性的數據序列,如海浪,可以利用傅里葉級數將它們分解為正弦波和余弦波。 樣條函數方法樣條函數是使用函數逼近曲面的一種方法。樣條函數易操作,計算量不大,它與空間統計方 法相比具有以下特點,不需要對空間方差的結構做預先估計;不需要做統計假設,而這些假設往往是難以估計和驗證的;同時,當表面很平滑時,也不犧牲精度。樣條函數適合于非常平滑的表面,一般要求有連續的一階和二階導數;它適合于根據很密的 點插等值線,特別是從不規則三角網( TIN)插等值線。樣條函數的缺點是難以對誤差進行估計,點稀時效果不好。樣條函數的種類很多,最常用的有 B樣條、力樣條和薄盤樣條等。 雙線性插雙線性插和立方卷積法都主要用于網格數據的插(重采樣),一般很少用于根據離散數據插空間分布。它使用與待估計網格距離最近的4個網格值,線性插獲得新的網格值。雙線性插方法的優點是數據重采樣后的結果較為平滑,沒有階躍效應,同時具有較高的精度。缺點是網格被平均化,具有低頻濾波的效果;邊緣被平滑,有些極值丟失了。2.4.4立方卷積法是最常使用的網格數據插方法之一。它使用與待估計網格距離最近的16個網格值,根據立方卷積公式計算輸出。立方卷積公式有幾個不同版本,有的產生低通濾波的效果,有的產生高通濾波的效果,較好的方法應該在高頻信息和低頻信息的取舍間取得平衡。立方卷積法的優點是采樣結果的統計信息(均值和方差)與原數據的相似程度比其他采樣方法高。缺點是數據值被改變,因此不能用于類型數據(專題圖)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論