總復習空間分析區域模型_第1頁
總復習空間分析區域模型_第2頁
總復習空間分析區域模型_第3頁
總復習空間分析區域模型_第4頁
總復習空間分析區域模型_第5頁
已閱讀5頁,還剩94頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

空間分析與區域模型

總復習名詞解釋(20±)簡答題(30±)做圖題(30±)論述題(20±)“空間分析”總復習緒論空間基礎&量測探索性空間數據分析空間點數據分析空間格數據分析空間插值與地統計空間回歸地圖代數一緒論0.空間分析概念空間數據與屬性數據的類型空間分析的框架空間統計陷阱0.空間分析概念空間分析(SpatialAnalysis):沒有統一定義。空間分析是對數據的空間信息、屬性信息或二者共同信息的統計描述或說明。

--Goodchild(1987)空間分析是對于地理空間現象的定量研究,其常規能力是操縱空間數據成為不同的形式,并且提取潛在信息。

--Openshaw(1997)&BaileyandGartell(1995)空間分析是結果隨著分析對象位置變化而改變的一系列方法。

--Longleyetal.(2001,p.278)空間分析是基于地理對象的位置和形態特征的空間數據分析技術,其目的在于提取和傳輸空間信息。—郭仁忠1.空間/屬性數據的類型1.1空間數據的類型空間點數據(PointData)空間線數據(LineData

Network)空間面數據(ArealData)地統計數據(GeostatisticalData)來源:

FreeSAT:Free

SpatialAnalysisTools1.2屬性數據的類型屬性(Attribute):與空間數據庫中一個獨立對象(記錄)關聯的數據項。屬性已成為描述一個位置任何可記錄特征或性質的術語。名義(Nominal)量次序(Ordinal)量間隔(Interval)量比率(Ratio)量StevensS.S.OntheTheoryofScalesofMeasurement[J].Science,1946,103(2684):677-680.

可視化探索性分析模型構建屬性數據空間數據數據庫圖示模式描述假設檢驗GIS

數據庫管理系統統計軟件2.空間分析的框架基于Anselin和Getis(1992)提出的一般框架,GIS環境下空間分析模塊的關系見右圖。參照GIS輸入、存儲、分析和輸出等功能,GIS環境下空間分析可進一步細分為選擇、操作、探索和確認4種。地理學第一定律:everythingisrelatedtoeverythingelse,butnearthingsaremorerelatedthandistantthings(Tobler,1970).3.1空間自相關(Spatialautocorrelation)GenerallytruewithdiscretedataDefinitelytruewithcontinuousdata空間自相關破壞了經典統計當中的樣本獨立性假設。3.空間統計分析陷阱(基本問題)3.2可變面元問題隨面積單元定義的不同而變化的問題,就是可變面元問題(ModifiableArealUnitProblem,MAUP)。古老但依然沒有很好解決。尺度效應(Scaleeffect):當空間數據經聚合而改變其單元面積的大小、形狀和方向時,分析結果也隨之變化的現象。區劃效應(Zoningeffect):給定尺度下不同的單元組合方式導致分析結果產生變化的現象。MAUP的類型:x=

均值,n=9x=9.33;n=3x=(10+5+5+15+10+10+5+15+5)/n=8.88;

x=8.47;

n=3可變面元問題:尺度效應O’Sullivan&Unwin(2003),p.31可變面元問題:區劃效應左右平均上下平均原始數據radiusradius3.3邊界效應邊界效應(edgeeffect)指分析中由于實體向一個或多個邊界近似時出現的誤差。二、空間基礎&量算地理空間數據的特征地理空間數據特征時空特征海量性多維結構不確定性多尺度性在進行空間分析時,一般主要從以下幾個方面入手:空間位置空間分布與格局資源配置與規劃空間關系與影響空間動態與過程2.地理空間問題三、探索性空間數據分析概述莖葉圖箱線圖&五數總結核密度估計(KernelDensityEstimation,KDE)三種類型的數據分析ClassicalProblem

Data

Model

Analysis

ConclusionsEDAProblem

Data

Analysis

Model

ConclusionsBayesianProblem

Data

Model

PriorDistribution

Analysis

Conclusions來源:NIST/SEMATECHe-HandbookofStatisticalMethods1.概述ExploratoryDataAnalysis(EDA)“Exploratorydataanalysisisanattitude,NOTabundleoftechniques”(Tukey1977).“Letdataspeakforthemselves”

JohnWilderTukey(1915.6.16–2000.6.26)TukeywasanAmericanstatistician,borninNewBedford,Massachusetts,andobtainedaB.A.in1936andM.Sc.in1937,inchemistry,fromBrownUniversity,beforemovingtoPrincetonUniversitywherehereceivedaPh.D.inmathematics.2.莖葉圖(Stem-and-Leafplot)Tukey在1977年提出。莖葉圖:單變量、小數據集數據分布的圖示方法。

示例:

5549375746406435736261437248546945784659405856524942625346813|574|002356668995|234567896|122497|2388|1葉莖莖葉圖制作方法選擇適當的數字為莖,通常是起首數字,莖之間的間距相等;每列標出所有可能葉的數字,葉子按數值大小依次排列;由第一行數據,在對應的莖之列,順序記錄莖后的一位數字為葉,直到最后一行數據,需排列整齊(葉之間的間隔相等)。3.箱線圖&五數總結 箱線圖(boxplot)也稱箱須圖(box-whiskerplot)需要五個數,稱為五數總結:最小值下四分位數:Q1中位數(median)上四分位數:Q3最大值Theinter-quartilerange:IQR=Q3-Q1BoxplotVariablename:PercentstudentsNumberofobservations)Hinge(1.5timesIQR)Hinge(1.5timesIQR)Median75thpercentile25thpercentileIQROutliers4.核密度估計(KernelDensityEstimation,KDE)核密度估計(KDE)

是估計一個隨機變量概率密度函數(pdf)的非參數方法。Ifx1,x2,...,xn~?isanindependentandidentically-distributed()sampleofarandomvariable,thenthekerneldensityapproximationofitsprobabilitydensityfunctionis應用不同帶寬生成的100個服從正態分布隨機數的核密度估計。四、空間點模式分析概述空間點模式分析方法點模式分析由植物學家和生態學家在1930s應用。但是,隨后許多不同領域也開始應用點模式分析,如考古學、流行病學、天文學和犯罪學。一般來說,點模式分析可以用來描述任何類型的事件數據(incidentdata)。因為每一事件都可以抽象化為空間上的一個位置點。1.概述隨機分布:任何一點在任何一個位置發生的概率相同,某點的存在不影響其它點的分布。又稱泊松分布(Poissondistribution)。均勻分布:個體間保持一定的距離,每一個點盡量地遠離其周圍的鄰近點。在單位(樣方)中個體出現與不出現的概率完全或幾乎相等。聚集分布:許多點集中在一個或少數幾個區域,大面積的區域沒有或僅有少量點。總體中一個或多個點的存在影響其它點在同一取樣單位中的出現概率。空間點模式的三種基本分布隨機均勻聚集點模式的三種基本空間分布2.1

基于密度的方法:測度一階效應2.空間點模式分析方法2.2基于距離的方法:測度二階效應

最近鄰距離

(NearestNeighborDistance)

最近鄰距離的統計檢驗

G函數(GFunction)

F函數(FFunction)

K

函數(KFunction)

樣方分析

(QuadratAnalysis)

樣方分析的統計檢驗

核密度估計

(KernelDensityEstimation)利用所有點:樣方的形狀、大小、方向對結果有影響如果樣方太大/小,則……隨機抽樣方法:有增加樣本量的作用可以描述一個沒有完全數據的空間點過程2.1基于密度的方法

①樣方分析-兩種方式樣方分析步驟a).研究區域中打上網格,建議方格大小為:

QuadratSize=2A/n

A:研究區域面積,n:點的個數。b).確定每個網格中點的個數。c).計算均值(Mean)、方差(Var)和方差均值比:VMR=Var/Mean

對于均勻分布,方差=0,因此VMR的期望值=0;對于隨機分布,方差=均值,因此VMR的期望值=1;對于聚集分布,方差大于均值。因此VMR的期望值>1。

注:N=樣方數量=10隨機均勻聚集隨機聚集x均勻xx樣方分析的缺點結果依賴于樣方的大小和方向。總的模式是分散的,但局部有聚集現象。樣方分析主要依據點密度,而不是點之間的相互關系,所以不能區別圖示的兩種情況:不能探測區域內的變化。密度:密度依賴于研究區域的大小。a:a,4a,16a,64an:2,2,5,10

:2.0,0.5,0.31,0.15基本思想:在研究區域內的任一點都有一個密度,而不僅僅是在事件點上。該密度通過計數一定區域內的事件點數量,或核(Kernel)進行估計。核以估計點為中心,一定距離為半徑。其中:C(p,r)

是以待估點p為圓心、r為半徑的圓。帶寬:r如果r太大/小,則……r固定?r變化?2.1基于密度的方法

①核密度估計EventssiStudyregion

locationsBandwidthrQuelle:AdaptiertvonGatrelletal.(1996)QuarticKernelFunktion0,00-0,09>0,09-0,26>0,26-0,50>0,50-1,12Kernel-DesityEstimationA0,00-0,05>0,05-0,16>0,16-0,31>0,31-0,62Kernel-DesityEstimationB0,00-0,04>0,04-0,11>0,11-0,22>0,22-0,35Kernel-DesityEstimationCr=500mr=1000mr=3000m核密度估計(KDE)用途:可視化點模式進行熱點(hotspot)探測;離散連續。如,疾病與污染。SpatialsmoothingClusterdetection計算每個點到其最近鄰點之間的距離,然后計算所有點最近鄰距離的平均值。對每一個點,根據其歐幾里德距離最小確定其最近鄰點。平均最近鄰距離的大小,反映點在空間的分布特征。最近鄰距離越小,說明點在空間分布越密集,反之,越離散。2.2基于距離的方法:測度二階效應

最近鄰距離方法

2.2基于距離的方法:測度二階效應

最近鄰距離方法:G函數(Event-Event)

歐幾里德距離:最近鄰距離的最小值是9.00,即點4&8和點8&4之間的距離,有兩個,2/12=0.167,所以G(d)在距離等于9時的值為0.167。下一個最近鄰距離的最小值是15.64,即點2的最近鄰距離,有一個,加上前面的兩個最近鄰距離(即9)共有3個,3/12=0.25,所以G(d)在距離等于15.64時的值為0.25。依次累積下去,得到G函數。如果點是聚集的,G(d)在短距離內急速上升。如果點趨于均勻分布,G(d)在一定距離內緩慢上升,在該距離內包含大多數點,之后G(d)快速上升。2.2基于距離的方法:測度二階效應

最近鄰距離方法:F函數(Point-Event)

與G函數僅僅基于事件間最近鄰距離的頻率分布不同,F函數基于區域內任意位置點與事件間最近鄰距離的頻率分布。F函數計算的三個步驟:隨機選擇m個位置{p1,p2,…,pm};計算dmin(pi,s):pi到點模式S中的任一事件的最小距離;計算:如果事件是聚集的,F(d)先緩慢上升,而在遠距離處急速上升,因為研究區的大部分地方沒有事件點。如果點趨于均勻分布,F(d)先快速上升,而在遠距離處上升緩慢。G

函數與F

函數的比較與G函數、F函數只使用事件或點的最近鄰距離不同,K函數基于事件間的所有距離。因此,K函數不僅能探測空間模式,而且可以給出空間模式和尺度的關系。2.2基于距離的方法:測度二階效應

K函數

定義:K

函數經驗K函數估計的四個步驟:對于每一個事件si

,以si為圓心、d

為半徑畫圓C(si,d)計算圓內其他事件點的數量3)計算同一半徑下所有事件的均值4)均值除以研究區內事件密度得:聚集均勻K

函數五、空間格數據分析空間權重矩陣連接數統計量(測度名義量)全局空間自相關指標(測度間隔量&比率量)局部空間自相關指標1.空間權重矩陣為了測度一組地理對象的空間自相關性,必須討論識別多邊形之間關系的方法。空間自相關衡量的是鄰接區域內各單元屬性值的相似程度,但首先必須定量地界定“鄰接區域”的概念。即,在計算這些統計量之前,必須定量地界定區域單元之間的鄰接關系,即,空間權重矩陣(SpatialWeightsMatrix)。鄰居的類型:兩種規則鄰接(公共邊):二值或標準距離(距離帶,K-近鄰)

空間權重的確定鄰居的設定:“車、象、后”鄰接方法Collins,K.,BabyakC.,MoloneyJ.TreatmentofSpatialAutocorrelationinGeocodedCrimeData.2.連接數統計量 連接數統計量(JoinCountStatistics):一般用于名義量(nominal)數據,尤其是二值變量數據。

由Cliff&Ord(1973)在《SpatialAutocorrelation》中首先提出。

如,生/死,污染/非污染,耕地/非耕地。可以把“耕地”作為“

1”

或白色格數據,而把“非耕地”作為“

0”

或黑色格數據。Moran’sI

指數及其統計檢驗Geary’s

C

指數Getis’sG

指數三個指標計算方法相似一般用于間隔量(interval)和比率量(ratio)數據最常用的是Moran’sI3.全局空間自相關指標Moran’sI

(covariance)Geary’sC

(variance)GorG*(movingaverages)局部Moran’sIi

指數局部Geary’s

Ci

指數局部Getis’sGi

指數4.局部空間自相關指標局部空間自相關指標:LocalIndicatorsofSpatialAssociation(LISA)ProposedinGetis&Ord(1992)andAnselin(1995).全局自相關:不能給出局部變化。LISA:全局自相關的分解,描述一個面元在多大程度上與其鄰居相似,或不同。六、空間插值與地統計倒距離權重(IDW)插值、趨勢面分析地統計學克里金(Kriging)插值

倒距離加權(IDW)插值方法假定每個輸入點都有著局部影響,這種影響隨著距離增加而減弱。步驟:計算未知點到所有點的距離;計算每個點的權重:

權重是距離倒數的函數。計算結果:

1.倒距離權重(IDW)插值當一個變量的取值與其空間位置有關時,就稱為區域化變量(regionalizedvariable)。區域化變量具有兩個最顯著,也是最重要的特征:隨機性和結構性。地統計學是以區域化變量理論為基礎,以變異函數為主要工具,研究那些在空間分布上既有隨機性又有結構性,或空間相關和依賴性現象的學科。克里金方法(Kriging)就是建立在變異函數理論和結構分析基礎之上的。2.地統計學區域化變量的組成部分

數據點結構性可以用均值和常數趨勢表示空間相關數據通常呈現正空間相關性

隨機性測量誤差,其他誤差

經驗半變異函數(semi-variogram)—區域化變量的基本研究工具

—半變異函數就是區域化變量增量平方的數學期望之半區域化變量在i、i+h點的值步長為h的樣品對數步長(h):在一定方向上,距離為h的矢量理論模型擬合

經驗半變異函數必須擬合一個數學函數或模型,以用于估計任何給定距離的半方差。理論變異函數圖模型偏基臺值:C(partialsill)塊金值:C0(nugget)變程:a(range)h基臺值(sill)notrelatedanymore變程范圍內才有結構性變化(有規律的變化)反映隨機性大小:主要來源于區域化變量Z(x)在小于抽樣尺度h時所具有的內部變異;另外還有抽樣分析誤差。變異函數是一個單調不減函數。當h超過某一個范圍,例如變程,變異函數不再增大,而是趨于一個極限值,即為基臺值。實際上等于區域化變量的先驗方差。即,即基臺值與塊金值之差,表示數據中存在空間相關性引起的方差變化范圍。克里金方法的基本形式確定趨勢項空間相關隨機誤差項3.理解不同的克里金模型對誤差項的假設:期望值為0,并且和之間的自相關不取決于s點的位置,而取決于位移量h。為確保自相關方差有解,必須允許某兩點間的自相關可以相等。如,下面有箭頭相連的兩對位置點假設具有相同的自相關性。趨勢值可以被簡單地賦予一個常量,即,在任何位置處。如果未知,就是普通克里金模型。如果在任何時候趨勢已知,無論趨勢是否是常量,都形成簡單克里金模型。趨勢也可以表示為:若趨勢中的系數未知,就是泛克里金模型。可以對Z(s)進行一下變換。例如,可以把它換為一個指示變量,若Z(s)低于一定的閾值(如空氣中的溴氧濃度值0.12ppm),則變為0;若Z(s)高于一定的閾值,則變為1。然后對高于閾值的情況進行預測。便形成了指示克里金模型。現在看一下方程的左邊部分。普通克里金(OrdinaryKriging,OK)簡單克里金(SimpleKriging,SK)泛克里金(UniversalKriging,UK)指示克里金(IndicatorKriging,IK)協克里金(cokriging)AssumesthatandareunknownconstantsThevariableofinterestisZ1,andbothautocorrelationforZ1andcross-correlationsbetweenZ2areused.地形插值比較Voronoi圖TINIDWKriging樣條規則樣條空間回歸模型應用的前提:ESDAandOLSdiagnosticstellyouthatthereisspatialautocorrelation.1.概述七、空間回歸式中,y是因變量,為n×1向量;X表示解釋變量的n×k階矩陣;m是隨空間變化的誤差項;e是白噪聲。W1,W2是空間權重矩陣。空間自回歸模型的一般形式(1)2.空間自回歸模型的形式如果對式(1)施加某些限定,可導出多種不同形式的空間自回歸模型。設X=0,W2=0,則由式(1)推出一階空間自回歸模型(SAR):意義:y的變化是鄰接空間單元的因變量的線性組合,解釋變量X對于y的變化沒有貢獻。包含空間效應的方法:通過因變量自身設W2=0,則由式(1)推出回歸-空間自回歸組合模型(MAR):意義:y的變化不僅和鄰接空間單元的因變量有關,而且解釋變量X對y的變化也有貢獻。y是因變量,經過空間加權(W1);r

為系數。設W1=0,則由式(1)推出空間誤差模型(Spatialerrormodel):m

是空間加權的(W2)誤差項;

l

系數;e

不相關的、同方差的誤差向量。

包含空間效應的方法:通過誤差項。空間Durbin模型(SDM):將因變量的空間延遲(spatiallag)和自變量的空間延遲項加在模型中便得到空間Durbin模型。7八、地圖代數&GIS空間建模1.柵格數據結構為空間分析提供了最強的建模環境及空間運算,方法很多。類型柵格單元疊合分析方法數學運算算術運算符:+、-、*、/……邏輯運算符:and、or、xor、not……關系運算符:=、>、<>、≥、≤……函數運算指數、對數:exp、log……算術函數:abs、isnull……三角函數:sin、cos、tan、arcsin、arccos……冪函數:pow、sqrt……統計運算統計函數:majority(眾數)、maximum、mean、median、minimum、minority(少數)

、range、standarddeviation、sum、variety……2.地圖代數中的函數與類型GIS空間分析的能力體現在回答“Where,What,When”等各類空間問題,即能夠描述地理要素的空間分布特征、空間關系、動態過程等,需要定量刻畫分布是否聚集、距離對于相互之間的影響、分布的高低趨勢等。函數是建立在基本運算符基礎上的對柵格數據的高級操作,主要包括:局部函數、焦點函數、類區函數、塊函數等。①數學函數:三角/指數/對數/冪函數等②選擇函數:選擇(select)、條件(con)等

highforest=if(landclass96==5&&elevation>120.,elevation,0)Mapalgebra:ifconditionsExample:findallforestedareaswithelevation>120m1.局部函數函數運算:柵格數據以某種函數關系作為分析依據進行逐網格運算,從而得到新的柵格數據。

③重分類函數

Reclassification

:transformationrulesusedtoconvertbetweenrastervaluetypesandclassesZipcodestocities:2751127513=1Cary

0-45=4East45-135=1North135-225=2West225-315=3South315-360=4EastFPaspecttoINTcardinaldirections④統計函數:局部函數中的統計函數一般有以下幾種類型:(1)Mean;(2)Maximum;(3)Minimum;(4)Median;(5)Sum;(6)Range;(7)Majority;(8)Minority;(9)Variety。鄰域分析也稱窗口分析,主要應用于柵格數據模型。鄰域函數計算出的柵格數據每個象元位置上的值都是輸入數據中相應位置下指定的一些鄰域單元的函數.計算出的鄰域統計值是一個移動窗口,它可以對數據進行掃描。窗口分析:對于柵格數據系統中的一個、多個柵格點或全部數據,開辟一個有固定分析半徑的分析窗口,并在該窗口內進行諸如極值、均值等一系列統計計算,或與其它層面的信息進行必要的復合分析,從而實現柵格數據水平方向上的擴展分析。2.鄰域函數分析窗口的類型按窗口的形狀可分為:矩形窗口:以目標柵格為中心,分別向周圍八個方向擴展一層或多層柵格,從而形成矩形分析區域,矩形區域的大小,比如3×3、5×5、7×7的窗口。圓型窗口:以目標柵格為中心,向周圍作一等距離搜索區,構成一圓型分析窗口。環型窗口:以目標柵格為中心,按指定的內、外半徑構成環型分析窗口。扇型窗口:以目標柵格為起點,按指定的起始、終止角度構成扇型分析窗口。3×3窗口5×5窗口7×7窗口圓形窗口 環形窗口 扇形窗口類區函數(zonalfunction)非常類似于鄰域函數,特別是二者都基于鄰域的思想,但類區函數中的鄰域是定義在地理空間的類型區上的。類區是柵格中所有具有相同值的單元格而不考慮它們在空間上是否相鄰,柵格和圖像數據集都能用作類型的數據集。3.類區函數“區域模型”總復習區域系統模型的理論基礎區域系統模型的層次和體系區域可持續發展評價模型區域投入產出結構模型一

區域系統模型的理論基礎簡述區域系統的特點。區域系統屬于開放的復雜巨系統。與其它普通系統相比具有如下特點:綜合性層次性非線性動態性隨機性和模糊性等突出。何謂區域系統模型?有哪些特點和功能?區域系統模型(RegionalSystemModels,RSM)實際就是現代科學的核心方法與區域開發研究這一重要的綜合性領域有機結合的產物。一般認為,區域系統模型是區域系統的狀態、結構及其屬性的簡化表示。功能:簡化系統的結構,描述和認識系統的構造,把所關心的問題抽取出來,如各類網絡模型、分類模型等;匯集數據,綜合系統的大量具體事實,發現內在規律;模擬系統過程,預測系統未來變化,如統計預測模型等;擔負邏輯職能,解釋變化結果的必然性,如因果關系模型;證假說和理論,形成新的理論,如空間相互作用模型;優化系統結構,設計新的方案,如各類優化模型。特點:綜合信息的多樣性與統一性總體內容的相似性與抽象性表達形式的簡潔性和精密性規模結構的靈活性與可控性二區域系統模型的層次和體系論述區域系統模型體系。區域系統模型體系是區

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論