第五講 元數據與空間數據質量_第1頁
第五講 元數據與空間數據質量_第2頁
第五講 元數據與空間數據質量_第3頁
第五講 元數據與空間數據質量_第4頁
第五講 元數據與空間數據質量_第5頁
已閱讀5頁,還剩53頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Page

1第5講元數據與空間數據質量Page

2元數據與空間數據質量

學習目標:1、理解元數據的概念,了解空間數據元數據所用到的概念;2、了解空間數據元數據的分類和標準;3、了解空間數據元數據的獲取方法;4、弄清為什么在地理信息系統中使用元數據5、說明空間數據元數據的應用6、理解空間數據質量及其相關概念7、了解空間數據質量評價的標準,并分析造成數據質量問題的來源8、說明控制空間數據質量的措施Page

3第一節空間數據的元數據一、元數據概念與分類二、空間數據元數據所涉及的概念三、空間數據元數據的標準四、空間數據元數據的獲取與管理五、空間數據元數據的應用Page

4一、元數據概念與分類元數據(Metadata)“meta”是一希臘語詞根,意思是“改變”,“Metadata”一詞的原意是關于數據變化的描述。一般都認為元數據就是“關于數據的數據”,即關于數據的描述性數據信息。在地理空間數據中,元數據說明數據內容、質量、狀況和其他有關特征的背景信息。

(聯想:紙質地圖的元數據)隨著計算機技術和GIS技術發展,特別是網絡通信技術的發展,空間數據共享日益普遍。管理和訪問大型數據集的復雜性正成為數據生產者和用戶面臨的突出問題。在這種情況下,空間數據的內容、質量、狀況等元數據信息變得更加重要。地理信息元數據標準和操作工具已經成為空間空間數據基礎設施的一個重要組成部分。Page

5元數據產生背景一、元數據概念與分類1、元數據概念元數據:是關于數據變化的描述,是描述數據的數據,它應盡可能多地反映數據集自身的特征規律,以便于用戶對數據的準確、高效與充分的開發與利用。關于元數據認識的共同點是:元數據的目的是促進數據集的高效利用,并為計算機輔助軟件工程服務。Page

6Page

72、元數據的內容元數據的內容包括:

(1)對數據的描述,對數據集中各數據項,數據來源、數據所有者、數據序代(數據生產歷史)等的說明;

(2)對數據質量的描述,如數據精度、數據的邏輯一致性、數據完整性、分辨率、源數據的比例尺等;(3)對數據處理的說明,如量綱的轉換等;

(4)對數據轉換方法的描述;

(5)對數據庫的更新、集成方法等的說明。Page

83、元數據的主要作用(1)幫助數據生產單位有效地管理和維護空間數據,建立數據文檔;(2)提供有關數據生產單位數據存儲、數據分類、數據內容、數據質量、數據交換網絡及數據銷售等方面的信息,便于用戶查詢檢索地理空間數據;(3)提供通過網絡對數據進行查詢檢索的方法或途徑,以及與數據交換和傳輸有關的輔助信息;(4)幫助用戶了解數據,以便就數據是否能滿足其需求作出正確的判斷;(5)提供有關信息,以便用戶處理和轉換有用的數據。Page

94、元數據的表達形式

元數據的表達形式:元數據也是一種數據,在形式上與其他數據沒有區別,它可以以數據存在的任何一種形式存在。主要的形式是與元數據內容標準相一致的數字形式,數字形式的元數據可以用多種方法建立、存儲和使用。(1)最基本的方法是文本文件。(2)元數據的另一種形式是用超文本鏈接標示語言(HTML)編寫的超文本文件,用戶可用瀏覽器查閱元數據。(3)用通用標示語言(SGML)建立元數據。SGML提供一種有效的方法連接元數據便于在空間數據交換網絡上查詢。Page

105、元數據的分類

分類原則不同,元數據的分類體系和內容將會有很大的差異,主要分類方法有:根據元數據的內容分類根據元數據描述對象分類根據數據在系統中的作用分類根據元數據的作用分類

Page

11(1)根據元數據的內容分類科研型元數據:主要目標是幫助用戶獲取各種來源的數據及其相關信息,主要任務是幫助科研工作者高效獲取所需數據。評估型元數據:主要服務于數據利用的評價。模型元數據:用于描述數據模型的元數據,與描述數據的元數據在結構上大致相同。Page

12(2)根據元數據描述對象分類數據層元數據:指描述數據集中每個數據的元數據。屬性元數據:關于屬性數據的元數據。實體元數據:是描述整個數據集的元數據。Page

13(3)根據數據在系統中的作用分類系統級別元數據:指用于實現文件系統特征或管理文件系統中數據的信息。應用層元數據:指有助于用戶查找、評估、訪問和管理數據等與數據用戶有關的信息。Page

14(4)根據元數據的作用分類說明元數據:是為用戶使用數據服務的元數據。多為描述性信息,側重數據庫的說明。控制元數據:是用于計算機操作流程控制的元數據,這類元數據有一定的關鍵詞和特定的句法來實現。Page

15二、空間數據元數據所涉及的概念空間數據:用于確定具有自然特征或者人工建筑特征的地理實體的地理位置、屬性及其便捷的信息;類型:在元數據標準中,數據類型指該數據能接收的值的類型;對象:

對地理實體的部分或整體的數字表達;實體類型:對于具有相似地理特征的地理實體集合的定義和描述;點:

用于位置確定的零維地理對象;結點:

拓撲連接兩個或多個鏈或環的一維對象;標識點:

顯示地圖或圖表時,用于特征標識的參考點;Page

16線:

一維對象的一般術語;線段:

兩個點之間的直線段;弧:

由數學表達式確定的點集組成的弧狀曲線;鏈:

兩個結點之間的拓撲關聯;鏈環:

非相切線段或由結點區分的弧段構成的有方向無分支序列;環:

封閉狀不相切鏈環或弧段序列;多邊形:

在二維平面中由封閉弧段包圍的區域;二、空間數據元數據所涉及的概念Page

17外多邊形:

數據覆蓋區域內最外側的多邊形,其面積是其他所有多邊形的面積之和;內部區域:

不包括其邊界的區域;格網:

組成一規則或近似規則的棋盤狀鑲嵌表面的格網集合,或者組成一規則或近似規則的棋盤狀鑲嵌表面的點集合;格網單元:

表示格網最小可分要素的二維對象;矢量:

有方向線的組合;柵格:

同一格網或數字影像的一個或多個疊加層;二、空間數據元數據所涉及的概念Page

18像元:

二維圖形要素,它是數字影像最小要素;柵格對象:

一個或多個影像或格網,每一個影像或格網表示一個數據層,各層之間相應的格網單元或像元一致且相互套準;圖形:

與預定義的限制規則一致的零維、一維和二維有拓撲相關的對象集;數據層:

集成到一起的面域分布空間數據集,它用于表示一個主體中的實體,或者有一公共屬性或屬性值的空間對象的聯合;二、空間數據元數據所涉及的概念Page

19層:

在有序系統中數據層、級別或梯度序列;緯度:

在中央經線上度量,以角度單位度量離開赤道的距離;經度:

經線面到格林威治中央經線面的角度距離;經圈:

穿過地球兩極的地球的大圓圈;坐標:

在笛卡爾坐標系中沿平行X軸和Y軸測量的坐標值;投影:

將地球球面坐標中的空間特征(集)轉化到平面坐標體系時使用的數學轉換方法;二、空間數據元數據所涉及的概念Page

20投影參數:

對數據集進行投影操作時用于控制投影誤差、變形實際分布的參考特征;地圖:空間現象的空間表征,通常以平面圖形表示;現象:

事實、發生的事件、狀態等;分辨率:由涉及到或使用的測量工具或分析方法能區分開的兩個獨立測量或計算的值的最小差值;質量:

數據符合一定使用要求的基本或獨特的性質;二、空間數據元數據所涉及的概念Page

21詳述:

用一對數或三個數分別直接描述水平位置和三維位置的方法;介質:

用于記錄、存儲或傳遞數據的物理設備。二、空間數據元數據所涉及的概念Page

22三、空間數據元數據的標準

空間數據元數據標準的建立是空間數據標準化的前提和保證,只有建立起規范的空間數據元數據才能有效利用空間數據。目前,空間數據元數據已形成了一些區域性或部門性的標準。下表為有關空間數據元數據的幾個現有主要標準。Page

23三、空間數據元數據的標準元數據標準名稱建立標準的組織CSDGM地球空間數據元數據內容標準FGDC,美國聯邦空間數據委員會GDDD數據集描述方法MEGRIN,歐洲地圖事務組織CGSB空間數據集描述CSC,加拿大標準委員會CEN地學信息—數據描述—元數據CEN/TC287DIF目錄交換格式NASAISO地理信息ISO/TC211Page

24三、空間數據元數據的標準

美國聯邦空間數據委員會(FGDC)的空間數據元數據內容標準的影響較大,該標準用于確定地學空間數據庫的元數據內容。該標準于1992年7月開始起草,1994年7月8日,FGDC正式確認該標準。該標準將地學領域中應用的空間數據元數據分為7個部分,它們是:數據標識信息、數據質量信息、空間數據組織信息、空間參照系統信息、地理實體及屬性信息、數據傳播及共享信息和元數據參考信息。元數據標準化這一問題逐漸成為共享地學信息的熱點。元數據標準依賴于信息共享標準的理論。Page

25三、空間數據元數據的標準Page

26四、空間數據元數據的獲取與管理

空間數據的地理特征要求對數據的各種操作,從數據獲取、數據處理、數據存儲、數據分析、數據更新等方面應有一套面向地理對象的方法,相應的空間數據元數據的內容和相關的操作也就具有了不同于其它類數據元數據的特點。空間數據元數據的獲取空間數據元數據的管理Page

271、空間數據元數據的獲取

獲取分為三個階段:數據收集前、數據收集中和數據收集后。對于模型元數據,這三個階段分別是模型形成前、模型形成中和模型形成后。第一階段的元數據是根據要建設的數據庫的內容而設計的元數據,內容包括:(1)普通元數據;(2)專指性元數據;

Page

281、空間數據元數據的獲取第二階段的元數據隨數據的形式同步產生。第三階段的元數據是在上述數據收集到以后,根據需要產生的。獲取方法:(1)鍵盤輸入法:一般工作量大且易出錯,如有可能應盡量避免。(2)關聯表法:是通過公共項(字段)從已存在的元數據或數據中獲取有關的元數據。(3)測量法:易使用且出錯少。(4)計算法:由其他元數據或數據計算得到的元數據。(5)推理法:根據數據的特征獲取元數據。在元數據獲取的不同階段,使用的方法也有差異。在第一階段主要是鍵盤輸入法和關聯表法;第二階段主要是采樣測量法;第三階段主要是計算法和推理法。Page

292、空間數據元數據的管理

空間數據元數據的理論和方法涉及到數據庫和元數據兩方面。由于元數據的內容、形式的差異,元數據的管理與數據涉及的領域有關,它通過建立不同數據領域基礎上的元數據信息系統實現的。在元數據管理系統中,物理層存放數據與元數據,該層由一些軟件通過一定的邏輯關系與邏輯層關聯起來。在概念層中用描述語言及模型定義了許多概念,如實體名稱、允許屬性值的類型、缺省值、允許輸入與輸出的內容、元數據的變化、操作模型等。通過這些概念及其限制特征,經過與邏輯層關聯可獲取、更新物理層的元數據及數據。Page

30五、空間數據元數據的應用使用元數據的原因空間數據元數據的應用Page

311、使用元數據的原因完整性:元數據可以幫助實現類與類之間的相互印證。可擴展性:動態變化元數據信息可以有意地延伸一種計算機語言或者數據庫特征的語義。特殊化:元數據可以表達繼承機制的信息。安全性:類的信息表示為元數據,在系統運行時,可以被類檢測者訪問。查錯功能:在查錯時使用元數據信息,有助于檢測可運行應用系統的解釋和修改狀態。瀏覽功能:為數據的控制開發瀏覽器時,為顯示數據,要求能解譯數據的結構,而這些信息是以元數據來表達的。程序生成:如果允許訪問元數據,則可以利用關于結構的信息自動生成程序。Page

322、空間數據元數據的應用幫助用戶獲取數據:通過元數據,用戶可以對空間數據庫進行瀏覽、檢索和研究等。空間數據質量控制:無論是統計數據還是空間數據都存在數據精度問題。影響空間數據精度的原因主要有兩個方面:一是源數據精度;二是數據加工處理過程中精度質量的控制情況。空間數據質量控制的主要內容有:(1)由準確定義的數據字典,說明數據的組成、各部分的名稱和表征的內容等。(2)保證數據邏輯科學地集成,要求數據按一定邏輯關系有效地組合。(3)有足夠的說明數據來源、數據的加工處理過程、數據解譯的信息。Page

332、空間數據元數據的應用在數據集成中的應用:數據集層次的元數據記錄了數據格式、空間坐標體系、數據的表達形式、數據類型等信息;系統層次和應用層次的元數據則記錄了數據使用軟硬件環境、數據使用規范、數據標準等信息。這些信息在數據集成的一系列處理中,如數據空間匹配、屬性一致化處理、數據在各平臺之間的轉換使用等是必需的。這些信息能夠使系統有效地控制系統中的數據流。數據存儲和功能實現:元數據系統用于數據庫的管理,可以避免數據的重復存儲,通過元數據建立的邏輯數據索引可以高效查詢檢索分布式數據庫中任何物理存儲的數據,減少用戶查詢數據庫及獲取數據的時間,從而降低數據庫的費用。Page

34第二節空間數據的質量空間數據質量的概念空間數據質量評價空間數據質量問題的來源與分析數據質量控制Page

35一、空間數據質量的概念空間數據:是對有關空間位置、專題特征及時間信息的符號紀錄,是對現實世界中空間特征和過程的抽象表達。空間數據質量:空間數據在表達實體空間位置、特征和實踐所能達到的準確性、一致性、完整性和三者統一性的程度,以及數據適應于不同應用的能力。Page

36二、空間數據質量評價與數據質量相關的幾個概念空間數據質量標準Page

371、相關概念誤差:

數據與真值之間的差異準確度:測量值與真值之間的接近程度精度:

對現象描述的詳細程度不確定性:關于空間過程和特征不能準確確定的程度,在真值不可測或無法知道時,取代誤差。空間分辨率:兩個可測量數值之間最小的可辨識的差異。比例尺:地圖上一個記錄的距離和它所表現的“真實世界的”距離之間的一個比例。Page

382、空間數據質量標準

空間數據質量標準是生產、使用和評價空間數據的依據。數據質量是數據整體性能的綜合體現。其主要內容如下:數據說明:要求對空間數據的來源、數據內容及其處理過程等作出準確、全面和詳盡的說明。位置精度:指空間實體的坐標數據與實體真實位置的接近程度,常表現為空間三維坐標數據的精度。屬性精度:指空間實體的屬性值與其真值相符的程度。它取決于地理數據的類型,常常與位置精度有關。時間精度:指時間的現勢性。可以通過數據更新的時間和頻度來體現。Page

392、空間數據質量標準邏輯一致性:指地理數據關系上的可靠性,包括數據結構、數據內容,以及拓撲性質上的內在一致性。完整性:指地理數據在范圍、內容及結構等方面滿足所有要求的完整程度,包括數據范圍、空間實體類型、空間關系分類、屬性特征分類等方面的完整性。表達形式的合理性:指數據抽象、數據表達與實體的吻合性,包括空間特征、專題特征和時間特征表達的合理性等。:Page

40三、空間數據質量問題的來源與分析源誤差

空間現象自身存在的不穩定性

空間現象的表達操作誤差空間數據使用中的誤差Page

41Page

421、源誤差地面測量數字數據的誤差地圖數字化數據的誤差遙感數據的誤差Page

43(1)地面測量數字數據的誤差

來源于地面測量的數字數據中含有控制測量和碎部測量誤差。其中控制點誤差又受控制網的參考基準、網形和觀測精度以及觀測費用等因素的影響。碎部點誤差除繼承了控制點的誤差外,還受自身的觀測方法、觀測精度和地界的人為判斷,以及地物地貌的取舍等因素的影響。當然,原始觀測誤差受觀測儀器、觀測者和外界環境三種因素影響。地面測量數據中的誤差可以表現為隨機誤差、系統誤差或粗差。一般而言,粗差可采用可靠性理論探測剔除,系統誤差可采用實驗方法校正或建立系統誤差模型處理,隨機誤差可采用隨機模型,如最小二乘法平差處理。利用誤差傳播規律可求得點坐標的方差—協方差矩陣或誤差橢圓(球)元素來表達點坐標數據的精度。

測量方面的誤差通常考慮的是:系統誤差、操作誤差和偶然誤差。Page

44(2)地圖數字化數據的誤差

地圖數字化是GIS數據來源之一,原圖固有誤差和數字化過程誤差是地圖數字化數據誤差的主要來源。原圖固有誤差除含有上述地面控制測量和碎部測量的全部誤差外,還含有制圖誤差。制圖誤差數字化誤差Page

45①制圖誤差控制點展繪誤差:展繪控制點是成圖的第一步。編繪誤差:地形圖的編繪一般用攝影測量手段把各種原始資料化為同一比例尺的過程,其中所引入的誤差大約在0.30~0.33毫米之間。繪圖誤差:這項誤差是在繪圖過程中產生的。綜合誤差:地圖綜合誤差的大小取決于特征的類型與復雜程度,故該項誤差極難量化。Page

46①制圖誤差地圖復制誤差:地圖復制誤差的均方差為0.1~0.2毫米。分色版套合誤差:該項誤差的均方差為0.17~0.30毫米。繪圖材料的變形誤差:地圖一般印刷于紙質載體上,隨著溫度和濕度的變化,紙的尺寸也會改變。歸化到同一比例尺所引起的誤差:地圖的比例尺是指真實的主比例尺,在將地圖數字化或從地圖量距時,必須利用適當的比例尺因子進行修正。Page

47①制圖誤差特征的定義:自然界的許多特征并無明確的界限。特征定義會引起特征位置的某些不確定性,但并非所有的特征都有此誤差。特征夸大誤差:為了增強地圖的易讀性,有時需要夸大某些特征,因為它們在圖上難以按其真實情況表示。由于很難知道制圖過程中各種誤差間的關系以及圖紙尺寸的不穩定性,因此,很難準確地評價原圖固有誤差。Page

48②數字化誤差

數字化方式主要有手扶跟蹤數字化和掃描數字化。在生產實踐中,采用掃描數字化,然后屏幕半自動化跟蹤。線劃跟蹤與掃描數字化所引起的平面誤差較小,只是在掃描時,要素結合處出現的誤差較大。手扶跟蹤數字化引起的誤差主要與被數字化的要素對象、作業員和數字化儀有關。要素對象:要素本身的寬度、密度和復雜程度對數字化誤差有顯著影響。Page

49②數字化誤差作業員:作業員的經驗與技能主要表現在選擇最佳點位、跟蹤曲線和判斷十字絲與目標重合程度的能力等方面。數字化儀:數字化儀的分辨率對數字化誤差有決定性影響。一般在選擇數字化儀時采用經濟實用的原則。Page

50(3)遙感數據誤差

遙感數據的誤差積累過程可以分為:數據獲取誤差、數據預處理誤差和人工判讀誤差等。數據獲取誤差:遙感資料獲取時存在著多種誤差。其中有些誤差源是可控的,有些則是不可控的,可控的數據獲取誤差又包括幾何誤差和遙感平臺誤差。數據預處理誤差:數據預處理包括利用地面控制對原始數據進行的幾何校正、圖像增強和分類等。這些預處理會引入各種各樣的誤差。Page

51(3)遙感數據誤差人工判讀誤差:在數據分析和判讀階段會引入人工判讀誤差。在GIS中使用遙感數據時,人工判讀會影響隨后的地圖分析結果。Page

522、操作誤差

除了地圖原始錄入數據本身帶有的源誤差外,空間數據處理操作中還會引入新誤差。由計算機字長引起的誤差

空間數據處理中的誤差在計算機中,數據是由一定字長的編碼表示的。舍入誤差是由計算機字長引起的一種誤差。除了數據處理精度外,數據存儲精度也與計算機字長有關。Page

53(1)空間數據處理中的誤差投影變換:地圖投影是三維地球橢球面到二維平面的拓撲變換。在不同投影形式下,地理特征的位置、面積和方向的表現會有誤差。數據格式轉換:在矢量格式和柵格格式之間的轉換中,數據所表達的空間特征的位置具有差異性。數據抽象:在數據發生比例尺變換時,對數據進行聚類、歸并、合并等操作時產生的誤差。建立

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論