空間數據倉庫_第1頁
空間數據倉庫_第2頁
空間數據倉庫_第3頁
空間數據倉庫_第4頁
空間數據倉庫_第5頁
已閱讀5頁,還剩21頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

空間數據倉庫第1頁,共26頁,2023年,2月20日,星期二1.空間數據倉庫的概況1.1空間數據倉庫的基本概念數據庫的創始人W.H.Inmon定義數據倉庫為支持管理的、決策過程的、面向主題的、集成的、穩定的、不同時間的數據集合。空間數據倉庫是建立在傳統的數據庫基礎上,依靠數據庫實現對數據的高效存儲,二者之間的區別在于其應用不同。因此,在數據組織、集成上有很大的差別:空間數據庫作為源數據庫負責數據的日常處理及一般的空間分析功能;空間數據倉庫根據用戶的要求對空間數據庫中分散的、多源的空間數據進行集成和分析,截取不同時段上的信息,將數據的時間屬性和空間屬性緊密地結合起來,通過模型構建分析和比較,進行數據挖掘發現隱藏在數據中的信息,從而為用戶提供決策服務.第2頁,共26頁,2023年,2月20日,星期二1.2空間數據倉庫的功能及特征

從組成上,空間數據倉庫有三方面的功能:從分散、獨立的空間數據庫中獲取空間數據,即數據ETL,包括數據抽取(extract)、轉換(transform)、清洗(cleaning)、裝載(loading),建立空間數據倉庫;對數據的存儲、管理和檢索;數據集成及數據挖掘.空間數據倉庫相比于空間數據庫有以下特征1.2.1空間數據倉庫是面向主題的傳統的GIS數據庫是面向對象的,根據應用對數據進行組織,空間數據倉庫是面向主題的,在空間數據庫的基礎上進行更高層次的數據組織和分析。第3頁,共26頁,2023年,2月20日,星期二1.2.2空間數據倉庫是集成的空間數據倉庫建立在GIS數據庫的基礎上,在進行決策時利用元數據對空間數據庫里的地理空間數據進行抽取、轉換,從而得到有用的的信息,把空間數據庫中面向對象的數據轉向面向主題的數據,實現決策支持。1.2.3引用時間維在進行趨勢分析時需要對關于主題的各時期的空間數據進行概括總結、分析,空間倉庫引進時間維把不同歷史時期的空間數據組織到一起,使數據具有時間屬性.1.2.4空間方位的引入在進行趨勢分析時需要對關于主題的各時期的空間數據進行概括總結、分析,空間倉庫引進時間維把不同歷史時期的空間數據組織到一起,使數據具有時間屬性.

第4頁,共26頁,2023年,2月20日,星期二1.3空間數據倉庫的體系結構空間數據倉庫是存儲、管理空間數據的一種組織形式,其物理實質仍是對數據的高效存儲系統,由于使用目的不同,其存儲的數據在量和質以及前端分析工具上與傳統GIS應用系統有所不同。空間數據倉庫按照功能劃分為以下幾部分:元數據、源數據、數據變換工具、空間數據倉庫、客戶端分析工具。

第5頁,共26頁,2023年,2月20日,星期二1.3.1元數據空間數據倉庫的元數據是指描述空間數據的數據,它是數據倉庫管理手段之一,也是空間數據交換的基礎,是空間數據標準化與質量的保證。在空間數據倉庫中,元數據可以分為兩類,一類是管理元數據(AdministrativeMetadata),它是對源數據及其內容、數據倉庫主題、數據轉換及各種操作信息的描述;另一類是用戶元數據(UserMetadata)它幫助用戶查詢信息、理解結果、了解數據倉庫中的數據的組織方式等。在數據傳輸、信息共享、大力發展互操作的今天,元數據標準化是必小可少的,一定要借鑒和使用ISO制定的元數據標準。第6頁,共26頁,2023年,2月20日,星期二1.3.2源數據空間數據倉庫為了支持高層次的決策分析需要大量的數據。這些數據分布在小同的地理信息系統或其他信息系統中的應用系統數據,它們存貯在不同的平臺和一般的數據庫中。數據的來源豐富,類型多樣式存儲或分布式存儲。第7頁,共26頁,2023年,2月20日,星期二1.3.3數據變換工具為了優化空間數據倉庫的分析性能,源數據必須經過變換以最適宜的方式進入空間數據倉庫。變換主要包括提煉、轉換、空間變換。數據提煉主要指數據的抽取,如數據項的重構、刪迭不需要的運行信息、字段值的解碼和翻譯、補充缺漏的信息、檢查數據的完整性和相容性等;數據轉換主要指統一數據編碼和數據結構、給數據加上時間標志、根據需要對數據集進行各種運算以及語義轉換等;空間變換主要指空間坐標和比例尺的統一、賦予一般數據空間屬性。數據轉換工具為數據庫和空間數據倉庫之間架起了一座橋梁,使源數據得到了增值和統一,最大限度地滿足了空間數據倉庫高層次決策分析的需要。第8頁,共26頁,2023年,2月20日,星期二1.3.4空間數據倉庫源數據經過變換進入空間數據倉庫。空間數據倉庫以多維方式來組織數據和顯示數據。維是人們觀察現實世界的角度,但多維數據庫中的維并小是隨意定義的,它是一種高層次的類型劃分。為了獲得較高的系統性能,維屏蔽掉了許多原始數據,決策分析所需的綜介數據預先已被統計出來放在其中。主題維、時間維、空間維、非空間維是空間數據倉庫最基本的組織方式。空間維和時間維是空間數據倉庫反映現實世界動態變化的基礎,它們的數據組織方式是整個空間數據倉庫技術的關鍵。空間數據倉庫的數據存儲方式可分為虛擬存儲方式、基于關系表的存儲方式和多維數據庫存儲方式。基于關系表的數據模型主要有星形模型,雪花模型和混介模型。多維數據庫數據模型主要是超立方體結構模型。第9頁,共26頁,2023年,2月20日,星期二1.4空間數據倉庫的建模1.4.1多維數據模型選擇多維數據模型是資源環境空間數據倉庫進行聯機分析處理或多維分析的基礎,維是觀察問題的角度,通過多維模型可以對觀察對象(某一主題)的不同側而不同層次上進行分析。數據模式主要有:星型模式、雪花模式、混介模式和多維數據庫模式。山于星型/雪花模式能夠提供簡潔和有組織的數據倉庫結構,并且支持OLAP操作,因此在空間數據倉庫的建模中,仍可沿用其基本框架。相比之下,星型結構更為簡潔、便于OLAP操作、并易于瀏覽,較雪花結構來講更適介于空間數據倉庫的建模。第10頁,共26頁,2023年,2月20日,星期二1.4.2維的建模在空間數據倉庫中司建立三種類型的維:①非空間維,僅僅包含非空間數據的維,其泛化值也是非空間的。②空間—非空間維,這種類型的維的特點是在原始概念層次上是空間數據,但其泛化值在較高的層次上即變成非空間的數據。例如,在土地利用時空分布研究中,各種土地類型在云南省地圖上的分布是用空間數據來表達的,而這些土地類型數據可以泛化為一些非空間的值,比如泛化為市一級行政區所包含的土地類型而積,其更高層次的泛化伯則全部變為非空間的數據,這種類型的維與非空間維所起的作用類似。③空高層次的泛化數據都是空間數據。例如各中土地類型的精確分布情況及其泛化數據,如土地利用類型在全省范圍的精確分布圖形數據。第11頁,共26頁,2023年,2月20日,星期二1.4.3度量的建模在空間數據倉庫中可建立兩種類型的度量:①數值型度量,僅僅包含數值型數據的度量。數值型度量可以進一步分為分布的、代數的和整體的。如果一個度量能用立方體分割和分布式聚介計算,那么它就是分布的,如count、sum、max如果一個度量能用分布式度量的代數操作運算,那么它就是代數的,如average、standard、deviation;如果一個度量,用于描述其子聚介的有儲空間的大小沒有常數約束,那么它就是全局的,如median、most–frequent、rank②空間度量,空間度量包含指向空間對象指針集合。例如,在泛化操作中,相同的單元,這樣形成的度量包含這些區域的指針的集合。第12頁,共26頁,2023年,2月20日,星期二1.5空間數據倉庫的結構框架

空間數據倉庫是在GIS空間數據庫的基礎上,利用數據庫技術、元數據技術、網絡技術對海量地理空間數據進行集成、管理、查詢分析、分發及應用,空間數據倉庫的總體框架如圖1所示(其中實線框架內為空間數據倉庫系統的研究內容,虛線框架內為其它系統的研究內容)。第13頁,共26頁,2023年,2月20日,星期二地理空間數據庫位于空間數據倉庫的最底層,這些數據可能來自不同單位,表示不同時期由不同軟件系統管理,它們相互獨立,形成各式各樣的異構數據,成為空間數據倉庫的數據源.應用系統位于最頂層,它通過統一標準的數據接口提取地理空間數據為多種應用系統服務空間數據倉庫系統位于中間層,它提取地理空間數據庫中的數據,經過空間數據倉庫進行數據集成轉換,為應用系統提供數據由此而看見空間數據倉庫是一個多源數據共享、處理機制在網絡技術、數據倉庫技術日益成熟的今天,根據用戶的不同需求,以空間數據倉庫系統為平臺,訪問多個地理空間數據庫,進行數據挖掘和GIS多維空間分析,為多種應用系統提供全面、科學、實用的決策支持。第14頁,共26頁,2023年,2月20日,星期二2.空間數據倉庫研究中主要研究方向根據空間數據倉庫的總體框架,目前空間數據倉庫研究的重點有:空間數據的ETL、空間數據倉庫元數據管理、GIS多維空間分析三方面.ETL是指從源系統中提取數據,轉換數據為一個標準的格式,加載數據到目標數據存儲區,是空間數據倉庫的構建過程中不可避免的問題,可以有以下兩種解決方案:一是把數據源中的數據分為空間數據、多種數據庫數據、XML文檔數據花種形式,分別設計數據轉換工ETL轉換工具基于特定的軟件,結合具體情況進行空間數據的集成轉化.前一種方法需要對數據進行分別具;一是借助元數據管理、開發專用的第15頁,共26頁,2023年,2月20日,星期二前一種方法需要對數據進行分別具;一是借助元數據管理、開發專用的處理,在加載過程中要求空間數據倉庫系統的儲存、更新、管理數據效率較高;后一種方法由于引入元數據管理,對數據的要求比較高,在實施時勞動強度比較大,可引人智能技術,提高空間數據ETL自動化和分析集成的水平.介于元數據在GIS中的重要地位,后一種實現方法的前景是比較誘人的,這是因為元數據是用來描述地理空間數據集的內容、質量、狀態等其他特性的數據,它們在實現地理空間數據倉庫的過程中起著重要的作用:指示空間數據倉庫如何從多個地理信息數據庫中提取出數據種類、數據標準等方面不同的地理空間數據;指示應用系統如何從空間數據倉庫中提取出標準的集成的地理空間數據.為用戶提供地理空間數據產品服務等.第16頁,共26頁,2023年,2月20日,星期二目前對空間數據倉庫元數據的研究主要集中在地理空間數據元數據的研究上.國際上有三個組織對地理空間數據元數據標準進行了大量的研究,這三個組織分別是:美國聯邦地理數據委員會(FGDC)、歐洲地理信息標準化委員會(CEN/TC287)以及國際標準化組織(ISO)地理信息/地球信息業技術委員會(ISO/TV211).在國內有中國可持續發展信息共享元數據標準、NREDIS信息共享元數據內容標準等.但對空間數據倉庫元數據的研究還是一片空白,當前可見的是武漢大學昊金華提出的空間數據倉庫元數據的研究.第17頁,共26頁,2023年,2月20日,星期二GIS因為其空間分析功能而逐漸發展起來.但隨著空間分析功能的深人研究,對空間數據的時間維、專題維的考慮日益成為GIS空間分析的重點,在空間數據倉庫中引人時間信息維、專題信息維,可以大大提高了GIS空間分析的能力.目前國外提出空間數據立方體(SOLAP)技術,將來自不同領域的地理空間信息、專題信息1、專題信息2,……專題信息n、時間信息按維的形式組成一個易理解的超數據立方體.用地理空間維、專題維、時間維來描述空間對象,通過維的不同操作可產生不同的空間分析結果,以滿足多維空間分析和概括的需求,實現GIS多維空間信息分析功能,進一步為用戶提供決策支持,這無疑為GIS的發展提供了更為廣闊的空間.大大的拓寬了GIS的應用范圍.第18頁,共26頁,2023年,2月20日,星期二3.空間數據倉庫的應用實例一、瀾滄江流域水資源空間數據倉庫設計及實現1.空間數據倉庫體系框架設計瀾滄江流域水資源空間數據倉庫體系結構由數據源、數據轉換、空間數據倉庫和客戶端分析工具四個部分組成。集成器對來自各種異構數據源數據進行抽取、清洗和轉換后,數據信息進入統一空間數據庫管理平臺,通過主題的確定,建立空間數據立方體模型結構,形成空間數據倉庫。最后,對多維數據進行多維分析及數據挖掘,并進行可視化處理。第19頁,共26頁,2023年,2月20日,星期二2.空間數據倉庫實現關鍵技術2.1數據源瀾滄江流域數據信息形式多樣,從地域單元上分成項目區、地區、縣、鄉四級;從數據類型上包括圖形數據、圖象數據、專題GIS數據、統計數據和成果圖象數據五類。由于數據來自不同的GIS應用平臺及數據庫管理系統,如何將它們高效地集成起來是構建空間數據倉庫的關鍵。為此,對數據信息的集成采取同類信息集成、異類信息集成兩種方式。第20頁,共26頁,2023年,2月20日,星期二①同類信息集成

同類信息集成指對來源不同、格式各異的瀾滄江區域多源數據,包括屬性數據、圖形數據與圖象數據,按類集成。它相當于對屬性數據、圖形數據及圖象數據按類進行整理,解決數據格式異構性、主題異構性、語義異構性、編碼異構性、投影參考坐標系異構性等一系列同類信息異構性問題。②異類信息集成

異類信息集成指對瀾滄江區域不同種類的信息進行集成,其關鍵是如何在各類數據信息之間建立起共同的識別字段。通過區域代碼ID(國際碼)作為屬性數據、空間數據的識別字段,易于建立屬性數據和空間數據兩類數據間的關聯第21頁,共26頁,2023年,2月20日,星期二2.2數據管理平臺

由于RDBMS(關系型數據庫管理系統)發展非常成熟,數據倉庫普遍采用RDBMS來作為數據倉庫的支持。對于空間數據倉庫而言,由于空間對象的引入,單純的關系數據庫是無法支持空間對象的存儲和操作的,同時,為實現統一管理與主題相關的屬性數據和圖形、圖象數據,采用了SQLServer(微軟公司開發的一個關系數據庫管理系統)關系數據庫來管理屬性數據,對于空間數據的存儲管理,通過在SQLServer關系數據庫上加載Mapinfo公司的Spatialware空間數據引擎構成空間數據庫,解決了在關系數據庫中存儲連續、大型的空間數據的問題題,能夠將傳統文件格式存儲的空間數據轉移存儲于空間數據庫中,從而將屬性數據和空間數據由同一數據庫系統管理,便于空間信息的查詢和操作。第22頁,共26頁,2023年,2月20日,星期二2.3空間數據倉庫的建立

空間數據倉庫是建造立方體的基礎,它的事實表和維表結構直接決定了立方體的結構。空間數據倉庫的結構設計和傳統數據倉庫一樣,通常采用星形模式和雪花模式。由于雪花模式難以理解,增加了查詢的復雜度,所以采用了星形模式,針對一個主題,設計一個事實表和多個維度表。事實表反映了應用的主題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論