空間數據挖掘技術研究分析_第1頁
空間數據挖掘技術研究分析_第2頁
空間數據挖掘技術研究分析_第3頁
空間數據挖掘技術研究分析_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、空間數據開掘技能研究闡發摘要:隨著空間數據網羅技能的飛速生長,宏大多樣的空間數據日益膨脹,急迫必要更新數據開掘的知識和要領。文章從空間數據開掘的根本觀點動身,闡述了空間數據開掘的范例與歷程,先容了空間數據開掘在gis中的應用,闡發了當前空問數據開掘面對的題目,并對空間數據開掘技能的生長舉行了預測。關鍵詞:空間數據開掘;地理信息體系;研究闡發隨著數據網羅技能的成熟和普及,大量的空間數據通過遙感、地理信息體系、多媒體體系、醫學和衛星圖像等多種情勢搜集成宏大而富厚的信息源。面對繁蕪、繁多的數據范例,空間數據開掘技能應運而生,并在地理信息體系、遙感勘察、圖像處置懲罰、交通辦理、環境研究等范疇得到普及應

2、用。1空間數據開掘研究概述空間數據開掘(spatialdataining,簡稱sd),是指從空間數據庫中提取用戶感愛好的空間形式、普及干系、數據特性的歷程。空間數據開掘技能綜合數據開掘技能與空間數據庫技能,可用于對空間數據的明白、空間干系和空間與非空間干系的創造、空間知識庫的構造以及空間數據庫的重組和查詢的優化等,其根底目的是把大量的原始數據轉換成有代價的知識,創造大量的地學信息中所隱含的規矩。空間數據開掘是盤算機技能、數據庫應用技能和辦理決議支持技能等多學科交織生長的新興邊沿學科,一樣平常來說,空間數據開掘可分成空間分類、空間聚類、空間趨勢闡發和空間關聯規矩四類。空間分類的目的是在空間數據庫

3、東西的空間屬性和非空間屬性之間創造分類規矩,是比年來空間數據開掘范疇中比力活潑的一個標的目的,常用的要領是決議樹。空間聚類是在一個比力大的多維數據會合按照間隔的度量尋出簇或稠密地區,如今提出的空間聚類要擁有基于支解的要領、基于條理的要領、基于密度的要領和基于棚格的要領。空間趨勢闡發指脫離一個給定的起始東西時非空間屬性的變革環境,比方,當離都會中央越來越遠時經濟形勢的變革趨勢,空間趨勢闡發必要利用回歸和相干的闡發要領。空間關聯規矩是指空間毗鄰圖中東西之間的關聯,空間關聯開掘多接納漸漸求精的優化頭腦,即起首用一種快速的算法大概地對初始空間數據庫舉行一次開掘,然后再在裁剪過的數據庫上用代價高的算法舉

4、行進一步精化開掘。空間數據開掘歷程一樣平常可分為數據挑選(消除原始數據的噪聲或不同等數據)、數據集成(將多種數據源組合在一起)、數據選擇(按照用戶的要求從空間數據庫中提取與空間數據開掘相干的數據)、數據變更(將數據同一成得當開掘的情勢)、空間數據開掘(運用選定的知識創造算法,從數據中提取用戶所需的知識)、形式評估(按照某種愛好度度量并識別表現知識的真正幽默的形式),知識表現(利用可視化技能和知識表現技能,向用戶提供開掘的知識)等階段(見圖1)。空間數據開掘現實上是一個“人引導呆板,呆板幫助人的交互明白數據的歷程。2空間數據開掘在gis中的應用空間數據開掘技能與地理信息體系(gis)的結合具有非

5、常普及的應用空間。數據開掘與gis集成具有三種形式:其一為疏松耦合式,也稱外部空間數據開掘形式,這種形式根本大將gis看成一個空間數據庫對待,在gis環境外部借助別的軟件或盤算機語言舉行空間數據開掘,與gis之間接納數據通訊的方法接洽。其二為嵌入式,又稱內部空間數據開掘形式,即在gis中將空間數據開掘技能交融到空間闡發成效中去。第三為混淆型空間模子法,是前兩種要領的結合,即盡大概利用gis提供的成效,最大限度的淘汰用戶自行開拓的事情量和難度,又可以保持外部空間數據開掘形式的機動性。利用空間數據開掘技能可以從空間數據庫中創造如下幾種重要范例的知識:普及的多少知識、空間漫衍紀律、空間關聯紀律、空間

6、聚類規矩、空間特性規矩、空間區分規矩,空間演變規矩、面向東西的知識。如今,這些知識已比力成熟地應用于軍事、地皮、電力、電信、石油和自然氣、都會方案、交通運輸、環境監測和庇護、110和120快速反響體系等資源辦理和都會辦理范疇。在市場闡發、企業客戶干系辦理、銀行保險、生齒統計、房地產開拓、小我私家位置辦事等范疇也正得到普及存眷與應用,現實上,它正在深化到人們事情和生存的各個方面。3空間數據開掘面對的題目(1)多數空間數據開掘算法是由一樣平常的數據開掘算法移植而來,并沒有思量空間數據存儲、處置懲罰及空間數據自己的特點。空間數據差異于干系數據庫中的數據,它有其特有的空間數據拜候要領,因此傳統的數據開

7、掘技能每每不克不及很好地闡發宏大的空間征象和空間東西。(2)空間數據開掘算法的服從不高,創造形式不簡練。面對海量的數據庫體系,在空間數據開掘歷程中出現不確定性、錯誤形式的大概性和待辦理題目的維數都很大,不但增大了算法的搜刮空間,也增長了盲目搜刮的大概性。因此必需利用范疇知識創造、去除與使命無關的數據,有用地低落題目的維數,方案出更有用的知識創造算法。(3)沒有公認的尺度化空間數據開掘查詢語言。數據庫技能飛速生長的緣故原由之一就是數據庫查詢語言的不竭美滿和生長,因此,要不竭美滿和生長空間數據開掘就必需生長空間數據開掘查詢語言。為高效的空間數據開掘奠基基矗(4)空間數據開掘知識創造體系交互性不強,

8、在知識創造歷程中很難充實有用地利用范疇專家知識,用戶不克不及很好掌控空間數據開掘歷程。(5)空間數據開掘要領和使命單一,根本上都是針對某個特定的題目,因此可以或許創造的知識有限。(6)空間數據開掘與其他體系的集成不敷,無視了gis在空間知識創造歷程中的作用。一個要領和成效單一的空間數據開掘體系的實用范疇一定受到許多限定,如今開拓的知識體系僅范圍于數據庫范疇,假設要在更遼闊的范疇創造知識,知識創造體系就應該是數據庫、知識庫、專家體系、決議支持體系、可視化東西、網絡等多項技能集成的體系。上述題目使得從空間數據庫中提取知識比從傳統的干系數據庫中提取知識更為困難,這給空間數據開掘研究帶來了挑釁。因此,

9、空間數據開掘在將來的生長中,另有許多理論和要擁有待深化研究。4空間數據開掘的生長趨勢(1)空間數據開掘算法和技能的研究。空間關聯規矩開掘算法、時間序列開掘技能、空間同位算法、空間分類技能、空間離群算法等是空間數據開掘研究的熱門,同時進步空間數據開掘算法的服從也很緊張。(2)多源空間數據的預處置懲罰。空間數據內容包羅數字線劃數據、影像數據、數字高程模子和地物的屬性數據,由于其自己的宏大性與數據網羅的困難,空間數據中不成制止地存在著空缺值、噪聲數據及不同等數據,多源空間數據的預處置懲罰就顯得分外緊張。(3)其他種種空間數據開掘及其相干技能研究。如網絡環境下的空間數據開掘、可視化數據開掘、柵格矢量體化空間數據開掘、配景知識觀點樹的主動天生、基于空間不確定性(位置、屬性、時問等)的數據開掘、遞增式數據開掘、多區分率及多條理數據開掘、并行數據開掘、遙感圖像數據庫的數據開掘、多媒體空間數據庫的知識創造等。5小結空間數據開掘可從大型空間數據庫中提取感愛好和紀律性的知識,可用于明白空間數據、創造空間數據與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論