信息技術 第一冊(五年制高職)教案 1.2數據庫存儲技術_第1頁
信息技術 第一冊(五年制高職)教案 1.2數據庫存儲技術_第2頁
信息技術 第一冊(五年制高職)教案 1.2數據庫存儲技術_第3頁
信息技術 第一冊(五年制高職)教案 1.2數據庫存儲技術_第4頁
信息技術 第一冊(五年制高職)教案 1.2數據庫存儲技術_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據庫存儲技術數據庫技術主要研究如何存儲、使用和管理數據,是計算機技術中發展最快、應用最廣的技術之一。在信息技術高速發展的今天,數據庫技術的應用已經深入到了各個領域。數據庫的定義

數據庫(Database,DB)是存儲在計算機內、有組織、可共享的數據和數據對象(如表、視圖、存儲過程和觸發器等)的集合。這種集合按一定的數據模型(或結構)組織、描述并長期存儲,同時能夠以安全可靠的方法進行數據的檢索和存儲。數據庫有以下幾個主要的特點:(1)數據結構化

數據的結構化是數據庫區別于文件系統的根本特征。在數據庫系統中的數據和文件系統中的數據不同。在文件系統中,文件數據之間不存在聯系,而且只能從屬于特定的應用,數據庫中的數據是面向全組織的、復雜的數據結構,數據具有完整的數據結構,同時同一個數據庫中的多個數據文件之間可以相互聯系。(2)數據共享

數據共享是數據庫技術的基本特征。數據庫中的數據可以供多個用戶或多個應用程序共享,數據共享大大減少了數據的冗余度和不一致性,大大提高了數據的利用率和工作效率。

(3)數據獨立性

數據獨立性主要包括數據的物理獨立性和邏輯獨立性。數據的物理獨立性是指用戶的應用程序與數據庫的數據是相互獨立的,不存儲在同一個地方,數據的邏輯獨立性是指用戶的應用程序與數據庫的邏輯結構是相互獨立的。不會因一方的變化而發生改變,大大地降低了應用程序開發和數據庫維護的工作量。數據庫技術的發展歷史

時至今日,數據庫技術已經形成了比較完善的理論體系和實用技術,它研究和解決了計算機信息處理過程中大量數據有效地組織和存儲的問題,在數據庫系統中減少數據存儲冗余、實現數據共享、保障數據安全以及高效地檢索數據和處理數據。隨著使用計算機進行數據管理的技術的不斷發展,數據庫技術經歷了人工管理、文件系統、數據庫系統三個階段。(1)人工管理階段(20世紀50年代中期以前)

在人工管理階段,計算機主要應用與科學計算,對于數據保存的需求尚不迫切,數據的管理是靠人工進行的,計算機外部設備只有磁帶機、卡片機和紙帶穿孔機,沒有直接存取的磁盤設備,也沒有操作系統,只有匯編語言,數據處理采取批處理的方式,數據存在大量重復存儲的現象。

人工管理數據的特點是數據不保存,沒有專門的軟件系統對數據進行管理,數據不共享也不獨立。(2)文件系統階段(20世紀50年代后期到60年代中期)

在文件系統階段,計算機不僅用于科學計算,同時也開始用以信息處理,硬件方面有了很大改進,出現了磁盤、磁鼓等直接存儲設備。軟件方面出現了高級語言和操作系統,且操作系統中出現了專門的數據管理軟件。這個階段的特點是數據以文件形式可長期保存下來,由專門的文件系統管理數據,文件形式多樣化,程序與數據間有一定獨立性。但是,文件系統的主要缺陷是數據文件之前缺乏有機的聯系,數據與程序之間缺乏獨立性,不能有效地共享相同的數據,從而造成數據的冗余度大和不一致性,給數據的修改和維護帶來了困難。(3)數據庫系統階段(20世紀60年代后期至今)隨著計算機技術的迅速發展和廣泛應用,磁盤技術取得重要進展,數據管理中數據量急劇增長,對數據共享和數據管理提出了更高的需求,文件系統已經不能滿足應用的需求,導致了數據庫技術的產生。數據庫技術是計算機科學技術中發展最快的領域之一,也是應用最廣的技術之一,先后經歷了三個演變:

①第一代數據庫系統——層次和網狀數據庫系統層次數據庫是數據庫系統的先驅,而網狀數據庫則是數據庫概念、方法、技術的奠基。它們是數據庫技術中研究得最早的兩種數據庫系統。層次模型對應于有根定向有序樹,而網狀模型對應的是有向圖。所以,這兩種數據模型可以統稱為格式化數據模型。這兩種數據庫系統具有下列共同特點:支持三級模式的體系結構;用存取路徑來表示數據之間的聯系;獨立的數據定義語言;

導航的數據操縱語言。②第二代數據庫系統——關系數據庫系統1970年美國IBM公司San

Jose研究室的研究員E.F.Codd首次提出了數據庫系統的關系模型。經過大量的高層次的研究和開發取得了一系列的成果,主要是:奠定了關系模型的理論基礎,研究了關系數據庫語言,有關系代數、關系演算、SQL語言及QBE等,同時研制了大量的RDBMS的原型,攻克了系統實現中查詢優化、并發控制、故障恢復等一系列關鍵技術。關系數據庫是以關系模型為基礎。關系模型有數據結構、關系操作以及數據完整性三部分組成,主要特點有關系模型的概念單一;以關系代數為基礎;數據獨立性強,數據的物理存儲和存取路徑對用戶隱蔽;關系數據庫語言是非過程化的,大大降低了用戶編程的難度。

③新一代數據庫技術——數據庫大家族從20世紀80年代以來,數據庫技術在商業領域的取大成功,刺激了其他領域對數據庫技術需求的迅速增長。隨著用戶應用需求的提高、硬件技術的發展和網絡提供的豐富多彩的多媒體交流方式,促進了數據庫技術與網絡通信技術、人工智能技術、面向對象程序設計技術、并行計算技術等相互滲透,互相結合,成為當前數據庫技術發展的主要特征,形成了數據庫新技術。新一代數據庫系統以更豐富的數據模型和更強大的數據管理功能為特征,滿足了更加廣泛復雜的新應用的要求。其基本特征為:第三代數據庫系統應支持數據管理、對象管理和知識管理;必須保持或繼承第二代數據庫系統的技術;必須對其他系統開放。數據庫技術發展的現狀在當今的互聯網中,最常見的數據庫模型主要是兩種,即關系型數據庫和非關系型數據庫。隨著應用領域的不斷擴展,關系數據庫的限制和不足日益顯現出來,不能有效地處理多維數據和互聯網應用中半結構化和非結構化的海量數據,如Web頁面、電子郵件、音頻、視頻等;當達到一定規模時,高并發讀寫性能低;所支持的容量也有限。而非關系型的數據庫在特定的場景下可以發揮出難以想象的高效率和高性能,它作為對傳統關系型數據庫的一個有效的補充,得到了非常迅速的發展。(1)結構化數據、非結構化數據和半結構化數據那為什么會有關系型數據庫和非關系型數據庫呢?主要是由于不同數據庫所處理的數據類型有所不同。在實際應用中,我們會遇到各式各樣的數據庫,主要有:①結構化數據結構化數據能夠用數據或統一的結構加以表示,如數字、符號。結構化數據又稱為作行數據,它是用二維表結構來邏輯表達和實現的數據,嚴格地遵循數據格式與長度規范,結構化數據主要通過關系型數據庫進行存儲和管理。②非結構化數據非結構化數據主要包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等。非結構化數據不能用數據庫的二維表來呈現的,它的字段長度是可變的,并且每個字段的記錄又可能由可重復或不可重復的子字段構成的數據庫。非結構化數據庫不僅可以處理結構化數據,更適合處理非結構化數據,它采用多值字段、了字段和變長字段機制進行數據項的創建和管理,廣泛應用于全文檢索和各種多媒體信息處理領域。③半結構化數據半結構化數據介于完全結構化數據(如關系型數據庫、面向對象數據庫中的數據)和完全無結構的數據(如聲音、圖像文件等)之間,一般是自描述的,數據的結構和內容混在一起,沒有明顯的區分。比如XML、HTML文檔就是半結構化數據。(2)主流的關系型數據庫和非關系型數據庫目前,主要的數據庫有關系型數據庫RDBMS和非關系型數據庫NoSQL。在這些數據庫中,處理的數據有的是結構化數據,有的是非結構化數據和半結構化數據。關系型數據庫已經擁有非常龐大的客戶群,其產品也以各自獨特的功能在數據庫市場上占有重要地位,現在比較常見的數據庫有Oracle、MySQL、Sybase、Access、DB2等,這些數據庫都為Java、C++、Python、PHP等常見編程語言提供了API,供它們連接和訪問。非關系型數據庫,即NoSQL數據庫,即NotOnlySQL,意為不僅僅是SQL。大多數人認為NoSQL數據庫與關系型數據庫完全對立,其實不然。非關系型數據庫基于數據存儲模型,可分為列存儲數據庫、鍵值(Key-Value)存儲數據庫,文檔型數據庫,對象型數據庫,圖形數據庫,各個類型的數據庫也都有許多自己的相關產品并被采納使用。鍵值(Key-Value)數據庫不關心具體的數據內容,直接把“鍵”映射到“值”上,值是非結構化的數據存儲模式。常見的有Redis、TokyoCabinet/Tyrant、OracleBDB、Voldemort。列存儲數據庫系統中,列簇形式存儲,將業務邏輯相關的數據放在同一列存儲,相同列的數據存儲在一起。列存儲數據庫支持列的動態擴展,更適合海量數據的處理,主要產品有HBase、Casssndra、Rias,常用于Hadoop分布式文件系統中。文檔存儲數據庫與鍵值(Key-Value)數據庫類似,但是值是結構化存儲的模式。文檔型數據庫中的文檔有的是JSON格式,有的類似JSON格式。常見的數據庫有MongoDB、CouchDB。對象型數據庫與文檔型數據庫相似,但數據以對象的形式進行存儲,這些對象只能由其所屬的類中定義的方法來操作。常見的數據庫有db4o、Versant。圖形結構數據庫使用圖形模型作為數據存儲結構,能擴展到不同服務器上,常用于社交網絡、推薦系統等。常見的有Neo4J、InfoGrid、InfiniteGraph。表1常用數據對照表類型名稱特點應用場景關系型數據庫Oracle支持多用戶、大事務量的高性能事務處理數據安全性和完整性控制支持分布式數據庫和分布處理基于客戶端/服務器技術大部分企事業單位都用ORACLE,在電信行業占用最大的份額。MySQL開源,體積小,速度快應用于中小型WEB網站Sybase基于客戶/服務器體系結構是一種高性能、可編程數據庫電信行業使用較多DB2并發性好,適合海量數據的存儲和處理,跨平臺,即能在所有主流平臺上運行,同時可伸縮性好,可支持從大型機到單用戶環境,應用于OS/2、Windows等平臺下。適用于數據倉庫和在線事物處理。適用于于大型應用系統,在企業級的應用最為廣泛。全球500家大型企業中,85%以上使用DB2的數據庫服務器。非關系型數據庫HBase屬于列存儲數據庫是Google的BigTable的開源實現,建立在HDFS上,提供高可靠性、高性能、列存儲、可伸縮、實時讀寫的數據庫系統通常用來應對分布式存儲海量數據;適用于偏好BigTable,并且需要對大數據進行隨機、實時訪問的場合。MongoDB屬于文檔型數據庫可存儲比較復雜的數據類型高性能、易部署、易使用支持動態查詢支持完全索引,包含內部對象使用高效的二進制數據存儲,包括大型對象(如視頻等)廣泛應用于各種大型門戶網站和專業網站,大大降低了企業運營成本。Redis屬于鍵值存儲數據庫性能高,擴展性強易部署、高并發適用于數據變化快且數據庫大小可遇見(適合內存容量)的應用程序。數據庫技術發展的趨勢經過幾十年的發展,數據庫技術已經得到了很好的完善,尤其是關系型數據庫管理系統。目前,隨著新技術的不斷涌現,數據庫技術不斷向新的應用領域的滲透,數據庫技術在下面幾個方面得到了更好的發展:(1)面向對象數據庫(OODBMS)數據庫領域中引入面向對象的方法,數據庫技術和面向對象技術相結合,就形成了面向對象數據庫管理系統。面向對象數據庫本質上也是一個數據庫系統,因此系統也具備數據庫系統的處理能力,其次它又是一個面向對象的系統,包含了對象的概念、方法和技術。與傳統的數據庫相比,面向對象數據庫在復雜系統的模擬、表達和處理能力等方面具有明顯的優勢,不足之處是面向對象數據庫的理論和技術還不成熟、不夠完善。但隨著數據庫技術和面向對象技術的不斷發展和完善,面向對象的數據庫必將會得到廣泛應用。(2)網絡技術與數據庫技術的融合數據庫技術和網絡技術相結合產生了分布式數據庫系統。分布式數據庫利用高速網絡將分散的多個數據存儲單元連接起來,組成一個邏輯上統一的數據庫,分布式數據庫有局部數據庫和全局數據庫的概念。分布式數據庫具有以下的優點:能對數據進行全局管理,也能讓各節點自主管理本節點的數據;分布式數據庫中的數據都是相互獨立的,且分布透明;分布式數據庫極大地增加了數據的容量;分布式數據庫的數據可靠性和可用度高;分布式數據庫改善了系統的性能和并行處理能力。分布式數據庫也存在一定的問題。比如花在通信上的系統開銷較大;分布式數據庫的存取結構比較復雜;分布式數據庫的數據安全性和保密性處理都相對較難。但隨著相關技術的發展,分布式數據庫的問題也會逐步得到解決。(3)多媒體技術進入數據庫領域隨著多媒體技術的發展,無論是電腦還是在網絡,到處都有各種多媒體信息,如聲音、圖像、視頻、超文本信息等,當多媒體信息太多時,需要使用多媒體數據庫來組織和管理它們。多媒體數據庫是計算機技術、影像技術和通信技術相結合的產物,多媒體數據類型復雜、信息量龐大,信息具有實時性、分布性和交互性等特點。(4)人工智能與數據庫技術的結合人工智能主要研究如何運用計算機模擬人的思維和活動,邏輯推理和判斷是人工智能最主要的特征,但信息檢索的效率較低。數據庫技術主要用來處理數據,適合進行數據的存儲、管理、檢索等操作,但不具備邏輯推理能力。人工智能對邏輯推理要求較高,但它不會注意空間和時間的限制,因此人工智能中語言和專家系統的效率較低。而數據庫關注實際存放的數據,同時也會考慮時間和空間效率,但不關心通過推理得出的數據。人工智能和數據庫技術相結合產生了智能數據庫系統,它發揮了兩種技術各自的優點,是一種新型的數據庫系統。(5)對象—關系數據庫有機結合當前數據庫大部分都是關系數據庫,關系語言與其他常規程序語言一起,可完成任意的數據庫操作。關系數據庫建模簡單,但數據類型有限,數據結構是有限制的。面向對象方法起源于程序設計語言,它用現實世界的實體對象為基本元素來描述復雜的客觀世界,建模能力強且易理解,但面向對象方法提供的功能不如數據庫靈活。將面向對象的建模能力

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論