《存儲技術基礎》課件第1章_第1頁
《存儲技術基礎》課件第1章_第2頁
《存儲技術基礎》課件第1章_第3頁
《存儲技術基礎》課件第1章_第4頁
《存儲技術基礎》課件第1章_第5頁
已閱讀5頁,還剩28頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章存儲技術概述1.1當代數據存儲需求1.2存儲數據的價值1.3數據的類型及存儲演變1.4數據增長率和管理數據的挑戰1.5數據存儲解決方案1.6存儲環境1.7存儲設備的基本情況 1.1當代數據存儲需求

平均而言,數據產生的年增長率已超過了50%,對于需要長期保存且易于讀取數據的需求也在不斷增長。同時,信息技術的預算也在不斷增長。這其中主要包括服務器、網絡、存儲以及個人終端的花費。據估計,在整個信息技術的投資預算中存儲的相關部分約占四成。

數據主要由個人和各種實體(如公司企業、政府機關、學校、社會團體等)產生。

1.2存儲數據的價值

日益增長的數據存儲需求,使得存儲技術得以長足發展。那么,我們為什么要保存諸多的數據呢?對于企業而言,海量數據中蘊含著許多重要的信息,企業保存數據就是為了從中挖掘出信息。這些信息可以轉換為企業的效益或者提升企業的管理水平。

具有創新能力的企業總是以創新的方式利用數據。

為了更進一步說明信息的價值,我們以計算機系統死機對各個行業帶來的實際經濟損失為例給出直觀的數據。圖1.1為具體以百萬美元計的每小時平均經濟損失數據。圖1.1系統死機帶給各行業每小時的平均經濟損失數據(單位:百萬美元) 1.3數據的類型及存儲演變

存儲數據可以分為結構化和非結構化兩種基本類型。結構化數據是指形式上整齊且有良好的組織的數據,這些數據一般存儲于數據庫或者電子表單中。根據研究機構的調查,目前大約80%以上的企業信息都是非結構化數據。常見的非結構化數據有論文、音/視頻資料、賬單、網頁、支票、電子郵件等。數據的存儲實際上經歷了一個演變過程。在計算機系統發展的早期,對于數據的計算和存儲只能選擇集中化模型。在這種模型情況下,處理和獲取數據都集中在適當的位置。該模型使得新的應用開發與利用得不到較快發展。系統對數據的存取可以依據商業需求進行預測,在這種系統下,通常認為計算能力比實時存取數據能力更加重要。在集中化系統中,用戶通過終端連接到主機上并通過主機訪問內部或外部的存儲設備。隨著網絡技術的進步,客戶端/服務器模型開始流行,逐步形成了分散式的存儲模型。在這種分散式存儲模型中,企業內的業務單元能夠訪問自己的服務器和存儲器。這樣,應用程序就不再排隊等待數據的獲取和程序的執行了。但是,分布式存儲導致了信息的分段化。這樣也會對信息處理和分布管理的均衡性帶來一定困難。面對這些分布式存儲的需求,網絡存儲的概念也隨之出現。簡單地講,在網絡存儲系統中生產部門擁有自己的客戶端、服務器和存儲器集合,財務部門也擁有自己的客戶端、服務器和存儲器,人力資源部門同樣具有自己的客戶端、服務器和存儲器。網絡存儲實際上也可以看做集中化存儲方式,而且這種方式是目前最好的信息存儲形式。網絡存儲解決方案的主要優點體現為在每一種情況下,數據都是集中定位并保存在磁盤存儲系統上的。網絡存儲實現了連接多個計算機到一個中央位置以利用數據的存儲和獲取,數據能實現更容易的管理、共享和保護,而且數據具有非常高的可用性。 1.4數據增長率和管理數據的挑戰

全球范圍內信息的快速增長比率是顯而易見的,圖1.2給出了截至2005年磁盤陣列數據的年增長比率。2005年前信息年平均增長約60%,而2005年后增長率超過了七成。

如此快速的增長給信息管理帶來了嚴重的困難。數據存儲整合到集中的陣列上僅僅是整體信息管理的一部分。信息管理主要面臨以下幾方面的挑戰:

(1)存儲容量的規劃。

(2)數據的分類。

(3)數據可用性支持。

(4)信息的安全性。圖1.2信息年增長率 1.5數據存儲解決方案

大量的數據存儲于硬盤、磁帶以及光盤上。每一種存儲介質都提供進行特定數據存取需要的解決方案。包含磁盤陣列和網絡技術的網絡存儲已經成為大多數商業數據存儲需求的主要解決方案。

在硬盤系統演變的早期,磁帶是主要的數據存儲介質。有些用戶或許曾見過具有數個磁帶驅動器的計算中心的照片。這些磁帶驅動器排列在支架上,操作員則忙于將成卷的磁帶安裝或者卸載到這些驅動器上。通常我們把磁帶驅動器和磁帶的集合稱為帶庫,而把光盤和光驅的集合稱為自動唱片點唱機(Jukeboxes),硬盤的集合稱為磁盤陣列。目前,在主要的數據存儲方案中,磁帶往往作為二級存儲使用。光盤集合則用于存儲那些長期內容不變的數據。磁盤陣列存儲可以立即獲取在線數據。

相比較磁盤陣列而言,磁帶非常便宜。在記錄信息方面,磁帶使用讀/寫磁頭將單位信息記錄在磁帶表面的磁介質上,并且記錄工藝技術也在不斷改進,提供了更高的存儲容量、讀/寫可靠性和性能。隨著光盤的出現,人們擁有了隨機數據獲取以及數據寫保護的手段。大量光盤裝配到類似自動點唱機式的設備中,這樣就能夠為集中獲取的存儲提供大容量陣列式解決方案。而單張光盤的容量仍然與磁帶和磁盤的容量有巨大差距。光盤數據存儲具有以下應用特征:

(1)在小型單用戶的計算環境中非常流行。

(2)個人經常用光盤作為存儲共享數據甚至備份的解決方案。

(3)光盤有時也被應用程序用作分布式介質,或者作為將少量數據從一個自我包含的系統傳送到其他系統的方式。磁盤驅動器自出現起就是備受歡迎的數據存儲方式。數據的急速增長導致了各種介質存儲陣列的發展。陣列能使數據并發地由多個服務器獲取。磁盤陣列甚至智能磁盤陣列快速成長,逐漸成為有效的大容量數據存儲解決方案。按照磁盤發展的歷史情況,我們主要考察的磁盤存儲方案有:直接獲取存儲設備(DASD)、磁盤簇系統(JBOD)、磁盤陣列以及智能磁盤陣列。

圖1.3給出了早期直接獲取存儲設備的結構。圖1.3DASD結構

DASD系統由IBM于1956年設計采用,是從主機中獲取磁盤數據最老的技術。磁盤直接由主機進行讀/寫操作,并且與主機環境緊密耦合。我們可以認為目前個人計算機中的硬盤驅動器就是一種DASD系統的實例。可以認為DASD是一種在服務器/計算機與其磁盤驅動器間的一對一映射關系。在DASD系統中,所有磁盤上的數據都必須經由服務器/計算機進行路由使用。在網絡技術出現以前,這種路由涉及到向操作員提交任務申請的過程。這種系統中的服務器/計算機有能力直接獲取數據而個人卻無法做到直接讀取數據。除了像磁帶系統那樣不斷定位裝載盤卷的不便外,DASD磁盤包必須為特定運行的任務交換磁盤。雖然這種方式速度慢,但它提供了比磁帶系統更快的切換方法。在DASD系統中如果某個磁盤出現故障,其上所有數據有可能丟失或者最近使用的數據有可能不可靠。磁盤簇系統(JBOD)是將多個物理磁盤安裝到外部的機柜中,并通過線路連接到唯一的服務器上。JBOD系統能夠隨著內部磁盤數目的增加而提供更大的存儲容量,但磁盤上的數據并不受到JBOD的保護。JBOD系統結構如圖1.4所示。

由于JBOD存在的局限性,磁盤陣列系統則提供了更高的性能和可靠性。在磁盤陣列中,具有多個與主機相連的接口,使得多個主機能夠共享訪問相同的磁盤陣列。陣列管理軟件可以實現陣列資源的分割,以使單個或者多個磁盤能夠分配給系統中的主機。一般在磁盤陣列中都具有硬件磁盤陣列控制器實現對獨立磁盤冗余的計算和系統中讀/寫操作的優化處理。圖1.4JBOD系統結構智能磁盤陣列具有獨立的操作環境。該操作環境可視為陣列的操作系統。在智能磁盤陣列中分布有大量的高速緩沖存儲器(Cache),并采用復雜的算法對Cache進行管理優化來自主機的讀/寫請求任務。大容量的磁盤驅動器可以分割為多個小單元。這些小單元又可以在主機方以單獨的磁盤驅動器形式出現。陣列管理軟件可以實現多個主機通過相同的I/O通道讀/寫陣列存儲。操作系統能夠確保每個主機僅能訪問到分配的磁盤資源。磁盤陣列系統結構如圖1.5所示。圖1.5磁盤陣列系統結構 1.6存儲環境

目前對于存儲而言,存在兩種不同的存儲環境,即直接互聯存儲(DirectAttachedStorage,DAS)和網絡存儲(NetworkStorage,NS)。其中,網絡存儲的主要形式包括存儲區域網絡(StorageAreaNetwork,SAN)和網絡互聯存儲(NetworkAttachedStorage,NAS)。

圖1.6給出了典型的DAS系統結構。在DAS環境中,服務器直接通過SCSI接口與磁盤陣列連接,在服務器之間相同的磁盤陣列端口不能共享,客戶端則通過局域網方式連接到服務器上,服務器和磁盤陣列的距離受到SCSI線路的限制。隨著網絡技術和光纖技術的發展,DAS已經逐步被取代了。圖1.6DAS系統結構圖1.7給出了SAN系統結構。在SAN環境中,服務器采用專用的網絡,即SAN網絡實現對磁盤陣列的讀/寫。SAN網絡包括光纖通道交換設備以提供服務器和磁盤陣列間的互聯。在SAN模型中,多個服務器可以訪問磁盤陣列上相同的光纖通道端口,服務器和磁盤陣列間的距離比DAS環境中的SCSI接口方式遠得多。同樣,客戶端也采用局域網方式訪問服務器。圖1.7SAN系統結構圖1.8給出了NAS系統結構。在NAS環境中,NAS設備通過直接連接或者外部連接對磁盤進行讀/寫操作。NAS頭實現了文件服務的優化,稱為NAS客戶端的服務器采用局域網讀取文件系統的方式運行應用程序,而客戶端也是通過局域網連接到服務器上的。圖1.8NAS系統結構 1.7存儲設備的基本情況

存儲設備在計算機的接口設備中具有非常重要的作用,在前面我們主要給出了從邏輯層面看到的存儲基本問題,接下來則從物理層面說明存儲設備的基本情況。

存儲設備從不同角度可以分成不同的類型。如果從產品本身的特性來分,可分為順序存取(SequentialAccess)和隨機存取(RandomAccess)兩大類。順序存取類讀/寫數據時按照一定的順序進行,有時為了訪問某個數據必須經過若干個數據后才能達到目的。隨機存取類存儲設備則對其中存放的數據同樣進行讀/寫處理,即無論地址順序如何,對任意位置讀/寫形式相同。隨機存取類的存儲設備主要是使用盤狀或是碟狀存儲媒體來制作的設備。其讀/寫裝置可以自由且快速地移動到文件存放位置上,并立即進行讀/寫數據的動作。目前,這類設備按照材質的特性可分為:可多次讀/寫設備(Rewritable)、單寫多讀式(Write-Once-Read-Many)及只讀式(ReadOnly)設備。按照實際產品可制作成磁盤陣列(DiskArray)、磁光驅(MagnetoOptical,MO)及磁光盤柜(MOJukebox)等。

DiskArray是由兩塊到數塊不等的硬盤及RAID(RedundantArraysofInexpensiveDisks)控制線路板組成的,能提供快速且直接的數據存取,又具有數據保護的功能。從推出到現在,磁盤陣列的觀念經歷了整十年的推廣,已漸漸被大眾所接受,磁盤陣列已被視為相當重要的第一級計算機數據存儲設備了。

MO目前有3.5"?和5.25"?兩種規格,其單片容量分別為640MB、2.6GB或2.4GB。當然,容量較小的磁光驅較適合個人使用;容量較大的磁光驅較適合伺服主機使用。因為磁光驅具有容量大、存儲數據特性穩定等特點,所以非常適合計算機數據的存儲。不過,因為它的讀/寫速度不如磁盤驅動器,所以,較適合作第二級的計算機數據存儲設備。但是,由于磁光盤片本身是可片片互相分離的,在使用操作上多了人工換片的動作,因此就有了自動換片的需求,甚至進一步要求能做到跨片存取的能力,這樣就產生了MOJukebox。

MOJukebox是由磁光驅以及機械換片裝置組成的一種計算機外圍存儲設備。單獨一部磁光盤柜是無法有效地直接提供給用戶使用的,必須與系統整合過的驅動程序一起工作,才能夠發揮應有的功能。一般而言,磁光盤柜的容量大小不等,有可裝16片的小型光盤柜,也有可裝238片的大型光盤柜,并且,也可配置由單臺到12臺不等的磁光驅。表1.1是HP磁光盤柜型號及其容量說明。表1.1HP磁光盤柜型號及其容量說明從另外一個角度來看,有一些計算機數據是屬于不常存取的,或是存取時允許較長的存取反應時間。這種數據就可以應用隨機存取類設備。問題是到底有哪些數據是屬于不常存取或是允許較長的存取反應時間呢?其實,這些數據就在我們的計算機里存在著。舉例而言,像是半年以前的電子郵件,一年以前的設計稿,多年前的數據庫數據,大的圖文件,還有復制整個系統的數據等。這種計算機數據雖不常用,但卻會逐年累月地不斷產生。這時,如果一直將它們存放在硬盤里,只會使得硬盤空間捉襟見肘。如轉放到磁帶上,存取又不方便,若計算機系統是交由專

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論