數(shù)據(jù)保護(hù)概述(1.5)._第1頁
數(shù)據(jù)保護(hù)概述(1.5)._第2頁
數(shù)據(jù)保護(hù)概述(1.5)._第3頁
數(shù)據(jù)保護(hù)概述(1.5)._第4頁
數(shù)據(jù)保護(hù)概述(1.5)._第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1數(shù)據(jù)保護(hù)數(shù)據(jù)保護(hù)數(shù)據(jù)信息的可用性數(shù)據(jù)信息的可用性( (Availability) )% Uptime% DowntimeDowntime per YearDowntime per Week98%2%7.3 days3hrs 22 min99%1%3.65 days1 hr 41 min99.8%0.2%17 hrs 31 min20 min 10 sec99.9%0.1%8 hrs 45 min10 min 5 sec99.99%0.01%52.5 min1 min99.999%0.001%5.25 min6 sec99.9999%0.0001%31.5 sec0.6 secMillions

2、 of US Dollars per Hour in Lost RevenueMillions of US Dollars per Hour in Lost Revenue6.56.53.63.62.82.82.62.62.02.01.61.61.61.61.51.51.31.31.21.21.11.1Retail brokerageRetail brokeragePoint of salePoint of saleEnergyEnergyCredit card sales authorizationCredit card sales authorizationTelecommunicatio

3、nsTelecommunicationsCall locationCall locationManufacturingManufacturingFinancial institutionsFinancial institutionsInformation technologyInformation technologyInsuranceInsuranceRetailRetailSource Meta Group, 2005數(shù)據(jù)丟失的原因數(shù)據(jù)丟失的原因 用戶誤操作用戶誤操作 系統(tǒng)錯誤系統(tǒng)錯誤 電力電力故障故障 災(zāi)難事故災(zāi)難事故 介質(zhì)故障介質(zhì)故障數(shù)據(jù)丟失原因統(tǒng)計數(shù)據(jù)丟失原因統(tǒng)計人為錯誤應(yīng)用軟件故障

4、計算機(jī)病毒場地災(zāi)害系統(tǒng)硬件故障32%44%3%7%14%RAID, 集群以及本地遠(yuǎn)程數(shù)據(jù)鏡像唯一方式是采用遠(yuǎn)程數(shù)據(jù)復(fù)制或離線數(shù)據(jù)備份及介質(zhì)異地存放軟件投產(chǎn)前在本地的數(shù)據(jù)拷貝上進(jìn)行測試source: Ontrack, a data availability service provider隔離的,實(shí)時的數(shù)據(jù)復(fù)制6建立容災(zāi)高可用環(huán)境的必要性建立容災(zāi)高可用環(huán)境的必要性 降低關(guān)鍵業(yè)務(wù)運(yùn)行風(fēng)險 最大限度地保護(hù)業(yè)務(wù)數(shù)據(jù)的實(shí)時性,完整性和一致性 增強(qiáng)數(shù)據(jù)中心的可用性和業(yè)務(wù)規(guī)劃的靈活性 增強(qiáng)企業(yè)的核心競爭能力部分災(zāi)難大事記1993年,世貿(mào)中心大樓發(fā)生爆炸,爆炸前,約有350家企業(yè)在該樓中工作。1年后,再回到世

5、貿(mào)大樓的公司變成了150家,有200家企業(yè)由于無法存取重要的信息系統(tǒng)而倒閉、消失。1995年1月,日本阪神大地震,摧毀了1700多套計算機(jī)系統(tǒng)。1999年6月,美國一家著名的商業(yè)交易網(wǎng)站的主機(jī)宕機(jī),由于24小時內(nèi)未能恢復(fù)訪問,事件發(fā)生的兩個星期后,該公司的股票值下跌了36%。在我國臺灣地區(qū),直到1999年大地震之前,各公司對災(zāi)害防備都不重視,地震發(fā)生后,由于關(guān)鍵業(yè)務(wù)中斷為很多公司帶來了損失。“911”事件中,由于有1993年爆炸的前車之鑒,在世貿(mào)大樓內(nèi)的一些公司建起了自己的容災(zāi)系統(tǒng),因此,當(dāng)災(zāi)難再次降臨時,有一批公司仍可及時地通過自己的容災(zāi)系統(tǒng)很快恢復(fù)營業(yè)。7數(shù)據(jù)保護(hù)的基本原則 信息冗余設(shè)備級

6、 RAID1 RAID3、RAID4、RAID5 系統(tǒng)級 備份(本地、遠(yuǎn)程) 快照 連續(xù)數(shù)據(jù)保護(hù) 信息冗余空間上 RAID1 RAID3、RAID4、RAID5 軟件鏡像時間上 備份(本地、遠(yuǎn)程) 快照 連續(xù)數(shù)據(jù)保護(hù)名詞術(shù)語名詞術(shù)語 RPO-Recovery Point Objectives 恢復(fù)點(diǎn)目恢復(fù)點(diǎn)目標(biāo)標(biāo)(指能把數(shù)據(jù)恢復(fù)到過去的那一個時間點(diǎn) ) RTO- Recovery Time Objectives 恢復(fù)時間恢復(fù)時間目標(biāo)目標(biāo)(指在出現(xiàn)問題后“什么時候”可以恢復(fù)數(shù)據(jù) ) Data Replication 數(shù)據(jù)復(fù)制數(shù)據(jù)復(fù)制(將數(shù)據(jù)拷貝到另外一個或多個不同的物理站點(diǎn)上,從而保持源數(shù)據(jù)與目

7、標(biāo)數(shù)據(jù)的一致性。分同步、異步復(fù)制 ) CDP (Continuous Data Protect) 持續(xù)數(shù)據(jù)保護(hù)Tape Tape BackupBackupPeriodic Periodic ReplicationReplicationRecovery Point Objective (RPO)WksDaysHrsMins SecsRecovery PointRecovery TimeRecovery PointRecovery TimeTape Tape BackupBackupPeriodic Periodic ReplicationReplicationAsynchronous Async

8、hronous ReplicationReplicationAsynchronous Asynchronous ReplicationReplicationSynchronous Synchronous ReplicationReplicationSynchronous Synchronous ReplicationReplicationSecsMinsHrs Days WksRecovery Point Objective (RPO) is the point in time to which systems and data must be recovered after an outag

9、e. This defines the amount of data loss a business can endure. Different business units within an organization may have varying RPOs.Recovery Time Objective (RTO)Recovery Time includes:Recovery Time includes:Fault detectionRecovering dataBringing apps back onlineRecovery Time Objective (RTO) is the

10、period of time within which systems, applications, or functions must be recovered after an outage. This defines the amount of downtime that a business can endure, and survive. Global Global ClusterClusterWksDaysHrsMins SecsSecsMinsHrs Days WksRecovery PointRecovery TimeRecovery PointRecovery TimeGlo

11、bal Global ClusterClusterManual Manual MigrationMigrationTape RestoreTape RestoreTape RestoreTape Restore傳統(tǒng)數(shù)據(jù)保護(hù)方案備份與恢復(fù):備份與恢復(fù):低廉低廉費(fèi)時、費(fèi)力費(fèi)時、費(fèi)力安全性?安全性?13介質(zhì)變革:磁盤 vs. 磁帶磁帶離線順序訪問容量大速度慢價格低磁盤在線隨機(jī)訪問容量速度快價格更適宜構(gòu)建系統(tǒng)一種常用的數(shù)據(jù)保護(hù)技術(shù) 快照(snapshot)15為什么“快照”?(1/2) 1K、1M、1G、1T我們是否愿意等待? 可否不停機(jī)進(jìn)行備份?漏備、錯備、多備 “快快”:解決批量數(shù)據(jù)備份中的長時間

12、窗口問題; “照照”:至少在邏輯上生成獨(dú)立冗余數(shù)據(jù),解決硬件故障以外的本地數(shù)據(jù)保護(hù)問題;16快照技術(shù)快照技術(shù)的提出最初主要用于備份,在以前要備份某個時刻的數(shù)據(jù),需采用一種叫分離鏡像的方式(遠(yuǎn)程鏡像或是本地鏡像),這種方式需要占用一塊和主卷相同容量大小的卷作為鏡像卷,并且需要停掉主機(jī)IO一段時間(分離主卷與鏡像卷),具體的步驟如下:1,如果某個時刻想要對整個鏡像卷進(jìn)行備份,需要停止讀寫主卷的應(yīng)用,然后分離主卷和鏡像卷。2,拆分之后,主卷恢復(fù)上層IO(整個停機(jī)時間不會很長,如果不采用鏡像卷,會有很長的停機(jī)時間,損失過大),之后主卷的讀寫不再跟鏡像卷關(guān)聯(lián)。此時的鏡像卷保持停止IO那一時刻原卷數(shù)據(jù)的完

13、整鏡像,此時可以使用備份軟件,將鏡像卷上的數(shù)據(jù),被分到其他介質(zhì)。3,拆分鏡像后,主卷的所有IO回以bitmap的方式記錄下來。Bitmap每一位表示卷上的一個塊。帶備份完成后,恢復(fù)鏡像,鏡像卷的數(shù)據(jù)需要重新同步,程序搜索bitmap中所有為1的塊,如果鏡像卷上對應(yīng)的塊尚未寫入,則同步兩個卷。 17 為什么使用這么復(fù)雜的方式備份,到了每個時間點(diǎn)需要備為什么使用這么復(fù)雜的方式備份,到了每個時間點(diǎn)需要備份,直接份,直接copy不行嗎不行嗎? 1, 備份的時候,如果停掉主卷的應(yīng)用服務(wù),直接將主卷的數(shù)據(jù)備份是可以的,但由于備份數(shù)據(jù)量大,需要很長一段時間完成,停機(jī)所造成的損失太大。 2, 不停掉IO服務(wù),

14、直接在某一時刻備份會有什么后果? 由于備份時間太長,備份過程中的IO會造成備份的數(shù)據(jù)不一致(漏備,錯備,多備)1, 備份過程中,一個已備份的文件移到一個未備份的目錄多余的備份2, 備份過程中,一個未備份的文件移到一個已備份的目錄漏掉的備份3, 備份過程中,一個即將備份的數(shù)據(jù)已被修改錯誤的備份18為什么“快照”?(2/2) 存儲網(wǎng)絡(luò)工業(yè)協(xié)會(SNIA)對快照的定義:快照(snapshot)為一個數(shù)據(jù)對象產(chǎn)生完全可用的副完全可用的副本本,它包含對該數(shù)據(jù)對象在某一時間點(diǎn)時間點(diǎn)的映象,快照在快照時間點(diǎn)對數(shù)據(jù)對象進(jìn)行邏輯復(fù)制邏輯復(fù)制操作,產(chǎn)生數(shù)據(jù)對象在該時間點(diǎn)的一致性數(shù)據(jù)副本時間點(diǎn)的一致性數(shù)據(jù)副本,但實(shí)

15、際的部分或全部物理復(fù)制過程可能在復(fù)制時間點(diǎn)之外的某些時間進(jìn)行。快照可以在非常短的時間內(nèi)完成數(shù)據(jù)對象邏輯副本的創(chuàng)建,其數(shù)量級通常為幾秒,因此也稱為零時間復(fù)制快照技術(shù)可以最大限度減小復(fù)制操作對上層應(yīng)用的影快照技術(shù)可以最大限度減小復(fù)制操作對上層應(yīng)用的影響,同時保證復(fù)制操作語義的原子性響,同時保證復(fù)制操作語義的原子性分層分層與虛擬化虛擬化:快照背后的思想(1/2) “零時間復(fù)制產(chǎn)生一致性數(shù)據(jù)副本”意味著什么?獨(dú)立的邏輯數(shù)據(jù)視圖獨(dú)立的邏輯數(shù)據(jù)視圖關(guān)聯(lián)的物理數(shù)據(jù)分布關(guān)聯(lián)的物理數(shù)據(jù)分布 “完全可用”的副本意味著什么?邏輯的副本具備可用性、一致性邏輯的副本具備可用性、一致性分層分層與虛擬化虛擬化:快照背后的思

16、想(2/2)快照技術(shù)的主要策略分離鏡像(1/3)ApplicationsWrite Read邏輯數(shù)據(jù)集物理數(shù)據(jù)集應(yīng)用Is it RAID1Is it RAID1? 分離鏡像技術(shù)是基于硬件的快照,其基本思想是建立一個分離的可尋址的存儲實(shí)體,包含真實(shí)的數(shù)據(jù)快照,可以在這個實(shí)體上執(zhí)行操作。 具體來說,分離鏡像快照技術(shù)在快照時間點(diǎn)到來之前,首先要為源數(shù)據(jù)卷創(chuàng)建并維護(hù)一個完整的物理鏡像卷,這一過程與標(biāo)準(zhǔn)的RAID1相似:同一數(shù)據(jù)的兩個副本分別保存在由源數(shù)據(jù)卷和鏡像卷組成的鏡像對上。在快照時間點(diǎn)到來時,鏡像操作被停止,鏡像卷轉(zhuǎn)化為快照卷,獲得一份數(shù)據(jù)快照。快照卷在完成數(shù)據(jù)備份等應(yīng)用后,將與源數(shù)據(jù)卷重新同步

17、,重新成為鏡像卷。對于要同時保留多個時間點(diǎn)快照的源數(shù)據(jù)卷,則必須預(yù)先為其創(chuàng)建多個鏡像卷。 分離鏡像快照的優(yōu)點(diǎn)為:在快照命令發(fā)出之后立即就能得到一個完整的物理副本,不再需要額外的復(fù)制操作。快照操作的時間非常短,僅僅是斷開鏡像卷對所需的時間,通常只有幾毫秒,這樣小的“復(fù)制窗口”幾乎不會對上層應(yīng)用造成影響。但是分離鏡像快照也存在一些缺點(diǎn):首先,這種快照技術(shù)缺乏靈活性,無法在任意時間點(diǎn)為任意的數(shù)據(jù)卷建立快照:如果源數(shù)據(jù)卷沒有預(yù)先創(chuàng)建鏡像卷,將無法建立快照;當(dāng)一個鏡像卷正處于重新同步狀態(tài)時,也無法用于建立快照。其次,預(yù)先創(chuàng)建鏡像卷占用了大量的存儲資源,并極有可能造成資源的浪費(fèi)。最后,快照時間點(diǎn)之前持續(xù)的

18、鏡像操作將會增加系統(tǒng)的開銷,尤其當(dāng)一個源數(shù)據(jù)卷同時維持多個鏡像卷時。按需復(fù)制快照技術(shù)按需復(fù)制快照技術(shù)在快照時間點(diǎn)之后,才開始建立一份快照時刻源數(shù)據(jù)卷的完整物理副本。存儲子系統(tǒng)接收到快照操作請求,首先暫停上層應(yīng)用;接著為源數(shù)據(jù)卷建立快照卷,并為其分配大于或等于源數(shù)據(jù)卷容量的存儲空間;并建立一個控制位圖,控制位圖的每一個控制位表示源數(shù)據(jù)卷的一個復(fù)制單位是否已經(jīng)被復(fù)制到快照卷,復(fù)制單位一般為數(shù)據(jù)塊或磁道;控制位圖建立之后,所有的控制位都被初始化,表示所有的數(shù)據(jù)塊尚未復(fù)制。至此創(chuàng)建快照的操作已經(jīng)完成,源數(shù)據(jù)卷的數(shù)據(jù)已經(jīng)被邏輯復(fù)制到快照卷上,被暫停的上層應(yīng)用恢復(fù)運(yùn)行,源數(shù)據(jù)卷和快照卷都能被訪問。此時源數(shù)

19、據(jù)卷上的數(shù)據(jù)并沒有被物理復(fù)制到快照卷上,快照卷實(shí)際上是空的。快照建立之后,一個后臺復(fù)制進(jìn)程開始將源數(shù)據(jù)卷的數(shù)據(jù)塊順序復(fù)制到快照卷,并在控制位圖上標(biāo)記該數(shù)據(jù)塊完成復(fù)制。如果上層應(yīng)用要訪問快照卷的某數(shù)據(jù)時,將首先檢索控制位圖:如果對應(yīng)的控制位顯示該數(shù)據(jù)還沒有被復(fù)制到快照卷上,則從源數(shù)據(jù)卷訪問實(shí)際數(shù)據(jù),否則直接訪問快照卷。當(dāng)源數(shù)據(jù)卷上某數(shù)據(jù)要被更新時,如果該數(shù)據(jù)尚未完成復(fù)制,這些數(shù)據(jù)將首先被復(fù)制到快照卷上,并標(biāo)記控制位圖對應(yīng)的控制位,然后才能更新源數(shù)據(jù)卷的數(shù)據(jù),這種操作稱為寫前復(fù)制,也就是我們前面所提到的CoW;如果要更新的數(shù)據(jù)已經(jīng)完成復(fù)制,則數(shù)據(jù)更新將直接進(jìn)行,不再影響快照卷的操作。寫前復(fù)制技術(shù)確

20、保復(fù)制操作發(fā)生在更新操作之前,使快照時間點(diǎn)后的數(shù)據(jù)更新不會出現(xiàn)在快照卷上,保證了快照操作的原子性。按需復(fù)制快照按需復(fù)制快照在快照時間點(diǎn)之前,不會占用任何的存儲資源,也不會影響系統(tǒng)性能;而且它在使用上非常靈活,可以在任意時間點(diǎn)為任意數(shù)據(jù)卷建立快照。在快照時間點(diǎn),存儲子系統(tǒng)要為快照卷分配存儲空間,并建立控制位圖,因此,產(chǎn)生的“復(fù)制窗口”的長度與源數(shù)據(jù)卷的容量成線性比例,一般為幾秒鐘。通過后臺復(fù)制進(jìn)程和寫前復(fù)制技術(shù),源數(shù)據(jù)卷所有的數(shù)據(jù)塊最終都將被復(fù)制到快照卷,得到源數(shù)據(jù)卷的完整物理副本,但完成這一過程的時間不僅與源數(shù)據(jù)卷的容量有關(guān),而且還受到上層應(yīng)用數(shù)據(jù)訪問的影響,很難準(zhǔn)確估算,可能需要幾個小時甚至

21、更長時間。3.2.3虛擬視圖快照技術(shù)虛擬視圖快照技術(shù)虛擬視圖快照技術(shù)在快照時間點(diǎn)之后,只建立一份快照時刻源數(shù)據(jù)卷的邏輯副本,最終也不會產(chǎn)生完整的物理副本。這種快照技術(shù)也在創(chuàng)建快照時才建立快照卷,但只需分配相對少量的存儲空間,用于保存快照時間點(diǎn)之后源數(shù)據(jù)卷中被更新的數(shù)據(jù)。由于被更新的數(shù)據(jù)通常僅占源數(shù)據(jù)卷容量很小比例,一般建議為每個快照卷保留源數(shù)據(jù)卷20%的空間,如果數(shù)據(jù)更新超過這一比例,快照將失效。在虛擬視圖快照技術(shù)中,每個源數(shù)據(jù)卷都有一個數(shù)據(jù)指針表,該指針表的記錄數(shù)量等于源數(shù)據(jù)卷的數(shù)據(jù)塊數(shù)量,每條記錄保存著指向?qū)?yīng)數(shù)據(jù)塊的指針。在創(chuàng)建快照時,存儲子系統(tǒng)為源數(shù)據(jù)卷的指針表建立一個副本,作為快照卷

22、的數(shù)據(jù)指針表。當(dāng)快照時間點(diǎn)結(jié)束時,快照建立了一個可供上層應(yīng)用訪問的邏輯副本,快照卷與源數(shù)據(jù)卷通過各自的指針表共享同一份物理數(shù)據(jù)。快照創(chuàng)建之后,當(dāng)源數(shù)據(jù)卷中某數(shù)據(jù)將要被更新時,為了保證快照操作的原子性,使用寫前復(fù)制技術(shù):首先將原始數(shù)據(jù)復(fù)制到快照卷的某個數(shù)據(jù)塊,并修改快照卷數(shù)據(jù)指針表的對應(yīng)記錄,使其指向該數(shù)據(jù)塊,最后才能更新源數(shù)據(jù)卷。對快照卷中數(shù)據(jù)的訪問,必須查詢數(shù)據(jù)指針表,根據(jù)對應(yīng)數(shù)據(jù)塊的指針確定所訪問數(shù)據(jù)的物理存儲位置。虛擬視圖快照的工作原理如圖3-2所示虛擬視圖快照技術(shù)的“復(fù)制窗口”的長度也為幾秒鐘,但為快照卷分配的存儲空間卻大大減少;復(fù)制操作只在源數(shù)據(jù)卷發(fā)生更新時才發(fā)生,因此系統(tǒng)開銷比后臺

23、進(jìn)程復(fù)制源數(shù)據(jù)卷的全部數(shù)據(jù)要小得多。但是由于快照卷僅僅保存了源數(shù)據(jù)卷被更新的數(shù)據(jù),此快照技術(shù)無法得到完整的物理副本,它對需要完整物理副本的應(yīng)用是不適用的。3.3 寫前復(fù)制(寫前復(fù)制(CoW)策略)策略我們可以看到,在當(dāng)前的主流快照技術(shù)中,都使用了如下同樣的方法來保證數(shù)據(jù)的一致性。那就是,快照創(chuàng)建之后,當(dāng)源數(shù)據(jù)卷中某數(shù)據(jù)將要被更新時,為了保證快照操作的原子性,均使用了寫前復(fù)制技術(shù)。本小節(jié)我們將專門來討論該策略。下面我們以文件系統(tǒng)快照為例來討論CoW策略19。文件系統(tǒng)快照是整個文件系統(tǒng)某一時刻的靜態(tài)只讀副本。在文件系統(tǒng)快照中采用CoW策略來保證副本的一致性,同時也能較容易地實(shí)現(xiàn)文件系統(tǒng)的活備份。文

24、件系統(tǒng)中的文件和目錄都是由磁盤上的數(shù)據(jù)塊構(gòu)成的,文件系統(tǒng)級的快照是在數(shù)據(jù)塊一級進(jìn)行操作的。圖3-3中顯示了文件系統(tǒng)中的一個文件myfile.dat由磁盤上的3個連續(xù)數(shù)據(jù)塊構(gòu)成,內(nèi)容分別為A,B和C。創(chuàng)建了快照S0后,S0中的myfile.dat仍由活動文件系統(tǒng)中原來的myfile.dat的3個物理塊構(gòu)成。快照的CoW策略基本原理如下:當(dāng)一個用戶修改了該文件的數(shù)據(jù)后,快照S0中就要分配一個空塊,將活動文件系統(tǒng)中的原數(shù)據(jù)塊內(nèi)容C復(fù)制到S0中,然后才將原數(shù)據(jù)塊內(nèi)容C改寫為C'。這樣一來,活動文件系統(tǒng)中myfile.dat的版本就包含數(shù)據(jù)塊A,B和C'。快照中的myfi

25、le.dat舊版本則包含數(shù)據(jù)塊A,B和C。結(jié)果如圖3-4所示。此后如果繼續(xù)有對C塊的操作,則直接對C'進(jìn)行修改,快照中保存的始終是快照開始時刻的文件系統(tǒng)的一個靜態(tài)副本,快照得到的數(shù)據(jù)是一個一致性得到保證的副本,而文件系統(tǒng)此時也可以進(jìn)行正常的工作。文件的完整性和一致性也就都可以得到保證了。前面所提到的當(dāng)前主流快照技術(shù)可以說都是基于數(shù)據(jù)塊層次的,無法保證文件或文件集的數(shù)據(jù)完整性和一致性,同時由于這些技術(shù)往往與存儲設(shè)備相關(guān),實(shí)施代價較高,移植性不好,也不適合我們的容災(zāi)備份系統(tǒng)。所以,為了保證數(shù)據(jù)一致性,本文將要實(shí)現(xiàn)的快照技術(shù)將是基于文件級的熱快照。快照技術(shù)的主要策略分離鏡像(2/3)

26、ApplicationsApp: e.g. BackupWrite Read邏輯數(shù)據(jù)集物理數(shù)據(jù)集應(yīng)用ReadWrite差量數(shù)據(jù)集緩沖區(qū)快照技術(shù)的主要策略分離鏡像(3/3)ApplicationsWrite Read邏輯數(shù)據(jù)集物理數(shù)據(jù)集應(yīng)用差量數(shù)據(jù)集緩沖區(qū)優(yōu):安全性優(yōu):安全性高,響應(yīng)快,高,響應(yīng)快,對系統(tǒng)性能影對系統(tǒng)性能影響小響小缺:空間效率低,缺:空間效率低,可擴(kuò)展性差,快照不可擴(kuò)展性差,快照不適合寫適合寫快照技術(shù)的主要策略寫時拷貝(1/3)ApplicationsWrite Read邏輯數(shù)據(jù)集物理數(shù)據(jù)集應(yīng)用3.3 寫前復(fù)制(寫前復(fù)制(CoW)策略)策略我們可以看到,在當(dāng)前的主流快照技術(shù)中,都

27、使用了如下同樣的方法來保證數(shù)據(jù)的一致性。那就是,快照創(chuàng)建之后,當(dāng)源數(shù)據(jù)卷中某數(shù)據(jù)將要被更新時,為了保證快照操作的原子性,均使用了寫前復(fù)制技術(shù)。本小節(jié)我們將專門來討論該策略。下面我們以文件系統(tǒng)快照為例來討論CoW策略19。文件系統(tǒng)快照是整個文件系統(tǒng)某一時刻的靜態(tài)只讀副本。在文件系統(tǒng)快照中采用CoW策略來保證副本的一致性,同時也能較容易地實(shí)現(xiàn)文件系統(tǒng)的活備份。文件系統(tǒng)中的文件和目錄都是由磁盤上的數(shù)據(jù)塊構(gòu)成的,文件系統(tǒng)級的快照是在數(shù)據(jù)塊一級進(jìn)行操作的。圖3-3中顯示了文件系統(tǒng)中的一個文件myfile.dat由磁盤上的3個連續(xù)數(shù)據(jù)塊構(gòu)成,內(nèi)容分別為A,B和C。創(chuàng)建了快照S0后,S0中的myfile.d

28、at仍由活動文件系統(tǒng)中原來的myfile.dat的3個物理塊構(gòu)成。快照的CoW策略基本原理如下:當(dāng)一個用戶修改了該文件的數(shù)據(jù)后,快照S0中就要分配一個空塊,將活動文件系統(tǒng)中的原數(shù)據(jù)塊內(nèi)容C復(fù)制到S0中,然后才將原數(shù)據(jù)塊內(nèi)容C改寫為C'。這樣一來,活動文件系統(tǒng)中myfile.dat的版本就包含數(shù)據(jù)塊A,B和C'。快照中的myfile.dat舊版本則包含數(shù)據(jù)塊A,B和C。結(jié)果如圖3-4所示。此后如果繼續(xù)有對C塊的操作,則直接對C'進(jìn)行修改,快照中保存的始終是快照開始時刻的文件系統(tǒng)的一個靜態(tài)副本,快照得到的數(shù)據(jù)是一個一致性得到保證的副本,而文件系統(tǒng)此時

29、也可以進(jìn)行正常的工作。文件的完整性和一致性也就都可以得到保證了。前面所提到的當(dāng)前主流快照技術(shù)可以說都是基于數(shù)據(jù)塊層次的,無法保證文件或文件集的數(shù)據(jù)完整性和一致性,同時由于這些技術(shù)往往與存儲設(shè)備相關(guān),實(shí)施代價較高,移植性不好,也不適合我們的容災(zāi)備份系統(tǒng)。所以,為了保證數(shù)據(jù)一致性,本文將要實(shí)現(xiàn)的快照技術(shù)將是基于文件級的熱快照。快照技術(shù)的主要策略寫時拷貝(2/3)ApplicationsApp: e.g. BackupWrite Read邏輯數(shù)據(jù)集物理數(shù)據(jù)集應(yīng)用ReadWrite快照技術(shù)的主要策略寫時拷貝(3/3)ApplicationsApp: e.g. BackupWrite Read邏輯數(shù)據(jù)集

30、物理數(shù)據(jù)集應(yīng)用ReadWrite1:Copy2:Write優(yōu):空間優(yōu):空間效率高,快效率高,快照可讀寫,照可讀寫,可擴(kuò)展性好,可擴(kuò)展性好,易改進(jìn)易改進(jìn)缺:缺:COW操作影響系操作影響系統(tǒng)性能統(tǒng)性能快照技術(shù)的主要策略寫重定向(1/4)ApplicationsWrite Read邏輯數(shù)據(jù)集物理數(shù)據(jù)集應(yīng)用快照技術(shù)的主要策略寫重定向(2/4)ApplicationsWriteRead邏輯數(shù)據(jù)集物理數(shù)據(jù)集應(yīng)用App: e.g. BackupReadWrite快照技術(shù)的主要策略寫重定向(3/4)快照技術(shù)的主要策略寫重定向(4/4)ApplicationsWrite Read邏輯數(shù)據(jù)集物理數(shù)據(jù)集應(yīng)用App:

31、 e.g. BackupReadWriteROW優(yōu):空間優(yōu):空間效率高,快效率高,快照可讀寫,照可讀寫,響應(yīng)快,可響應(yīng)快,可擴(kuò)展擴(kuò)展缺:物理缺:物理數(shù)據(jù)交疊,數(shù)據(jù)交疊,映射關(guān)系維映射關(guān)系維護(hù)復(fù)雜護(hù)復(fù)雜數(shù)據(jù)備份方法數(shù)據(jù)備份方法 熱備份(Hot Backup): 應(yīng)用服務(wù)不中斷. 冷備份(Cold Backup): 應(yīng)用服務(wù)被中斷. 一般通過備份代理管理備份不同類型的數(shù)據(jù):結(jié)構(gòu)化數(shù)據(jù) (such as databases)半結(jié)構(gòu)化數(shù)據(jù) (such as email)非結(jié)構(gòu)化數(shù)據(jù) (file systems)Backing up datab can occur useing two differen

32、t methods:A Hot backup, which means that the application is still up and running, with users accessing it, while backup is taking place.A Cold backup, which means that the application will be shut down for the backup to take place.Most backup applications offer various Backup Agents to do these kind

33、s of operations. There will be different agents for different types of data and applications. 40備份的分類和級別備份的分類和級別全備份(全備份(Full Backup)累積(差分)備份(累積(差分)備份(Cumulative Cumulative (Differential(Differential) ))增量備份(增量備份(IncrementalIncremental)FullCumulativeIncremental數(shù)據(jù)備份中的去重42 重復(fù)數(shù)據(jù)刪除(Deduplication) 重刪級別:Fi

34、le,Block 數(shù)據(jù)指紋: MD5, SHA-1, SHA-256, SHA-512 重刪后的數(shù)據(jù)恢復(fù)連續(xù)數(shù)據(jù)保護(hù) (CDP) SNIA對連續(xù)數(shù)據(jù)保護(hù)(CDP)的定義:CDP是這樣一種方法,它在不影響主要數(shù)據(jù)運(yùn)行的前提下,可以實(shí)現(xiàn)持續(xù)捕捉或跟蹤目標(biāo)數(shù)據(jù)所發(fā)生的任何改變,并且能夠恢復(fù)到此前任意時間點(diǎn)。連續(xù)數(shù)據(jù)保護(hù)系統(tǒng)可以基于塊、文件或應(yīng)用實(shí)現(xiàn),可以為恢復(fù)對象提供足夠細(xì)的恢復(fù)粒度,實(shí)現(xiàn)幾乎無限多的恢復(fù)時間點(diǎn) 三種實(shí)現(xiàn)方式:基準(zhǔn)參考數(shù)據(jù)模式、復(fù)制參考數(shù)據(jù)模式、合成參考數(shù)據(jù)模式 產(chǎn)品方案:基于應(yīng)用,基于文件,基于數(shù)據(jù)塊的CDPCDP是一個實(shí)時的數(shù)據(jù)備份系統(tǒng),它自動地將應(yīng)用數(shù)據(jù)的所有變化實(shí)時的紀(jì)錄下來。它的關(guān)鍵是將每一個應(yīng)用數(shù)據(jù)的變化加上了時間索引。這樣,當(dāng)出現(xiàn)數(shù)據(jù)丟失、數(shù)據(jù)損壞、或者安全問題時,就可能恢復(fù)到最近的完好數(shù)據(jù)。持續(xù)數(shù)據(jù)保護(hù)1基于應(yīng)用實(shí)現(xiàn)持續(xù)數(shù)據(jù)保護(hù) 對需要保護(hù)的關(guān)鍵應(yīng)用程序,可以在其中直接嵌入和運(yùn)行CDP功能。這種實(shí)現(xiàn)CDP的方式首先能夠和應(yīng)用進(jìn)行深度整合,確保應(yīng)用數(shù)據(jù)在持續(xù)保護(hù)中的一致性。CDP功能可以由軟件廠商將其直接嵌入在軟件產(chǎn)品中,也可以是軟件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論