云計算基礎知識整理_第1頁
云計算基礎知識整理_第2頁
云計算基礎知識整理_第3頁
云計算基礎知識整理_第4頁
云計算基礎知識整理_第5頁
已閱讀5頁,還剩4頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1. 云計算是對(D )技術的發展與運用A.并行計算B網格計算 C分布式計算 D三個選項都是2. IBM在2007年11月退出了 “改進游戲規則”的(A )計算平臺,為客戶帶來即買即用的云計算平臺。A.藍云 B.藍天 C. ARUZE D. EC23. 微軟于2008年10月推出云計算操作系統是( C)A. Google App EngineB.藍云 C. Azure D. EC24. 2008年,(A )先后在無錫和北京建立了兩個云計算中心A. IBM B. Google C. Amazon D. 微軟5. 將平臺作為服務的云計算服務類型是(B)A. IaaS B.PaaS C.SaaS D

2、.三個選項都不是6. 將基礎設施作為服務的云計算服務類型是( A)A. IaaS B.PaaS C.SaaS D.三個選項都不是7. IaaS計算實現機制中,系統管理模塊的核心功能是(A)A.負載均衡B監視節點的運行狀態 C應用API D.節點環境配置8. 云計算體系結構的(C )負責資源管理、任務管理用戶管理和安全管理等工作A.物理資源層 B.資源池層 C.管理中間件層 D. SOA構建層9. 云計算按照服務類型大致可分為以下類(A、B、C)A.IaaS B. PaaS C. SaaSD.效用計算10. 下列不屬于Google云計算平臺技術架構的是( D)A.并行數據處理 MapReduce

3、B.分布式鎖 Chubby C.結構化數據表BigTableD.彈性云計算EC211. 在目前GFS集群中,每個集群包含(B )個存儲節點A.幾百個 B.幾千個 C.幾十個 D.幾十萬個12. 下列選項中,哪條不是GFS選擇在用戶態下實現的原因( D )A.調試簡單B.不影響數據塊服務器的穩定性C.降低實現難度,提高通用性 D.容易擴展13. GFS中主服務器節點存儲的元數據包含這些信息(BCD )A.文件副本的位置信息B.命名空間C. Chunk與文件名的映射 D. Chunk副本的位置信息14. 單一主服務器(Master)解決性能瓶頸的方法是(ABCD )A.減少其在數據存儲中的參與程度

4、B.不適用Master讀取數據C.客戶端緩存元數據D.采用大尺寸的數據塊15. ( B )是Google提出的用于處理海量數據的并行編程模式和大規模數據集的并行運算的軟件架構。A. GFS B.MapReduce C.Chubby D.BitTable16. Mapreduce 適用于 (D )A.任意應用程序B.任意可在windows servet2008上運行的程序C.可以串行處理的應用程序 D.可以并行處理的應用程序17. MapReduce通常把輸入文件按照( C ) MB來劃分 A. 16B32C64D12818. 與傳統的分布式程序設計相比,Map reduce封裝了 ( ABCD

5、 )等細節,還提供了一個簡單而強大的接口。A.并行處理 B.容錯處理 C.本地化計算 D.負載均衡佃.(D )是Google的分布式數據存儲于管理系統A. GFS B. MapReduce C. Chubby D.Bigtable20. 在 Bigtable 中,(A )主要用來存儲子表數據以及一些日志文件 A. GFS B. Chubby C.SSTable D.MapReduce21. Google APP Engine使用的數據庫是(C )A.改進的 SQLServer B. Orack C. Date storeD.亞馬遜的 SimpleDB22. Google APP Engine目

6、前支持的編程語言有(AD ) A. Python語言 B. C+語言 C.匯編語言D. JAVA語言23. 亞馬遜 AWS采用 (A )虛擬化技術A.未使用 B. Hyper-V C. Vmware D. Xen24. 亞馬遜將區域分為(AC)A地理區域 B不可用區域 C可用區域 D隔離區域25. 下面選項屬于Amazon提供的云計算服務是(ABC)A.彈性云計算EC2 B簡單存儲服務S3 c簡單隊列服務SQS D.Net服務26. 不屬于彈性計算云 EC2包含的IP地址的是(C)A.公共IP地址B.私有IP地址 C.隧道IP地址 D.彈性IP地址27. 在EC2的安全與容錯機制中,一個用戶目

7、前最多可以創建(B )安全組。A. 50 B. 100 C. 150 D. 20028. EC2常用的API包含下列哪些類型的操作(ABCD )A.AMI B.安全組 C實例 D彈性IP地址29. S3的基本存儲單元是(B) A.服務 B.對象 C.卷 D.組30. S3采用的專門安全措施是(AB)A.身份認證B.訪問控制列表 C防火墻 D防木馬病毒技術31. 在云計算系統中,提供“云端”服務模式是( D)公司的云計算服務平臺。A. IBM B. GOOGLE C. Amax on D. 微軟32. 下列四種云計算方案中,服務間的耦合度最高的是(C)A.亞馬遜 AWS B.微軟 AZURE C

8、. Google APP Engine D. IBM 的“藍云”33. 云格可以完成的服務有(ABCD )A.數據處理服務 B.格處理服務 C.高性能計算服務 D.協作服務34. 亞馬遜AWS提供的云計算服務類型是(D)A. IaaS B. PaaS C.SaaS D.三個選項都是35. Google文件系統將整個系統的節點分為( ABC )的角色A.客戶端 B.主服務器C.數據塊服務器D.監測服務器36. Google文件系統具有(ABD )特點A.采用中心服務器模式B不緩存數據C.采用邊緣服務器模式D在用戶態下實現37. Google不緩存數據的原因是(ABCD )A. OFS的文件操作大

9、部門是流式讀寫;B.維護緩存與實際數據之間的一致性太復雜C.不存在大量的重復讀寫D.數據塊服務器上的數據存取使用本地文件系統38. 從研究現狀上看,下面不屬于云計算特點的是(C ) A.超大規模B.虛擬化 C.私有化D.高可靠性39. 與網絡計算相比,不屬于云計算特征的是(B )A.資源高度共享 B.適合緊耦合科學計算C.支持虛擬機 D.適用于商業領域一,填空題 (30分)云計算是以公開的標準和服務為基礎,以互聯網 為中心,提供安全、快速、便捷的數據存儲和網絡計算服務,讓互聯網這片"云"成為每一個網民的數據中心和計算中心。對提供者而言,云計算可以三種部署模式,即 公有云、私

10、有云和混合云。當前,幾乎所有的知名IT提供商、互聯網提供商,甚至電信運營商都在向云計算進軍,都 在提供相關的云服務。但歸納起來,當前云提供者可以分為三大類,即SaaS提供商、PaaS和IaaS提供商。5.云計算(Cloud Computing ): 一種利用大規模低成本運算單元通過IP網絡連接,以提供各種計算和存儲服務的IT技術。二,選擇題(可多選)(50分)1云計算的特點?( ABCDE)A .大規模 B.平滑擴展C資源共享 D.動態分配 E.跨地域2.寶德存儲云解決方案價值有哪些?( ABCD) A.海量小文件的高效管理B. PB級的存儲空間和線行擴展能力C.可動態提升的性能D.數據高可靠

11、性3目前,選用開源的虛擬化產品組建虛擬化平臺,構建基于硬件的虛擬化層,可以選用( BCD ) A .Xen B.VMware C. Hyper-v D. Citrix4在云計算中,虛擬層主要包括( ABC ) A.服務器虛擬化 B.存儲虛擬化C.網絡虛擬化 D.桌面虛擬化7. 未來云計算服務面向那些客戶? ( ABCDE ) A.個人B.企業C.政府 D.教育E.研究所8. 云安全主要的考慮的關鍵技術有哪些? ( ABC ) A.數據安全 B.應用安全C.虛擬化安 全D.服務器安全由于云計算分為laaS、PaaS和SaaS三種類型,不同的廠家又提供了不同的解決方案,目 前還沒有一個統一的技術體

12、系結構,對讀者了解云計算的原理構成了障礙。為此,本文綜合不同廠家的方案,構造了一個供商榷的云計算體系結構。這個體系結構如圖3所示,它概括了不同解決方案的主要特征,每一種方案或許只實現了其中部分功能,或許也還有部分相對次要功能尚未概括進來。用戶骨理嶽號管理用戶環境配置J用戶龍互骨理使用計鱉枉務管理k1映憾部罟和野理任務調度任務抉療生“曾理1安全麗卅廣 安全管理故障檢S!鯊輒統計.細晉理rSOA構建屋眼務接口(畛注冊腮務杳找.JI 軽務王作酒管理中問料計算資源油存鶴資諫池網絡資源池Vr物理竊瀝計 Lj軟件1圖3云計算技術體系結構云計算技術體系結構分為 4層:物理資源層、資源池層、管理中間件層和SO

13、A構建層,如圖3所示。物理資源層包括計算機、存儲器、網絡設施、數據庫和軟件等;資源池層是將大 量相同類型的資源構成同構或接近同構的資源池,如計算資源池、數據資源池等。構建資源池更多是物理資源的集成和管理工作,例如研究在一個標準集裝箱的空間如何裝下2000個服務器、解決散熱和故障節點替換的問題并降低能耗;管理中間件負責對云計算的資源進行管理,并對眾多應用任務進行調度,使資源能夠高效、安全地為應用提供服務;SOA構建層將云計算能力封裝成標準的Web Services服務,并納入到 SOA體系進行管理和使用,包括服務注冊、查找、訪問和構建服務工作流等。管理中間件和資源池層是云計算技術的最關 鍵部分,

14、SOA構建層的功能更多依靠外部設施提供。云計算的管理中間件負責資源管理、任務管理、用戶管理和安全管理等工作。資源管理負責均衡地使用云資源節點,檢測節點的故障并試圖恢復或屏蔽之,并對資源的使用情況進行監視統計;任務管理負責執行用戶或應用提交的任務,包括完成用戶任務映象(Image)的部署和管理、任務調度、 任務執行、任務生命期管理等等;用戶管理是實現云計算商業模式的一 個必不可少的環節,包括提供用戶交互接口、管理和識別用戶身份、 創建用戶程序的執行環境、對用戶的使用進行計費等;安全管理保障云計算設施的整體安全,包括身份認證、訪問授權、綜合防護和安全審計等。基于上述體系結構,本文以IaaS云計算為

15、例,簡述云計算的實現機制,如圖4所示。用戶交互接口向應用以 Web Services方式提供訪問接口,獲取用戶需求。服務目錄是用戶可 以訪問的服務清單。系統管理模塊負責管理和分配所有可用的資源,其核心是負載均衡。配置工具負責在分配的節點上準備任務運行環境。監視統計模塊負責監視節點的運行狀態,并完成用戶使用節點情況的統計。執行過程并不復雜:用戶交互接口允許用戶從目錄中選取并調用一個服務。該請求傳遞給系統管理模塊后,它將為用戶分配恰當的資源,然后調用配置工具來為用戶準備運行環境。Hadoop HDFS特性簡介一、設計思想1硬件失效是“常態事件“,而非“偶然事件”。HDFS可能是有上千的機器組成(文

16、檔中描述的Yahoo! 個Hadoop集群有4096個節點),任何一個組件都有可能一直失效,因此 數據的健壯性錯誤檢測和快速、自動的恢復是HDFS的核心架構目標。2、 流式數據訪問。運行在HDFS上的應用和普通的應用不同,需要流式訪問它們的數據集。 HDFS的設計中更多的考慮到了數據批處理,而不是用戶交互處理。比之數據訪問的低延遲問題,更關鍵的在于數據并發訪問的高吞吐量。POSIX標準設置的很多硬性約束對HDFS應用系統不是必需的。為了提高數據的吞吐量,在一些關鍵方面對POSIX的語義做了一些修改。3、 HDFS應用對文件要求的是 write-o ne-read-ma ny 訪問模型。一個文件

17、經過創建、寫, 關閉之后就不需要改變。這一假設簡化了數據一致性問題,使高吞吐量的數據訪問成為可能。典型的如MapReduce框架,或者一個 web crawler應用都很適合這個模型。4、移動計算的代價比之移動數據的代價低。一個應用請求的計算,離它操作的數據越近就越高效,這在數據達到海量級別的時候更是如此。將計算移動到數據附近,比之將數據移動到應用所在顯然更好,HDFS提供給應用這樣的接口。5、在異構的軟硬件平臺間的可移植性。二、Name node 和 Data node 的劃分一個HDFS集群有一個Name node和一定數目的 Data node組成。Name node是一個中心服務器,負

18、責管理文件系統的namespace和客戶端對文件的訪問。Data node在集群中會有多個,一般是一個節點存在一個,負責管理其自身節點上它們附帶 的存儲。在內部,一個大文件其分成一個或多個block,這些block存儲在Data node集合里。Name node執行文件系統的 namespace相關操作,例如打開、關閉、重命名文件和目錄, 同時決定了 block到具體Data node節點的映射。Data node在Name node的指揮下進行 block 的創建、刪除和復制。單一節點的Name node大大簡化了系統的架構。 Name node負責保管和管理所有的 HDFS元數 據,因而

19、在請求Name node得到文件的位置后就不需要通過 Name node參與而直接從Data node 進行。為了提高Name node的性能,所有文件的 namespace數據都在內存中維護,所以就天生存在 了由于內存大小的限制導致一個HDFS集群的提供服務的文件數量的上限。根據目前的文檔,一個元數據(一個HDFS文件塊兒)占用200Bytes,如果是頁面抓取的小文件,那么32GB內存能承載1.5億左右的文件存儲(有待精確詳細測試)。三、 文件系統操作和namespace的關系HDFS支持傳統的層次型文件組織,與大多數其他文件系統類似,用戶可以創建目錄,并在 其間創建、刪除、移動和重命名文件

20、。HDFS不支持user quotas 和訪問權限,也不支持鏈接(li nk),不過當前的架構并不排除實現這些特性。Name node維護文件系統的namespace,任何對文件系統 namespace和文件屬性的修改都將被 Name node記錄下來。應用可以設置 HDFS保存的文件的副本數目,文件副本的數目稱為文件的replicatio n因子,這個信息也是由Name node保存。四、數據復制HDFS被設計成在一個大集群中可以跨機器地可靠地存儲海量的文件。它將每個文件存儲成 block序列,除了最后一個 block,所有的block都是同樣的大小。文件的所有block為了容錯都會被復制。

21、每個文件的block大小和replication因子都是可配置的。Replication因子可以在文件創建的時候配置,以后也可以改變。HDFS中的文件是 write-one ,并且嚴格要求在任何時候只有一個writer 。 Name node全權管理block的復制,它周期性地從集群中的每個Data node接收心跳包和一個 Blockreport 。心跳包的接收表示該 Data node節點正常 工作,而 Blockreport 包括了該 Data node上所有的block組成的列表。1、 副本的存放,副本的存放是 HDFS可靠性和性能的關鍵。龐大的 HDFS實例一般運行在多 個機架的計算

22、機形成的集群上, 不同機架間的兩臺機器的通訊需要通過交換機,顯然通常情 況下,同一個機架內的兩個節點間的帶寬會比不同機架間的兩臺機器的帶寬大。在大多數情況下,replication因子是3, HDFS的存放策略是將一個副本存放在本地機架上的節點,一個副本放在同一機架上的另一個節點,最后一個副本放在不同機架上的一個節點。機架的錯誤遠遠比節點的錯誤少,這個策略不會影響到數據的可靠性和有效性。三分之一的副本在一個節點上,三分之二在一個機架上,其他保存在剩下的機架中,這一策略改進了寫的性能。2、 畐環的選擇,為了降低整體的帶寬消耗和讀延時,HDFS會盡量讓reader讀最近的副本。 如果在reader

23、的同一個機架上有一個副本, 那么就讀該副本。如果一個HDFS集群跨越多個 數據中心,那么reader也將首先嘗試讀本地數據中心的副本。3、SafeModeName node啟動后會進入一個稱為SafeMode的特殊狀態,處在這個狀態的Name node是不會進行數據塊的復制的。Name node從所有的 Data node接收心跳包和 Blockreport 。Blockreport 包括了某個Data node所有的數據塊列表。每個block都有指定的最小數目的副本。當Name node僉測確認某個 Data node的數據塊副本的最小數目,那么該 Data node就 會被認為是安全的;如

24、果一定百分比(這個參數可配置)的數據塊檢測確認是安全的,那么Name node將退出SafeMode狀態,接下來它會確定還有哪些數據塊的副本沒有達到指定數目, 并將這些block復制到其他Data node。五、文件系統元數據的持久化Name node存儲HDFS的元數據。對于任何對文件元數據產生修改的操作,Name node都使用一個稱為Editlog 的事務日志記錄下來。例如,在HDFS中創建一個文件,Name node就會在Editlog 中插入一條記錄來表示;同樣,修改文件的replication 因子也將往Editlog 插入一條記錄。Name node在本地OS的文件系統中存儲這個

25、Editlog。整個文件系統的 namespace,包括block到文件的映射、文件的屬性,都存儲在稱為FsImage的文件中,這個文件也是放 在Name node所在系統的文件系統上。Name node在內存中保存著整個文件系統 namespace和文件Block map的映像。這個關鍵的元 數據設計得很緊湊,一般為 200Bytes的內存占用,因而一個帶有 4G內存的Name node足夠 支撐海量的文件和目錄。當 Name node啟動時,它從硬盤中讀取 Editlog 和FsImage,將所 有Editlog 中的事務作用(apply)在內存中的FsImage,并將這個新版本的 FsI

26、mage從內 存中flush到硬盤上,然后再truncate 這個舊的Editlog ,因為這個舊的 Editlog 的事務都 已經作用在FsImage上了。這個過程稱為 checkpoint。在當前實現中,checkpoint只發生 在Name node啟動時,在不久的將來我們將實現支持周期性的checkpoi nt 。Data node并不知道關于文件的任何東西,除了將文件中的數據保存在本地的文件系統上。它把每個HDFS數據塊存儲在本地文件系統上隔離的文件中。Data node并不在同一個目錄創建所有的文件,相反,它用啟發式地方法來確定每個目錄的最佳文件數目,并且在適當的時候創建子目錄。在

27、同一個目錄創建所有的文件不是最優的選擇,因為本地文件系統可能無法高效地在單一目錄中支持大量的文件。當一個Data node啟動時,它掃描本地文件系統,對這些本地文件產生相應的一個所有HDFS數據塊的列表,然后發送報告到Name node這個報告就是 Blockreport 。六、通訊協議所有的HDFS通訊協議都是構建在 TCP/IP協議上。客戶端通過一個可配置的端口連接到Name node 通過 Clie ntProtocol 與 Name node 交互。而 Data node 是使用 Data no deProtocol 與 Name node交互。從 Clie ntProtocol 和

28、Data nodeprotocol 抽象出一個遠程調用(RPC), 在設計上,Name node不會主動發起 RPC而是是響應來自客戶端和 Data node的RPC青求。七、健壯性HDFS的主要目標就是實現在失敗情況下的數據存儲可靠性。常見的三種失敗:Name nodefailures, Data node failures禾口網絡分割(n etwork partiti ons)。1硬盤數據錯誤、心跳檢測和重新復制 每個Data node節點都向Name node周期性地發送心跳包。 網絡切割可能導致一部分Data node跟Name node失去聯系。Name node通過心跳包的缺失檢測

29、到這一情況,并將這些Data node標記為dead,不會將新的IO請求發給它們。寄存在 dead Data node上的任何數據將不再有 效。Data node的死亡可能引起一些block的副本數目低于指定值,Name node不斷地跟蹤需要復制的block,在任何需要的情況下啟動復制。在下列情況可能需要重新復制:某個Data node節點失效,某個副本遭到損壞,Data node上的硬盤錯誤,或者文件的replicati on 因子增大。2、集群均衡HDFS支持數據的均衡計劃,如果某個Data node節點上的空閑空間低于特定的臨界點,那么就會啟動一個計劃自動地將數據從一個Data nod

30、e搬移到空閑的Data node。當對某個文件的請求突然增加,那么也可能啟動一個計劃創建該文件新的副本,并分布到集群中以滿足應用的要求。這些均衡計劃目前還沒有實現。3、數據完整性從某個Data node獲取的數據塊有可能是損壞的,這個損壞可能是由于Data node的存儲設備錯誤、網絡錯誤或者軟件bug造成的。HDFS客戶端軟件實現了 HDFS文件內容的校驗和。當某個客戶端創建一個新的HDFS文件,會計算這個文件每個block的校驗和,并作為一個單獨的隱藏文件保存這些校驗和在同一個HDFS namespace下。當客戶端檢索文件內容,它會確認從Data node獲取的數據跟相應的校驗和文件中的

31、校驗和是否匹配,如果不匹配,客戶 端可以選擇從其他 Data node獲取該block的副本。4、元數據磁盤錯誤FsImage和Editlog是HDFS的核心數據結構。這些文件如果損壞了,整個HDFS實例都將失效。因而,Name node可以配置成支持維護多個FsImage和Editlog 的拷貝。任何對 FsImage或者Editlog的修改,都將同步到它們的副本上。這個同步操作可能會降低Name node每秒能支持處理的namespace事務。這個代價是可以接受的,因為HDFS是數據密集的,而非元數據密集。當 Name node重啟的時候,它總是選取最近的一致的FsImage和Editlo

32、g 使用。Name node在HDFS是單點存在,如果 Name node所在的機器錯誤,手工的干預是必須的。目 前,在另一臺機器上重啟因故障而停止服務的Name node這個功能還沒實現。八、數據組織1數據塊兼容HDFS勺應用都是處理大數據集合的。這些應用都是寫數據一次,讀卻是一次到多次,并且讀的速度要滿足流式讀。 HDFS支持文件的 write-onee , read-many。一個典型的 block 大小是64MB因而,文件總是按照 64M切分成chunk,每個chunk存儲于不同的 Data node 上。2、數據產生步驟某個客戶端創建文件的請求其實并沒有立即發給Name node事實上,HDFS客戶端會將文件數據緩存到本地的一個臨時文件。應用的寫被透明地重定向到這個臨時文件。當這個臨時文件累積的數據超過一個 block的大小(默認64M),客戶端才會聯系 Name node Name node將 文件名插入文件系統的層次結構中,并且分配一個數據塊給它,然后返回Data node的標識符和目標數據塊給客戶端。客戶端將本地臨時文件flush到指定的Data node上。當文件關閉時,在臨時文件中剩余的沒有flush的數據也會傳輸到指定的Data node,然后客戶端告訴Name node文件已經關閉。此時 Na

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論