管理集群的工作負載_第1頁
管理集群的工作負載_第2頁
管理集群的工作負載_第3頁
管理集群的工作負載_第4頁
管理集群的工作負載_第5頁
已閱讀5頁,還剩5頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

主講:朱佳目錄01管理集群的工作負載管理集群的工作負載1管理集群的工作負載作為一個Hadoop管理員,一個關鍵任務是平衡工作負載,以便滿足SLA和用戶的期望。Hadoop提供了幾個非常強大的資源調度器(公平調度器和容量調度器)來管理集群的工作負載。管理集群的工作負載Hadoop資源調度器是負責將任務分配給各種DataNodes.上的可用YARN容器的組件。調度器是ResourceManager中的一個插件。可以將Hadoop調度器視為一個工具,它使集群的多個租戶共享集群,并以有效和及時的方式使用集群資源,同時它還注意集群的總分配容量。在這種情況下資源通常指內存(RAM)和處理能力(CPU內核),盡管未來版本會將磁盤存儲作為資源。管理集群的工作負載假設有一個典型的場景,在這個場景中需要滿足不同SLA的各種用戶組。除了這些用戶組之外,還有幾個數據科學家可以在集群中執行長時間運行的作業,這些作業可能需要24小時或更長時間才能完成。需要嚴格滿足SLA的用戶無法接受任務運行超過工作窗口,而數據科學家和分析師希望我們公平地分配資源,不至于使他們的任務一直運行。管理集群的工作負載這里最大的問題是,如果為數據科學家提供大量資源(他們的工作將占用大量資源,他們的數據集通常非常大),則有嚴格SLA要求的關鍵任務將超過為其分配的工作窗口。管理集群的工作負載我們使用基于Hadoop資源調度器之一的資源分配策略(具體來說就是公平調度器,這是下一節的主題),并使用權重和其他優先級分配策略來確保SLA的作業按時完成。如果這些作業沒有運行,則為數據科學家分配的資源會增多,因此他們的工作可以在合理的時間內完成。管理集群的工作負載注意容量調度器是ApacheHadoop的默認調度器,而對于某些Hadoop發行版,如Cloud

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論