課件yarn支持的計算框架_第1頁
課件yarn支持的計算框架_第2頁
課件yarn支持的計算框架_第3頁
課件yarn支持的計算框架_第4頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Hadoop大數據解決方案進階應用Hadoop講師:迪倫(北風網 )YARN支持的計算框架(3) Storm On YARN服務 Apache Tez介紹 Tez實現原理課程目標YARN-Storm ApplicationMasterStorm ApplicationMaster初始化時,將在同一個Container中啟動Storm Nimbus和Storm Web UI兩個服務根據待啟動的Supervisor數目向ResourceManager申請資源ApplicationMaster將請求一個節點上所有資源然后啟動Supervisor服務也就是說,當前Supervisor將獨占節點而不會與

2、其他服務共享節點資源,這種情況下可避免其他服務對Storm集群的干擾Storm ApplicationMaster還會啟動一個Thrift Server以處理來自YARN-Storm Client端的各種請求當前Storm On YARN存在的問題難以將所有Storm服務運行在相鄰的節點上,比如同一個機架上由于Nimbus服務運行在ApplicationMaster上,而一旦ApplicationMaster失敗后,YARN會將它運行在另外一個節點上YARN需要提供一個ApplicationMaster或Nimbus位置獲取服務,客戶端直接通過該服務獲取Nimbus位置即可NodeManage

3、r本身無法支持動態升級Apache Tez是什么Tez是Apache開源的支持DAG作業的計算框架直接源于MapReduce框架,核心思想是將Map和Reduce兩個操作進一步拆分Map被拆分成Input、Processor、Sort、Merge和Output Reduce被拆分成Input、Shuffle、Sort、Merge、Processor和Output分解后的元操作可以任意靈活組合,產生新的操作,這些操作經過一些控制程序組裝后,可形成一個大的DAG作業天生融入Hadoop 2.0中的資源管理平臺YARNTez主要由兩部分組成數據處理引擎DAGAppMaster傳統的MR運行過程包括H

4、ive,Pig和直接編寫MR程序采用Tez的運行過程使用MapReduce和Tez解決WordCount問題Tez特點與MapReduce兼容,繼承了MapReduce的各種優點(比如良好的擴展性和容錯性)運行在YARN之上適用于DAG(有向圖)應用Apache當前有頂級項目Oozie用于DAG作業設計,但Oozie是比較高層(作業層面)的Tez在更底層提供了DAG編程接口,用戶編寫程序時直接采用這些接口進行程序設計,這種更底層的編程方式會帶來更高的效率Tez數據處理引擎Tez提供了6中可編程組件,實現了一些常見的算法和組件Input:對輸入數據源的抽象,類似于MR模型中的InputFormat,它解析輸入數據格式,并吐出一個個Key/valueOutput:對輸出數據源的抽象,類似于MR模型中的OutputFormat,它將用戶程序產生的Key/value寫入文件系統Partitioner:對數據進行分片,類似于MR中的PartitionerProcessor:對計算單元的抽象,它從一個Input中獲取數據,經用戶定義的邏輯處理后,通過Output輸出到文件系統Task:對任務的抽象,每

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論