




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Hadoop大數據項目開發——Hadoop生態系統目錄content02MapRedcue01HDFS03YARN04ZooKeeper05Hive07Sqoop06HBase08Kafka09FlumeHadoop生態系統簡介Hadoop生態系統圖HDFS:分布式文件系統成百上千臺服務器完成海量數據存儲和管理。可以運行在廉價的個人計算機集群上。HDFS負責整個分布式文件的存儲YARN:資源調度YARN負責資源的管理和調度例如內存,CPU,帶寬等需要YARN統一調度。海量數據在HDFS存儲后,需要進行相關的處理,但是處理之前,需要一個計算的框架去調度資源,底層那么多資源,需要YARN框架進行調度。MapReduce:分布式文件計算不是實時計算,是負責離線,批處理計算的。用戶只需實現Map和Reduce兩個函數就可以完成分布式計算任務。MapReduce解決海量數據的計算問題Hive:數據倉庫Hive是Hadoop的數據倉庫。用于離線分析用于企業的決策分析ZooKeeper:協調服務用于統一維護配置信息、域名,提供分布式同步、組服務等可以用來搭建高可用集群。Hive是分布式應用程序協調服務。HBase:非結構化數據庫面向列的分布式開源數據庫。隨機讀寫,支持實時應用。HBase是非關系型數據庫。HBase是Hadoop的非結構化數據庫。Flume:日志收集訪問阿里巴巴、淘寶時的數據流都是實時生成的,需要進行實時分析,必須有一套工具把它收集過來,Flume就是幫助進行日志收集的。Flume負責日志收集Sqoop:數據導入導出Sqoop專門用于把關系型數據庫中的相關產品導入到Hadoop平臺上的HDFS、HBASE、HIVE數據庫;反之,用Sqoop把Hadoop平臺上的HDFS、HBASE、HIVE中的數據導出到關系型數據庫中。Sqoop負責數據的導入導出Kafka:開源流處理平臺是一個開源流處理平臺,由Scala和Java編寫。是一種高吞吐量的分布式發布訂閱消息系統。它可以處理消費者在網站中的所有動作流數據。本節小結本節
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 空調行業發展趨勢與未來市場前景解析
- 滑雪場項目發展潛力分析報告
- 孫景坤事跡交流發言材料
- 解除委托協議告知函
- 開放式課堂與學生主體地位計劃
- 2025年國際金融理財師考前復習策略的多樣性與靈活性試題及答案
- 《絲綢名人傳》課件-項目三 產業發展與管理
- 實戰演練2024小語種證書考試試題及答案
- 體育場館的安全保障體系計劃
- 創造力重塑的工作環境計劃
- 2022可調節負荷并網運行與控制技術規范+第4部分-數據模型與存儲
- 《食品生產經營企業落實食品安全主體責任監督管理規定》解讀與培訓
- 2025-2030中國內聯pH傳感器行業市場發展趨勢與前景展望戰略研究報告
- 創傷現場急救課件
- 2025年云南德宏州宏康投資開發有限公司招聘筆試參考題庫含答案解析
- 勞動與烹飪課件
- 高血壓、2型糖尿病、高脂血癥、肥胖癥膳食運動指導要點基層醫務人員應用實操手冊
- 2024內蒙古能源集團校園招聘394人筆試參考題庫附帶答案詳解
- 交通設計(Traffic Design)知到智慧樹章節測試課后答案2024年秋同濟大學
- 2024年畢節市金沙縣全縣考調機關單位事業單位人員考試真題
- 水利系統職稱考試水利專業技術人員職稱考試題(附答案)
評論
0/150
提交評論