




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、大數據學習問題及答案匯總1. HDFS管道流方式導入,如何轉變成文件存儲 答:寫入文件的過程比讀取較為復雜:使用HDFS提供的客戶端開發庫 Client,向遠程的Namenode 發起RPC請求;Namenode會檢查要創建的文件是否已經存在,創建者是否 有權限進行操作,成功則會為文件創建一個記錄,否則會讓客戶端拋出異常;當客戶端開始寫入文件的時候,開發庫會將文件切分成多個packets,并在內 部以數據隊 歹!J "data queue"的形式 管理這些 packets,并向 Namenode申請新的 blocks,獲取用來存儲 replicas 的合適的datanode
2、s列表,列表的大小根據在Namenode中對replication的設置而定。開始以pipeline (管道)的形式將packet寫入所有的replicas 中。開發庫把packet以流的方式寫入第一個 datanode,該datanode 把該packet存儲之后,再將其傳遞給在此 pipeline中的下一個 datanode,直到最后一個 datanode,這種寫數據的方式呈流水線 的形式。最后一個datanode成功存儲之后會返回一個 ack packet,在 pipeline里傳遞至客戶端,在客戶端的開發庫內部維護著"ack queue",成功收到 datanode
3、返回的 ack packet 后會從"ack queue移除相應的packeto如果傳輸過程中,有某個datanode出現了故障,那么當前的 pipeline會被關閉,出現故障的 datanode會從當前的pipeline中 移除,剩余的block會繼續剩下的datanode中繼續以pipeline的 形式傳輸,同時Namenode會分配一個新的 datanode,保持replicas 設定的數量。2. HDFS有哪些開源的第三方導入工具答: Cloudera官方提供 HTTP方式連接 HDFS工具:Hoophoo漪介.doc3. HBase有哪些第三方Client工具答:沒有搜到,
4、網上有一些愛好者自己寫了些小工具,有 PHP的有C#的,也有java的,但是都沒經過正式測試4. Hive集群部署方式答:只需要部署一臺機器,不必須裝到master節點,只要那臺機 器上裝了 hadoop,能夠正確指向 master地址5. Reduce方法不排序結果的驗證答:待驗證6. Impala各版本支持情況答:最新版本1.0,全面支持HDFS7. LLVM是什么答:LLVM 命名最早源自于底層虛擬機( Low Level Virtual Machine)的縮寫LLVM 是Illinois大學發起的一個開源項目,和之前為大家所熟 知的JVM以及.net Runtime這樣的虛擬機不同,這
5、個虛擬系統 提供了一套中立的中間代碼和編譯基礎設施,并圍繞這些設施提供了一套全新的編譯策略(使得優化能夠在編譯、連接、運行環 境執行過程中,以及安裝之后以有效的方式進行)和其他一些非 常有意思的功能。2000年LLVM開始開發。2005年 Apple 雇了 Chris Lattner, LLVM 也相當于成了 Apple 的 官方支持的編譯器。Apple已經將它用在OpenCL的流水線優化,Xcode已經能使用 llvm-gcc編譯代碼。2011-12-02 LLVM3.0發布,LLVM 包括了一系列子項目, 它們也 同步發布了新版本,如 C/C+/Objective-C前端Clang 3.0改進了 C+程序編譯支持;改進 C+ 2011標準支持;實現支持即將發 布的C1x標準的某些特性;更快的生成代碼,更快的編譯,等等。8. Data locality的I/O調度機制的說明答:遵循先均勻分配再均衡負載的算法,分配任務各自盡量在單個計算節點上完成9. Impala自身處理以及其任務互相分配互相監控的實現原理答Ft燈處守、:3 O)2 mu ID書G iatluQ B ' C | Ri -”收巴 8W AS”M4 TIA mm Q XMMA«
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 西安外國語大學《景觀設計基礎》2023-2024學年第一學期期末試卷
- 江蘇省南京玄武區2025屆初三3月聯合檢測試題(生物試題理)試題含解析
- 山西省晉中學市榆社縣2024-2025學年初三下學期期初自測化學試題含解析
- 重慶航天職業技術學院《能源動力測試技術》2023-2024學年第二學期期末試卷
- 江蘇省鹽城市東臺市2025年學生學業調研抽測試卷(第二次)化學試題含解析
- 吉林省梅河口五中2025年高中畢業班質量檢查(II)生物試題含解析
- 山西醫科大學《通風與空調工程課程設計》2023-2024學年第二學期期末試卷
- 西安美術學院《基礎藥理學》2023-2024學年第二學期期末試卷
- 江西工程學院《機械與電氣安全》2023-2024學年第二學期期末試卷
- 云南省楚雄北浦中學2025屆初三大練習(一)數學試題含解析
- 基礎工程課程設計-低樁承臺基礎設計(樁徑1.5m)
- 機械加工企業安全生產應急預案樣本(2篇)
- 鋼結構防火施工方案
- 耳穴壓豆治療便秘
- 2023年長江產業投資集團有限公司招聘考試真題
- 中華人民共和國安全生產法知識培訓
- 機械CAD、CAM-形考任務二-國開-參考資料
- 腫瘤中醫治療及調養
- 施工現場機械設備管理規定
- 高質量數字化轉型技術解決方案集(2024上半年度)
- 云計算數據備份與恢復預案
評論
0/150
提交評論