




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數據平臺搭建與配置管理第11頁共11頁《大數據平臺搭建與配置管理》期中試題期中試題(閉卷B)題號一二三四五六七八九十成績滿分30202030100得分【本套試卷共有4大題,計66小題】一、選擇題(20題,每題1.5分,共30分)1、欲把當前目錄下的file1.txt復制為file2.txt,以下正確的命令是()。A.copyfile1.txtfile2.txtB.cpfile1.txt|file2.txtC.catfile2.txtfile1.txtD.catfile1.txt>file2.txt2、下面哪個命令可以用來切換使用者的身份()。A.passwdB.logC.whoD.su3、以下哪個不是HDFS的守護進程()。A.datanodeB.namenodeC.secondarynamenodeD.mrappmaster/yarnchild4、Hadoop-2.6.5集群中的HDFS的默認的數據塊的大小是()。A.32MBB.64MBC.128MBD.256MB5、HDFS集群中的namenode職責不包括()。A.維護HDFS集群的目錄樹結構B.維護HDFS集群的所有數據塊的分布、副本數和負載均衡C.負責保存客戶端上傳的數據D.響應客戶端的所有讀寫數據請求6、下列關于HDFS的描述正確的是()。A.如果NameNode宕機,SecondaryNameNode會接替它使集群繼續工作B.HDFS集群支持數據的隨機讀寫C.NameNode磁盤元數據不保存Block的位置信息D.DataNode通過長連接與NameNode保持通信7、MapReduce是()上的并行計算。A.運行于大規模集群B.運行于磁盤C.運行于小規模集群D.運行在復雜的系統中8、MapReduce框架會將Map程序就近地在()數據所在的節點運行。A.HDFSB.SparkC.MapReduceD.Zookeeper9、MapReduce為了保證任務的正常執行,采用()等多種容錯機制。A.重復執行B.重新開始整個任務C.直接丟棄執行效率低的作業D.以上都是10、ZooKeeper是集群的(),監視著集群中各個節點的狀態根據節點提交的反饋進行下一步合理操作。A.領導者B.執行者C.管理者D.以上都不是11、ZK提供了一定的()可以用來獲取一個順序增長的,可以在集群環境下使用的ID。A.函數B.接口C.方法D.類12、名稱空間由()組成。A.磁盤寄存器B.表C.內存寄存器D.數據寄存器13、hive數據倉庫中的數據,不可能的來源有哪些?()A.Mysql或Oracle數據庫B.行為數據C.業務數據系統D.娛樂資料14、解壓.tar.gz結尾的HBase壓縮包使用的Linux命令是什么?()A.tar-vfB.tarC.tar-zxD.tar-zxvf15、下以下數據第三列,應該用哪種數據類型存儲:1,zhangsan,[90,79.88]。()A.mapB.intC.arrayD.struct16、查詢速度的提升是以額外的()為代價的。A.創建索引B.創建索引和存儲索引C.刪除索引D.存儲索引17、當客戶端發起一個Put請求時,首先它從()表中查出該Put數據。A.hbase:metaB.hbase:valueC.-ROOT-D.hbase:key18、HBase構建二級索引的實現方式有哪些?()A.MapReduceB.HiveC.BloomFilterD.Filter19、Storm將()組成的網絡抽象成Topology。A.Spouts和BoltsB.字段C.GFSD.Tuple20、Storm運行在分布式集群中,其運行任務的方式與()類似。A.HDFSB.HBaseC.HadoopD.Zookeeper二、填空題(20題,每題1分,共10分)21、鏈接分為:。22、JDK下解釋執行Java的程序是。23、是客戶端需要執行的一個工作單元。24、HDFS在設計上采取了多種機制保證在硬件出錯的環境中實現數據的。25、HDFS不適合用在的應用場合。26、HDFS集群中只有唯一一個名稱節點,該節點負責所有的。27、Map的輸出結果首先被寫入。28、磁盤包含機械部件,它是通過和來尋址定位數據。29、Shuffle優化的原則是給Shuffle過程盡可能多的。30、ZooKeeper允許分布式進程通過共享的相互協調。31、分布式應用正在運行的一組系統稱為。32、ZooKeeper類通過其構造函數提供功能。33、Hive中創建的目的就是在查詢一個表中某列值時提升速度。34、使用命令可以創建一個指定名字的表。35、WHERE子句是一個。36、HBase主要用來存儲和的松散數據。37、在HBase中執行操作時,并不會刪除數據舊的版本。38、服務器負責存儲和維護分配給自己的。39、Storm可以用來實時處理新數據和。40、Topology中每一個計算組件都有一個執行度。三、判斷題,正確填“T”,錯誤填“F”(20題,每題1分,共20分)41、Hive本地模式和遠程模式,最關鍵的差別是存儲元數據的mysql數據庫的安裝位置是在本地還是在遠端。()42、Hive數據類型中date類型是與時區無關的類型。()43、Hive數據類型中,Timestamp類型是與時區無關的類型。()44、Hive中的表,對應hdfs中文件的目錄。()45、外部表和內部表的差別,只是需要添加External關鍵詞就可以了。()46、刪除外部表,只會刪除外部表的元數據信息,并不會將外部表的數據刪除。()47、刪除外部表,會同時刪除外部表的數據和元數據。()48、在Hive中,執行分桶操作,具體哪個值,分到哪個桶中,可以通過對數據進行Hash運算取得。()49、HBase是一套高性能的分布式數據集群,必須在大型機或者高性能的服務器上進行搭建。()50、HBase是Apache的Hadoop項目的子項目,利用HadoopHDFS作為其文件存儲系統,適合于非結構化數據存儲。()51、MapReduce程序可以直接讀取HBase內存儲的數據內容。()52、HBase系統適合進行多表聯合查詢以及復雜性讀寫操作。()53、Hadoop是IBM公司開發的一款商用大數據軟件。()54、Hadoop是一個能夠對大量數據進行分布式處理的軟件框架,能夠處理PB級數據。()55、Hadoop存儲系統HDFS的文件是分塊存儲,每個文件塊默認大小為32MB。()56、HDFS系統為了容錯保證數據塊完整性,每一塊數據都采用2份副本。()57、HDFS系統采用NameNode定期向DataNode發送心跳消息,用于檢測系統是否正常運行。()58、用戶可以通過”hadoopfs–put”命令獲取遠端文件數據。()59、Nagios不可以監控Hadoop集群,因為它不提供Hadoop支持()。60、Ganglia不僅可以進行監控,也可以進行報警()。四、簡答題(6題,每題5分,共30分)61、試論述實現矩陣向量乘法與矩陣乘法采用不同MapReduce策略的原因。62、試論述HBase的三層結構中各層次的名稱和作用。答:63、Storm集群中的Master節點和Work節點各自運行什么后臺進程?這些進程又分別負責什么工作?答:64、試論述Storm框架的工作流程。答:65、試論述Hadoop和谷歌的mapreduce、gfs等技術之間的關系。答:66、試論述Hadoop在各個領域的應用情況。答:《大數據平臺搭建與配置管理》期中標答期中標答B(閉卷)題號一二三四五六七八九十成績滿分30202030100得分一、選擇題(20題,每題1.5分,共30分)1-5:DDDCD 6-10:CAAAC11-15:BDDDC16-20:BAAAC二、填空題(20題,每題1分,共20分)21、軟鏈接和硬鏈接 22、java.exe23、job24、完整性25、低延遲26、元數據的管理27、緩存28、磁頭移動盤片的轉動29、內存30、分層命名空間31、集群32、connect33、索引34、CREATETABLE35、邏輯表達式36、非結構化半結構化37、更新38、RegionRegion39、更新數據庫40、并行三、判斷題(20題,每題1分,共20分)41-45:FFTTF46-50:TFTFT51-55:TFFTF56-60:FFFFT四、簡答題(6題,每題5分,共60分)61、答:矩陣向量乘法:Map函數:每個Map任務將整個向量V和矩陣M的一個文件塊作為輸入。對每個元素Mij,Map任務會產生鍵值對。Reduce函數:Reduce任務將所有與給定鍵i關聯的值相加即可得到<i,xi>。矩陣乘法:1.自然連接:Map函數:對每個矩陣元素My產生一個鍵值對,對每個矩陣元素Njk產生一個鍵值對。Reduce函數:對每個相同鍵j,輸出所有滿足形式<j,<i,k,mijnjk>>的元組。62、答:63、答:Storm采用“Master-Worker”的節點方式:Master節點運行名為“Nimbus”的后臺程序,負責在集群范圍內分發代碼、為Work
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 染整行業綠色制造與環保法規執行考核試卷
- 玻璃纖維增強塑料在建筑外墻材料的應用考核試卷
- 人事行政培訓人力資源戰略考核試卷
- 木質裝飾材料選購技巧考核試卷
- 皮革制品保養市場前景分析考核試卷
- 醫院建筑安全與設施維護知識考核試卷
- 柑橘種植園生態環境保護考核試卷
- 生態保護與生態智慧城市建設考核試卷
- 財務報銷票據粘貼規范
- 《上下前后左右》位置課件
- 2025年4月自考13887經濟學原理中級押題及答案
- 2025廣東廣州市花都區恒悅房地產開發有限公司招聘項目用工人員16人筆試參考題庫附帶答案詳解
- 琴行規章制度
- 小學校長在月度教師會議總結發言:教學、管理、成長全回顧
- 國企人力筆試題庫及答案
- 公司事故隱患內部報告獎勵制度
- 如何通過合理膳食安排促進嬰幼兒成長發育
- JJF(紡織) 061-2024 圓盤取樣器校準規范
- 智能健康養老服務人才培養創新與實踐探索
- 2025年宣傳策劃類面試題及答案
- 人教版(2024)七年級下冊生物期中復習必背知識點提綱
評論
0/150
提交評論