




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數據HCIA練習題庫(含答案)一、單選題(共40題,每題1分,共40分)1、下列哪個HDFS命令可用于檢測數據塊的完整性?A、hdfsfsck/B、hdfsfsck/-deleteC、hdfsdfsadmin-reportD、hdfsbalancer-threshold1正確答案:A2、下列哪個命令是刪除文件的?()A、dfs-clearB、dfs-rmC、dfs-delD、dfs-ls正確答案:B3、有關普通表和外部表的描述,下面哪句是錯誤的?A、缺省創建時為普通表;B、外部表實際上是將HDFS中已有路徑的文件與表聯系起來;C、刪除普通表時會刪除數據和元數據;D、刪除外部表時只刪除數據,不刪除元數據;正確答案:D4、FusionInsight系統中,Flume數據流在節點內不需要經過哪個component?A、channelB、sinkC、topicD、source正確答案:C5、FusionInsightHD產品中,關于Kafka組件部署說法不正確的是?A、Kafka強依賴于ZooKeeper,安裝Kafka必須安裝ZooKeeperB、Kafka部署的實例個數不得小于2C、Kafka的服務端可以產生消息D、Consumer作為Kafka的客戶端角色專門進行消息的消費正確答案:C6、某銀行規劃的FusionlnsightHD集群有90個節點,如果控制節點規劃了3個,那集群中數據節點推薦規劃()個。A、87B、85C、90D、86正確答案:B7、加載數據到Hive表,哪種方式不正確?A、直接將本地路徑的文件load到Hive表中B、將HDFS上的額文件load到Hive表中C、Hive支持insertinto單條記錄的方法,所以可以直接在命令行插入單條記錄D、將其他表的結果集insertinto到Hive表中正確答案:C8、在FusionInsightManager界面中,對loader的操作不包括下列哪個選項?()A、切換Loader主備節點B、配置loader參數C、查看loader服務狀態D、啟動loader實例正確答案:A9、傳統數據處理的數據規模的單位是?A、TBB、EBC、PBD、GB正確答案:D10、下列哪個命令是刪除文件的A、dfs-lsB、dfs-delC、dfs-clearD、dfs-rm正確答案:D11、HBase不適合哪些應用場景?A、海量數據(TB、PB)應用場景B、高吞吐率應用場景C、要求具有完全ACID特性的應用場景D、半結構化數據應用場景正確答案:C12、在WebHCat架構中,用戶能夠通過安全的HTTPS協議執行以下哪些操作()A、執行HiveDDL操作B、運行MapReduce任務C、運行HiveHQL任務D、以上全部正確正確答案:D13、哪個不是Flume的channel類型?A、MemoryChannelB、FileChannelC、JDBCChannelD、HDFSChannel正確答案:D14、FusionInsightManager用戶權限管理不支持哪個配置?A、給用戶配置角色B、給用戶組配置角色C、給用戶組配置權限D、給用戶配置權限正確答案:C15、YARN是主從架構,其中”從“是指下列選項中的那個?A、NodeManagerB、NameNodeC、AppMasterD、ResourceManager正確答案:A16、FusionInsightHD的Loader在創建作業時,連接器(Connector)有什么作用?A、確定有哪些轉換步驟B、提供優化參數,提高數據導入導出性能C、配置作業如何與外部數據源進行連接D、配置作業如何與內部數據源進行連接正確答案:C17、kafka集群在運行期間,直接依賴于下面那些組件?()A、ZookeeperB、HDFSC、SparkD、HBase正確答案:A18、HDFS的副本存放策略中,同一機架不同服務器之間的距離是()A、2B、3C、1D、4正確答案:A19、以下關于Zookeeper關鍵特性中的原子性說法正確的是?A、集群中無論哪臺服務器,對外展示的均是同一視圖B、更新只能全部完成或失敗,不會部分完成C、一條消息被一個server接收,將被所有server接收D、客戶端發送的更新會按照他們被發送的順序進行應用正確答案:B20、Flink中的()接口用于流數據處理,()接口用于批處理A、StreamAPI,BatchAPIB、DataStreamAPI,DataSetAPIC、DataBatchAPI,DataStreamAPID、BatchAPI,StreamAPI正確答案:B21、關于FusionInsightHDStreaming的Supervisor描述正確的是?A、Supervisor負責資源的分配和任務的調度B、Supervisor負責接受Nimbus分配的任務,啟動停止屬于自己管理的Worker進程C、Supervisor是運行具體處理邏輯的進程D、Supervisor是在Topology中接收數據然后執行處理的組件正確答案:B22、創建Loader作業時,可以在一下那個步驟中設置Map數?A、轉換B、基本信息C、輸出D、輸入設置正確答案:C23、FusionInsightHD的HBase中的一張表包含以下幾個Region[10,20),[20,30),[30,+∞],分別編號為①,②,③,那么,11,20,222分別屬于哪個Region?A、①①③B、①②③C、①②②D、①①②正確答案:C24、Spark自帶的資源管理框架是?A、StandaloneB、MesosC、YARND、Docker正確答案:B25、Hadoop系統中關于客戶端向HDFS文件系統上傳文件說法正確的是?A、客戶端的文件數據經過NameNode傳遞給DataNodeB、客戶端將文件劃分為多個Block,根據DataNode的地址信息,按順序寫入每一個DataNode中C、客戶端根據DataNode的地址信息,按順序將整個文件寫入每一個DataNode中,然后由DataNode將文件劃分為多個BlockD、客戶端只上傳數據到一個DataNode,然后由NameNode負責Block復制正確答案:B26、FusionlnsightHDLoader作業前后,需要哪些節點與外部數據源通訊?A、Loadeir服務主節點B、運行Yarn服務作業的節點C、前面兩個都需要D、前面兩個都不需要正確答案:C27、FusionInsightHD中Loader實例必須與哪個實例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、NodeManager正確答案:D28、在Fusionlnsight集群規劃部署時,建議管理節點最好部署()個,控制節點最少需要部署()數據節點最少需要部署()個。A、1,2,2B、1,3,2C、2,3,3D、2,3,1正確答案:C29、Hadoop的HBase不適合哪些數據類型的應用場景?A、大文件應用場景B、海量數據應用場景C、高吞吐率應用場景D、半結構化數據應用場景正確答案:A30、HDFS的NameNode節點主備狀態管理及元數據文件合并分別由哪兩個角色負責?A、ZKFC和備NameNodeB、主NameNode和備NameNodeC、ZKFC和主NameNodeD、主NameNode和JournalNode正確答案:A31、Hadoop平臺中,要查看YARN服務中一個application的信息,通常需要使用什么命令?A、containerB、jarC、application-attemptD、Application正確答案:D32、FusionInsightHDManager界面Hive日志收集,哪個選項不正確?A、可指定實例進行日志收集,比如指定單獨收集MetaStore的日志B、可指定時間段進行日志收集,比如只收集2016-1-1到2016-1-10的日志C、可指定節點IP進行日志收集,例如僅下載某個ip的日志D、可指定特定用戶進行日志收集,例如僅下載userA用戶產生的日志正確答案:D33、以下關于KafkaPartition副本的特性描述不正確的是A、主副本叫做Leader,從副本叫做FollowerB、Follower通過拉取的方式從Leader中同步數據C、副本以區分為單位。每個區分都有各自的主副本和從副本D、消費者和生產者是從Leader中讀寫數據,也可直接與Follower交互正確答案:D34、以下關于FusionInsightCTBase的描述不正確的是?A、CTBase的讀寫數據接口,統一封裝了行定義的接口,自動進行冷字段的合并和解析,不需要在應用程序中進行合并和解釋B、CTBase是基于HBase的聚簇表開發框架C、CTBase提供了一套WebUI進行元數據定義,提供了只管醫用的表設計工具,降低表設計的難度D、CTBase的javaAPI提供一套HBase連接池管理的接口,內部進行連接共享,減少客戶端應用開發難度。正確答案:B35、FusionInsightHD中HBase默認使用什么組件作為其底層文件存儲系統?()A、kafkaB、HDFSC、MemoryD、File正確答案:B36、在FusionInsight集群規劃部署時,建議管理節點最好部署()個,控制節點最少需要部署()數據節點最少需要部署()個。A、1,2,2B、2,3,1C、1,3,2D、2,3,3正確答案:D37、傳統數據處理的數據規模單位是()A、TBB、GBC、PBD、EB正確答案:B38、下列哪個命令是從HDFS下載目錄/文件到本地的?()A、dfs-catB、dfs-mkdirC、dfs-getD、dfs-put正確答案:C39、關于FusionInsightManager關鍵特性或操作說法正確的是?A、能夠針對整個集群或者某個服務進行健康檢查,不能夠針對某個節點進行健康檢查B、Manager引入角色的概念,采用RBAC的方式對系統進行權限管理C、整個系統使用Kerberos管理用戶,使用LDAP進行用戶認證,通過CAS實現單點登錄D、對于健康檢查結果,不能夠導出檢查報告,只能夠在線查看正確答案:B40、在FusionInsight產品中,關于KafkaTopic,以下描述不正確的有?A、每個Topic只能被分成一個partition(區)B、Topic的partition數量可以在創建時配置C、每個Partition的存儲層面對應一個log文件,log文件中記錄了所有的信息數據D、每條發布到Kafka的消息都有一個類別,這個類別被稱為Topic,也可以理解為一個存儲消息的隊列正確答案:A二、多選題(共30題,每題1分,共30分)1、FusionInsight家族包含下列哪些子產品?A、FusionInsightHDB、GaussDB200C、FusionInsightMinerD、FunsionInsightFarmer正確答案:ABCD2、關于大數據的主要特征理解和描述正確的有?A、來源多,格式多B、數據的價值密度較低C、存儲量大,計算量大D、增長速度快,處理速度快正確答案:ABCD3、華為大數據產品FusionInsightHD中的Streaming具有哪些關鍵特性?A、可伸縮性B、容錯能力C、消息可靠性D、靈活性正確答案:ABCD4、HDFS不適用以下哪些場景()A、大文件存儲與訪問B、大量小文件存儲C、隨機寫入D、流式數據訪問正確答案:BC5、以下關于Hadoop的HDFS描述正確的有?A、HDFS由NameNode,DataNode,Client組成B、HDFS備NameNode上的元數據是主NameNode同步過去的C、HDFS采用就近的機架節點進行數據的第一副本存儲D、HDFS適合一次寫入,多次讀取的讀寫任務正確答案:ACD6、以下說法正確的有A、作業運行了一段時間后失敗了,不會殘留原始文件。B、臟數據是指不符合轉換規則的數據。C、Loader客戶端腳本只能提交作業。D、創建了一個人機賬號,就可以操作所有Loader作業。正確答案:AB7、Loader提供了哪些方式或接口實現作業管理?A、WebUIB、Linux命令行C、Rest接口D、JavaAPI正確答案:ABCD8、FusionInsightHDLoader可以將HDFS數據導出到以下哪些目標端?A、SFTP服務器B、FTP服務器C、Oracle數據庫D、DB2數據庫正確答案:ABCD9、下列哪些組件必須依賴于Zookeeper才能運行?A、HDFSB、HBaseC、SparkD、YARN正確答案:ABD10、在loader歷史作業記錄中,可以查看以下哪些內容?()A、臟數據鏈接B、作業狀態C、作業開始/運行時間D、錯誤行/文件數量正確答案:ABCD11、FusionInsightHD集群中包含多種服務,每種服務又由若干角色組成,下面哪些是服務的角色?A、HDFSB、NameNodeC、DataNodeD、HBase正確答案:BC12、Hadoop通過ResourceManager對集群資源進行管理,它的主要功能有?A、日志管理B、集群資源調度C、應用程序管理D、集群資源管理正確答案:BCD13、以下關于Flink關鍵特性描述不正確的是?A、Flink流式處理引擎能夠同時提供支持流處理和批處理應用的功能B、checkpoint實現了Flink的容錯C、SparkStreaming與Flink相比,時延更低D、與FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量正確答案:CD14、Loader可以實現以下哪些轉換規則()A、拼接轉換B、空值轉換C、增量轉換D、長整型時間轉換正確答案:ABCD15、以下哪些選項屬于FusionInsight數據安全性?A、用戶權限認證管理B、組件數據加密C、操作系統安全加固D、數據完整性校驗正確答案:BD16、fusininsightHD平臺中,那些組件支持對列表加密?A、HDFSB、FlinkC、hbaseD、hive正確答案:CD17、以下哪些選項屬于Hive的數據存儲模型?A、以上全都正確B、桶C、數據庫D、表E、分區正確答案:ABCDE18、華為大數據解決方案中平臺架構包括以下哪些組成部分?()A、Hadoop層B、GaussDB200C、Datafarm層D、FusioInghtManager正確答案:ACD19、以下選項中,屬于HDFS架構關鍵特性的是?A、多方式訪問機制B、健壯機制C、HA高可靠性D、元數據持久化機制正確答案:ABCD20、HBase集群定時執行Compaction的目的是什么?A、減少同一Region,同一ColumnFamily下的文件數目B、提升數據讀取性能C、減少同一ColumnFamily的文件數據D、減少同一Region的文件數目正確答案:ABD21、關于大數據的主要特征的理解和描述正確的有哪些?A、數據來源多,格式多B、數據價值密度低,價值高C、數據量大,計算量大D、數據增長速度快,處理速度快正確答案:ABCD22、以下屬于Streaming特點的是?A、可做連續查詢B、數據先存儲再計算C、延遲低D、屬于事件驅動正確答案:ACD23、FusionInsightHD集群中包含了多種服務,每種服務又由若干角色組成,下面哪些是服務的角色?A、HDFSB、NameNodeC、DataNodeD、HBase正確答案:BC24、下列關于HBase存儲模型的描述正確的是A、同一個Key值可以關聯多個ValueB、KeyValue中擁有時間戳,類型等關鍵信息C、即使是Key值相同,Qualifier也相同的多個KeyValue,也可能有多個,此時使用時間戳來區分D、每一個KeyValue都擁有一個Qualifier標識正確答案:ABCD25、關于SparkSQL&Hive區別與聯系,下列說法正確的是?()A、SparkSQL不可以使用Hive的自定義函數B、SparkSQL依賴Hive的元數據C、SparkSQL的執行引擎為Sparkcore,Hive默認執行引擎為MapReduceD、SparkSQL兼容絕大部分Hive的語法和函數正確答案:BCD26、HDFS系統中對備用NameNode的作用的描述正確的有?A、主NameNode的熱備B、備NameNode對內存沒有要求C、幫助主NameNode合并編輯日志,減少主NameNode的啟動時間D、備NameNode應與主NameNode部署到一個節點正確答案:AC27、Flink支持的時間操作類型包括以下哪些選項?A、事件時間B、采集時間C、處理時間D、結束時間正確答案:ABC28、Spark適用于以下哪些場景?A、圖計算B、批處理C、交互式查詢D、實時流處理正確答案:BCD29、下列哪些措施為了保障數據的完整性?A、集群數據均衡B、元數據可靠性保證C、安全模式D、重建失效數據盤的副本數據正確答案:ABCD30、Spark可以接收哪些來源的數據?A、YARNB、HDFSC、HIVED、HBase正確答案:BCD三、判斷題(共30題,每題1分,共30分)1、Zookeeper所有節點都可以處理請求A、正確B、錯誤正確答案:A2、Flume的tertises配置文件中可以配置多個channel來傳輸數據A、正確B、錯誤正確答案:A3、FusionInsightManager界面上,當收到kafka擦盤容量不足警告,且該警告的原因已經排除硬盤硬件故障時,系統管理員需要考慮擴容解決此問題。()A、正確B、錯誤正確答案:A4、FusionInsightHD系統中一個集群可以管理多個服務,每個服務可以管理多個角色,每個角色只能管理一個實例。A、正確B、錯誤正確答案:B5、RDD可以從Hadoop兼容的文件系統生成,生成之后可以通過調用RDD的算子對RDD的數據進行部分更新。A、正確B、錯誤正確答案:A6、華為FusionInsight中,Hbase的表設計工具、連接池管理和增強的SDK,可以簡化復雜表的業務開發。A、正確B、錯誤正確答案:A7、二級索引為HBase提供了按照某些列的值進行索引的能力。二級索引先查索引表,再定位到數據表中的位置,不用全表掃描,時延小。A、正確B、錯誤正確答案:A8、容量調度器在盡行資源分配,現有同級的2個隊列Q1和Q2,他們的容量均為30,其中Q1已使用8,Q2已使用14,則會優先將資源分配Q1。A、正確B、錯誤正確答案:A9、Topology在任務完成后會自動結束運行。A、正確B、錯誤正確答案:B10、FusioninsightHD產品中,一個典型的kafka集群包含若干個producer若干個Consummer和一個zookeeper集群?A、正確B、錯誤正確答案:B11、Hive是一種數據倉庫處理工具,使用類SQL的HiveQL語言實現數據查詢功能,所有Hive的數據都存儲在HDFS中()A、正確B、錯誤正確答案:A12、導入數據到Hive表時,不會檢查數據合法性,只會在讀取數據時候檢查。A、正確B、錯誤正確答案:A13、SparkStreaming計算基于DStream,將流式計算分解成一系列短小的批處理作業。A、正確B、錯誤正確答案:A14、SparkStreaming相比Storm具備更高的實時性。A、正確B、錯誤正確答案:B15、在Zookeeper的服務模型中,Leader節點以主備模式存在,其他節點都屬于Follower節點。A、正確B、錯誤正確答案:B16、FusionInisghtHD系統中,在創建Kafka的Topic時必須設置Partition個數和副本個數,設置多副本可以增強Kafka服務的容災能力。A、正確B、錯誤正確答案:A17、Flink中的checkpoint機制
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 湖南體育職業學院《招投標及合同管理》2023-2024學年第一學期期末試卷
- 湖南省長沙市雅禮集團2024-2025學年初三第5次月考試題化學試題試卷含解析
- 2025的場地租賃合同樣本
- 2025技術授權借貸合同范本
- 2025攪拌車租賃合同范本
- 2025簡約標準的房屋租賃合同
- 2025建筑工程項目管理國內競爭性招標合同
- 2025年企業安全生產知識競賽試題100題及答案
- 2025年高考歷史總復習人教版必修二全冊知識點梳理匯編
- 2025商店商鋪租賃合同樣式模板
- 金屬加工基礎知識考試考核試卷
- DB23T 3840-2024 非煤礦山隱蔽致災因素普查治理工作指南
- 2024年建設工程質量檢測人員-建設工程質量檢測人員(使用功能)考試近5年真題集錦(頻考類試題)帶答案
- 專題03二元一次方程(組)中含參數問題壓軸題三種模型全(原卷版)
- 龐貝病護理教學查房
- 第3節 第2課時 理想氣體狀態方程和氣體實驗定律的微觀解釋 教學課件
- 人教版初中數學《等腰三角形》-課件-
- 【必刷題型07】機械能守恒與能量守恒問題(原卷版)
- 2024年大學生信息素養大賽(省賽)練習考試題庫(含答案)
- 新人教版一年級數學下冊全冊教案(表格式)
- 2024年全國(保衛管理員安全及理論)知識考試題庫與答案
評論
0/150
提交評論