




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數據HCIA考試題及參考答案一、單選題(共41題,每題1分,共41分)1.下面關于ZKFC的說法錯誤的是?A、ZKFC(ZKFailoverController)作為一個Zookeeper集群的客戶端,用來監控NameNode的狀態信息B、ZKFC進程需要在NameNode的節點和Zookeeper的Leader節點中部署C、StandbyNameNode通過Zookeeper感知ActiveNameNode的狀態,一旦ActiveNameNode宕機,StandbyNameNode就會執行升主操作D、HDFSNameNode的ZKFC連接到Zookeeper,把主機名等信息保存到Zookeeper中正確答案:B2.HBase的最小處理單元是Region,UserRegion和RegionServer之間的路由信息是保存在哪里的?A、ZookeeperB、HDFSC、MasterD、meta表正確答案:A3.FusionlnsightHD中Loader實例必須與哪個實例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、Nodemanager正確答案:D4.在有N個節點FusionInsightHD集群中部署HBase時,推薦部署()個HMaster進程,()個RegionServer進程A、3,NB、N,NC、2,ND、2,2正確答案:C5.Hadoop平臺中,要查看YARN服務中一個application的信息,通常需要使用什么命令?A、containerB、applicationattemptC、jarD、application正確答案:D6.FusionInsightHD產品中,關于Kafka組件部署說法不正確的是?A、Kafka強依賴于ZooKeeper,安裝Kafka必須安裝ZooKeeperB、Kafka部署的實例個數不得小于2C、Kafka的服務端可以產生消息D、Consumer作為Kafka的客戶端角色專門進行消息的消費正確答案:C7.以下哪些選項屬于Hive的數據存儲模型?A、以上全都正確B、表C、桶D、數據庫E、分區正確答案:A8.FusionInsightManager對服務的管理操作,下面說法錯誤的是?A、可查看服務的當前狀態B、可設置不常用的服務隱藏或顯示C、可對服務進行啟停重啟操作D、可以添加和卸載服務正確答案:B9.關于Hive與傳統數據倉庫的對比,以下描述錯誤的是?A、Hive元數據存儲獨立于數據存儲之外,從而解耦合元數據和數據,靈活性高,而傳統數據倉庫數據應用單一,靈活性低B、Hive基于HDFS存儲,理論上存儲量可無限擴展,而傳統數據倉庫存儲量會有上限C、由于Hive的數據存儲在HDFS中,所以可以保證數據的高容錯,高可靠D、由于Hive基于大數據平臺,所以查詢效率比傳統數據倉庫快正確答案:D10.以下哪個不屬于Hadoop中MapReduce組件的特點?A、實時計算B、易于編程C、良好的拓展性D、高容錯性正確答案:A11.在Flink技術架構中,()是流處理和批處理的計算引擎A、StandaloneB、RuntimeC、DataStreamD、FlinkCore正確答案:B12.關于Hive中普通表和外部表的描述不正確的是?A、默認創建普通表B、外部表實質是將已經存在HDFS上的文件路徑跟表關聯起來C、刪除普通表時,元數據和數據同時被刪除D、刪除外部表時,只刪除外部表數據而不刪除元數據正確答案:D13.HBase中如果發生一個Region的Split,將一個HFile文件真正分開到兩個Region的過程發生在以下什么階段?A、Split過程中B、Flush過程中C、Compaction過程中D、HFile分開過程中正確答案:C14.在FusionInsightManager界面中,對loader的操作不包括下列哪個選項?()A、配置loader參數B、查看loader服務狀態C、切換Loader主備節點D、啟動loader實例正確答案:C15.下面關于ZooKeeper描述錯誤的是()A、一條消息被一半以上的server接收,他將寫入磁盤B、ZooKeeper的節點數必須是奇數個C、消息更新只有成功和失敗,沒有中間狀態D、客戶端發送的更新會按照他們發送的順序被應用正確答案:B16.FusionInsightHD系統中,以下選項哪一個不是HBase寫數據流程涉及的角色或服務?A、ZooKeeperB、HDFSC、HMasterD、RegionServer正確答案:C17.以下關于KafkaPartition偏移量的描述不正確的是?A、offset是一個String型字符串B、唯一標記一條消息C、每條消息在文件中的位置稱為offset(偏移量)D、消費者通過(offset、partition、topic)跟蹤記錄正確答案:A18.FuskmlnsightHD集群規劃中,管理節點&控制節點&數據節點合一部署方案適合什么樣的場景?A、30節點以下B、100節點以上C、100-200節點D、200節點以上正確答案:A19.fusioninsightmanager不能夠管理哪個對象?A、sparkB、主機OSC、yarnD、HDFS正確答案:B20.在有N個節點FusionInsightHD集群中部署HBase時,推薦部署()個HMaster進程,()個RegionServer進程?A、2,2B、2,NC、3,ND、N,N正確答案:B21.以下關于kafkapartition偏移量的描述不正確的是?()A、每條消息在文件中的位置稱為offset(偏移量)B、唯一標記一條消息C、offset是一個String型字符串D、消費者通過(offset、partition、topic)跟蹤記錄正確答案:C22.Flink中的()接口用于流數據處理,()接口用于批處理?A、DataStreamAPI,DataSetAPIB、DatabatchAPI,DataStreamAPIC、StreamAPI,BatchAPID、BatchAPI,StreamAPI正確答案:A23.安裝FusionInsightHD的Streaming組件時,Nimbus角色要求安裝幾個節點()A、3B、2C、1D、4正確答案:B24.HDFS的NameNode節點主備狀態管理及元數據文件合并分別由哪兩個角色負責?A、ZKFC和備NameNodeB、主NameNode和備NameNodeC、ZKFC和主NameNodeD、主NameNode和JournalNode正確答案:A25.以下關于Flink關鍵特性描述不正確的是?A、SparkStreaming與Flink相比,時延更低B、Flink流式處理引擎能夠同時提供支持流處理和批處理應用的功能C、與FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量D、checkpoint實現了Flink的容錯正確答案:A26.關于Hive與Hadoop其他組件的關系。以下描述錯誤的是?A、Hive最終將數據存儲在HDFS中B、Hive是Hadoop平臺的數據倉庫工具C、HQL可以通過MapReduce執行任務D、Hive對HBase有強依賴正確答案:D27.在WebHCat架構中,用戶能夠通過安全的HTTPS協議執行以下哪些操作()A、執行HiveDDL操作B、運行MapReduce任務C、運行HiveHQL任務D、以上全部正確正確答案:D28.HBase的某張表的RowKey劃分SplitKey為9,E,a,z,請問該表有幾個Region?A、3B、4C、5D、6正確答案:C29.下列哪個HDFS命令可用于檢測數據塊的完整性?A、hdfsfsck/B、hdfsfsck/-deleteC、hdfsdfsadmin-reportD、hdfsbalancer-threshold1正確答案:A30.HBase不適合哪些應用場景?A、海量數據(TB、PB)應用場景B、高吞吐率應用場景C、要求具有完全ACID特性的應用場景D、半結構化數據應用場景正確答案:C31.以下關于Zookeeper關鍵特性中的原子性說法正確的是?A、集群中無論哪臺服務器,對外展示的均是同一視圖B、更新只能全部完成或失敗,不會部分完成C、一條消息被一個server接收,將被所有server接收D、客戶端發送的更新會按照他們被發送的順序進行應用正確答案:B32.FusionInsightHD系統中HBase的最小處理單元是Region,UserRegion和RegionServer之間的路由信息是保存在哪?A、ZooKeeperB、HDFSC、MasterD、meta表正確答案:D33.硬件故障被認為是常態,為了解決這個問題,HDFS設計了副本機制。默認情況下,一份文件,HDFS會存()份?A、2B、4C、3D、5正確答案:C34.FusionInsightHD系統中HDFS默認BlockSize是多少?A、32MB、64MC、128MD、256M正確答案:C35.在FusionInsightHD中,創建Loader作業的進行數據轉換的正確步驟是()A、加載、轉換、輸出B、輸入設置、轉換、輸出C、加載、轉化、抽取D、抽取、轉換、輸出正確答案:B36.Flume數據采集過程中,下列選項中能對數據進行過濾和修飾的是?A、SinkB、ChannelSelectorC、InterceptorD、Channel正確答案:C37.Spark組件中哪個選項不屬于transformation操作?A、joinB、distinctC、reduceByKeyD、reduce正確答案:D38.安裝FusionInsightHD的Streaming組件Nimbus角色要求安裝幾個節點?A、4B、3C、2D、1正確答案:C39.關于FusionlnsightHD中Loader作業描述正確的是?A、Loader將作業提交到Yam執行后,如果此時Loader服務異常,則此作業執行失敗。B、Loader將作業提交到Yam執行后,如果某個Mapper任務執行失敗,能夠自動進行重試C、Loadet作業執行失敗后將會產生垃壩數據,需要用戶手動清除D、Loader將一個作業提交至Yam執行后,該作業執行完成前,不能再提交其他作業正確答案:B40.關于Hive建表基本操作,描述正確的是?A、創建外部表時需要指定external關鍵字B、一旦表創建好,不可再修改表名C、一旦表創建好,不可再增加新列D、一旦表創建好,不可再修改列名正確答案:A41.下列關于HBase的BloomFilter特性理解不正確的是?A、用來過濾數據B、用來優化隨機讀取的性能C、會增加存儲的消耗D、可以準確判斷某條數據不存在S正確答案:C二、多選題(共30題,每題1分,共30分)1.與開源Sqoop相比,Loader具有哪些增強特性?()多選A、高性能B、安全性C、高可靠D、圖形化正確答案:ABCD2.Loader提供了哪些方式或接口實現作業管理?A、WebUIB、Linux命令行C、Rest接口D、JavaAPI正確答案:ABCD3.大數據時代的到來,依賴于以下哪些技術的提升?A、網絡B、硬件設備制造C、云計算D、人工智能正確答案:ABCD4.Spark適用于以下哪些場景?A、實時流處理B、批處理C、圖計算D、交互式查詢正確答案:ABD5.以下哪些是Spark可以提供的功能?A、分布式文件系統B、流處理功能C、分布式內存計算引擎D、集群資源的統一調度正確答案:BC6.Hbase中的以下哪種場景會觸發Flush操作?A、當Wals中的文件數量達到閾值時B、Region中MemStore的總大小,達到了預設的FlushSize閾值C、Hbase定期刷新Memstore,默認周期為1小時D、MemStore占用內存的總量和RegionServer總內存比值超出了預設的閾值大小正確答案:ABCD7.以下關于KafkaPartition說法正確的有?A、每個Partition都是有序且不可變的消息隊列B、每個Partition在存儲層面對應一個log文件C、Partition數量決定了每個Consumergroup中并發消費者的最大數量D、引入Partition機制,保證了Kafka的高吞吐能力正確答案:ABCD8.StructuredStreaming在OutPut階段可以定義不同的數據寫入方式,包括下列哪些方式?A、CompleteModeB、UpdateModeC、AppendModeD、GeneralMode正確答案:ABC9.Flink流式處理的數據源類型包括?A、CollectionsB、JDBCC、SocketstreamsD、Files正確答案:ABCD10.以下關于KafkaPartition副本的特性描述正確的是?A、副本以分區為單位。每個分區都有各自的主副本的從副本B、Follower通過拉取的方式從Leader中同步數據C、主副本叫做Leader,從副本叫做FollowerD、消費者和生產者都是從Leader中讀寫數據,也可直接與Follower交互正確答案:ABC11.根據數據流如何在兩個Transformation之間傳輸數據,數據流可以分為哪些類型?A、redistributing流B、distributing流C、一對多流D、一對一流正確答案:CD12.FusionInsightHDLoader可以將HDFS數據導出到以下哪些目標端?A、SFTP服務器B、FTP服務器C、Oracle數據庫D、DB2數據庫正確答案:ABCD13.以下哪些選項屬于FusionInsightSparkSQL的優點。A、以上全都正確B、穩定和高性能C、SQL兼容性D、長穩測試E、支持數據插入,更新和刪除正確答案:ABCDE14.在FusionInsightHD中,Flink主要與以下哪些組件進行交互?A、KafkaB、YARNC、ZookeeperD、HDFS正確答案:ABCD15.FusionInsightManager與外部管理平臺對接時,支持哪些接口?A、SNMPB、VPNC、BGPD、Syslog正確答案:AD16.以下關于HBase中HregionServer的功能描述哪些是不正確的?A、管理所有的Region,Region可以在RegionServer之間遷移B、HBase的數據處理和計算單元C、RegionServer是HBase的數據服務進程,負責處理用戶數據的讀寫請求D、RegionServer一般與HDFS集群的NameNode部署在一起,實現數據的存儲功能正確答案:AD17.以下關于Zookeeper的leader選舉說法正確的是A、當實例數n為奇數時,假定n=2x+1,則成為leader節點需要x票B、當實例數為8時,則成為leader節點需要5票,容災能力為4C、Zookeeper選舉leader時,需要半數以上的票數D、當實例數n為奇數時,假定n=2x+1,則成為leader節點需要x+1票正確答案:CD18.ZKFC進程部署在hdfs中的以下那個節點上?A、activenamenodeB、standbynamenodeC、datanodeD、以上全部不對正確答案:AB19.在Loader歷史作業記錄中,可以查看以下哪些內容?A、作業開始/運行時間B、作業狀態C、錯誤行/文件數量D、臟數據連接正確答案:ABCD20.YARN通過ResourceManager對集群資源進行管理,它的主要功能有?A、集群資源調度B、應用程序管理C、日志管理D、以上說法都不對正確答案:AB21.kafka消息傳輸保障通常有以下哪幾種?()A、最多三次(AtMostThreeTimes)B、僅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)正確答案:BCD22.HDFS聯邦環境下,NameSpace(命名空間)包括以下哪些內容?A、目錄B、文件C、塊D、以上全不正確正確答案:ABC23.HBase中包含的一些典型的Filter有哪些?A、SingleColumnValueFilterB、FilterListC、RowFilterD、KeyOnlyFilter正確答案:ABCD24.以下關于FusionInsight多租戶管理的描述正確的有()A、一站式管理租戶資源,計算資源(CPU/內存/IO)、存儲資源(HDFS)、服務資源(HBase…)B、可視化的多級租戶管理,與企業組織結構相匹配,簡化系統資源分配與管理C、基于容器機制的租戶資源隔離,為租戶SLA保駕護航D、與企業組織結構相匹配的多級的租戶模型,不同部門對應不同的租戶、按需動態增刪租戶正確答案:ABCD25.下列關于HBase存儲模型的描述正確的是A、同一個Key值可以關聯多個ValueB、KeyValue中擁有時間戳,類型等關鍵信息C、即使是Key值相同,Qualifier也相同的多個KeyValue,也可能有多個,此時使用時間戳來區分D、每一個KeyValue都擁有一個Qualifier標識正確答案:ABCD26.在FusionInsightHD中,Flink主要與以下哪些組件進行交互A、zookeeperB、HDFSC、KafkaD、Yarn正確答案:ABCD27.在FusionInsight集群規劃時,以下哪些集群命名是系統允許的?A、123FusionInsightB、FusionInsight-123C、FusionInsigh_123D、FusionInsight123正確答案:ACD28.FusionInsightHD集群中包含了多種服務,每種服務又由若干角色組成,下面哪些是服務的角色?A、HDFSB、NameNodeC、DataNodeD、HBase正確答案:BC29.FusionInsightHD支持哪些日志下載方式?(多選)A、下載已安裝的所有組件的日志B、下載單個組件某個模塊的日志C、下載指定主機的日志D、下載指定時間段的日志正確答案:ABCD30.在大數據時代,企業所面臨的挑戰有以下哪些?A、數據結構多樣化。B、企業各部門間數據分散,相同數據在各部門內部存儲格式不一致。C、競爭對手的技術進步。D、數據存在噪音、缺失、存儲類型不規范等問題,需要進行大量的數據預處理工作。正確答案:ABCD三、判斷題(共32題,每題1分,共32分)1.topology的處理邏輯都在bolt中。A、正確B、錯誤正確答案:A2.Zookeeper的增強特性包括在審計日志中添加ephemeralnode被刪除的審計日志。()A、正確B、錯誤正確答案:A3.Flink適用于高并發處理數據、毫秒級時延的應用A、正確B、錯誤正確答案:A4.Kafka是一個高吞吐,分布式,基于發布訂閱的消息系統,利用Kafka技術可在廉價PCServer上搭建起大規模消息系統。A、正確B、錯誤正確答案:A5.Hive是一種數據倉庫處理工具,使用類SQL的HiveQL語言實現數據查詢功能,所有Hive的數據都存儲在HDFS中A、正確B、錯誤正確答案:A6.kafkaConsumer寫數據總體流程是,Consumer連接指定TopicPartition所在的LeaderBroker,用于主動獲取方式從kafka中獲取消息。()A、正確B、錯誤正確答案:A7.FusionInsightHD的Loader中,一個連接器只可以分配給一個作業使用A、正確B、錯誤正確答案:A8.Flume的perties配置文件可以配置多個channel來傳輸數據。A、正確B、錯誤正確答案:A9.假設HDFS在寫入數據時只存2份,那么在寫入過程中,HDFSClient先將數據寫入DataNodel,再將數據寫入DataNode2.A、正確B、錯誤正確答案:B10.Spark是基于內存的計算引擎,所有Spark程序運行過程中的數據只能存儲在內存中A、正確B、錯誤正確答案:B11.如果某些Containers的物理內存利用率超過了配置的內存閾值,但所有Containers的總內存利用率并沒有超過設置的NodeManager內存閾值,那么內存使用過多的Containers仍可以繼續運行。A、正確B、錯誤正確答案:A12.FusionInsightManager支持大規模集群的安裝部署、監控、告警、用戶管理、權限管理、審計、服務管理、健康檢查、問題定位、升級和補丁。A、正確B、錯誤正確答案:A13.現在有3個機架,有一個文件需要存3份,其中副本1和副本2存放在與Client相同的機架且不同的服務器上,根據HDFS副本放置策略,副本3一定要存放在其他機架。A、正確B、錯誤正確答案:A14.Hadoop的NameNode用于存儲文件系統的元數據。A、正確B、錯誤正確答案:A15.Solr創建Collection時,推薦選用路由算法為compositldRouter,那么該Collection可以拓展shard。A、正確B、錯誤正確答案:B16.FusionInsightHD集群安裝成功后,不允許修改服務、角色和實例的配置。A、正確B、錯誤正確答案:B17.Flink只能部署在Local和Cluster,暫不支持其他部署()A、正確B、錯誤正確答案:B18.Flink與SparkStreaming類似,屬于時間驅動型實時流系統。()A、正確B、錯誤正確答案:B19.FusionInsightManager界面上,當收到kafka擦盤容量不足警告,且該警告的原因已經排除硬盤硬件故障時,系統管理員需要考慮擴容解決此問題。(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 服裝銷售工作方案怎么寫2025年
- 汽車使用與維護 課件 項目二 行駛系統的使用與維護2-1 懸架的檢查與維護
- 2025年浙江省生態環境廳所屬事業單位招聘考試備考題庫
- 2025年煤電鉆綜合保護器項目可行性研究報告
- 浙江省“六市六校”聯盟2025屆高三物理試題第一次月考含解析
- 遼寧石油化工大學《金屬基復合材料概論》2023-2024學年第一學期期末試卷
- 營口理工學院《出鏡報道與節目主持》2023-2024學年第二學期期末試卷
- 武漢大學《數據結構及算法》2023-2024學年第一學期期末試卷
- 山東師范大學《中醫學基礎2》2023-2024學年第二學期期末試卷
- 平涼市涇川縣2025屆六年級下學期小升初真題數學試卷含解析
- (一模)桂林市、來賓市2025屆高考第一次跨市聯合模擬考試地理試卷(含答案詳解)
- 2025-2030“一帶一路”之菲律賓礦業行業市場深度調研及發展趨勢與投資前景預測研究報告
- 飾品干貨知識培訓課件
- 2024-2030年中國高純銅行業發展監測及發展趨勢預測報告
- 2025-2030中國國防車輛行業市場發展趨勢與前景展望戰略研究報告
- 2025年03月荊門市“招碩引博”1412人筆試歷年參考題庫考點剖析附解題思路及答案詳解
- “育人為本,德育為先”在學校人才培養方案中的具體體現
- 獸醫病理學基礎試題及答案
- 電力電纜及通道檢修規程QGDW 11262-2014(文字版)
- 軟件研制總結報告范文
- 我是安全守法小公民
評論
0/150
提交評論