大數(shù)據(jù)技術(shù)教材配套習(xí)題練習(xí)測(cè)試卷

上傳人：喝*** IP屬地：廣西上傳時(shí)間：2025-03-06 格式：DOC 頁(yè)數(shù)：37 大小：68.65KB 積分：25 舉報(bào) 版權(quán)申訴

大數(shù)據(jù)技術(shù)教材配套習(xí)題練習(xí)測(cè)試卷_第2頁(yè)

大數(shù)據(jù)技術(shù)教材配套習(xí)題練習(xí)測(cè)試卷_第3頁(yè)

大數(shù)據(jù)技術(shù)教材配套習(xí)題練習(xí)測(cè)試卷_第4頁(yè)

大數(shù)據(jù)技術(shù)教材配套習(xí)題練習(xí)測(cè)試卷_第5頁(yè)

已閱讀5頁(yè)，還剩32頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第頁(yè)大數(shù)據(jù)技術(shù)教材配套習(xí)題練習(xí)測(cè)試卷1.下面哪個(gè)選項(xiàng)不屬于Hadoop1.0的問題?A、單一名稱節(jié)點(diǎn),存在單點(diǎn)失效問題B、單一命名空間,無法實(shí)現(xiàn)資源隔離C、資源管理效率低D、很難上手【正確答案】：D2.分布式文件系統(tǒng)指的是什么?A、把文件分布存儲(chǔ)到多個(gè)計(jì)算機(jī)節(jié)點(diǎn)上,成千上萬的計(jì)算機(jī)節(jié)點(diǎn)構(gòu)成計(jì)算機(jī)集群B、用于在Hadoop與傳統(tǒng)數(shù)據(jù)庫(kù)之間進(jìn)行數(shù)據(jù)傳遞C、一個(gè)高可用的,高可靠的,分布式的海量日志采集、聚合和傳輸?shù)南到y(tǒng)D、一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),可以處理消費(fèi)者規(guī)模的網(wǎng)站中的所有動(dòng)作流數(shù)據(jù)【正確答案】：A3.下列關(guān)于NoSQL與關(guān)系數(shù)據(jù)庫(kù)的比較,哪個(gè)說法是錯(cuò)誤的?()A、在一致性方面,RDBMS強(qiáng)于NoSQLB、在數(shù)據(jù)完整性方面,RDBMS容易實(shí)現(xiàn)C、在擴(kuò)展性方面,NoSQL比較好D、在可用性方面,NoSQL優(yōu)于RDBMS【正確答案】：D4.在Hadoop項(xiàng)目結(jié)構(gòu)中,MapReduce指的是什么?A、分布式并行編程模型B、流計(jì)算框架C、Hadoop上的工作流管理系統(tǒng)D、提供分布式協(xié)調(diào)一致性服務(wù)【正確答案】：A5.下列關(guān)于MapReduce1.0的描述,錯(cuò)誤的是?A、JobTracker“大包大攬”導(dǎo)致任務(wù)過重B、不存在單點(diǎn)故障C、容易出現(xiàn)內(nèi)存溢出(分配資源只考慮MapReduce任務(wù)數(shù),不考慮CPU、內(nèi)存)D、資源劃分不合理(強(qiáng)制劃分為slot,包括Mapslot和Reduceslot)【正確答案】：B6.下列哪一個(gè)不屬于HDFS1.0中存在的問題?A、無法水平擴(kuò)展B、單點(diǎn)故障問題C、單一命名空間D、系統(tǒng)整體性能受限于單個(gè)名稱節(jié)點(diǎn)的吞吐量【正確答案】：A7.下列哪一個(gè)不屬于第三次信息化浪潮中新興的技術(shù)?A、互聯(lián)網(wǎng)B、云計(jì)算C、大數(shù)據(jù)D、物聯(lián)網(wǎng)【正確答案】：A8.下面哪一項(xiàng)不是MapReduce體系結(jié)構(gòu)主要部分?A、ClientB、JobTrackerC、TaskTracker以及TaskD、Job【正確答案】：A9.下列關(guān)于Spark的描述,錯(cuò)誤的是哪一項(xiàng)?A、Spark最初由美國(guó)加州伯克利大學(xué)(UCBerkeley)的AMP實(shí)驗(yàn)室于2009年開發(fā)B、Spark在2014年打破了Hadoop保持的基準(zhǔn)排序紀(jì)錄.C、Spark用十分之一的計(jì)算資源,獲得了比Hadoop快3倍的速度D、Spark運(yùn)行模式單一【正確答案】：D10.大數(shù)據(jù)產(chǎn)業(yè)指什么?A、一切與支撐大數(shù)據(jù)組織管理和價(jià)值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動(dòng)的集合B、提供智能交通、智慧醫(yī)療、智能物流、智能電網(wǎng)等行業(yè)應(yīng)用的企業(yè)C、提供數(shù)據(jù)分享平臺(tái)、數(shù)據(jù)分析平臺(tái)、數(shù)據(jù)租售平臺(tái)等服務(wù)的企業(yè)D、提供分布式計(jì)算、數(shù)據(jù)挖掘、統(tǒng)計(jì)分析等服務(wù)的各類企業(yè)【正確答案】：A11.、顯示當(dāng)前目錄的命令是:()A、cdB、pwdC、whoD、Is【正確答案】：B12.關(guān)于文檔數(shù)據(jù)庫(kù)的說法,下列哪一項(xiàng)是錯(cuò)誤的?A、數(shù)據(jù)是規(guī)則的B、性能好(高并發(fā))C、缺乏統(tǒng)一的查詢語法D、復(fù)雜性低【正確答案】：A13.下列哪個(gè)不屬于NoSQL數(shù)據(jù)庫(kù)的特點(diǎn)?A、靈活的可擴(kuò)展性B、靈活的數(shù)據(jù)模型C、與云計(jì)算緊密融合D、數(shù)據(jù)存儲(chǔ)規(guī)模有限【正確答案】：D14.下列關(guān)于MapReduce工作流程,哪個(gè)描述是正確的?A、所有的數(shù)據(jù)交換都是通過MapReduce框架自身去實(shí)現(xiàn)的B、不同的Map任務(wù)之間會(huì)進(jìn)行通信C、不同的Reduce任務(wù)之間可以發(fā)生信息交換D、用戶可以顯式地從一臺(tái)機(jī)器向另一臺(tái)機(jī)器發(fā)送消息【正確答案】：A15.下列哪項(xiàng)是Hadoop生態(tài)系統(tǒng)中Spark的功能?A、處理大規(guī)模數(shù)據(jù)的腳本語言B、工作流和協(xié)作服務(wù)引擎,協(xié)調(diào)Hadoop上運(yùn)行的不同任務(wù)C、不支持DAG作業(yè)的計(jì)算框架D、基于內(nèi)存的分布式并行編程框架,具有較高的實(shí)時(shí)性,并且較好支持迭代計(jì)算【正確答案】：D16.對(duì)文件重命名的命令是:()A、rmB、mvC、moveD、cp【正確答案】：B17.下面哪個(gè)選項(xiàng)屬于大數(shù)據(jù)技術(shù)的“數(shù)據(jù)存儲(chǔ)和管理”技術(shù)層面的功能?A、利用分布式文件系統(tǒng)、數(shù)據(jù)倉(cāng)庫(kù)、關(guān)系數(shù)據(jù)庫(kù)等實(shí)現(xiàn)對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化海量數(shù)據(jù)的存儲(chǔ)和管理B、利用分布式并行編程模型和計(jì)算框架,結(jié)合機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法,實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的處理和分析C、構(gòu)建隱私數(shù)據(jù)保護(hù)體系和數(shù)據(jù)安全體系,有效保護(hù)個(gè)人隱私和數(shù)據(jù)安全D、把實(shí)時(shí)采集的數(shù)據(jù)作為流計(jì)算系統(tǒng)的輸入,進(jìn)行實(shí)時(shí)處理分析【正確答案】：A18.下列關(guān)于RDD說法,描述有誤的是?A、一個(gè)RDD就是一個(gè)分布式對(duì)象集合,本質(zhì)上是一個(gè)只讀的分區(qū)記錄集合B、每個(gè)RDD可分成多個(gè)分區(qū),每個(gè)分區(qū)就是一個(gè)數(shù)據(jù)集片段C、RDD是可以直接修改的D、RDD提供了一種高度受限的共享內(nèi)存模型【正確答案】：C19.()不是Hbase的特點(diǎn)。A、大B、稀疏C、面向列D、面向行【正確答案】：D20.下列哪個(gè)不屬于YARN體系結(jié)構(gòu)中ResourceManager的功能?A、處理客戶端請(qǐng)求B、監(jiān)控NodeManagerC、資源分配與調(diào)度D、處理來自ApplicationMaster的命令【正確答案】：D21.下面哪個(gè)不可能是hive的執(zhí)行引擎:()A、mapreduceB、tezC、stormD、spark【正確答案】：C22.下列關(guān)于Map和Reduce函數(shù)的描述,哪個(gè)是錯(cuò)誤的?A、Map將小數(shù)據(jù)集進(jìn)一步解析成一批<key,value>對(duì),輸入Map函數(shù)中進(jìn)行處理B、Map每一個(gè)輸入的<k1,v1>會(huì)輸出一批<k2,v2>。<k2,v2>是計(jì)算的中間結(jié)果C、Reduce輸入的中間結(jié)果<k2,List(v2)>中的List(v2)表示是一批屬于不同k2的valueD、Reduce輸入的中間結(jié)果<k2,List(v2)>中的List(v2)表示是一批屬于同一個(gè)k2的value【正確答案】：C23.下面哪個(gè)不是Hadoop1.0的組件:()A、HDFSB、MapReduceC、YARND、NameNode和DataNode【正確答案】：C24.在Hadoop項(xiàng)目結(jié)構(gòu)中,HDFS指的是什么?A、分布式文件系統(tǒng)B、流數(shù)據(jù)讀寫C、資源管理和調(diào)度器D、Hadoop上的數(shù)據(jù)倉(cāng)庫(kù)【正確答案】：A25.下面對(duì)FsImage的描述,哪個(gè)是錯(cuò)誤的?A、FsImage文件沒有記錄每個(gè)塊存儲(chǔ)在哪個(gè)數(shù)據(jù)節(jié)點(diǎn)B、FsImage文件包含文件系統(tǒng)中所有目錄和文件inode的序列化形式C、FsImage用于維護(hù)文件系統(tǒng)樹以及文件樹中所有的文件和文件夾的元數(shù)據(jù)D、FsImage文件記錄了每個(gè)塊具體被存儲(chǔ)在哪個(gè)數(shù)據(jù)節(jié)點(diǎn)【正確答案】：D26.在HDFS中,NameNode的主要功能是什么?A、維護(hù)了blockid到datanode本地文件的映射關(guān)系B、存儲(chǔ)文件內(nèi)容C、文件內(nèi)存保存在磁盤中D、存儲(chǔ)元數(shù)據(jù)【正確答案】：D27.下列關(guān)于MapReduce模型的描述,錯(cuò)誤的是哪一項(xiàng)?A、MapReduce采用“分而治之”策略B、MapReduce設(shè)計(jì)的一個(gè)理念就是“計(jì)算向數(shù)據(jù)靠攏”C、MapReduce框架采用了Master/Slave架構(gòu)D、MapReduce應(yīng)用程序只能用Java來寫【正確答案】：D28.下列有關(guān)hive和impala的對(duì)比錯(cuò)誤的是:()A、hive與impala使用相同的元數(shù)據(jù)B、hive與impala中對(duì)sql的解釋處理比較相似,都是通過詞法分析生成執(zhí)行計(jì)劃C、hive適合于長(zhǎng)時(shí)間的批處理查詢分析,而impala適合于實(shí)時(shí)交互式sql查詢D、hive在內(nèi)存不足以存儲(chǔ)所有數(shù)據(jù)時(shí),會(huì)使用外存,而impala也是如此【正確答案】：D29.在Hadoop項(xiàng)目結(jié)構(gòu)中,HDFS指的是什么?A、分布式文件系統(tǒng)B、分布式并行編程模型C、資源管理和調(diào)度器D、Hadoop上的數(shù)據(jù)倉(cāng)庫(kù)【正確答案】：A30.下面關(guān)于云計(jì)算數(shù)據(jù)中心的描述正確的是:A、數(shù)據(jù)中心是云計(jì)算的重要載體,為各種平臺(tái)和應(yīng)用提供運(yùn)行支撐環(huán)境B、數(shù)據(jù)中心就是放在企業(yè)內(nèi)部的一臺(tái)中心服務(wù)器C、每個(gè)企業(yè)都需要建設(shè)一個(gè)云計(jì)算數(shù)據(jù)中心D、數(shù)據(jù)中心不需要網(wǎng)絡(luò)帶寬的支撐【正確答案】：A31.下面關(guān)于Hive的描述錯(cuò)誤的是:()A、Hive是一個(gè)構(gòu)建在Hadoop之上的數(shù)據(jù)倉(cāng)庫(kù)工具B、Hive是由Facebook公司開發(fā)的C、Hive在某種程度上可以看作是用戶編程接口,其本身并不存儲(chǔ)和處理數(shù)據(jù)D、Hive定義了簡(jiǎn)單的類似SQL的查詢語言——HiveQL,它與大部分SQL語法無法兼容【正確答案】：D32.內(nèi)部表和外部表的區(qū)別之一:創(chuàng)建表時(shí)是否使用()關(guān)鍵字。A、overB、outerC、exteriorD、external【正確答案】：D33.MapReduce1.0的體系結(jié)構(gòu)中,JobTracker是主要任務(wù)是什么?A、負(fù)責(zé)資源監(jiān)控和作業(yè)調(diào)度,監(jiān)控所有TaskTracker與Job的健康狀況B、使用“slot”等量劃分本節(jié)點(diǎn)上的資源量(CPU、內(nèi)存等)C、會(huì)周期性地通過“心跳”將本節(jié)點(diǎn)上資源的使用情況和任務(wù)的運(yùn)行進(jìn)度匯報(bào)給TaskTrackerD、會(huì)跟蹤任務(wù)的執(zhí)行進(jìn)度、資源使用量等信息,并將這些信息告訴任務(wù)(Task)【正確答案】：A34.下列關(guān)于BigTable的描述,哪個(gè)是錯(cuò)誤的?A、爬蟲持續(xù)不斷地抓取新頁(yè)面,這些頁(yè)面每隔一段時(shí)間地存儲(chǔ)到BigTable里BigTable是一個(gè)分布式存儲(chǔ)系統(tǒng)C、BigTable起初用于解決典型的互聯(lián)網(wǎng)搜索問題D、網(wǎng)絡(luò)搜索應(yīng)用查詢建立好的索引,從BigTable得到網(wǎng)頁(yè)【正確答案】：A35.HBase中需要根據(jù)某些因素來確定一個(gè)單元格,這些因素可以視為一個(gè)“四維坐標(biāo)”,下面哪個(gè)不屬于“四維坐標(biāo)”?A、行鍵B、關(guān)鍵字C、列族D、時(shí)間戳【正確答案】：B36.Hadoop最初是由誰創(chuàng)建的?A、LuceneB、DougCuttingC、ApacheD、MapReduce【正確答案】：B37.在HBase中,關(guān)于數(shù)據(jù)操作的描述,下列哪一項(xiàng)是錯(cuò)誤的?A、HBase采用了更加簡(jiǎn)單的數(shù)據(jù)模型,它把數(shù)據(jù)存儲(chǔ)為未經(jīng)解釋的字符串B、HBase操作不存在復(fù)雜的表與表之間的關(guān)系C、HBase不支持修改操作D、HBase在設(shè)計(jì)上就避免了復(fù)雜的表和表之間的關(guān)系【正確答案】：C38.第一次信息化浪潮主要解決什么問題?A、信息傳輸B、信息處理C、信息爆炸D、信息轉(zhuǎn)換【正確答案】：B39.下面描述錯(cuò)誤的是:()A、hive的功能十分強(qiáng)大,可以支持采用sql方式查詢hadoop平臺(tái)上的數(shù)據(jù)B、在實(shí)際應(yīng)用中,hive也暴露出不穩(wěn)定的問題,在極少數(shù)情況下,其至?xí)霈F(xiàn)端口不響應(yīng)或者進(jìn)程丟失的問題C、在hiveha中,在hadoop集群上構(gòu)建的數(shù)據(jù)倉(cāng)庫(kù)是由單個(gè)hive實(shí)例進(jìn)行管理的D、在hiveha中,客戶端的查詢請(qǐng)求首先訪問haproxy,由haproxy對(duì)訪問請(qǐng)求進(jìn)行轉(zhuǎn)發(fā)【正確答案】：C40.下列說法哪項(xiàng)有誤?A、相對(duì)于Spark來說,使用Hadoop進(jìn)行迭代計(jì)算非常耗資源B、Spark將數(shù)據(jù)載入內(nèi)存后,之后的迭代計(jì)算都可以直接使用內(nèi)存中的中間結(jié)果作運(yùn)算,避免了從磁盤中頻繁讀取數(shù)據(jù)C、Hadoop的設(shè)計(jì)遵循“一個(gè)軟件棧滿足不同應(yīng)用場(chǎng)景”的理念D、Spark可以部署在資源管理器YARN之上,提供一站式的大數(shù)據(jù)解決方案【正確答案】：C41.下列傳統(tǒng)并行計(jì)算框架,說法錯(cuò)誤的是哪一項(xiàng)?A、刀片服務(wù)器、高速網(wǎng)、SAN,價(jià)格貴,擴(kuò)展性差上B、共享式(共享內(nèi)存/共享存儲(chǔ)),容錯(cuò)性好C、編程難度高D、實(shí)時(shí)、細(xì)粒度計(jì)算、計(jì)算密集型【正確答案】：B42.下面關(guān)于Hive的描述錯(cuò)誤的是:()A、HBase與Hive的功能是互補(bǔ)的,它實(shí)現(xiàn)了Hive不能提供的功能B、當(dāng)采用MapReduce作為執(zhí)行引擎時(shí),用HiveQL語句編寫的處理邏輯,最終都要轉(zhuǎn)化為MapReduce任務(wù)來運(yùn)行C、Hive一般用于處理靜態(tài)數(shù)據(jù),主要是BI報(bào)表數(shù)據(jù)D、Hive主要是用于滿足實(shí)時(shí)數(shù)據(jù)流的處理需求【正確答案】：D43.、()是Hbase存儲(chǔ)的核心。A、StorageB、StoreC、toreFileD、MemStore【正確答案】：B44.HDFS中的Block默認(rèn)保存()A、3份B、2份C、1份D、不確定【正確答案】：A45.云計(jì)算平臺(tái)層(PaaS)指的是什么?A、操作系統(tǒng)和圍繞特定應(yīng)用的必需的服務(wù)B、將基礎(chǔ)設(shè)施(計(jì)算資源和存儲(chǔ))作為服務(wù)出租C、從一個(gè)集中的系統(tǒng)部署軟件,使之在一臺(tái)本地計(jì)算機(jī)上(或從云中遠(yuǎn)程地)運(yùn)行的一個(gè)模型D、提供硬件、軟件、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施以及提供咨詢、規(guī)劃和系統(tǒng)集成服務(wù)【正確答案】：A46.、()主要存放用戶建表未指定命名空間的表A、tableB、defaultC、namespaceD、hbase【正確答案】：B47.、查看主機(jī)名稱的命令是:()A、ifconfigB、hostnameC、topD、wget【正確答案】：B48.下列哪一項(xiàng)不屬于數(shù)據(jù)庫(kù)事務(wù)具有ACID四性?A、間斷性B、原子性C、一致性D、持久性【正確答案】：A49.在一個(gè)基本的Hadoop集群中,SecondaryNameNode主要負(fù)責(zé)什么?A、幫助NameNode收集文件系統(tǒng)運(yùn)行的狀態(tài)信息B、負(fù)責(zé)執(zhí)行由JobTracker指派的任務(wù)C、協(xié)調(diào)數(shù)據(jù)計(jì)算任務(wù)D、負(fù)責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲(chǔ)【正確答案】：A50.下列哪個(gè)不屬于Hadoop的特性?A、成本高B、高可靠性C、高容錯(cuò)性D、運(yùn)行在Linux平臺(tái)上【正確答案】：A51.下面描述錯(cuò)誤的是:()A、Hive的功能十分強(qiáng)大,可以支持采用SQL方式查詢Hadoop平臺(tái)上的數(shù)據(jù)B、在實(shí)際應(yīng)用中,Hive也暴露出不穩(wěn)定的問題,在極少數(shù)情況下,甚至?xí)霈F(xiàn)端口不響應(yīng)或者進(jìn)程丟失的問題C、在HiveHA中,在Hadoop集群上構(gòu)建的數(shù)據(jù)倉(cāng)庫(kù)是由單個(gè)Hive實(shí)例進(jìn)行管理的D、在HiveHA中,客戶端的查詢請(qǐng)求首先訪問HAProxy,由HAProxy對(duì)訪問請(qǐng)求進(jìn)行轉(zhuǎn)發(fā)【正確答案】：C52.下列關(guān)于Spark的描述,錯(cuò)誤的是哪一項(xiàng)?A、使用DAG執(zhí)行引擎以支持循環(huán)數(shù)據(jù)流與內(nèi)存計(jì)算析B、可運(yùn)行于獨(dú)立的集群模式中,可運(yùn)行于Hadoop中,也可運(yùn)行于AmazonEC2等云環(huán)境中C、支持使用ScalA.Java、Python和R語言進(jìn)行編程,但是不可以通過SparkShell進(jìn)行交互式編程D、可運(yùn)行于獨(dú)立的集群模式中,可運(yùn)行于Hadoop中,也可運(yùn)行于AmazonEC2等云環(huán)境中【正確答案】：C53.關(guān)于HDFSFederation的設(shè)計(jì)的描述,哪個(gè)是錯(cuò)誤的?()A、屬于不同命名空間的塊可以構(gòu)成同一個(gè)“塊池”B、HDFSFederation中,所有名稱節(jié)點(diǎn)會(huì)共享底層的數(shù)據(jù)節(jié)點(diǎn)存儲(chǔ)資源,數(shù)據(jù)節(jié)點(diǎn)向所有名稱節(jié)點(diǎn)匯報(bào)C、設(shè)計(jì)了多個(gè)相互獨(dú)立的名稱節(jié)點(diǎn)D、HDFS的命名服務(wù)能夠水平擴(kuò)展【正確答案】：A54.下列哪一個(gè)不屬于大數(shù)據(jù)產(chǎn)業(yè)的產(chǎn)業(yè)鏈環(huán)節(jié)?A、數(shù)據(jù)循環(huán)層B、數(shù)據(jù)源層C、數(shù)據(jù)分析層D、數(shù)據(jù)應(yīng)用層【正確答案】：A55.下列說法錯(cuò)誤的是?A、HadoopMapReduce是MapReduce的開源實(shí)現(xiàn),后者比前者使用門檻低很多B、MapReduce采用非共享式架構(gòu),容錯(cuò)性好C、MapReduce主要用于批處理、實(shí)時(shí)、計(jì)算密集型應(yīng)用D、MapReduce采用“分而治之”策略【正確答案】：C56.Hadoop1.0的核心組件(僅指MapReduce和HDFS,不包括Hadoop生態(tài)系統(tǒng)內(nèi)的

P.ig、Hive、HBase等其他組件),下列哪項(xiàng)是它的不足?A、抽象層次高B、表達(dá)能力有限,抽象層次低,需人工編碼C、價(jià)格昂貴D、可維護(hù)性低【正確答案】：B57.下列關(guān)于HDFS的描述,哪個(gè)不正確?A、HDFS還采用了相應(yīng)的數(shù)據(jù)存放、數(shù)據(jù)讀取和數(shù)據(jù)復(fù)制策略,來提升系統(tǒng)整體讀寫響應(yīng)性能B、HDFS采用了主從(Master/Slave)結(jié)構(gòu)模型C、HDFS采用了冗余數(shù)據(jù)存儲(chǔ),增強(qiáng)了數(shù)據(jù)可靠性D、HDFS采用塊的概念,使得系統(tǒng)的設(shè)計(jì)變得更加復(fù)雜【正確答案】：D58.以下哪個(gè)不是Hive的用戶接口模塊:()A、PMIB、HWI(HiveWebInterface)C、JDBC/ODBCD、ThriftServer【正確答案】：A59.、Spark生態(tài)系統(tǒng)組件MLlib的應(yīng)用場(chǎng)景是?A、圖結(jié)構(gòu)數(shù)據(jù)的處理B、基于歷史數(shù)據(jù)的交互式查詢C、復(fù)雜的批量數(shù)據(jù)處理D、基于歷史數(shù)據(jù)的數(shù)據(jù)挖掘【正確答案】：D60.關(guān)于HDFSFederation的設(shè)計(jì)的描述,哪個(gè)是錯(cuò)誤的?A、屬于不同命名空間的塊可以構(gòu)成同一個(gè)“塊池”B、HDFSFederation中,所有名稱節(jié)點(diǎn)會(huì)共享底層的數(shù)據(jù)節(jié)點(diǎn)存儲(chǔ)資源,數(shù)據(jù)節(jié)點(diǎn)向所有名稱節(jié)點(diǎn)匯報(bào)C、設(shè)計(jì)了多個(gè)相互獨(dú)立的名稱節(jié)點(diǎn)D、HDFS的命名服務(wù)能夠水平擴(kuò)展【正確答案】：A61.下面關(guān)于NoSQL和關(guān)系數(shù)據(jù)庫(kù)的簡(jiǎn)單比較,哪個(gè)是錯(cuò)誤的?A、RDBMS有關(guān)系代數(shù)理論作為基礎(chǔ),NoSQL沒有統(tǒng)一的理論基礎(chǔ)B、NoSQL很難實(shí)現(xiàn)橫向擴(kuò)展,RDBMS可以很容易通過添加更多設(shè)備來支持更大規(guī)模的數(shù)據(jù)C、RDBMS需要定義數(shù)據(jù)庫(kù)模式,嚴(yán)格遵守?cái)?shù)據(jù)定義,NoSQL一般不存在數(shù)據(jù)庫(kù)模式,可以自由靈活定義并存儲(chǔ)各種不同類型的數(shù)據(jù)D、RDBMS借助于索引機(jī)制可以實(shí)現(xiàn)快速查詢,很多NoSQL數(shù)據(jù)庫(kù)沒有面向復(fù)雜查詢的索引【正確答案】：B62.()關(guān)鍵字用來復(fù)制指定表的表結(jié)構(gòu)和數(shù)據(jù)。A、likeB、copyC、asD、replication【正確答案】：C63.HBase只有一個(gè)針對(duì)行健的索引,如果要訪問HBase表中的行,下面哪種方式是不可行的?A、通過單個(gè)行健訪問B、通過時(shí)間戳訪問C、通過一個(gè)行健的區(qū)間來訪問D、全表掃描【正確答案】：B64.在一個(gè)基本的Hadoop集群中,DataNode主要負(fù)責(zé)什么?A、負(fù)責(zé)執(zhí)行由JobTracker指派的任務(wù)B、協(xié)調(diào)數(shù)據(jù)計(jì)算任務(wù)C、負(fù)責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲(chǔ)D、存儲(chǔ)被拆分的數(shù)據(jù)塊【正確答案】：D65.以下哪個(gè)不是數(shù)據(jù)倉(cāng)庫(kù)的特性:()A、面向主題的B、集成的C、動(dòng)態(tài)變化的D、反映歷史變化的【正確答案】：C66.下列哪個(gè)不屬于物聯(lián)網(wǎng)的應(yīng)用?A、智能物流B、智能安防C、環(huán)保監(jiān)測(cè)D、數(shù)據(jù)清洗【正確答案】：D67.Hive的大部分查詢操作通過()完成。A、MapReduce作業(yè)B、HDFS作業(yè)C、HBase作業(yè)D、YARN作業(yè)【正確答案】：A68.HDFS采用了什么模型?A、分層模型B、主從結(jié)構(gòu)模型C、管道-過濾器模型D、點(diǎn)對(duì)點(diǎn)模型【正確答案】：B69.下列關(guān)于Scala特性的描述,錯(cuò)誤的是哪一項(xiàng)?A、Scala語法復(fù)雜,但是能提供優(yōu)雅的API計(jì)算B、Scala具備強(qiáng)大的并發(fā)性,支持函數(shù)式編程,可以更好地支持分布式系統(tǒng)C、Scala兼容Java,運(yùn)行速度快,且能融合到Hadoop生態(tài)圈中D、Scala是Spark的主要編程語言【正確答案】：A70.下列說法錯(cuò)誤的是?A、RDD(ResillientDistributedDataset)是運(yùn)行在工作節(jié)點(diǎn)(WorkerNode)的一個(gè)進(jìn)程,負(fù)責(zé)運(yùn)行TaskB、Application是用戶編寫的Spark應(yīng)用程序C、一個(gè)Job包含多個(gè)RDD及作用于相應(yīng)RDD上的各種操作DirectedAcyclicGraph反映RDD之間的依賴關(guān)系【正確答案】：A71.下面哪一項(xiàng)不屬于計(jì)算機(jī)集群中的節(jié)點(diǎn)?A、主節(jié)點(diǎn)(MasterNode)B、源節(jié)點(diǎn)(SourceNode)C、名稱結(jié)點(diǎn)(NameNode)D、從節(jié)點(diǎn)(SlaveNode)【正確答案】：B72.下列哪項(xiàng)不屬于大數(shù)據(jù)的發(fā)展歷程?A、成熟期B、萌芽期C、大規(guī)模應(yīng)用期D、迷茫期【正確答案】：D73.下列關(guān)于鍵值數(shù)據(jù)庫(kù)的描述,哪一項(xiàng)是錯(cuò)誤的?A、擴(kuò)展性好,靈活性好B、大量寫操作時(shí)性能高C、無法存儲(chǔ)結(jié)構(gòu)化信息D、條件查詢效率高【正確答案】：D74.在HBase訪問接口中,Pig主要用在哪個(gè)場(chǎng)合?A、適合HadoopMapReduce作業(yè)并行批處理HBase表數(shù)據(jù)B、適合HBase管理使用C、適合其他異構(gòu)系統(tǒng)在線訪問HBase表數(shù)據(jù)D、適合做數(shù)據(jù)統(tǒng)計(jì)【正確答案】：D75.在Hadoop生態(tài)系統(tǒng)中,Kafka主要解決Hadoop中存在哪些的問題?A、Hadoop生態(tài)系統(tǒng)中各個(gè)組件和其他產(chǎn)品之間缺乏統(tǒng)一的、高效的數(shù)據(jù)交換中介B、不同的MapReduce任務(wù)之間存在重復(fù)操作,降低了效率C、延遲高,而且不適合執(zhí)行迭代計(jì)算D、抽象層次低,需要手工編寫大量代碼【正確答案】：A76.下列哪一項(xiàng)不屬于NoSQL的四大類型?A、文檔數(shù)據(jù)庫(kù)B、圖數(shù)據(jù)庫(kù)C、列族數(shù)據(jù)庫(kù)D、時(shí)間戳數(shù)據(jù)庫(kù)【正確答案】：D77.下列關(guān)于NoSQL與關(guān)系數(shù)據(jù)庫(kù)的比較,哪個(gè)說法是錯(cuò)誤的?A、在一致性方面,RDBMS強(qiáng)于NoSQLB、在數(shù)據(jù)完整性方面,RDBMS容易實(shí)現(xiàn)C、在擴(kuò)展性方面,NoSQL比較好D、在可用性方面,NoSQL優(yōu)于RDBMS【正確答案】：D78.下面關(guān)于MongoDB說法,哪一項(xiàng)是正確的?A、具有較差的水平可擴(kuò)展性B、設(shè)置個(gè)別屬性的索引來實(shí)現(xiàn)更快的排序C、提供了一個(gè)面向文檔存儲(chǔ),操作復(fù)雜D、可以實(shí)現(xiàn)替換完成的文檔(數(shù)據(jù))或者一些指定的數(shù)據(jù)字段【正確答案】：D79.下面關(guān)于主服務(wù)器Master主要負(fù)責(zé)表和Region的管理工作的描述,哪個(gè)是錯(cuò)誤的?A、在Region分裂或合并后,負(fù)責(zé)重新調(diào)整Region的分布B、對(duì)發(fā)生故障失效的Region服務(wù)器上的Region進(jìn)行遷移C、管理用戶對(duì)表的增加、刪除、修改、查詢等操作D、不支持不同Region服務(wù)器之間的負(fù)載均衡【正確答案】：D80.下面對(duì)SecondaryNameNode第二名稱節(jié)點(diǎn)的描述,哪個(gè)是錯(cuò)誤的?A、SecondaryNameNode一般是并行運(yùn)行在多臺(tái)機(jī)器上B、它是用來保存名稱節(jié)點(diǎn)中對(duì)HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點(diǎn)重啟的時(shí)間C、SecondaryNameNode通過HTTPGET方式從NameNode上獲取到FsImage和EditLog文件,并下載到本地的相應(yīng)目錄下D、SecondaryNameNode是HDFS架構(gòu)中的一個(gè)組成部分【正確答案】：A81.在大數(shù)據(jù)的計(jì)算模式中,流計(jì)算解決的是什么問題?A、針對(duì)大規(guī)模數(shù)據(jù)的批量處理B、針對(duì)大規(guī)模圖結(jié)構(gòu)數(shù)據(jù)的處理C、大規(guī)模數(shù)據(jù)的存儲(chǔ)管理和查詢分析D、針對(duì)流數(shù)據(jù)的實(shí)時(shí)計(jì)算【正確答案】：D82.、Spark生態(tài)系統(tǒng)組件SparkStreaming的應(yīng)用場(chǎng)景是?A、基于歷史數(shù)據(jù)的數(shù)據(jù)挖掘B、圖結(jié)構(gòu)數(shù)據(jù)的處理C、基于歷史數(shù)據(jù)的交互式查詢D、基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理【正確答案】：D83.在HDFS中,默認(rèn)一個(gè)塊多大?A、64MBB、32KBC、128KBD、16KB【正確答案】：A84.關(guān)于MapReduce1.0的體系結(jié)構(gòu)的描述,下列說法錯(cuò)誤的是?A、Task分為MapTask和ReduceTask兩種,分別由JobTracker和TaskTracker啟動(dòng)B、slot分為Mapslot和Reduceslot兩種,分別供MapTask和ReduceTask使用C、TaskTracker使用“slot”等量劃分本節(jié)點(diǎn)上的資源量(CPU、內(nèi)存等)D、TaskTracker會(huì)周期性接收J(rèn)obTracker發(fā)送過來的命令并執(zhí)行相應(yīng)的操作(如啟

動(dòng)新任務(wù)、殺死任務(wù)等)【正確答案】：A85.下列關(guān)于列族數(shù)據(jù)庫(kù)的描述,哪一項(xiàng)是錯(cuò)誤的?A、查找速度慢,可擴(kuò)展性差B、功能較少,大都不支持強(qiáng)事務(wù)一致性C、容易進(jìn)行分布式擴(kuò)展D、復(fù)雜性低【正確答案】：A86.關(guān)于Hive和傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的對(duì)比分析,下面描述錯(cuò)誤的是:()A、Hive一般依賴于分布式文件系統(tǒng)HDFS,而傳統(tǒng)數(shù)據(jù)庫(kù)則依賴于本地文件系統(tǒng)B、傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)可以針對(duì)多個(gè)列構(gòu)建復(fù)雜的索引,Hive不支持索引C、Hive和傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)都支持分區(qū)D、傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)橫向擴(kuò)展,Hive具有很好的水平擴(kuò)展性【正確答案】：B87.Hadoop框架中最核心的設(shè)計(jì)是什么?A、為海量數(shù)據(jù)提供存儲(chǔ)的HDFS和對(duì)數(shù)據(jù)進(jìn)行計(jì)算的MapReduceB、提供整個(gè)HDFS文件系統(tǒng)的NameSpace(命名空間)管理、塊管理等所有服務(wù)C、Hadoop不僅可以運(yùn)行在企業(yè)內(nèi)部的集群中,也可以運(yùn)行在云計(jì)算環(huán)境中D、Hadoop被視為事實(shí)上的大數(shù)據(jù)處理標(biāo)準(zhǔn)【正確答案】：A88.下面關(guān)于Region的說法,哪個(gè)是錯(cuò)誤的?A、同一個(gè)Region不會(huì)被分拆到多個(gè)Region服務(wù)器B、為了加快訪問速度,.META.表的全部Region都會(huì)被保存在內(nèi)存中C、一個(gè)-ROOT-表可以有多個(gè)RegionD、為了加速尋址,客戶端會(huì)緩存位置信息,同時(shí),需要解決緩存失效問題【正確答案】：C89.下面哪一項(xiàng)不是Hadoop的特性?A、可擴(kuò)展性高B、只支持少數(shù)幾種編程語言C、成本低D、能在linux上運(yùn)行【正確答案】：B90.、在Spark生態(tài)系統(tǒng)組件的應(yīng)用場(chǎng)景中,下列哪項(xiàng)說法是錯(cuò)誤的?A、Spark應(yīng)用在復(fù)雜的批量數(shù)據(jù)處理B、SparkSQL是基于歷史數(shù)據(jù)的交互式查詢C、SparkStreaming是基于歷史數(shù)據(jù)的數(shù)據(jù)挖掘D、GraphX是圖結(jié)構(gòu)數(shù)據(jù)的處理【正確答案】：C91.下列哪一項(xiàng)不屬于HDFS采用抽象的塊概念帶來的好處?A、簡(jiǎn)化系統(tǒng)設(shè)計(jì)B、支持大規(guī)模文件存儲(chǔ)C、強(qiáng)大的跨平臺(tái)兼容性D、適合數(shù)據(jù)備份【正確答案】：C92.下列哪一個(gè)不屬于Hadoop的大數(shù)據(jù)層的功能?A、數(shù)據(jù)挖掘B、離線分析C、實(shí)時(shí)計(jì)算D、BI分析【正確答案】：C93.下列關(guān)于MapReduce的說法,哪個(gè)描述是錯(cuò)誤的?A、MapReduce具有廣泛的應(yīng)用,比如關(guān)系代數(shù)運(yùn)算、分組與聚合運(yùn)算等B、MapReduce將復(fù)雜的、運(yùn)行于大規(guī)模集群上的并行計(jì)算過程高度地抽象到了兩個(gè)函數(shù)C、編程人員在不會(huì)分布式并行編程的情況下,也可以很容易將自己的程序運(yùn)行在分布式系統(tǒng)上,完成海量數(shù)據(jù)集的計(jì)算D、不同的Map任務(wù)之間可以進(jìn)行通信【正確答案】：D94.關(guān)于HBase的三層結(jié)構(gòu)中各層次的名稱和作用的說法,哪個(gè)是錯(cuò)誤的?A、Zookeeper文件記錄了用戶數(shù)據(jù)表的Region位置信息B、-ROOT-表記錄了.META.表的Region位置信息C、META.表保存了HBase中所有用戶數(shù)據(jù)表的Region位置信息D、Zookeeper文件記錄了-ROOT-表的位置信息【正確答案】：A95.下列選項(xiàng)中,關(guān)于HBase和BigTable的底層技術(shù)對(duì)應(yīng)關(guān)系,哪個(gè)是錯(cuò)誤的?A、GFS與HDFS相對(duì)應(yīng)B、GFS與Zookeeper相對(duì)應(yīng)C、MapReduce與HadoopMapReduce相對(duì)應(yīng)D、Chubby與Zookeeper相對(duì)應(yīng)【正確答案】：B96.下列關(guān)于鍵值數(shù)據(jù)庫(kù)的描述,哪一項(xiàng)是錯(cuò)誤的?()A、擴(kuò)展性好,靈活性好B、大量寫操作時(shí)性能高C、無法存儲(chǔ)結(jié)構(gòu)化信息D、條件查詢效率高【正確答案】：D97.下列哪個(gè)不屬于YARN體系結(jié)構(gòu)中ApplicationMaster的功能?A、任務(wù)調(diào)度、監(jiān)控與容錯(cuò)B、為應(yīng)用程序申請(qǐng)資源C、將申請(qǐng)的資源分配給內(nèi)部任務(wù)D、處理來自ResourceManger的命令【正確答案】：D1.信息科技為大數(shù)據(jù)時(shí)代提供哪些技術(shù)支撐?A、存儲(chǔ)設(shè)備容量不斷增加B、網(wǎng)絡(luò)帶寬不斷增加CPU處理能力大幅提升D、數(shù)據(jù)量不斷增大【正確答案】：ABC2.數(shù)據(jù)庫(kù)事務(wù)具有ACID四性,下面哪幾項(xiàng)屬于四性?A、原子性B、持久性C、間斷性D、一致性【正確答案】：ABD3.數(shù)據(jù)節(jié)點(diǎn)(DataNode)的主要功能包括哪些?A、負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和讀取B、根據(jù)客戶端或者是名稱節(jié)點(diǎn)的調(diào)度來進(jìn)行數(shù)據(jù)的存儲(chǔ)和檢索C、向名稱節(jié)點(diǎn)定期發(fā)送自己所存儲(chǔ)的塊的列表D、用來保存名稱節(jié)點(diǎn)中對(duì)HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點(diǎn)重啟的時(shí)間【正確答案】：ABC4.下列哪些選項(xiàng)屬于Hadoop的缺點(diǎn)?A、表達(dá)能力有限B、磁盤IO開銷大C、延遲高D、在前一個(gè)任務(wù)執(zhí)行完成之前,其他任務(wù)就無法開始,難以勝任復(fù)雜、多階段的計(jì)算任務(wù)【正確答案】：ABCD5.HBase與傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)的區(qū)別主要體現(xiàn)在以下哪幾個(gè)方面?A、數(shù)據(jù)類型B、數(shù)據(jù)操作C、存儲(chǔ)模式D、數(shù)據(jù)維護(hù)【正確答案】：ABCD6.下列選項(xiàng)中,哪些屬于Hadoop1.0的核心組件的不足之處?A、實(shí)時(shí)性差(適合批處理,不支持實(shí)時(shí)交互式)B、資源浪費(fèi)(Map和Reduce分兩階段執(zhí)行)C、執(zhí)行迭代操作效率低D、難以看到程序整體邏輯【正確答案】：ABCD7.下面哪個(gè)屬于大數(shù)據(jù)的應(yīng)用領(lǐng)域?A、智能醫(yī)療研發(fā)B、監(jiān)控身體情況C、實(shí)時(shí)掌握交通狀況D、金融交易【正確答案】：ABCD8.云計(jì)算關(guān)鍵技術(shù)包括什么?A、分布式存儲(chǔ)B、虛擬化C、分布式計(jì)算D、多租戶【正確答案】：ABCD9.Hadoop生態(tài)系統(tǒng)中Hive與其他部分的關(guān)系的描述正確的是:()A、HDFS作為高可靠的底層存儲(chǔ),用來存儲(chǔ)Hive的海量數(shù)據(jù)B、MapReduce對(duì)這些海量數(shù)據(jù)進(jìn)行批處理,實(shí)現(xiàn)Hive的高性能計(jì)算C、當(dāng)采用MapRedue作為Hive的執(zhí)行引擎時(shí),用HiveQL語句編寫的處理邏輯,最終都要轉(zhuǎn)化為MapReduce任務(wù)來運(yùn)行D、HBase與Hive的功能是互補(bǔ)的,它實(shí)現(xiàn)了Hive不能提供的功能【正確答案】：ABCD10.MapReduce相較于傳統(tǒng)的并行計(jì)算框架有什么優(yōu)勢(shì)?A、非共享式,容錯(cuò)性好B、普通PC機(jī),便宜,擴(kuò)展性好C、編程簡(jiǎn)單,只要告訴MapReduce做什么即可D、批處理、非實(shí)時(shí)、數(shù)據(jù)密集型【正確答案】：ABCD11.與HadoopMapReduce計(jì)算框架相比,Spark所采用的Executor具有哪些優(yōu)點(diǎn)?A、利用多線程來執(zhí)行具體的任務(wù),減少任務(wù)的啟動(dòng)開銷B、Executor中有一個(gè)BlockManager存儲(chǔ)模塊,有效減少IO開銷C、提供了一種高度受限的共享內(nèi)存模型D、不同場(chǎng)景之間輸入輸出數(shù)據(jù)能做到無縫共享【正確答案】：AB12.下面關(guān)于NoSQL與關(guān)系數(shù)據(jù)庫(kù)的比較,哪些是正確的?A、關(guān)系數(shù)據(jù)庫(kù)以完善的關(guān)系代數(shù)理論作為基礎(chǔ),有嚴(yán)格的標(biāo)準(zhǔn)B、關(guān)系數(shù)據(jù)庫(kù)可擴(kuò)展性較差,無法較好支持海量數(shù)據(jù)存儲(chǔ)C、NoSQL可以支持超大規(guī)模數(shù)據(jù)存儲(chǔ)D、NoSQL數(shù)據(jù)庫(kù)缺乏數(shù)學(xué)理論基礎(chǔ),復(fù)雜查詢性能不高【正確答案】：ABCD13.物聯(lián)網(wǎng)的關(guān)鍵技術(shù)包括哪些?A、識(shí)別和感知技術(shù)B、網(wǎng)絡(luò)與通信技術(shù)C、數(shù)據(jù)挖掘與融合技術(shù)D、信息處理一體化技術(shù)【正確答案】：ABC14.下列說法中,哪些選項(xiàng)描述正確?A、Spark在借鑒HadoopMapReduce優(yōu)點(diǎn)的同時(shí),很好地解決了MapReduce所面臨的問題B、Spark的計(jì)算模式也屬于MapReduce,但不局限于Map和Reduce操作C、HadoopMapReduce編程模型比Spark更靈活D、HadoopMapReduce提供了內(nèi)存計(jì)算,可將中間結(jié)果放到內(nèi)存中,對(duì)于迭代運(yùn)算效率更高【正確答案】：AB15.下列關(guān)于MySQL集群的描述,哪些是正確的?A、復(fù)雜性:部署、管理、配置很復(fù)雜B、數(shù)據(jù)庫(kù)復(fù)制:MySQL主備之間一般采用復(fù)制方式,很多時(shí)候是異步復(fù)制C、擴(kuò)容問題:如果系統(tǒng)壓力過大需要增加新的機(jī)器,這個(gè)過程涉及數(shù)據(jù)重新劃分D、動(dòng)態(tài)數(shù)據(jù)遷移問題:如果某個(gè)數(shù)據(jù)庫(kù)組壓力過大,需要將其中部分?jǐn)?shù)據(jù)遷移出去【正確答案】：ABCD16.HDFS要實(shí)現(xiàn)以下哪幾個(gè)目標(biāo)?A、兼容廉價(jià)的硬件設(shè)備B、流數(shù)據(jù)讀寫C、大數(shù)據(jù)集D、復(fù)雜的文件模型【正確答案】：ABC17.大數(shù)據(jù)對(duì)社會(huì)發(fā)展的影響有哪些?A、大數(shù)據(jù)成為一種新的決策方式B、大數(shù)據(jù)應(yīng)用促進(jìn)信息技術(shù)與各行業(yè)的深度融合C、大數(shù)據(jù)開發(fā)推動(dòng)新技術(shù)和新應(yīng)用的不斷涌現(xiàn)D、大數(shù)據(jù)對(duì)社會(huì)發(fā)展沒有產(chǎn)生積極影響【正確答案】：ABC18.Impala主要由哪幾個(gè)部分組成:()A、ImpaladB、StateStoreCLID、Hive【正確答案】：ABC19.下面哪個(gè)屬于不斷完善的Hadoop生態(tài)系統(tǒng)中的組件?A、PigB、TezC、KafkaDN8【正確答案】：ABC20.JobTracker主要包括哪三大功能?A、資源管理B、任務(wù)調(diào)度C、任務(wù)監(jiān)控D、數(shù)據(jù)即服務(wù)【正確答案】：ABC21.、在實(shí)際應(yīng)用中,大數(shù)據(jù)處理主要包括以下哪三個(gè)類型?A、復(fù)雜的批量數(shù)據(jù)處理:通常時(shí)間跨度在數(shù)十分鐘到數(shù)小時(shí)之間B、基于歷史數(shù)據(jù)的交互式查詢:通常時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間C、基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:通常時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間D、基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:通常時(shí)間跨度在數(shù)百毫秒到數(shù)秒之間【正確答案】：ABD22.、Spark采用RDD以后能夠?qū)崿F(xiàn)高效計(jì)算的原因主要在于?A、高效的容錯(cuò)性B、中間結(jié)果持久化到內(nèi)存,數(shù)據(jù)在內(nèi)存中的多個(gè)C、存放的數(shù)據(jù)可以是Java對(duì)象,避免了不必要的對(duì)象序列化和反序列化D、采用數(shù)據(jù)復(fù)制實(shí)現(xiàn)容錯(cuò)【正確答案】：ABC23.、傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)面臨哪些挑戰(zhàn):()A、.無法滿足快速增長(zhǎng)的海量數(shù)據(jù)存儲(chǔ)需求B、.無法有效處理不同類型的數(shù)據(jù)C、具有很強(qiáng)的擴(kuò)展性D、計(jì)算和處理能力不足【正確答案】：ABD24.HDFS的命名空間包含什么?A、磁盤B、文件C、塊D、目錄【正確答案】：BCD25.以下屬于Hive的基本數(shù)據(jù)類型是:()A、TINYINTB、FLOATC、STRINGD、BINARY【正確答案】：ABCD26.MapReduce體系結(jié)構(gòu)主要由以下那幾個(gè)部分構(gòu)成?A、ClientB、JobTrackerC、TaskTrackerD、Task【正確答案】：ABCD27.一個(gè)基本的Hadoop集群中的節(jié)點(diǎn)主要包括什么?A、DataNode:存儲(chǔ)被拆分的數(shù)據(jù)塊B、JobTracker:協(xié)調(diào)數(shù)據(jù)計(jì)算任務(wù)C、TaskTracker:負(fù)責(zé)執(zhí)行由JobTracker指派的任務(wù)D、SecondaryNameNode:幫助NameNode收集文件系統(tǒng)運(yùn)行的狀態(tài)信息【正確答案】：ABCD28.下列對(duì)于客服端的描述,哪些是正確的?A、客戶端是用戶操作HDFS最常用的方式,HDFS在部署時(shí)都提供了客戶端B、HDFS客戶端是一個(gè)庫(kù),暴露了HDFS文件系統(tǒng)接口C、嚴(yán)格來說,客戶端并不算是HDFS的一部分D、客戶端可以支持打開、讀取、寫入等常見的操作【正確答案】：ABCD29.當(dāng)處理CAP的問題時(shí),可以有哪幾個(gè)明顯的選擇?A、CA:也就是強(qiáng)調(diào)一致性(C)和可用性(A),放棄分區(qū)容忍性(P)B、CP:也就是強(qiáng)調(diào)一致性(C)和分區(qū)容忍性(P),放棄可用性(A)C、AP:也就是強(qiáng)調(diào)可用性(A)和分區(qū)容忍性(P),放棄一致性(C)D、CAP:也就是同時(shí)兼顧可用性(A)、分區(qū)容忍性(P)和一致性(C),當(dāng)時(shí)系統(tǒng)性能會(huì)下降很多【正確答案】：ABC30.HDFS采用抽象的塊概念可以帶來以下哪幾個(gè)明顯的好處?A、支持大規(guī)模文件存儲(chǔ)B、支持小規(guī)模文件存儲(chǔ)C、適合數(shù)據(jù)備份D、簡(jiǎn)化系統(tǒng)設(shè)計(jì)【正確答案】：ACD31.大數(shù)據(jù)的兩個(gè)核心技術(shù)是什么?A、分布式存儲(chǔ)B、分布式應(yīng)用C、分布式處理D、集中式存儲(chǔ)【正確答案】：AC32.下列關(guān)于圖數(shù)據(jù)庫(kù)的描述,哪些是正確的?A、專門用于處理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)B、比較適合于社交網(wǎng)絡(luò)、模式識(shí)別、依賴分析、推薦系統(tǒng)以及路徑尋找等問題C、靈活性高,支持復(fù)雜的圖算法D、復(fù)雜性高,只能支持一定的數(shù)據(jù)規(guī)模【正確答案】：ABCD33.Hive的復(fù)雜數(shù)據(jù)類型包括()。ARRAYB、MAPC、STRUCTD、UNION【正確答案】：ABCD34.Spark具有以下哪幾個(gè)主要特點(diǎn)?A、運(yùn)行速度快B、容易使用C、通用性D、運(yùn)行模式單一【正確答案】：ABC35.HBase的實(shí)現(xiàn)包括哪三個(gè)主要的功能組件?A、庫(kù)函數(shù):鏈接到每個(gè)客戶端B、一個(gè)Master主服務(wù)器C、許多個(gè)Region服務(wù)器D、廉價(jià)的計(jì)算機(jī)集群【正確答案】：ABC36.在HDFS中,名稱節(jié)點(diǎn)(NameNode)主要保存了哪些核心的數(shù)據(jù)結(jié)構(gòu)?A、FsImageB、DN8C、BlockD、EditLog【正確答案】：AD37.YARN體系結(jié)構(gòu)主要包括哪三部分?A、ResourceManagerB、NodeManagerC、DataManagerD、ApplicationMaster【正確答案】：ABD38.以下哪些是數(shù)據(jù)倉(cāng)庫(kù)的特性:()A、面向主題的(SubjectOriented)B、集成的(Integrated)C、相對(duì)穩(wěn)定的(Non-Volatile)D、反映歷史變化【正確答案】：ABCD39.第三次信息化浪潮的標(biāo)志是哪些技術(shù)的興起?A、個(gè)人計(jì)算機(jī)B、物聯(lián)網(wǎng)C、云計(jì)算D、大數(shù)據(jù)【正確答案】：BCD40.HBase訪問接口類型包括哪些?A、NativeJavaAPIB、HBaseShellC、ThriftGatewayD、RESTGateway【正確答案】：ABCD41.Hadoop的特性包括哪些?A、高可擴(kuò)展性B、支持多種編程語言C、成本低D、運(yùn)行在Linux平臺(tái)上【正確答案】：ABCD42.對(duì)于MapReduce而言,其處理單位是split。split是一個(gè)邏輯概念,它包含哪些元數(shù)據(jù)信息?A、數(shù)據(jù)起始位置B、數(shù)據(jù)長(zhǎng)度C、數(shù)據(jù)所在節(jié)點(diǎn)D、數(shù)據(jù)大小【正確答案】：AB43.下列關(guān)于Hadoop的描述,哪些是錯(cuò)誤的?A、只能支持一種編程語言B、具有較差的跨平臺(tái)特性C、可以部署在廉價(jià)的計(jì)算機(jī)集群中D、曾經(jīng)被公認(rèn)為行業(yè)大數(shù)據(jù)標(biāo)準(zhǔn)開源軟件【正確答案】：AB44.云計(jì)算的服務(wù)模式和類型主要包括哪三類?A、軟件即服務(wù)(SaaS)B、平臺(tái)即服務(wù)(PaaS)C、基礎(chǔ)設(shè)施即服務(wù)(IaaS)D、數(shù)據(jù)采集即服務(wù)(DaaS)【正確答案】：ABC45.下列關(guān)于數(shù)據(jù)模型的描述,哪些是正確的?A、HBase采用表來組織數(shù)據(jù),表由行和列組成,列劃分為若干個(gè)列族B、每個(gè)HBase表都由若干行組成,每個(gè)行由行鍵(rowkey)來標(biāo)識(shí)C、列族里的數(shù)據(jù)通過列限定符(或列)來定位D、每個(gè)單元格都保存著同一份數(shù)據(jù)的多個(gè)版本,這些版本采用時(shí)間戳進(jìn)行索引【正確答案】：ABCD46.、Scala具有以下哪幾個(gè)主要特點(diǎn)?A、Scala的優(yōu)勢(shì)是提供了REPL(Read-Eval-PrintLoop,交互式解釋器),提高程序開發(fā)效率B、Scala兼容Java,運(yùn)行速度快,且能融合到Hadoop生態(tài)圈中C、Scala具備強(qiáng)大的并發(fā)性,支持函數(shù)式編程D、Scala可以更好地支持分布式系統(tǒng)【正確答案】：ABCD47.Hadoop的優(yōu)化與發(fā)展主要體現(xiàn)在哪幾個(gè)方面?A、Hadoop自身核心組件MapReduce的架構(gòu)設(shè)計(jì)改進(jìn)B、Hadoop自身核心組件HDFS的架構(gòu)設(shè)計(jì)改進(jìn)C、Hadoop生態(tài)系統(tǒng)其它組件的不斷豐富D、Hadoop生態(tài)系統(tǒng)減少不必要的組件,整合系統(tǒng)【正確答案】：ABC48.Hadoop集群的整體性能主要受到什么因素影響?A、CPU性能B、內(nèi)存C、網(wǎng)絡(luò)D、存儲(chǔ)容量【正確答案】：ABCD49.關(guān)于Hive與傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的對(duì)比分析,下面描述正確的是:()A、.在數(shù)據(jù)存儲(chǔ)方面,Hive一般依賴于分布式文件系統(tǒng)HDFS,而傳統(tǒng)數(shù)據(jù)庫(kù)則依賴于本地文件系統(tǒng)B、在索引方面,傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)可以針對(duì)多個(gè)列構(gòu)建復(fù)雜的索引,大幅度提升數(shù)據(jù)查詢性能,而Hive不像傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)那樣有鍵的概念,它只能提供有限的索引功能C、在分區(qū)方面,傳統(tǒng)的數(shù)據(jù)庫(kù)提供分區(qū)功能來改善大型表以及具有各種訪問模式的表的可伸縮性、可管理性,以及提高數(shù)據(jù)庫(kù)效率;Hive不支持分區(qū)功能D、.在執(zhí)行引擎方面,傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)依賴自身的執(zhí)行引擎,而Hive則依賴于

M.apReduce、Tez和Spark等執(zhí)行引擎【正確答案】：ABD50.、Spark支持哪三種不同類型的部署方式?A、Standalone(類似于MapReduce1.0,slot為資源分配單位)B、SparkonMesos(和Spark有血緣關(guān)系,更好支持Mesos)C、SparkonYARND、SparkonHDFS【正確答案】：ABC51.、數(shù)據(jù)倉(cāng)庫(kù)Hive的執(zhí)行引擎可以是:()A、TezB、MapReduceC、PigD、Spark【正確答案】：ABD52.MapReduce的作業(yè)主要包括什么?A、從磁盤或從網(wǎng)絡(luò)讀取數(shù)據(jù),即IO密集工作B、計(jì)算數(shù)據(jù),即CPU密集工作C、針對(duì)不同的工作節(jié)點(diǎn)選擇合適硬件類型D、負(fù)責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲(chǔ)【正確答案】：AB53.下列哪一項(xiàng)不屬于Hadoop的特性?A、較低可擴(kuò)展性B、只支持java語言C、成本低D、運(yùn)行在Linux平臺(tái)上【正確答案】：AB54.下列關(guān)于MapReduce的體系結(jié)構(gòu)的描述,說法正確的有?A、用戶編寫的MapReduce程序通過Client提交到JobTracker端B、JobTracker負(fù)責(zé)資源監(jiān)控和作業(yè)調(diào)度C、TaskTracker監(jiān)控所有TaskTracker與Job的健康狀況D、TaskTracker使用“slot”等量劃分本節(jié)點(diǎn)上的資源量(CPU、內(nèi)存等)【正確答案】：ABD55.HDFS1.0主要存在哪些問題?A、單點(diǎn)故障問題B、不可以水平擴(kuò)展C、單個(gè)名稱節(jié)點(diǎn)難以提供不同程序之間的隔離性D、系統(tǒng)整體性能受限于單個(gè)名稱節(jié)點(diǎn)的吞吐量【正確答案】：ACD56.HDFS特殊的設(shè)計(jì),在實(shí)現(xiàn)優(yōu)良特性的同時(shí),也使得自身具有一些應(yīng)用局限性,主要包括以下哪幾個(gè)方面?A、較差的跨平臺(tái)兼容性B、無法高效存儲(chǔ)大量小文件C、不支持多用戶寫入及任意修改文件D、不適合低延遲數(shù)據(jù)訪問【正確答案】：BCD57.MapReduce的具體應(yīng)用包括哪些?A、關(guān)系代數(shù)運(yùn)算(選擇、投影、并、交、差、連接)B、分組與聚合運(yùn)算C、矩陣-向量乘法D、矩陣乘法【正確答案】：ABCD58.下列關(guān)于Region服務(wù)器工作原理的描述,哪些是正確的?A、每個(gè)Region服務(wù)器都有一個(gè)自己的HLog文件B、每次刷寫都生成一個(gè)新的StoreFile,數(shù)量太多,影響查找速度C、合并操作比較耗費(fèi)資源,只有數(shù)量達(dá)到一個(gè)閾值才啟動(dòng)合并D、Store是Region服務(wù)器的核心【正確答案】：ABCD59.NoSQL的三大基石?A、CAPB、最終一致性C、BASEDN8【正確答案】：ABC60.下列關(guān)于Map端的Shuffle的描述,哪些是正確的?A、MapReduce默認(rèn)為每個(gè)Map任務(wù)分配1000MB緩存B、多個(gè)溢寫文件歸并成一個(gè)或多個(gè)大文件,文件中的鍵值對(duì)是排序的C、當(dāng)數(shù)據(jù)很少時(shí),不需要溢寫到磁盤,直接在緩存中歸并,然后輸出給ReduceD、每個(gè)Map任務(wù)分配多個(gè)緩存,使得任務(wù)運(yùn)行更有效率【正確答案】：BC61.、Spark運(yùn)行架構(gòu)具有以下哪些特點(diǎn)?A、每個(gè)Application都有自己專屬的Executor進(jìn)程,并且該進(jìn)程在Application運(yùn)行期間一直駐留B、Executor進(jìn)程以多線程的方式運(yùn)行TaskC、Spark運(yùn)行過程與資源管理器無關(guān),只要能夠獲取Executor進(jìn)程并保持通信即可D、Task采用了數(shù)據(jù)本地性和推測(cè)執(zhí)行等優(yōu)化機(jī)制【正確答案】：ABCD62.關(guān)系數(shù)據(jù)庫(kù)引以為傲的兩個(gè)關(guān)鍵特性(完善的事務(wù)機(jī)制和高效的查詢機(jī)制),到了Web2.0時(shí)代卻成了雞肋,主要表現(xiàn)在以下哪幾個(gè)方面?A、Web2.0網(wǎng)站系統(tǒng)通常不要求嚴(yán)格的數(shù)據(jù)庫(kù)事務(wù)B、Web2.0網(wǎng)站系統(tǒng)基本上不用關(guān)系數(shù)據(jù)庫(kù)來存儲(chǔ)數(shù)據(jù)C、Web2.0并不要求嚴(yán)格的讀寫實(shí)時(shí)性D、Web2.0通常不包含大量復(fù)雜的SQL查詢【正確答案】：ACD63.關(guān)于NoSQL的三大基石之一的CAP,下列哪些說法是正確的?A、一致性,是指任何一個(gè)讀操作總是能夠讀到之前完成的寫操作的結(jié)果量B、一個(gè)分布式系統(tǒng)可以同時(shí)滿足一致性、可用性和分區(qū)容忍性這三個(gè)需求C、可用性,是指快速獲取數(shù)據(jù)D、分區(qū)容忍性,是指當(dāng)出現(xiàn)網(wǎng)絡(luò)分區(qū)的情況時(shí)(即系統(tǒng)中的一部分節(jié)點(diǎn)無法和其

他節(jié)點(diǎn)進(jìn)行通信),分離的系統(tǒng)也能夠正常運(yùn)行【正確答案】：ACD64.HBase的三層結(jié)構(gòu)中,三層指的是哪三層?A、Zookeeper文件B、-ROOT-表C、META.表D、數(shù)據(jù)類型【正確答案】：ABC65.關(guān)系數(shù)據(jù)庫(kù)已經(jīng)無法滿足Web2.0的需求,主要表現(xiàn)在以下幾個(gè)方面?A、無法滿足海量數(shù)據(jù)的管理需求B、無法滿足數(shù)據(jù)高并發(fā)的需求C、無法滿足高可擴(kuò)展性和高可用性的需求D、使用難度高【正確答案】：ABC66.Zookeeper是一個(gè)很好的集群管理工具,被大量用于分布式計(jì)算,它主要提供什么服務(wù)?A、配置維護(hù)B、域名服務(wù)C、分布式同步D、負(fù)載均衡服務(wù)【正確答案】：ABC67.大數(shù)據(jù)具有哪些特點(diǎn)?A、數(shù)據(jù)的“大量化”B、數(shù)據(jù)的“快速化”C、數(shù)據(jù)的“多樣化”D、數(shù)據(jù)的“價(jià)值密度比較低”【正確答案】：ABCD68.下列關(guān)于Hadoop的描述,哪些是正確的?A、為用戶提供了系統(tǒng)底層細(xì)節(jié)透明的分布式基礎(chǔ)架構(gòu)B、具有很好的跨平臺(tái)特性C、可以部署在廉價(jià)的計(jì)算機(jī)集群中D、曾經(jīng)被公認(rèn)為行業(yè)大數(shù)據(jù)標(biāo)準(zhǔn)開源軟件【正確答案】：ABCD69.Hive主要由哪三個(gè)模塊組成:()A、用戶接口模塊B、.用戶查詢模塊C、驅(qū)動(dòng)模塊D、元數(shù)據(jù)存儲(chǔ)模塊【正確答案】：ABD70.、在實(shí)際應(yīng)用中,當(dāng)采用多種計(jì)算架構(gòu)來滿足不同應(yīng)用場(chǎng)景需求時(shí),大數(shù)據(jù)處理難免會(huì)帶來哪些問題?A、不同場(chǎng)景之間輸入輸出數(shù)據(jù)無法做到無縫共享,通常需要進(jìn)行數(shù)據(jù)格式的轉(zhuǎn)換B、不同的軟件需要不同的開發(fā)和維護(hù)團(tuán)隊(duì)C、需要較高的使用成本D、比較難以對(duì)同一個(gè)集群中的各個(gè)系統(tǒng)進(jìn)行統(tǒng)一的資源協(xié)調(diào)和分配【正確答案】：ABCD71.HDFS數(shù)據(jù)塊多副本存儲(chǔ)具備以下哪些優(yōu)點(diǎn)?A、加快數(shù)據(jù)傳輸速度B、容易檢查數(shù)據(jù)錯(cuò)誤C、保證數(shù)據(jù)可靠性D、適合多平臺(tái)上運(yùn)行【正確答案】：ABC72.下列關(guān)于文檔數(shù)據(jù)庫(kù)的描述,哪些是正確的?A、性能

人人文庫(kù)> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

大數(shù)據(jù)技術(shù)教材配套習(xí)題練習(xí)測(cè)試卷

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

大數(shù)據(jù)技術(shù)教材配套習(xí)題練習(xí)測(cè)試卷

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔