MOOC 大數(shù)據(jù)技術(shù)原理與應(yīng)用-廈門(mén)大學(xué) 中國(guó)大學(xué)慕課答案

上傳人：小*** IP屬地：廣東上傳時(shí)間：2024-04-14 格式：DOCX 頁(yè)數(shù)：31 大小：60.21KB 積分：9.6 舉報(bào) 版權(quán)申訴

MOOC 大數(shù)據(jù)技術(shù)原理與應(yīng)用-廈門(mén)大學(xué) 中國(guó)大學(xué)慕課答案_第2頁(yè)

MOOC 大數(shù)據(jù)技術(shù)原理與應(yīng)用-廈門(mén)大學(xué) 中國(guó)大學(xué)慕課答案_第3頁(yè)

MOOC 大數(shù)據(jù)技術(shù)原理與應(yīng)用-廈門(mén)大學(xué) 中國(guó)大學(xué)慕課答案_第4頁(yè)

MOOC 大數(shù)據(jù)技術(shù)原理與應(yīng)用-廈門(mén)大學(xué) 中國(guó)大學(xué)慕課答案_第5頁(yè)

已閱讀5頁(yè)，還剩26頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

MOOC大數(shù)據(jù)技術(shù)原理與應(yīng)用-廈門(mén)大學(xué)中國(guó)大學(xué)慕課答案第1章大數(shù)據(jù)概述單元測(cè)驗(yàn)1、問(wèn)題：第三次信息化浪潮的標(biāo)志是：選項(xiàng)：A、個(gè)人電腦的普及B、互聯(lián)網(wǎng)的普及C、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù)的普及D、虛擬現(xiàn)實(shí)技術(shù)的普及正確答案:【云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù)的普及】2、問(wèn)題：就數(shù)據(jù)的量級(jí)而言，1PB數(shù)據(jù)是多少TB？選項(xiàng)：A、512B、1024C、1000D、2048正確答案:【1024】3、問(wèn)題：以下關(guān)于云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)之間的關(guān)系，論述錯(cuò)誤的是：選項(xiàng)：A、云計(jì)算側(cè)重于數(shù)據(jù)分析B、云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)三者緊密相關(guān)，相輔相成C、物聯(lián)網(wǎng)可以借助于云計(jì)算實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ)D、物聯(lián)網(wǎng)可以借助于大數(shù)據(jù)實(shí)現(xiàn)海量數(shù)據(jù)的分析正確答案:【云計(jì)算側(cè)重于數(shù)據(jù)分析】4、問(wèn)題：以下哪個(gè)不是大數(shù)據(jù)時(shí)代新興的技術(shù)：選項(xiàng)：A、HadoopB、SparkC、HBaseD、MySQL正確答案:【MySQL】5、問(wèn)題：每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景，以下哪個(gè)產(chǎn)品是用于批處理的：選項(xiàng)：A、MapReduceB、PregelC、DremelD、Storm正確答案:【MapReduce】6、問(wèn)題：每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景，以下哪個(gè)產(chǎn)品是用于流計(jì)算的：選項(xiàng)：A、GraphXB、S4C、HiveD、Impala正確答案:【S4】7、問(wèn)題：每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景，以下哪個(gè)產(chǎn)品是用于圖計(jì)算的：選項(xiàng)：A、CassandraB、FlumeC、StormD、Pregel正確答案:【Pregel】8、問(wèn)題：每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景，以下哪個(gè)產(chǎn)品是用于查詢分析計(jì)算的：選項(xiàng)：A、MapReduceB、HDFSC、DremelD、S4正確答案:【Dremel】9、問(wèn)題：數(shù)據(jù)產(chǎn)生方式大致經(jīng)歷了三個(gè)階段，包括：選項(xiàng)：A、運(yùn)營(yíng)式系統(tǒng)階段B、用戶原創(chuàng)內(nèi)容階段C、感知式系統(tǒng)階段D、移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)階段正確答案:【運(yùn)營(yíng)式系統(tǒng)階段#用戶原創(chuàng)內(nèi)容階段#感知式系統(tǒng)階段】10、問(wèn)題：大數(shù)據(jù)發(fā)展的三個(gè)階段是：選項(xiàng)：A、萌芽期B、低谷期C、成熟期D、大規(guī)模應(yīng)用期正確答案:【萌芽期#成熟期#大規(guī)模應(yīng)用期】11、問(wèn)題：大數(shù)據(jù)的特性包括：選項(xiàng)：A、數(shù)據(jù)量大B、數(shù)據(jù)類型繁多C、處理速度快D、價(jià)值密度低正確答案:【數(shù)據(jù)量大#數(shù)據(jù)類型繁多#處理速度快#價(jià)值密度低】12、問(wèn)題：圖領(lǐng)獎(jiǎng)獲得者、著名數(shù)據(jù)庫(kù)專家JimGray博士認(rèn)為，人類自古以來(lái)在科學(xué)研究上先后經(jīng)歷了哪幾種范式：選項(xiàng)：A、實(shí)驗(yàn)科學(xué)B、理論科學(xué)C、計(jì)算科學(xué)D、數(shù)據(jù)密集型科學(xué)正確答案:【實(shí)驗(yàn)科學(xué)#理論科學(xué)#計(jì)算科學(xué)#數(shù)據(jù)密集型科學(xué)】13、問(wèn)題：大數(shù)據(jù)帶來(lái)思維方式的三個(gè)轉(zhuǎn)變是：選項(xiàng)：A、精確而非全面B、全樣而非抽樣C、效率而非精確D、相關(guān)而非因果正確答案:【全樣而非抽樣#效率而非精確#相關(guān)而非因果】14、問(wèn)題：大數(shù)據(jù)主要有哪幾種計(jì)算模式：選項(xiàng)：A、批處理計(jì)算B、流計(jì)算C、圖計(jì)算D、查詢分析計(jì)算正確答案:【批處理計(jì)算#流計(jì)算#圖計(jì)算#查詢分析計(jì)算】15、問(wèn)題：云計(jì)算的典型服務(wù)模式包括三種：選項(xiàng)：A、PaaSB、IaaSC、SaaSD、MaaS正確答案:【PaaS#IaaS#SaaS】第2章大數(shù)據(jù)處理架構(gòu)Hadoop單元測(cè)驗(yàn)1、問(wèn)題：?jiǎn)?dòng)hadoop所有進(jìn)程的命令是:選項(xiàng)：A、start-dfs.shB、start-hadoop.shC、start-all.shD、start-hdfs.sh正確答案:【start-all.sh】2、問(wèn)題：以下對(duì)Hadoop的說(shuō)法錯(cuò)誤的是：選項(xiàng)：A、Hadoop的核心是HDFS和MapReduceB、Hadoop是基于Java語(yǔ)言開(kāi)發(fā)的，只支持Java語(yǔ)言編程C、Hadoop2.0增加了NameNodeHA和Wire-compatibility兩個(gè)重大特性D、HadoopMapReduce是針對(duì)谷歌MapReduce的開(kāi)源實(shí)現(xiàn)，通常用于大規(guī)模數(shù)據(jù)集的并行計(jì)算正確答案:【Hadoop是基于Java語(yǔ)言開(kāi)發(fā)的，只支持Java語(yǔ)言編程】3、問(wèn)題：以下哪個(gè)不是Hadoop的特性:選項(xiàng)：A、高容錯(cuò)性B、高可靠性C、成本高D、支持多種編程語(yǔ)言正確答案:【成本高】4、問(wèn)題：以下名詞解釋不正確的是:選項(xiàng)：A、HDFS：分布式文件系統(tǒng)，是Hadoop項(xiàng)目的兩大核心之一，是谷歌GFS的開(kāi)源實(shí)現(xiàn)B、HBase：提供高可靠性、高性能、分布式的行式數(shù)據(jù)庫(kù)，是谷歌BigTable的開(kāi)源實(shí)現(xiàn)C、Hive：一個(gè)基于Hadoop的數(shù)據(jù)倉(cāng)庫(kù)工具，用于對(duì)Hadoop文件中的數(shù)據(jù)集進(jìn)行數(shù)據(jù)整理、特殊查詢和分析存儲(chǔ)D、Zookeeper：針對(duì)谷歌Chubby的一個(gè)開(kāi)源實(shí)現(xiàn)，是高效可靠的協(xié)同工作系統(tǒng)正確答案:【HBase：提供高可靠性、高性能、分布式的行式數(shù)據(jù)庫(kù)，是谷歌BigTable的開(kāi)源實(shí)現(xiàn)】5、問(wèn)題：以下哪些組件是Hadoop的生態(tài)系統(tǒng)的組件：選項(xiàng)：A、MapReduceB、HDFSC、OracleD、HBase正確答案:【MapReduce#HDFS#HBase】6、問(wèn)題：以下哪個(gè)命令可以用來(lái)操作HDFS文件:選項(xiàng)：A、hadoopfsB、hdfsdfsC、hadoopdfsD、hdfsfs正確答案:【hadoopfs#hdfsdfs#hadoopdfs】第3章分布式文件系統(tǒng)HDFS單元測(cè)驗(yàn)1、問(wèn)題：HDFS的命名空間不包含:選項(xiàng)：A、目錄B、文件C、塊D、字節(jié)正確答案:【字節(jié)】2、問(wèn)題：對(duì)HDFS通信協(xié)議的理解錯(cuò)誤的是:選項(xiàng)：A、HDFS通信協(xié)議都是構(gòu)建在IoT協(xié)議基礎(chǔ)之上的B、名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)之間則使用數(shù)據(jù)節(jié)點(diǎn)協(xié)議進(jìn)行交互C、客戶端與數(shù)據(jù)節(jié)點(diǎn)的交互是通過(guò)RPC（RemoteProcedureCall）來(lái)實(shí)現(xiàn)的D、客戶端通過(guò)一個(gè)可配置的端口向名稱節(jié)點(diǎn)主動(dòng)發(fā)起TCP連接，并使用客戶端協(xié)議與名稱節(jié)點(diǎn)進(jìn)行交互正確答案:【HDFS通信協(xié)議都是構(gòu)建在IoT協(xié)議基礎(chǔ)之上的】3、問(wèn)題：采用多副本冗余存儲(chǔ)的優(yōu)勢(shì)不包含:選項(xiàng)：A、加快數(shù)據(jù)傳輸速度B、節(jié)約存儲(chǔ)空間C、容易檢查數(shù)據(jù)錯(cuò)誤D、保證數(shù)據(jù)可靠性正確答案:【節(jié)約存儲(chǔ)空間】4、問(wèn)題：假設(shè)已經(jīng)配置好環(huán)境變量，啟動(dòng)Hadoop和關(guān)閉Hadoop的命令分別是:選項(xiàng)：A、start-hdfs.sh，stop-hdfs.shB、start-dfs.sh，stop-dfs.shC、start-dfs.sh，stop-hdfs.shD、start-hdfs.sh，stop-dfs.sh正確答案:【start-dfs.sh，stop-dfs.sh】5、問(wèn)題：分布式文件系統(tǒng)HDFS采用了主從結(jié)構(gòu)模型，由計(jì)算機(jī)集群中的多個(gè)節(jié)點(diǎn)構(gòu)成的，這些節(jié)點(diǎn)分為兩類，一類存儲(chǔ)元數(shù)據(jù)叫，另一類存儲(chǔ)具體數(shù)據(jù)叫:選項(xiàng)：A、名稱節(jié)點(diǎn)，數(shù)據(jù)節(jié)點(diǎn)B、數(shù)據(jù)節(jié)點(diǎn)，名稱節(jié)點(diǎn)C、名稱節(jié)點(diǎn)，主節(jié)點(diǎn)D、從節(jié)點(diǎn)，主節(jié)點(diǎn)正確答案:【名稱節(jié)點(diǎn)，數(shù)據(jù)節(jié)點(diǎn)】6、問(wèn)題：下面關(guān)于分布式文件系統(tǒng)HDFS的描述正確的是：選項(xiàng)：A、分布式文件系統(tǒng)HDFS是一種關(guān)系型數(shù)據(jù)庫(kù)B、分布式文件系統(tǒng)HDFS是GoogleBigtable的一種開(kāi)源實(shí)現(xiàn)C、分布式文件系統(tǒng)HDFS是谷歌分布式文件系統(tǒng)GFS（GoogleFileSystem）的一種開(kāi)源實(shí)現(xiàn)D、分布式文件系統(tǒng)HDFS比較適合存儲(chǔ)大量零碎的小文件正確答案:【分布式文件系統(tǒng)HDFS是谷歌分布式文件系統(tǒng)GFS（GoogleFileSystem）的一種開(kāi)源實(shí)現(xiàn)】7、問(wèn)題：以下對(duì)名稱節(jié)點(diǎn)理解正確的是:選項(xiàng)：A、名稱節(jié)點(diǎn)通常用來(lái)保存元數(shù)據(jù)B、名稱節(jié)點(diǎn)的數(shù)據(jù)保存在內(nèi)存中C、名稱節(jié)點(diǎn)作為中心服務(wù)器，負(fù)責(zé)管理文件系統(tǒng)的命名空間及客戶端對(duì)文件的訪問(wèn)D、名稱節(jié)點(diǎn)用來(lái)負(fù)責(zé)具體用戶數(shù)據(jù)的存儲(chǔ)正確答案:【名稱節(jié)點(diǎn)通常用來(lái)保存元數(shù)據(jù)#名稱節(jié)點(diǎn)的數(shù)據(jù)保存在內(nèi)存中#名稱節(jié)點(diǎn)作為中心服務(wù)器，負(fù)責(zé)管理文件系統(tǒng)的命名空間及客戶端對(duì)文件的訪問(wèn)】8、問(wèn)題：以下對(duì)數(shù)據(jù)節(jié)點(diǎn)理解正確的是:選項(xiàng)：A、數(shù)據(jù)節(jié)點(diǎn)用來(lái)存儲(chǔ)具體的文件內(nèi)容B、數(shù)據(jù)節(jié)點(diǎn)的數(shù)據(jù)保存在磁盤(pán)中C、數(shù)據(jù)節(jié)點(diǎn)在名稱節(jié)點(diǎn)的統(tǒng)一調(diào)度下進(jìn)行數(shù)據(jù)塊的創(chuàng)建、刪除和復(fù)制等操作D、數(shù)據(jù)節(jié)點(diǎn)通常只有一個(gè)正確答案:【數(shù)據(jù)節(jié)點(diǎn)用來(lái)存儲(chǔ)具體的文件內(nèi)容#數(shù)據(jù)節(jié)點(diǎn)的數(shù)據(jù)保存在磁盤(pán)中#數(shù)據(jù)節(jié)點(diǎn)在名稱節(jié)點(diǎn)的統(tǒng)一調(diào)度下進(jìn)行數(shù)據(jù)塊的創(chuàng)建、刪除和復(fù)制等操作】9、問(wèn)題：HDFS只設(shè)置唯一一個(gè)名稱節(jié)點(diǎn)帶來(lái)的局限性包括:選項(xiàng)：A、性能的瓶頸B、命名空間的限制C、隔離問(wèn)題D、集群的可用性正確答案:【性能的瓶頸#命名空間的限制#隔離問(wèn)題#集群的可用性】10、問(wèn)題：以下HDFS相關(guān)的shell命令不正確的是:選項(xiàng)：A、hadoopfs-lspath：顯示path指定的文件的詳細(xì)信息B、hadoopdfsmkdirpath：創(chuàng)建path指定的文件夾C、hadoopfs-copyFromLocalpath1path2：將路徑path2指定的文件或文件夾復(fù)制到路徑path1指定的文件夾中D、hdfsdfs-rmpath：刪除路徑path指定的文件正確答案:【hadoopdfsmkdirpath：創(chuàng)建path指定的文件夾#hadoopfs-copyFromLocalpath1path2：將路徑path2指定的文件或文件夾復(fù)制到路徑path1指定的文件夾中】第4章分布式數(shù)據(jù)庫(kù)HBase單元測(cè)驗(yàn)1、問(wèn)題：HBase是一種數(shù)據(jù)庫(kù)選項(xiàng)：A、行式數(shù)據(jù)庫(kù)B、列式數(shù)據(jù)庫(kù)C、文檔數(shù)據(jù)庫(kù)D、關(guān)系數(shù)據(jù)庫(kù)正確答案:【列式數(shù)據(jù)庫(kù)】2、問(wèn)題：下列對(duì)HBase數(shù)據(jù)模型的描述錯(cuò)誤的是:選項(xiàng)：A、HBase是一個(gè)稀疏、多維度、排序的映射表，這張表的索引是行鍵、列族、列限定符和時(shí)間戳B、HBase列族支持動(dòng)態(tài)擴(kuò)展，可以很輕松地添加一個(gè)列族或列C、HBase中執(zhí)行更新操作時(shí)，會(huì)刪除數(shù)據(jù)舊的版本，并生成一個(gè)新的版本D、每個(gè)HBase表都由若干行組成，每個(gè)行由行鍵（rowkey）來(lái)標(biāo)識(shí)正確答案:【HBase中執(zhí)行更新操作時(shí)，會(huì)刪除數(shù)據(jù)舊的版本，并生成一個(gè)新的版本】3、問(wèn)題：下列說(shuō)法正確的是:選項(xiàng)：A、HBase的實(shí)現(xiàn)包括的主要功能組件是庫(kù)函數(shù)，一個(gè)Master主服務(wù)器和一個(gè)Region服務(wù)器B、Zookeeper是一個(gè)集群管理工具，常用于分布式計(jì)算，提供配置維護(hù)、域名服務(wù)、分布式同步等C、如果不啟動(dòng)Hadoop，則HBase完全無(wú)法使用D、如果通過(guò)HBaseShell插入表數(shù)據(jù)，可以插入一行數(shù)據(jù)或一個(gè)單元格數(shù)據(jù)正確答案:【Zookeeper是一個(gè)集群管理工具，常用于分布式計(jì)算，提供配置維護(hù)、域名服務(wù)、分布式同步等】4、問(wèn)題：在HBase數(shù)據(jù)庫(kù)中，每個(gè)Region的建議最佳大小是：選項(xiàng)：A、100MB-200MBB、500MB-1000MBC、1GB-2GBD、2GB-4GB正確答案:【1GB-2GB】5、問(wèn)題：HBase三層結(jié)構(gòu)的順序是:選項(xiàng)：A、Zookeeper文件，.MEATA.表，-ROOT-表B、Zookeeper文件，-ROOT-表，.MEATA.表C、-ROOT-表，Zookeeper文件，.MEATA.表D、.MEATA.表，Zookeeper文件，-ROOT-表正確答案:【Zookeeper文件，-ROOT-表，.MEATA.表】6、問(wèn)題：客戶端是通過(guò)級(jí)尋址來(lái)定位Region:選項(xiàng)：A、一B、二C、三D、四正確答案:【三】7、問(wèn)題：關(guān)于HBaseShell命令解釋錯(cuò)誤的是:選項(xiàng)：A、create：創(chuàng)建表B、list：顯示表的所有數(shù)據(jù)C、put：向表、行、列指定的單元格添加數(shù)據(jù)D、get：通過(guò)表名、行、列、時(shí)間戳、時(shí)間范圍和版本號(hào)來(lái)獲得相應(yīng)單元格的值正確答案:【list：顯示表的所有數(shù)據(jù)】8、問(wèn)題：下列對(duì)HBase的理解正確的是：選項(xiàng)：A、HBase是一個(gè)行式分布式數(shù)據(jù)庫(kù)，是Hadoop生態(tài)系統(tǒng)中的一個(gè)組件B、HBase是針對(duì)谷歌BigTable的開(kāi)源實(shí)現(xiàn)C、HBase多用于存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)D、HBase是一種關(guān)系型數(shù)據(jù)庫(kù)，現(xiàn)成功應(yīng)用于互聯(lián)網(wǎng)服務(wù)領(lǐng)域正確答案:【HBase是針對(duì)谷歌BigTable的開(kāi)源實(shí)現(xiàn)#HBase多用于存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)】9、問(wèn)題：HBase和傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的區(qū)別在于哪些方面:選項(xiàng)：A、數(shù)據(jù)模型B、數(shù)據(jù)操作C、存儲(chǔ)模式D、數(shù)據(jù)索引正確答案:【數(shù)據(jù)模型#數(shù)據(jù)操作#存儲(chǔ)模式#數(shù)據(jù)索引】10、問(wèn)題：訪問(wèn)HBase表中的行，有哪些方式:選項(xiàng)：A、通過(guò)單個(gè)行健訪問(wèn)B、通過(guò)一個(gè)行健的區(qū)間來(lái)訪問(wèn)C、全表掃描D、通過(guò)某列的值區(qū)間正確答案:【通過(guò)單個(gè)行健訪問(wèn)#通過(guò)一個(gè)行健的區(qū)間來(lái)訪問(wèn)#全表掃描】第5章NoSQL數(shù)據(jù)庫(kù)單元測(cè)驗(yàn)1、問(wèn)題：下列關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系型數(shù)據(jù)庫(kù)的比較，不正確的是：選項(xiàng)：A、NoSQL數(shù)據(jù)庫(kù)具有弱一致性，關(guān)系型數(shù)據(jù)庫(kù)具有強(qiáng)一致性B、NoSQL數(shù)據(jù)庫(kù)很容易實(shí)現(xiàn)數(shù)據(jù)完整性，關(guān)系型數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性C、NoSQL數(shù)據(jù)庫(kù)的可擴(kuò)展性比傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)更好D、NoSQL數(shù)據(jù)庫(kù)缺乏統(tǒng)一的查詢語(yǔ)言，而關(guān)系型數(shù)據(jù)庫(kù)有標(biāo)準(zhǔn)化查詢語(yǔ)言正確答案:【NoSQL數(shù)據(jù)庫(kù)很容易實(shí)現(xiàn)數(shù)據(jù)完整性，關(guān)系型數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性】2、問(wèn)題：以下對(duì)各類數(shù)據(jù)庫(kù)的理解錯(cuò)誤的是:選項(xiàng)：A、HBase數(shù)據(jù)庫(kù)是列族數(shù)據(jù)庫(kù)，可擴(kuò)展性強(qiáng)，支持事務(wù)一致性B、文檔數(shù)據(jù)庫(kù)的數(shù)據(jù)是松散的，XML和JSON文檔等都可以作為數(shù)據(jù)存儲(chǔ)在文檔數(shù)據(jù)庫(kù)中C、鍵值數(shù)據(jù)庫(kù)的鍵是一個(gè)字符串對(duì)象，值可以是任意類型的數(shù)據(jù)，比如整型和字符型等D、圖數(shù)據(jù)庫(kù)靈活性高，支持復(fù)雜的圖算法，可用于構(gòu)建復(fù)雜的關(guān)系圖譜正確答案:【HBase數(shù)據(jù)庫(kù)是列族數(shù)據(jù)庫(kù)，可擴(kuò)展性強(qiáng)，支持事務(wù)一致性】3、問(wèn)題：下列數(shù)據(jù)庫(kù)屬于文檔數(shù)據(jù)庫(kù)的是:選項(xiàng)：A、MySQLB、HBaseC、RedisD、MongoDB正確答案:【MongoDB】4、問(wèn)題：NoSQL數(shù)據(jù)庫(kù)的三大理論基石不包括:選項(xiàng)：A、CAPB、BASEC、最終一致性D、ACID正確答案:【ACID】5、問(wèn)題：關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)，下列說(shuō)法正確的是：選項(xiàng)：A、關(guān)系數(shù)據(jù)庫(kù)有關(guān)系代數(shù)理論作為基礎(chǔ)，NoSQL數(shù)據(jù)庫(kù)沒(méi)有統(tǒng)一的理論基礎(chǔ)B、NoSQL數(shù)據(jù)庫(kù)可以支持超大規(guī)模數(shù)據(jù)存儲(chǔ)，具有強(qiáng)大的橫向擴(kuò)展能力C、大多數(shù)NoSQL數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性D、NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)各有優(yōu)缺點(diǎn)，但隨著NoSQL的發(fā)展，終將取代關(guān)系數(shù)據(jù)庫(kù)正確答案:【關(guān)系數(shù)據(jù)庫(kù)有關(guān)系代數(shù)理論作為基礎(chǔ)，NoSQL數(shù)據(jù)庫(kù)沒(méi)有統(tǒng)一的理論基礎(chǔ)#NoSQL數(shù)據(jù)庫(kù)可以支持超大規(guī)模數(shù)據(jù)存儲(chǔ)，具有強(qiáng)大的橫向擴(kuò)展能力#大多數(shù)NoSQL數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性】6、問(wèn)題：NoSQL數(shù)據(jù)庫(kù)的類型包括：選項(xiàng)：A、鍵值數(shù)據(jù)庫(kù)B、列族數(shù)據(jù)庫(kù)C、文檔數(shù)據(jù)庫(kù)D、圖數(shù)據(jù)庫(kù)正確答案:【鍵值數(shù)據(jù)庫(kù)#列族數(shù)據(jù)庫(kù)#文檔數(shù)據(jù)庫(kù)#圖數(shù)據(jù)庫(kù)】7、問(wèn)題：CAP是指:選項(xiàng)：A、一致性B、可用性C、持久性D、分區(qū)容忍性正確答案:【一致性#可用性#分區(qū)容忍性】8、問(wèn)題：NoSQL數(shù)據(jù)庫(kù)的BASE特性是指:選項(xiàng)：A、基本可用B、軟狀態(tài)C、最終一致性D、持續(xù)性正確答案:【基本可用#軟狀態(tài)#最終一致性】第6章云數(shù)據(jù)庫(kù)單元測(cè)驗(yàn)1、問(wèn)題：下列Amazon的云數(shù)據(jù)庫(kù)屬于關(guān)系數(shù)據(jù)庫(kù)的是：選項(xiàng)：A、AmazonSimpleDBB、AmazonRDSC、AmazonDynamoDBD、AmazonRedshift正確答案:【AmazonRDS】2、問(wèn)題：下列關(guān)于UMP系統(tǒng)的說(shuō)法不正確的是:選項(xiàng)：A、UMP系統(tǒng)是低成本和高性能的MySQL云數(shù)據(jù)庫(kù)方案B、Controller服務(wù)器向UMP集群提供各種管理服務(wù)，實(shí)現(xiàn)集群成員管理、元數(shù)據(jù)存儲(chǔ)等功能C、Agent服務(wù)器部署在運(yùn)行MySQL進(jìn)程的機(jī)器上，用來(lái)管理每臺(tái)物理機(jī)上的MySQL實(shí)例D、Mnesia是UMP系統(tǒng)的一個(gè)組件，是一個(gè)分布式數(shù)據(jù)庫(kù)管理系統(tǒng)，且不支持事務(wù)正確答案:【Mnesia是UMP系統(tǒng)的一個(gè)組件，是一個(gè)分布式數(shù)據(jù)庫(kù)管理系統(tǒng)，且不支持事務(wù)】3、問(wèn)題：UMP依賴的開(kāi)源組件包括:選項(xiàng)：A、MnesiaB、LVSC、RabbitMQD、ZooKeeper正確答案:【Mnesia#LVS#RabbitMQ#ZooKeeper】4、問(wèn)題：在UMP系統(tǒng)中，Zookeeper主要發(fā)揮的作用包括:選項(xiàng)：A、作為全局的配置服務(wù)器B、提供分布式鎖，選出一個(gè)集群的“總管”C、監(jiān)控所有MySQL實(shí)例D、負(fù)責(zé)集群負(fù)載均衡正確答案:【作為全局的配置服務(wù)器#提供分布式鎖，選出一個(gè)集群的“總管”#監(jiān)控所有MySQL實(shí)例】5、問(wèn)題：UMP系統(tǒng)設(shè)計(jì)了哪些機(jī)制來(lái)保證數(shù)據(jù)安全:選項(xiàng)：A、SSL數(shù)據(jù)庫(kù)連接B、記錄用戶操作日志C、數(shù)據(jù)訪問(wèn)IP白名單D、SQL攔截正確答案:【SSL數(shù)據(jù)庫(kù)連接#記錄用戶操作日志#數(shù)據(jù)訪問(wèn)IP白名單#SQL攔截】第7章MapReduce單元測(cè)驗(yàn)1、問(wèn)題：下列說(shuō)法錯(cuò)誤的是:選項(xiàng)：A、Hadoop框架是用Java實(shí)現(xiàn)的，MapReduce應(yīng)用程序則一定要用Java來(lái)寫(xiě)B(tài)、MapReduce框架采用了Master/Slave架構(gòu)，包括一個(gè)Master和若干個(gè)SlaveC、Map函數(shù)將輸入的元素轉(zhuǎn)換成key,value形式的鍵值對(duì)D、不同的Map任務(wù)之間不能互相通信正確答案:【Hadoop框架是用Java實(shí)現(xiàn)的，MapReduce應(yīng)用程序則一定要用Java來(lái)寫(xiě)】2、問(wèn)題：在使用MapReduce程序WordCount進(jìn)行詞頻統(tǒng)計(jì)時(shí)，對(duì)于文本行“hellohadoophelloworld”，經(jīng)過(guò)WordCount程序的Map函數(shù)處理后直接輸出的中間結(jié)果，應(yīng)該是下面哪種形式：選項(xiàng)：A、hello,1,1、hadoop,1和world,1B、hello,2、hadoop,1和world,1C、hello,1,1、hadoop,1和world,1D、hello,1、hello,1、hadoop,1和world,1正確答案:【hello,1、hello,1、hadoop,1和world,1】3、問(wèn)題：對(duì)于文本行“hellohadoophelloworld”，經(jīng)過(guò)WordCount的Reduce函數(shù)處理后的結(jié)果是:選項(xiàng)：A、hello,1,1hadoop,1world,1B、hello,2hadoop,1world,1C、hello,1,1hadoop,1world,1D、hello,1hello,1hadoop,1world,1正確答案:【hello,2hadoop,1world,1】4、問(wèn)題：下列關(guān)于傳統(tǒng)并行計(jì)算框架（比如MPI）和MapReduce并行計(jì)算框架比較正確的是：選項(xiàng)：A、前者是共享式(共享內(nèi)存/共享存儲(chǔ))，容錯(cuò)性差，后者是非共享式的，容錯(cuò)性好B、前者所需硬件價(jià)格貴，可擴(kuò)展性差，后者硬件便宜，擴(kuò)展性好C、前者相比后者學(xué)習(xí)起來(lái)更難D、前者適用于實(shí)時(shí)、細(xì)粒度計(jì)算、計(jì)算密集型，后者適用于批處理、非實(shí)時(shí)、數(shù)據(jù)密集型正確答案:【前者是共享式(共享內(nèi)存/共享存儲(chǔ))，容錯(cuò)性差，后者是非共享式的，容錯(cuò)性好#前者所需硬件價(jià)格貴，可擴(kuò)展性差，后者硬件便宜，擴(kuò)展性好#前者相比后者學(xué)習(xí)起來(lái)更難#前者適用于實(shí)時(shí)、細(xì)粒度計(jì)算、計(jì)算密集型，后者適用于批處理、非實(shí)時(shí)、數(shù)據(jù)密集型】5、問(wèn)題：MapReduce1.0的體系結(jié)構(gòu)主要由哪幾個(gè)部分組成:選項(xiàng)：A、ClientB、JobTrackerC、TaskTrackerD、Task正確答案:【Client#JobTracker#TaskTracker#Task】第8章Hadoop再探討單元測(cè)驗(yàn)1、問(wèn)題：下列說(shuō)法正確的是:選項(xiàng)：A、第二名稱節(jié)點(diǎn)無(wú)法解決單點(diǎn)故障問(wèn)題B、第二名稱節(jié)點(diǎn)是熱備份C、HDFSHA提供高可用性，可以實(shí)現(xiàn)可擴(kuò)展性、系統(tǒng)性能和隔離性D、HDFSHA可用性不好正確答案:【第二名稱節(jié)點(diǎn)無(wú)法解決單點(diǎn)故障問(wèn)題】2、問(wèn)題：HDFSFederation設(shè)計(jì)不能解決“單名稱節(jié)點(diǎn)”存在的哪個(gè)問(wèn)題:選項(xiàng)：A、HDFS集群擴(kuò)展性B、性能更高效C、良好的隔離性D、單點(diǎn)故障問(wèn)題正確答案:【單點(diǎn)故障問(wèn)題】3、問(wèn)題：下列哪些是Hadoop1.0存在的問(wèn)題：選項(xiàng)：A、抽象層次低B、表達(dá)能力有限C、開(kāi)發(fā)者自己管理作業(yè)之間的依賴關(guān)系D、執(zhí)行迭代操作效率低正確答案:【抽象層次低#表達(dá)能力有限#開(kāi)發(fā)者自己管理作業(yè)之間的依賴關(guān)系#執(zhí)行迭代操作效率低】4、問(wèn)題：下列對(duì)Hadoop各組件的理解正確的是:選項(xiàng)：A、Pig：處理大規(guī)模數(shù)據(jù)的腳本語(yǔ)言B、Tez：支持DAG作業(yè)的計(jì)算框架C、Oozie:工作流和協(xié)作服務(wù)引擎D、Kafka：分布式發(fā)布訂閱消息系統(tǒng)正確答案:【Pig：處理大規(guī)模數(shù)據(jù)的腳本語(yǔ)言#Tez：支持DAG作業(yè)的計(jì)算框架#Oozie:工作流和協(xié)作服務(wù)引擎#Kafka：分布式發(fā)布訂閱消息系統(tǒng)】5、問(wèn)題：對(duì)新一代資源管理調(diào)度框架YARN的理解正確的是:選項(xiàng)：A、YARN可以實(shí)現(xiàn)“一個(gè)集群多個(gè)框架”，即在一個(gè)集群上部署一個(gè)統(tǒng)一的資源調(diào)度管理框架B、YARN的體系結(jié)構(gòu)包含三個(gè)組件：ResourceManager，NodeManager，ApplicationMasterC、YARN既是資源管理調(diào)度框架，也是一個(gè)計(jì)算框架D、MapReduce2.0是運(yùn)行在YARN之上的計(jì)算框架，由YARN來(lái)為MapReduce提供資源管理調(diào)度服務(wù)正確答案:【YARN可以實(shí)現(xiàn)“一個(gè)集群多個(gè)框架”，即在一個(gè)集群上部署一個(gè)統(tǒng)一的資源調(diào)度管理框架#YARN的體系結(jié)構(gòu)包含三個(gè)組件：ResourceManager，NodeManager，ApplicationMaster#MapReduce2.0是運(yùn)行在YARN之上的計(jì)算框架，由YARN來(lái)為MapReduce提供資源管理調(diào)度服務(wù)】第9章數(shù)據(jù)倉(cāng)庫(kù)Hive單元測(cè)驗(yàn)1、問(wèn)題：下列有關(guān)Hive和Impala的對(duì)比錯(cuò)誤的是:選項(xiàng)：A、Hive與Impala使用相同的元數(shù)據(jù)B、Hive與Impala中對(duì)SQL的解釋處理比較相似，都是通過(guò)詞法分析生成執(zhí)行計(jì)劃C、Hive適合于長(zhǎng)時(shí)間的批處理查詢分析，而Impala適合于實(shí)時(shí)交互式SQL查詢D、Hive在內(nèi)存不足以存儲(chǔ)所有數(shù)據(jù)時(shí)，會(huì)使用外存，而Impala也是如此正確答案:【Hive在內(nèi)存不足以存儲(chǔ)所有數(shù)據(jù)時(shí)，會(huì)使用外存，而Impala也是如此】2、問(wèn)題：下列關(guān)于Hive基本操作命令的解釋錯(cuò)誤的是:選項(xiàng)：A、createdatabaseuserdb;//創(chuàng)建數(shù)據(jù)庫(kù)userdbB、createtableifnotexistsusr(idbigint,namestring,ageint);//如果usr表不存在，創(chuàng)建表usr，含三個(gè)屬性id,name,ageC、loaddatalocalinpath‘/usr/local/data’overwriteintotableusr;//把目錄’/usr/local/data’下的數(shù)據(jù)文件中的數(shù)據(jù)以追加的方式裝載進(jìn)usr表D、insertoverwritetablestudentselect*fromuserwhereage10;//向表usr1中插入來(lái)自u(píng)sr表的age大于10的數(shù)據(jù)并覆蓋student表中原有數(shù)據(jù)正確答案:【loaddatalocalinpath‘/usr/local/data’overwriteintotableusr;//把目錄’/usr/local/data’下的數(shù)據(jù)文件中的數(shù)據(jù)以追加的方式裝載進(jìn)usr表】3、問(wèn)題：下列說(shuō)法正確的是：選項(xiàng)：A、數(shù)據(jù)倉(cāng)庫(kù)Hive不需要借助于HDFS就可以完成數(shù)據(jù)的存儲(chǔ)B、Impala和Hive、HDFS、HBase等工具可以統(tǒng)一部署在一個(gè)Hadoop平臺(tái)上C、Hive本身不存儲(chǔ)和處理數(shù)據(jù)，依賴HDFS存儲(chǔ)數(shù)據(jù)，依賴MapReduce處理數(shù)據(jù)D、HiveQL語(yǔ)法與傳統(tǒng)的SQL語(yǔ)法很相似正確答案:【Impala和Hive、HDFS、HBase等工具可以統(tǒng)一部署在一個(gè)Hadoop平臺(tái)上#Hive本身不存儲(chǔ)和處理數(shù)據(jù)，依賴HDFS存儲(chǔ)數(shù)據(jù)，依賴MapReduce處理數(shù)據(jù)#HiveQL語(yǔ)法與傳統(tǒng)的SQL語(yǔ)法很相似】4、問(wèn)題：Impala主要由哪幾個(gè)部分組成:選項(xiàng)：A、ImpaladB、StateStoreC、CLID、Hive正確答案:【Impalad#StateStore#CLI】5、問(wèn)題：以下屬于Hive的基本數(shù)據(jù)類型是:選項(xiàng)：A、TINYINTB、FLOATC、STRINGD、BINARY正確答案:【TINYINT#FLOAT#STRING#BINARY】第10章Spark單元測(cè)驗(yàn)1、問(wèn)題：SparkSQL目前暫時(shí)不支持下列哪種語(yǔ)言:選項(xiàng)：A、ScalaB、JavaC、PythonD、Lisp正確答案:【Lisp】2、問(wèn)題：RDD操作分為轉(zhuǎn)換（Transformation）和動(dòng)作（Action）兩種類型，下列屬于動(dòng)作（Action）類型的操作的是:選項(xiàng)：A、mapB、filterC、groupByD、count正確答案:【count】3、問(wèn)題：下列說(shuō)法錯(cuò)誤的是：選項(xiàng)：A、Spark支持三種類型的部署方式：Standalone，SparkonMesos，SparkonYARNB、在選擇SparkStreaming和Storm時(shí)，對(duì)實(shí)時(shí)性要求高（比如要求毫秒級(jí)響應(yīng)）的企業(yè)更傾向于選擇流計(jì)算框架StormC、RDD提供的轉(zhuǎn)換接口既適用filter等粗粒度的轉(zhuǎn)換，也適合某一數(shù)據(jù)項(xiàng)的細(xì)粒度轉(zhuǎn)換D、RDD采用惰性調(diào)用，遇到“轉(zhuǎn)換(Transformation)”類型的操作時(shí)，只會(huì)記錄RDD生成的軌跡，只有遇到“動(dòng)作(Action)”類型的操作時(shí)才會(huì)觸發(fā)真正的計(jì)算正確答案:【RDD提供的轉(zhuǎn)換接口既適用filter等粗粒度的轉(zhuǎn)換，也適合某一數(shù)據(jù)項(xiàng)的細(xì)粒度轉(zhuǎn)換】4、問(wèn)題：下列關(guān)于常見(jiàn)的動(dòng)作（Action）和轉(zhuǎn)換（Transformation）操作的API解釋錯(cuò)誤的是:選項(xiàng)：A、count()：返回?cái)?shù)據(jù)集中的元素個(gè)數(shù)B、filter(func)：篩選出滿足函數(shù)func的元素，并返回一個(gè)新的數(shù)據(jù)集C、take(n)：返回?cái)?shù)據(jù)集中的第n個(gè)元素D、map(func)：將每個(gè)元素傳遞到函數(shù)func中，并將結(jié)果返回為一個(gè)新的數(shù)據(jù)集正確答案:【take(n)：返回?cái)?shù)據(jù)集中的第n個(gè)元素】5、問(wèn)題：下列大數(shù)據(jù)處理類型與其對(duì)應(yīng)的軟件框架不匹配的是:選項(xiàng)：A、復(fù)雜的批量數(shù)據(jù)處理：MapReduceB、基于歷史數(shù)據(jù)的交互式查詢：ImpalaC、基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理：StormD、圖結(jié)構(gòu)數(shù)據(jù)的計(jì)算：Hive正確答案:【圖結(jié)構(gòu)數(shù)據(jù)的計(jì)算：Hive】6、問(wèn)題：Apache軟件基金會(huì)最重要的三大分布式計(jì)算系統(tǒng)開(kāi)源項(xiàng)目包括：選項(xiàng)：A、HadoopB、SparkC、StormD、Oracle正確答案:【Hadoop#Spark#Storm】7、問(wèn)題：Spark的主要特點(diǎn)包括:選項(xiàng)：A、運(yùn)行速度快B、容易使用C、通用性好D、運(yùn)行模式多樣正確答案:【運(yùn)行速度快#容易使用#通用性好#運(yùn)行模式多樣】8、問(wèn)題：下列關(guān)于Scala的說(shuō)法正確的是:選項(xiàng)：A、Scala是一種多范式編程語(yǔ)言B、Scala運(yùn)行于Java平臺(tái)，兼容現(xiàn)有的Java程序C、Scala具備強(qiáng)大的并發(fā)性，支持函數(shù)式編程D、Scala是Spark的主要編程語(yǔ)言，但Spark還支持Java、Python、R作為編程語(yǔ)言正確答案:【Scala是一種多范式編程語(yǔ)言#Scala運(yùn)行于Java平臺(tái)，兼容現(xiàn)有的Java程序#Scala具備強(qiáng)大的并發(fā)性，支持函數(shù)式編程#Scala是Spark的主要編程語(yǔ)言，但Spark還支持Java、Python、R作為編程語(yǔ)言】9、問(wèn)題：Spark的運(yùn)行架構(gòu)包括:選項(xiàng)：A、集群資源管理器ClusterManagerB、運(yùn)行作業(yè)任務(wù)的工作節(jié)點(diǎn)WorkerNodeC、每個(gè)應(yīng)用的任務(wù)控制節(jié)點(diǎn)DriverD、每個(gè)工作節(jié)點(diǎn)上負(fù)責(zé)具體任務(wù)的執(zhí)行進(jìn)程Executor正確答案:【集群資源管理器ClusterManager#運(yùn)行作業(yè)任務(wù)的工作節(jié)點(diǎn)WorkerNode#每個(gè)應(yīng)用的任務(wù)控制節(jié)點(diǎn)Driver#每個(gè)工作節(jié)點(diǎn)上負(fù)責(zé)具體任務(wù)的執(zhí)行進(jìn)程Executor】第11章流計(jì)算單元測(cè)驗(yàn)1、問(wèn)題：流計(jì)算秉承一個(gè)基本理念，即數(shù)據(jù)的價(jià)值隨著時(shí)間的流逝而，如用戶點(diǎn)擊流：選項(xiàng)：A、降低B、升高C、不變D、不確定正確答案:【降低】2、問(wèn)題：Hadoop運(yùn)行的是MapReduce任務(wù)，類似地，Storm運(yùn)行的任務(wù)叫做選項(xiàng)：A、TopologyB、BoltC、TupleD、Spout正確答案:【Topology】3、問(wèn)題：對(duì)于一個(gè)流計(jì)算系統(tǒng)來(lái)說(shuō)，它應(yīng)達(dá)到如下哪些需求:選項(xiàng)：A、高性能B、海量式C、實(shí)時(shí)性D、分布式正確答案:【高性能#海量式#實(shí)時(shí)性#分布式】4、問(wèn)題：數(shù)據(jù)采集系統(tǒng)的基本架構(gòu)包括哪些部分:選項(xiàng)：A、AgentB、CollectorC、StoreD、Controller正確答案:【Agent#Collector#Store】5、問(wèn)題：以下哪些是開(kāi)源的流計(jì)算框架:選項(xiàng)：A、Yahoo!S4B、TwitterStormC、FacebookPumaD、IBMInfoSphereStreams正確答案:【Yahoo!S4#TwitterStorm】6、問(wèn)題：下面哪幾個(gè)屬于Storm中的StreamGroupings的分組方式:選項(xiàng)：A、隨機(jī)分組B、按照字段分組C、廣播發(fā)送D、全局分組正確答案:【隨機(jī)分組#按照字段分組#廣播發(fā)送#全局分組】第12章Flink單元測(cè)驗(yàn)1、問(wèn)題：以下哪個(gè)不是Flink的優(yōu)勢(shì)：選項(xiàng)：A、同時(shí)支持高吞吐、低延遲、高性能B、同時(shí)支持流處理和批處理C、不支持增量迭代D、支持有狀態(tài)計(jì)算正確答案:【不支持增量迭代】2、問(wèn)題：在Flink中哪個(gè)是基于批處理的圖計(jì)算庫(kù)：選項(xiàng)：A、FlinkMLB、GellyC、CEPD、SQLTable庫(kù)正確答案:【Gelly】3、問(wèn)題：下面關(guān)于Flink的說(shuō)法正確的是：選項(xiàng)：A、Flink不是Apache軟件基金會(huì)的項(xiàng)目B、Flink可以同時(shí)支持實(shí)時(shí)計(jì)算和批量計(jì)算C、Flink起源于Stratosphere項(xiàng)目，該項(xiàng)目是在2010年到2014年間由柏林工業(yè)大學(xué)、柏林洪堡大學(xué)和哈索普拉特納研究所聯(lián)合開(kāi)展的D、Flink是Apache軟件基金會(huì)的5個(gè)最大的大數(shù)據(jù)項(xiàng)目之一正確答案:【Flink可以同時(shí)支持實(shí)時(shí)計(jì)算和批量計(jì)算#Flink起源于Stratosphere項(xiàng)目，該項(xiàng)目是在2010年到2014年間由柏林工業(yè)大學(xué)、柏林洪堡大學(xué)和哈索普拉特納研究所聯(lián)合開(kāi)展的#Flink是Apache軟件基金會(huì)的5個(gè)最大的大數(shù)據(jù)項(xiàng)目之一】4、問(wèn)題：Flink的主要特性包括：選項(xiàng)：A、批流一體化B、精密的狀態(tài)管理C、事件時(shí)間支持D、精確一次的狀態(tài)一致性保障正確答案:【批流一體化#精密的狀態(tài)管理#事件時(shí)間支持#精確一次的狀態(tài)一致性保障】5、問(wèn)題：下面論述正確的是：選項(xiàng)：A、流處理架構(gòu)需要具備低延遲、高吞吐和高性能的特性，而目前從市場(chǎng)上已有的產(chǎn)品來(lái)看，只有Flink可以滿足要求B、Storm雖然可以做到低延遲，但是無(wú)法實(shí)現(xiàn)高吞吐，也不能在故障發(fā)生時(shí)準(zhǔn)確地處理計(jì)算狀態(tài)C、SparkStreaming通過(guò)采用微批處理方法實(shí)現(xiàn)了高吞吐和容錯(cuò)性，但是犧牲了低延遲和實(shí)時(shí)處理能力D、Flink實(shí)現(xiàn)了GoogleDataflow流計(jì)算模型，是一種兼具高吞吐、低延遲和高性能的實(shí)時(shí)流計(jì)算框架，并且同時(shí)支持批處理和流處理正確答案:【流處理架構(gòu)需要具備低延遲、高吞吐和高性能的特性，而目前從市場(chǎng)上已有的產(chǎn)品來(lái)看，只有Flink可以滿足要求#Storm雖然可以做到低延遲，但是無(wú)法實(shí)現(xiàn)高吞吐，也不能在故障發(fā)生時(shí)準(zhǔn)確地處理計(jì)算狀態(tài)#SparkStreaming通過(guò)采用微批處理方法實(shí)現(xiàn)了高吞吐和容錯(cuò)性，但是犧牲了低延遲和實(shí)時(shí)處理能力#Flink實(shí)現(xiàn)了GoogleDataflow流計(jì)算模型，是一種兼具高吞吐、低延遲和高性能的實(shí)時(shí)流計(jì)算框架，并且同時(shí)支持批處理和流處理】6、問(wèn)題：Flink常見(jiàn)的應(yīng)用場(chǎng)景包括：選項(xiàng)：A、事件驅(qū)動(dòng)型應(yīng)用B、數(shù)據(jù)分析應(yīng)用C、地圖應(yīng)用D、數(shù)據(jù)流水線應(yīng)用正確答案:【事件驅(qū)動(dòng)型應(yīng)用#數(shù)據(jù)分析應(yīng)用#數(shù)據(jù)流水線應(yīng)用】7、問(wèn)題：Flink核心組件棧分為哪三層：選項(xiàng)：A、物理部署層B、Runtime核心層C、APILibraries層D、Core層正確答案:【物理部署層#Runtime核心層#APILibraries層】8、問(wèn)題：Flink有哪幾種部署模式：選項(xiàng)：A、Local模式B、Standalone集群模式C、YARN集群模式D、運(yùn)行在GCE（谷歌云服務(wù)）和EC2（亞馬遜云服務(wù)）上正確答案:【Local模式#Standalone集群模式#YARN集群模式#運(yùn)行在GCE（谷歌云服務(wù)）和EC2（亞馬遜云服務(wù)）上】9、問(wèn)題：Flink系統(tǒng)主要由兩個(gè)組件組成，分別為:選項(xiàng)：A、JobManagerB、TaskSchedulerC、JobSchedulerD、TaskManager正確答案:【JobManager#TaskManager】10、問(wèn)題：在編程模型方面，F(xiàn)link提供了不同級(jí)別的抽象，以開(kāi)發(fā)流或批處理作業(yè)，主要包括哪幾個(gè)級(jí)別的抽象：選項(xiàng)：A、狀態(tài)化的數(shù)據(jù)流接口B、DataStreamAPI（有界或無(wú)界流數(shù)據(jù)）以及DataSetAPI（有界數(shù)據(jù)集）C、TableAPID、SQL正確答案:【狀態(tài)化的數(shù)據(jù)流接口#DataStreamAPI（有界或無(wú)界流數(shù)據(jù)）以及DataSetAPI（有界數(shù)據(jù)集）#TableAPI#SQL】第13章圖計(jì)算單元測(cè)驗(yàn)1、問(wèn)題：Pregel是一種基于模型實(shí)現(xiàn)的并行圖處理系統(tǒng):選項(xiàng)：A、BSPB、TSPC、SBPD、STP正確答案:【BSP】2、問(wèn)題：谷歌在后Hadoop時(shí)代的新“三駕馬車(chē)”不包括:選項(xiàng)：A、CaffeineB、DremelC、HamaD、Pregel正確答案:【Hama】3、問(wèn)題：下列哪些是以圖頂點(diǎn)為中心的，基于消息傳遞批處理的并行圖計(jì)算框架：選項(xiàng)：A、PregelB、HamaC、GiraphD、Neo4j正確答案:【Pregel#Hama#Giraph】4、問(wèn)題：以下關(guān)于Pregel圖計(jì)算框架說(shuō)法正確的是:選項(xiàng)：A、通常只對(duì)滿足交換律和結(jié)合律的操作才會(huì)開(kāi)啟Combiner功能B、Aggregator提供了一種全局通信、監(jiān)控和數(shù)據(jù)查看的機(jī)制C、Pregel采用檢查點(diǎn)機(jī)制來(lái)實(shí)現(xiàn)容錯(cuò)D、對(duì)于全局拓?fù)涓淖儯琍regel采用了惰性協(xié)調(diào)機(jī)制正確答案:【通常只對(duì)滿足交換律和結(jié)合律的操作才會(huì)開(kāi)啟Combiner功能#Aggregator提供了一種全局通信、監(jiān)控和數(shù)據(jù)查看的機(jī)制#Pregel采用檢查點(diǎn)機(jī)制來(lái)實(shí)現(xiàn)容錯(cuò)#對(duì)于全局拓?fù)涓淖儯琍regel采用了惰性協(xié)調(diào)機(jī)制】第14章大數(shù)據(jù)在不同領(lǐng)域的應(yīng)用單元測(cè)驗(yàn)1、問(wèn)題：下列說(shuō)法錯(cuò)誤的是：選項(xiàng)：A、UserCF算法推薦的是那些和目標(biāo)用戶有共同興趣愛(ài)好的其他用戶所喜歡的物品B、ItemCF算法推薦的是那些和目標(biāo)用戶之前喜歡的物品類似的其他物品C、UserCF算法的推薦更偏向社會(huì)化，而ItemCF算法的推薦更偏向于個(gè)性化D、基于用戶的協(xié)同過(guò)濾算法（簡(jiǎn)稱UserCF算法）是目前業(yè)界應(yīng)用最多的算法正確答案:【基于用戶的協(xié)同過(guò)濾算法（簡(jiǎn)稱UserCF算法）是目前業(yè)界應(yīng)用最多的算法】2、問(wèn)題：推薦方法包括哪些類型:選項(xiàng)：A、專家推薦B、基于統(tǒng)計(jì)的推薦C、基于內(nèi)容的推薦D、協(xié)同過(guò)濾推薦正確答案:【專家推薦#基于統(tǒng)計(jì)的推薦#基于內(nèi)容的推薦#協(xié)同過(guò)濾推薦】大數(shù)據(jù)技術(shù)原理與應(yīng)用期末試卷1、問(wèn)題：數(shù)據(jù)產(chǎn)生方式的變革主要經(jīng)歷了三個(gè)階段，以下哪個(gè)不屬于這三個(gè)階段：選項(xiàng)：A、運(yùn)營(yíng)式系統(tǒng)階段B、用戶原創(chuàng)內(nèi)容階段C、感知式系統(tǒng)階段D、數(shù)據(jù)流階段正確答案:【數(shù)據(jù)流階段】2、問(wèn)題：第三次信息化浪潮的發(fā)生標(biāo)志是以下哪種技術(shù)的普及：選項(xiàng)：A、個(gè)人計(jì)算機(jī)B、互聯(lián)網(wǎng)C、物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)D、CPU正確答案:【物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)】3、問(wèn)題：在Flink中哪個(gè)是基于批處理的圖計(jì)算庫(kù)：選項(xiàng)：A、FlinkMLB、GellyC、CEPD、SQLTable庫(kù)正確答案:【Gelly】4、問(wèn)題：Hadoop的兩大核心是和選項(xiàng)：A、HDFS;MapReduceB、HDFS;HBaseC、MapReduce;HBaseD、GFS;MapReduce正確答案:【HDFS;MapReduce】5、問(wèn)題：HDFS默認(rèn)的一個(gè)塊大小是選項(xiàng)：A、64MBB、8KBC、16KBD、32KB正確答案:【64MB】6、問(wèn)題：在分布式文件系統(tǒng)HDFS中，負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和讀取:選項(xiàng)：A、數(shù)據(jù)節(jié)點(diǎn)B、主節(jié)點(diǎn)C、名稱節(jié)點(diǎn)D、第二名稱節(jié)點(diǎn)正確答案:【數(shù)據(jù)節(jié)點(diǎn)】7、問(wèn)題：上傳當(dāng)前目錄下的本地文件file.txt到分布式文件系統(tǒng)HDFS的“/path”目錄下的Shell命令是：選項(xiàng)：A、hdfsdfs-putfile.txt/pathB、hadoopdfs-put/pathfile.txtC、hdfsdfs-put/pathfile.txtD、hdfsfs-putfile.txt/path正確答案:【hdfsdfs-putfile.txt/path】8、問(wèn)題：在HDFS根目錄下創(chuàng)建一個(gè)文件夾/test，且/test文件夾內(nèi)還包含一個(gè)文件夾dir，正確的shell命令是:選項(xiàng)：A、hadoopfs-mkdir-p/test/dirB、hadoopdfs-mkdir/test/dirC、hdfsfs-mkdir-p/test/dirD、hdfsdfs*mkdir-p/test/dir正確答案:【hadoopfs-mkdir-p/test/dir】9、問(wèn)題：下列有關(guān)HBase的說(shuō)法正確的是：選項(xiàng)：A、HBase是針對(duì)谷歌BigTable的開(kāi)源實(shí)現(xiàn)，是高可靠、高性能的圖數(shù)據(jù)庫(kù)B、HBase是一種NoSQL數(shù)據(jù)庫(kù)C、在向數(shù)據(jù)庫(kù)中插入記錄時(shí)，HBase和關(guān)系數(shù)據(jù)庫(kù)一樣，每次都是以“行”為單位把整條記錄插入數(shù)據(jù)庫(kù)D、HBase數(shù)據(jù)庫(kù)表可以設(shè)置該表任意列作為索引正確答案:【HBase是一種NoSQL數(shù)據(jù)庫(kù)】10、問(wèn)題：已知一張表student存儲(chǔ)在HBase中，向表中插入一條記錄{id:2015001,name:Mary,{score:math}:88}，其id作為行鍵，其中，在插入數(shù)學(xué)成績(jī)88分時(shí)，正確的命令是:選項(xiàng)：A、put'student','2015001','score:math','88'B、put'student','2015001','88'C、put'student','2015001','math','88'D、put'student','score:math','88'正確答案:【put'student','2015001','score:math','88'】11、問(wèn)題：NoSQL數(shù)據(jù)庫(kù)的三大理論基石不包括:選項(xiàng)：A、CAPB、BASEC、最終一致性D、ACID正確答案:【ACID】12、問(wèn)題：在設(shè)計(jì)詞頻統(tǒng)計(jì)的MapReduce程序時(shí)，對(duì)于文本行“hellobigdatahellohadoop”，經(jīng)過(guò)map函數(shù)處理后直接輸出的結(jié)果應(yīng)該是（沒(méi)有發(fā)生combine和merge操作）:選項(xiàng)：A、hello,1,1、bigdata,1和hadoop,1B、hello,2、bigdata,1和hadoop,1C、hello,1,1、bigdata,1和hadoop,1D、hello,1、hello,1、bigdata,1和hadoop,1正確答案:【hello,1、hello,1、bigdata,1和hadoop,1】13、問(wèn)題：假設(shè)已經(jīng)配置好PATH環(huán)境變量，啟動(dòng)Hadoop的命令是:選項(xiàng)：A、start-dfs.shB、start-hadoop.shC、start-fs.shD、start-hdfs.sh正確答案:【start-dfs.sh】14、問(wèn)題：下列說(shuō)法錯(cuò)誤的是：選項(xiàng)：A、第二名稱節(jié)點(diǎn)無(wú)法解決單點(diǎn)故障問(wèn)題B、HDFSHA可以解決單點(diǎn)故障問(wèn)題C、第二名稱節(jié)點(diǎn)是熱備份，而HDFSHA不是熱備份D、HDFSFederation使得HDFS的命名服務(wù)能夠水平擴(kuò)展正確答案:【第二名稱節(jié)點(diǎn)是熱備份，而HDFSHA不是熱備份】15、問(wèn)題：RDD操作包括轉(zhuǎn)換（Transformation）和動(dòng)作(Action)兩種類型，下列RDD操作屬于動(dòng)作（Action）類型的是:選項(xiàng)：A、mapB、joinC、collectD、groupBy正確答案:【collect】16、問(wèn)題：下列關(guān)于Hive的說(shuō)法正確的是:選項(xiàng)：A、Hive支持頻繁數(shù)據(jù)更新B、Hive的可擴(kuò)展性差C、Hive不支持索引D、Hive支持批量導(dǎo)入正確答案:【Hive支持批量導(dǎo)入】17、問(wèn)題：大數(shù)據(jù)的特點(diǎn)包括:選項(xiàng)：A、數(shù)據(jù)量大B、數(shù)據(jù)種類繁多C、處理速度快D、價(jià)值密度低正確答案:【數(shù)據(jù)量大#數(shù)據(jù)種類繁多#處理速度快#價(jià)值密度低】18、問(wèn)題：下列適用于批處理計(jì)算的框架有哪些：選項(xiàng)：A、MapReduceB、SparkC、StormD、Pregel正確答案:【MapReduce#Spark】19、問(wèn)題：下列適用于流計(jì)算的框架有哪些:選項(xiàng)：A、StormB、SparkStreamingC、PregelD、Dremel正確答案:【Storm#SparkStreaming】20、問(wèn)題：Flink核心組件棧分為哪三層：選項(xiàng)：A、物理部署層B、Runtime核心層C、APILibraries層D、Core層正確答案:【物理部署層#Runtime核心層#APILibraries層】21、問(wèn)題：從技術(shù)架構(gòu)上來(lái)看，物聯(lián)網(wǎng)可以分為哪幾層:選項(xiàng)：A、感知層B、網(wǎng)絡(luò)層C、處理層D、應(yīng)用層正確答案:【感知層#網(wǎng)絡(luò)層#處理層#應(yīng)用層】22、問(wèn)題：HBase需要根據(jù)哪些屬性來(lái)唯一地確定一個(gè)單元格(cell)中的某個(gè)版本數(shù)據(jù):選項(xiàng)：A、行鍵B、列族C、列限定符D、時(shí)間戳正確答案:【行鍵#列族#列限定符#時(shí)間戳】23、問(wèn)題：典型的NoSQL數(shù)據(jù)庫(kù)的類型包括：選項(xiàng)：A、鍵值數(shù)據(jù)庫(kù)B、列族數(shù)據(jù)庫(kù)C、文檔數(shù)據(jù)庫(kù)D、圖數(shù)據(jù)庫(kù)正確答案:【鍵值數(shù)據(jù)庫(kù)#列族數(shù)據(jù)庫(kù)#文檔數(shù)據(jù)庫(kù)#圖數(shù)據(jù)庫(kù)】24、問(wèn)題：CAP是指：選項(xiàng)：A、一致性B、可用性C、持久性D、分區(qū)容忍性正確答案:【一致性#可用性#分區(qū)容忍性】25、問(wèn)題：云計(jì)算主要包括哪3種類型：選項(xiàng)：A、IaaSB、PaaSC、SaaSD、CaaS正確答案:【I

人人文庫(kù)> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

MOOC 大數(shù)據(jù)技術(shù)原理與應(yīng)用-廈門(mén)大學(xué) 中國(guó)大學(xué)慕課答案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

MOOC 大數(shù)據(jù)技術(shù)原理與應(yīng)用-廈門(mén)大學(xué) 中國(guó)大學(xué)慕課答案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔