




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
MOOC大數(shù)據(jù)技術(shù)原理與應(yīng)用-廈門(mén)大學(xué)中國(guó)大學(xué)慕課答案第1章大數(shù)據(jù)概述單元測(cè)驗(yàn)1、問(wèn)題:第三次信息化浪潮的標(biāo)志是:選項(xiàng):A、個(gè)人電腦的普及B、互聯(lián)網(wǎng)的普及C、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù)的普及D、虛擬現(xiàn)實(shí)技術(shù)的普及正確答案:【云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù)的普及】2、問(wèn)題:就數(shù)據(jù)的量級(jí)而言,1PB數(shù)據(jù)是多少TB?選項(xiàng):A、512B、1024C、1000D、2048正確答案:【1024】3、問(wèn)題:以下關(guān)于云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)之間的關(guān)系,論述錯(cuò)誤的是:選項(xiàng):A、云計(jì)算側(cè)重于數(shù)據(jù)分析B、云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)三者緊密相關(guān),相輔相成C、物聯(lián)網(wǎng)可以借助于云計(jì)算實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ)D、物聯(lián)網(wǎng)可以借助于大數(shù)據(jù)實(shí)現(xiàn)海量數(shù)據(jù)的分析正確答案:【云計(jì)算側(cè)重于數(shù)據(jù)分析】4、問(wèn)題:以下哪個(gè)不是大數(shù)據(jù)時(shí)代新興的技術(shù):選項(xiàng):A、HadoopB、SparkC、HBaseD、MySQL正確答案:【MySQL】5、問(wèn)題:每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于批處理的:選項(xiàng):A、MapReduceB、PregelC、DremelD、Storm正確答案:【MapReduce】6、問(wèn)題:每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于流計(jì)算的:選項(xiàng):A、GraphXB、S4C、HiveD、Impala正確答案:【S4】7、問(wèn)題:每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于圖計(jì)算的:選項(xiàng):A、CassandraB、FlumeC、StormD、Pregel正確答案:【Pregel】8、問(wèn)題:每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于查詢分析計(jì)算的:選項(xiàng):A、MapReduceB、HDFSC、DremelD、S4正確答案:【Dremel】9、問(wèn)題:數(shù)據(jù)產(chǎn)生方式大致經(jīng)歷了三個(gè)階段,包括:選項(xiàng):A、運(yùn)營(yíng)式系統(tǒng)階段B、用戶原創(chuàng)內(nèi)容階段C、感知式系統(tǒng)階段D、移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)階段正確答案:【運(yùn)營(yíng)式系統(tǒng)階段#用戶原創(chuàng)內(nèi)容階段#感知式系統(tǒng)階段】10、問(wèn)題:大數(shù)據(jù)發(fā)展的三個(gè)階段是:選項(xiàng):A、萌芽期B、低谷期C、成熟期D、大規(guī)模應(yīng)用期正確答案:【萌芽期#成熟期#大規(guī)模應(yīng)用期】11、問(wèn)題:大數(shù)據(jù)的特性包括:選項(xiàng):A、數(shù)據(jù)量大B、數(shù)據(jù)類型繁多C、處理速度快D、價(jià)值密度低正確答案:【數(shù)據(jù)量大#數(shù)據(jù)類型繁多#處理速度快#價(jià)值密度低】12、問(wèn)題:圖領(lǐng)獎(jiǎng)獲得者、著名數(shù)據(jù)庫(kù)專家JimGray博士認(rèn)為,人類自古以來(lái)在科學(xué)研究上先后經(jīng)歷了哪幾種范式:選項(xiàng):A、實(shí)驗(yàn)科學(xué)B、理論科學(xué)C、計(jì)算科學(xué)D、數(shù)據(jù)密集型科學(xué)正確答案:【實(shí)驗(yàn)科學(xué)#理論科學(xué)#計(jì)算科學(xué)#數(shù)據(jù)密集型科學(xué)】13、問(wèn)題:大數(shù)據(jù)帶來(lái)思維方式的三個(gè)轉(zhuǎn)變是:選項(xiàng):A、精確而非全面B、全樣而非抽樣C、效率而非精確D、相關(guān)而非因果正確答案:【全樣而非抽樣#效率而非精確#相關(guān)而非因果】14、問(wèn)題:大數(shù)據(jù)主要有哪幾種計(jì)算模式:選項(xiàng):A、批處理計(jì)算B、流計(jì)算C、圖計(jì)算D、查詢分析計(jì)算正確答案:【批處理計(jì)算#流計(jì)算#圖計(jì)算#查詢分析計(jì)算】15、問(wèn)題:云計(jì)算的典型服務(wù)模式包括三種:選項(xiàng):A、PaaSB、IaaSC、SaaSD、MaaS正確答案:【PaaS#IaaS#SaaS】第2章大數(shù)據(jù)處理架構(gòu)Hadoop單元測(cè)驗(yàn)1、問(wèn)題:?jiǎn)?dòng)hadoop所有進(jìn)程的命令是:選項(xiàng):A、start-dfs.shB、start-hadoop.shC、start-all.shD、start-hdfs.sh正確答案:【start-all.sh】2、問(wèn)題:以下對(duì)Hadoop的說(shuō)法錯(cuò)誤的是:選項(xiàng):A、Hadoop的核心是HDFS和MapReduceB、Hadoop是基于Java語(yǔ)言開(kāi)發(fā)的,只支持Java語(yǔ)言編程C、Hadoop2.0增加了NameNodeHA和Wire-compatibility兩個(gè)重大特性D、HadoopMapReduce是針對(duì)谷歌MapReduce的開(kāi)源實(shí)現(xiàn),通常用于大規(guī)模數(shù)據(jù)集的并行計(jì)算正確答案:【Hadoop是基于Java語(yǔ)言開(kāi)發(fā)的,只支持Java語(yǔ)言編程】3、問(wèn)題:以下哪個(gè)不是Hadoop的特性:選項(xiàng):A、高容錯(cuò)性B、高可靠性C、成本高D、支持多種編程語(yǔ)言正確答案:【成本高】4、問(wèn)題:以下名詞解釋不正確的是:選項(xiàng):A、HDFS:分布式文件系統(tǒng),是Hadoop項(xiàng)目的兩大核心之一,是谷歌GFS的開(kāi)源實(shí)現(xiàn)B、HBase:提供高可靠性、高性能、分布式的行式數(shù)據(jù)庫(kù),是谷歌BigTable的開(kāi)源實(shí)現(xiàn)C、Hive:一個(gè)基于Hadoop的數(shù)據(jù)倉(cāng)庫(kù)工具,用于對(duì)Hadoop文件中的數(shù)據(jù)集進(jìn)行數(shù)據(jù)整理、特殊查詢和分析存儲(chǔ)D、Zookeeper:針對(duì)谷歌Chubby的一個(gè)開(kāi)源實(shí)現(xiàn),是高效可靠的協(xié)同工作系統(tǒng)正確答案:【HBase:提供高可靠性、高性能、分布式的行式數(shù)據(jù)庫(kù),是谷歌BigTable的開(kāi)源實(shí)現(xiàn)】5、問(wèn)題:以下哪些組件是Hadoop的生態(tài)系統(tǒng)的組件:選項(xiàng):A、MapReduceB、HDFSC、OracleD、HBase正確答案:【MapReduce#HDFS#HBase】6、問(wèn)題:以下哪個(gè)命令可以用來(lái)操作HDFS文件:選項(xiàng):A、hadoopfsB、hdfsdfsC、hadoopdfsD、hdfsfs正確答案:【hadoopfs#hdfsdfs#hadoopdfs】第3章分布式文件系統(tǒng)HDFS單元測(cè)驗(yàn)1、問(wèn)題:HDFS的命名空間不包含:選項(xiàng):A、目錄B、文件C、塊D、字節(jié)正確答案:【字節(jié)】2、問(wèn)題:對(duì)HDFS通信協(xié)議的理解錯(cuò)誤的是:選項(xiàng):A、HDFS通信協(xié)議都是構(gòu)建在IoT協(xié)議基礎(chǔ)之上的B、名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)之間則使用數(shù)據(jù)節(jié)點(diǎn)協(xié)議進(jìn)行交互C、客戶端與數(shù)據(jù)節(jié)點(diǎn)的交互是通過(guò)RPC(RemoteProcedureCall)來(lái)實(shí)現(xiàn)的D、客戶端通過(guò)一個(gè)可配置的端口向名稱節(jié)點(diǎn)主動(dòng)發(fā)起TCP連接,并使用客戶端協(xié)議與名稱節(jié)點(diǎn)進(jìn)行交互正確答案:【HDFS通信協(xié)議都是構(gòu)建在IoT協(xié)議基礎(chǔ)之上的】3、問(wèn)題:采用多副本冗余存儲(chǔ)的優(yōu)勢(shì)不包含:選項(xiàng):A、加快數(shù)據(jù)傳輸速度B、節(jié)約存儲(chǔ)空間C、容易檢查數(shù)據(jù)錯(cuò)誤D、保證數(shù)據(jù)可靠性正確答案:【節(jié)約存儲(chǔ)空間】4、問(wèn)題:假設(shè)已經(jīng)配置好環(huán)境變量,啟動(dòng)Hadoop和關(guān)閉Hadoop的命令分別是:選項(xiàng):A、start-hdfs.sh,stop-hdfs.shB、start-dfs.sh,stop-dfs.shC、start-dfs.sh,stop-hdfs.shD、start-hdfs.sh,stop-dfs.sh正確答案:【start-dfs.sh,stop-dfs.sh】5、問(wèn)題:分布式文件系統(tǒng)HDFS采用了主從結(jié)構(gòu)模型,由計(jì)算機(jī)集群中的多個(gè)節(jié)點(diǎn)構(gòu)成的,這些節(jié)點(diǎn)分為兩類,一類存儲(chǔ)元數(shù)據(jù)叫,另一類存儲(chǔ)具體數(shù)據(jù)叫:選項(xiàng):A、名稱節(jié)點(diǎn),數(shù)據(jù)節(jié)點(diǎn)B、數(shù)據(jù)節(jié)點(diǎn),名稱節(jié)點(diǎn)C、名稱節(jié)點(diǎn),主節(jié)點(diǎn)D、從節(jié)點(diǎn),主節(jié)點(diǎn)正確答案:【名稱節(jié)點(diǎn),數(shù)據(jù)節(jié)點(diǎn)】6、問(wèn)題:下面關(guān)于分布式文件系統(tǒng)HDFS的描述正確的是:選項(xiàng):A、分布式文件系統(tǒng)HDFS是一種關(guān)系型數(shù)據(jù)庫(kù)B、分布式文件系統(tǒng)HDFS是GoogleBigtable的一種開(kāi)源實(shí)現(xiàn)C、分布式文件系統(tǒng)HDFS是谷歌分布式文件系統(tǒng)GFS(GoogleFileSystem)的一種開(kāi)源實(shí)現(xiàn)D、分布式文件系統(tǒng)HDFS比較適合存儲(chǔ)大量零碎的小文件正確答案:【分布式文件系統(tǒng)HDFS是谷歌分布式文件系統(tǒng)GFS(GoogleFileSystem)的一種開(kāi)源實(shí)現(xiàn)】7、問(wèn)題:以下對(duì)名稱節(jié)點(diǎn)理解正確的是:選項(xiàng):A、名稱節(jié)點(diǎn)通常用來(lái)保存元數(shù)據(jù)B、名稱節(jié)點(diǎn)的數(shù)據(jù)保存在內(nèi)存中C、名稱節(jié)點(diǎn)作為中心服務(wù)器,負(fù)責(zé)管理文件系統(tǒng)的命名空間及客戶端對(duì)文件的訪問(wèn)D、名稱節(jié)點(diǎn)用來(lái)負(fù)責(zé)具體用戶數(shù)據(jù)的存儲(chǔ)正確答案:【名稱節(jié)點(diǎn)通常用來(lái)保存元數(shù)據(jù)#名稱節(jié)點(diǎn)的數(shù)據(jù)保存在內(nèi)存中#名稱節(jié)點(diǎn)作為中心服務(wù)器,負(fù)責(zé)管理文件系統(tǒng)的命名空間及客戶端對(duì)文件的訪問(wèn)】8、問(wèn)題:以下對(duì)數(shù)據(jù)節(jié)點(diǎn)理解正確的是:選項(xiàng):A、數(shù)據(jù)節(jié)點(diǎn)用來(lái)存儲(chǔ)具體的文件內(nèi)容B、數(shù)據(jù)節(jié)點(diǎn)的數(shù)據(jù)保存在磁盤(pán)中C、數(shù)據(jù)節(jié)點(diǎn)在名稱節(jié)點(diǎn)的統(tǒng)一調(diào)度下進(jìn)行數(shù)據(jù)塊的創(chuàng)建、刪除和復(fù)制等操作D、數(shù)據(jù)節(jié)點(diǎn)通常只有一個(gè)正確答案:【數(shù)據(jù)節(jié)點(diǎn)用來(lái)存儲(chǔ)具體的文件內(nèi)容#數(shù)據(jù)節(jié)點(diǎn)的數(shù)據(jù)保存在磁盤(pán)中#數(shù)據(jù)節(jié)點(diǎn)在名稱節(jié)點(diǎn)的統(tǒng)一調(diào)度下進(jìn)行數(shù)據(jù)塊的創(chuàng)建、刪除和復(fù)制等操作】9、問(wèn)題:HDFS只設(shè)置唯一一個(gè)名稱節(jié)點(diǎn)帶來(lái)的局限性包括:選項(xiàng):A、性能的瓶頸B、命名空間的限制C、隔離問(wèn)題D、集群的可用性正確答案:【性能的瓶頸#命名空間的限制#隔離問(wèn)題#集群的可用性】10、問(wèn)題:以下HDFS相關(guān)的shell命令不正確的是:選項(xiàng):A、hadoopfs-lspath:顯示path指定的文件的詳細(xì)信息B、hadoopdfsmkdirpath:創(chuàng)建path指定的文件夾C、hadoopfs-copyFromLocalpath1path2:將路徑path2指定的文件或文件夾復(fù)制到路徑path1指定的文件夾中D、hdfsdfs-rmpath:刪除路徑path指定的文件正確答案:【hadoopdfsmkdirpath:創(chuàng)建path指定的文件夾#hadoopfs-copyFromLocalpath1path2:將路徑path2指定的文件或文件夾復(fù)制到路徑path1指定的文件夾中】第4章分布式數(shù)據(jù)庫(kù)HBase單元測(cè)驗(yàn)1、問(wèn)題:HBase是一種數(shù)據(jù)庫(kù)選項(xiàng):A、行式數(shù)據(jù)庫(kù)B、列式數(shù)據(jù)庫(kù)C、文檔數(shù)據(jù)庫(kù)D、關(guān)系數(shù)據(jù)庫(kù)正確答案:【列式數(shù)據(jù)庫(kù)】2、問(wèn)題:下列對(duì)HBase數(shù)據(jù)模型的描述錯(cuò)誤的是:選項(xiàng):A、HBase是一個(gè)稀疏、多維度、排序的映射表,這張表的索引是行鍵、列族、列限定符和時(shí)間戳B、HBase列族支持動(dòng)態(tài)擴(kuò)展,可以很輕松地添加一個(gè)列族或列C、HBase中執(zhí)行更新操作時(shí),會(huì)刪除數(shù)據(jù)舊的版本,并生成一個(gè)新的版本D、每個(gè)HBase表都由若干行組成,每個(gè)行由行鍵(rowkey)來(lái)標(biāo)識(shí)正確答案:【HBase中執(zhí)行更新操作時(shí),會(huì)刪除數(shù)據(jù)舊的版本,并生成一個(gè)新的版本】3、問(wèn)題:下列說(shuō)法正確的是:選項(xiàng):A、HBase的實(shí)現(xiàn)包括的主要功能組件是庫(kù)函數(shù),一個(gè)Master主服務(wù)器和一個(gè)Region服務(wù)器B、Zookeeper是一個(gè)集群管理工具,常用于分布式計(jì)算,提供配置維護(hù)、域名服務(wù)、分布式同步等C、如果不啟動(dòng)Hadoop,則HBase完全無(wú)法使用D、如果通過(guò)HBaseShell插入表數(shù)據(jù),可以插入一行數(shù)據(jù)或一個(gè)單元格數(shù)據(jù)正確答案:【Zookeeper是一個(gè)集群管理工具,常用于分布式計(jì)算,提供配置維護(hù)、域名服務(wù)、分布式同步等】4、問(wèn)題:在HBase數(shù)據(jù)庫(kù)中,每個(gè)Region的建議最佳大小是:選項(xiàng):A、100MB-200MBB、500MB-1000MBC、1GB-2GBD、2GB-4GB正確答案:【1GB-2GB】5、問(wèn)題:HBase三層結(jié)構(gòu)的順序是:選項(xiàng):A、Zookeeper文件,.MEATA.表,-ROOT-表B、Zookeeper文件,-ROOT-表,.MEATA.表C、-ROOT-表,Zookeeper文件,.MEATA.表D、.MEATA.表,Zookeeper文件,-ROOT-表正確答案:【Zookeeper文件,-ROOT-表,.MEATA.表】6、問(wèn)題:客戶端是通過(guò)級(jí)尋址來(lái)定位Region:選項(xiàng):A、一B、二C、三D、四正確答案:【三】7、問(wèn)題:關(guān)于HBaseShell命令解釋錯(cuò)誤的是:選項(xiàng):A、create:創(chuàng)建表B、list:顯示表的所有數(shù)據(jù)C、put:向表、行、列指定的單元格添加數(shù)據(jù)D、get:通過(guò)表名、行、列、時(shí)間戳、時(shí)間范圍和版本號(hào)來(lái)獲得相應(yīng)單元格的值正確答案:【list:顯示表的所有數(shù)據(jù)】8、問(wèn)題:下列對(duì)HBase的理解正確的是:選項(xiàng):A、HBase是一個(gè)行式分布式數(shù)據(jù)庫(kù),是Hadoop生態(tài)系統(tǒng)中的一個(gè)組件B、HBase是針對(duì)谷歌BigTable的開(kāi)源實(shí)現(xiàn)C、HBase多用于存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)D、HBase是一種關(guān)系型數(shù)據(jù)庫(kù),現(xiàn)成功應(yīng)用于互聯(lián)網(wǎng)服務(wù)領(lǐng)域正確答案:【HBase是針對(duì)谷歌BigTable的開(kāi)源實(shí)現(xiàn)#HBase多用于存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)】9、問(wèn)題:HBase和傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的區(qū)別在于哪些方面:選項(xiàng):A、數(shù)據(jù)模型B、數(shù)據(jù)操作C、存儲(chǔ)模式D、數(shù)據(jù)索引正確答案:【數(shù)據(jù)模型#數(shù)據(jù)操作#存儲(chǔ)模式#數(shù)據(jù)索引】10、問(wèn)題:訪問(wèn)HBase表中的行,有哪些方式:選項(xiàng):A、通過(guò)單個(gè)行健訪問(wèn)B、通過(guò)一個(gè)行健的區(qū)間來(lái)訪問(wèn)C、全表掃描D、通過(guò)某列的值區(qū)間正確答案:【通過(guò)單個(gè)行健訪問(wèn)#通過(guò)一個(gè)行健的區(qū)間來(lái)訪問(wèn)#全表掃描】第5章NoSQL數(shù)據(jù)庫(kù)單元測(cè)驗(yàn)1、問(wèn)題:下列關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系型數(shù)據(jù)庫(kù)的比較,不正確的是:選項(xiàng):A、NoSQL數(shù)據(jù)庫(kù)具有弱一致性,關(guān)系型數(shù)據(jù)庫(kù)具有強(qiáng)一致性B、NoSQL數(shù)據(jù)庫(kù)很容易實(shí)現(xiàn)數(shù)據(jù)完整性,關(guān)系型數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性C、NoSQL數(shù)據(jù)庫(kù)的可擴(kuò)展性比傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)更好D、NoSQL數(shù)據(jù)庫(kù)缺乏統(tǒng)一的查詢語(yǔ)言,而關(guān)系型數(shù)據(jù)庫(kù)有標(biāo)準(zhǔn)化查詢語(yǔ)言正確答案:【NoSQL數(shù)據(jù)庫(kù)很容易實(shí)現(xiàn)數(shù)據(jù)完整性,關(guān)系型數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性】2、問(wèn)題:以下對(duì)各類數(shù)據(jù)庫(kù)的理解錯(cuò)誤的是:選項(xiàng):A、HBase數(shù)據(jù)庫(kù)是列族數(shù)據(jù)庫(kù),可擴(kuò)展性強(qiáng),支持事務(wù)一致性B、文檔數(shù)據(jù)庫(kù)的數(shù)據(jù)是松散的,XML和JSON文檔等都可以作為數(shù)據(jù)存儲(chǔ)在文檔數(shù)據(jù)庫(kù)中C、鍵值數(shù)據(jù)庫(kù)的鍵是一個(gè)字符串對(duì)象,值可以是任意類型的數(shù)據(jù),比如整型和字符型等D、圖數(shù)據(jù)庫(kù)靈活性高,支持復(fù)雜的圖算法,可用于構(gòu)建復(fù)雜的關(guān)系圖譜正確答案:【HBase數(shù)據(jù)庫(kù)是列族數(shù)據(jù)庫(kù),可擴(kuò)展性強(qiáng),支持事務(wù)一致性】3、問(wèn)題:下列數(shù)據(jù)庫(kù)屬于文檔數(shù)據(jù)庫(kù)的是:選項(xiàng):A、MySQLB、HBaseC、RedisD、MongoDB正確答案:【MongoDB】4、問(wèn)題:NoSQL數(shù)據(jù)庫(kù)的三大理論基石不包括:選項(xiàng):A、CAPB、BASEC、最終一致性D、ACID正確答案:【ACID】5、問(wèn)題:關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù),下列說(shuō)法正確的是:選項(xiàng):A、關(guān)系數(shù)據(jù)庫(kù)有關(guān)系代數(shù)理論作為基礎(chǔ),NoSQL數(shù)據(jù)庫(kù)沒(méi)有統(tǒng)一的理論基礎(chǔ)B、NoSQL數(shù)據(jù)庫(kù)可以支持超大規(guī)模數(shù)據(jù)存儲(chǔ),具有強(qiáng)大的橫向擴(kuò)展能力C、大多數(shù)NoSQL數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性D、NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)各有優(yōu)缺點(diǎn),但隨著NoSQL的發(fā)展,終將取代關(guān)系數(shù)據(jù)庫(kù)正確答案:【關(guān)系數(shù)據(jù)庫(kù)有關(guān)系代數(shù)理論作為基礎(chǔ),NoSQL數(shù)據(jù)庫(kù)沒(méi)有統(tǒng)一的理論基礎(chǔ)#NoSQL數(shù)據(jù)庫(kù)可以支持超大規(guī)模數(shù)據(jù)存儲(chǔ),具有強(qiáng)大的橫向擴(kuò)展能力#大多數(shù)NoSQL數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性】6、問(wèn)題:NoSQL數(shù)據(jù)庫(kù)的類型包括:選項(xiàng):A、鍵值數(shù)據(jù)庫(kù)B、列族數(shù)據(jù)庫(kù)C、文檔數(shù)據(jù)庫(kù)D、圖數(shù)據(jù)庫(kù)正確答案:【鍵值數(shù)據(jù)庫(kù)#列族數(shù)據(jù)庫(kù)#文檔數(shù)據(jù)庫(kù)#圖數(shù)據(jù)庫(kù)】7、問(wèn)題:CAP是指:選項(xiàng):A、一致性B、可用性C、持久性D、分區(qū)容忍性正確答案:【一致性#可用性#分區(qū)容忍性】8、問(wèn)題:NoSQL數(shù)據(jù)庫(kù)的BASE特性是指:選項(xiàng):A、基本可用B、軟狀態(tài)C、最終一致性D、持續(xù)性正確答案:【基本可用#軟狀態(tài)#最終一致性】第6章云數(shù)據(jù)庫(kù)單元測(cè)驗(yàn)1、問(wèn)題:下列Amazon的云數(shù)據(jù)庫(kù)屬于關(guān)系數(shù)據(jù)庫(kù)的是:選項(xiàng):A、AmazonSimpleDBB、AmazonRDSC、AmazonDynamoDBD、AmazonRedshift正確答案:【AmazonRDS】2、問(wèn)題:下列關(guān)于UMP系統(tǒng)的說(shuō)法不正確的是:選項(xiàng):A、UMP系統(tǒng)是低成本和高性能的MySQL云數(shù)據(jù)庫(kù)方案B、Controller服務(wù)器向UMP集群提供各種管理服務(wù),實(shí)現(xiàn)集群成員管理、元數(shù)據(jù)存儲(chǔ)等功能C、Agent服務(wù)器部署在運(yùn)行MySQL進(jìn)程的機(jī)器上,用來(lái)管理每臺(tái)物理機(jī)上的MySQL實(shí)例D、Mnesia是UMP系統(tǒng)的一個(gè)組件,是一個(gè)分布式數(shù)據(jù)庫(kù)管理系統(tǒng),且不支持事務(wù)正確答案:【Mnesia是UMP系統(tǒng)的一個(gè)組件,是一個(gè)分布式數(shù)據(jù)庫(kù)管理系統(tǒng),且不支持事務(wù)】3、問(wèn)題:UMP依賴的開(kāi)源組件包括:選項(xiàng):A、MnesiaB、LVSC、RabbitMQD、ZooKeeper正確答案:【Mnesia#LVS#RabbitMQ#ZooKeeper】4、問(wèn)題:在UMP系統(tǒng)中,Zookeeper主要發(fā)揮的作用包括:選項(xiàng):A、作為全局的配置服務(wù)器B、提供分布式鎖,選出一個(gè)集群的“總管”C、監(jiān)控所有MySQL實(shí)例D、負(fù)責(zé)集群負(fù)載均衡正確答案:【作為全局的配置服務(wù)器#提供分布式鎖,選出一個(gè)集群的“總管”#監(jiān)控所有MySQL實(shí)例】5、問(wèn)題:UMP系統(tǒng)設(shè)計(jì)了哪些機(jī)制來(lái)保證數(shù)據(jù)安全:選項(xiàng):A、SSL數(shù)據(jù)庫(kù)連接B、記錄用戶操作日志C、數(shù)據(jù)訪問(wèn)IP白名單D、SQL攔截正確答案:【SSL數(shù)據(jù)庫(kù)連接#記錄用戶操作日志#數(shù)據(jù)訪問(wèn)IP白名單#SQL攔截】第7章MapReduce單元測(cè)驗(yàn)1、問(wèn)題:下列說(shuō)法錯(cuò)誤的是:選項(xiàng):A、Hadoop框架是用Java實(shí)現(xiàn)的,MapReduce應(yīng)用程序則一定要用Java來(lái)寫(xiě)B(tài)、MapReduce框架采用了Master/Slave架構(gòu),包括一個(gè)Master和若干個(gè)SlaveC、Map函數(shù)將輸入的元素轉(zhuǎn)換成key,value形式的鍵值對(duì)D、不同的Map任務(wù)之間不能互相通信正確答案:【Hadoop框架是用Java實(shí)現(xiàn)的,MapReduce應(yīng)用程序則一定要用Java來(lái)寫(xiě)】2、問(wèn)題:在使用MapReduce程序WordCount進(jìn)行詞頻統(tǒng)計(jì)時(shí),對(duì)于文本行“hellohadoophelloworld”,經(jīng)過(guò)WordCount程序的Map函數(shù)處理后直接輸出的中間結(jié)果,應(yīng)該是下面哪種形式:選項(xiàng):A、hello,1,1、hadoop,1和world,1B、hello,2、hadoop,1和world,1C、hello,1,1、hadoop,1和world,1D、hello,1、hello,1、hadoop,1和world,1正確答案:【hello,1、hello,1、hadoop,1和world,1】3、問(wèn)題:對(duì)于文本行“hellohadoophelloworld”,經(jīng)過(guò)WordCount的Reduce函數(shù)處理后的結(jié)果是:選項(xiàng):A、hello,1,1hadoop,1world,1B、hello,2hadoop,1world,1C、hello,1,1hadoop,1world,1D、hello,1hello,1hadoop,1world,1正確答案:【hello,2hadoop,1world,1】4、問(wèn)題:下列關(guān)于傳統(tǒng)并行計(jì)算框架(比如MPI)和MapReduce并行計(jì)算框架比較正確的是:選項(xiàng):A、前者是共享式(共享內(nèi)存/共享存儲(chǔ)),容錯(cuò)性差,后者是非共享式的,容錯(cuò)性好B、前者所需硬件價(jià)格貴,可擴(kuò)展性差,后者硬件便宜,擴(kuò)展性好C、前者相比后者學(xué)習(xí)起來(lái)更難D、前者適用于實(shí)時(shí)、細(xì)粒度計(jì)算、計(jì)算密集型,后者適用于批處理、非實(shí)時(shí)、數(shù)據(jù)密集型正確答案:【前者是共享式(共享內(nèi)存/共享存儲(chǔ)),容錯(cuò)性差,后者是非共享式的,容錯(cuò)性好#前者所需硬件價(jià)格貴,可擴(kuò)展性差,后者硬件便宜,擴(kuò)展性好#前者相比后者學(xué)習(xí)起來(lái)更難#前者適用于實(shí)時(shí)、細(xì)粒度計(jì)算、計(jì)算密集型,后者適用于批處理、非實(shí)時(shí)、數(shù)據(jù)密集型】5、問(wèn)題:MapReduce1.0的體系結(jié)構(gòu)主要由哪幾個(gè)部分組成:選項(xiàng):A、ClientB、JobTrackerC、TaskTrackerD、Task正確答案:【Client#JobTracker#TaskTracker#Task】第8章Hadoop再探討單元測(cè)驗(yàn)1、問(wèn)題:下列說(shuō)法正確的是:選項(xiàng):A、第二名稱節(jié)點(diǎn)無(wú)法解決單點(diǎn)故障問(wèn)題B、第二名稱節(jié)點(diǎn)是熱備份C、HDFSHA提供高可用性,可以實(shí)現(xiàn)可擴(kuò)展性、系統(tǒng)性能和隔離性D、HDFSHA可用性不好正確答案:【第二名稱節(jié)點(diǎn)無(wú)法解決單點(diǎn)故障問(wèn)題】2、問(wèn)題:HDFSFederation設(shè)計(jì)不能解決“單名稱節(jié)點(diǎn)”存在的哪個(gè)問(wèn)題:選項(xiàng):A、HDFS集群擴(kuò)展性B、性能更高效C、良好的隔離性D、單點(diǎn)故障問(wèn)題正確答案:【單點(diǎn)故障問(wèn)題】3、問(wèn)題:下列哪些是Hadoop1.0存在的問(wèn)題:選項(xiàng):A、抽象層次低B、表達(dá)能力有限C、開(kāi)發(fā)者自己管理作業(yè)之間的依賴關(guān)系D、執(zhí)行迭代操作效率低正確答案:【抽象層次低#表達(dá)能力有限#開(kāi)發(fā)者自己管理作業(yè)之間的依賴關(guān)系#執(zhí)行迭代操作效率低】4、問(wèn)題:下列對(duì)Hadoop各組件的理解正確的是:選項(xiàng):A、Pig:處理大規(guī)模數(shù)據(jù)的腳本語(yǔ)言B、Tez:支持DAG作業(yè)的計(jì)算框架C、Oozie:工作流和協(xié)作服務(wù)引擎D、Kafka:分布式發(fā)布訂閱消息系統(tǒng)正確答案:【Pig:處理大規(guī)模數(shù)據(jù)的腳本語(yǔ)言#Tez:支持DAG作業(yè)的計(jì)算框架#Oozie:工作流和協(xié)作服務(wù)引擎#Kafka:分布式發(fā)布訂閱消息系統(tǒng)】5、問(wèn)題:對(duì)新一代資源管理調(diào)度框架YARN的理解正確的是:選項(xiàng):A、YARN可以實(shí)現(xiàn)“一個(gè)集群多個(gè)框架”,即在一個(gè)集群上部署一個(gè)統(tǒng)一的資源調(diào)度管理框架B、YARN的體系結(jié)構(gòu)包含三個(gè)組件:ResourceManager,NodeManager,ApplicationMasterC、YARN既是資源管理調(diào)度框架,也是一個(gè)計(jì)算框架D、MapReduce2.0是運(yùn)行在YARN之上的計(jì)算框架,由YARN來(lái)為MapReduce提供資源管理調(diào)度服務(wù)正確答案:【YARN可以實(shí)現(xiàn)“一個(gè)集群多個(gè)框架”,即在一個(gè)集群上部署一個(gè)統(tǒng)一的資源調(diào)度管理框架#YARN的體系結(jié)構(gòu)包含三個(gè)組件:ResourceManager,NodeManager,ApplicationMaster#MapReduce2.0是運(yùn)行在YARN之上的計(jì)算框架,由YARN來(lái)為MapReduce提供資源管理調(diào)度服務(wù)】第9章數(shù)據(jù)倉(cāng)庫(kù)Hive單元測(cè)驗(yàn)1、問(wèn)題:下列有關(guān)Hive和Impala的對(duì)比錯(cuò)誤的是:選項(xiàng):A、Hive與Impala使用相同的元數(shù)據(jù)B、Hive與Impala中對(duì)SQL的解釋處理比較相似,都是通過(guò)詞法分析生成執(zhí)行計(jì)劃C、Hive適合于長(zhǎng)時(shí)間的批處理查詢分析,而Impala適合于實(shí)時(shí)交互式SQL查詢D、Hive在內(nèi)存不足以存儲(chǔ)所有數(shù)據(jù)時(shí),會(huì)使用外存,而Impala也是如此正確答案:【Hive在內(nèi)存不足以存儲(chǔ)所有數(shù)據(jù)時(shí),會(huì)使用外存,而Impala也是如此】2、問(wèn)題:下列關(guān)于Hive基本操作命令的解釋錯(cuò)誤的是:選項(xiàng):A、createdatabaseuserdb;//創(chuàng)建數(shù)據(jù)庫(kù)userdbB、createtableifnotexistsusr(idbigint,namestring,ageint);//如果usr表不存在,創(chuàng)建表usr,含三個(gè)屬性id,name,ageC、loaddatalocalinpath‘/usr/local/data’overwriteintotableusr;//把目錄’/usr/local/data’下的數(shù)據(jù)文件中的數(shù)據(jù)以追加的方式裝載進(jìn)usr表D、insertoverwritetablestudentselect*fromuserwhereage10;//向表usr1中插入來(lái)自u(píng)sr表的age大于10的數(shù)據(jù)并覆蓋student表中原有數(shù)據(jù)正確答案:【loaddatalocalinpath‘/usr/local/data’overwriteintotableusr;//把目錄’/usr/local/data’下的數(shù)據(jù)文件中的數(shù)據(jù)以追加的方式裝載進(jìn)usr表】3、問(wèn)題:下列說(shuō)法正確的是:選項(xiàng):A、數(shù)據(jù)倉(cāng)庫(kù)Hive不需要借助于HDFS就可以完成數(shù)據(jù)的存儲(chǔ)B、Impala和Hive、HDFS、HBase等工具可以統(tǒng)一部署在一個(gè)Hadoop平臺(tái)上C、Hive本身不存儲(chǔ)和處理數(shù)據(jù),依賴HDFS存儲(chǔ)數(shù)據(jù),依賴MapReduce處理數(shù)據(jù)D、HiveQL語(yǔ)法與傳統(tǒng)的SQL語(yǔ)法很相似正確答案:【Impala和Hive、HDFS、HBase等工具可以統(tǒng)一部署在一個(gè)Hadoop平臺(tái)上#Hive本身不存儲(chǔ)和處理數(shù)據(jù),依賴HDFS存儲(chǔ)數(shù)據(jù),依賴MapReduce處理數(shù)據(jù)#HiveQL語(yǔ)法與傳統(tǒng)的SQL語(yǔ)法很相似】4、問(wèn)題:Impala主要由哪幾個(gè)部分組成:選項(xiàng):A、ImpaladB、StateStoreC、CLID、Hive正確答案:【Impalad#StateStore#CLI】5、問(wèn)題:以下屬于Hive的基本數(shù)據(jù)類型是:選項(xiàng):A、TINYINTB、FLOATC、STRINGD、BINARY正確答案:【TINYINT#FLOAT#STRING#BINARY】第10章Spark單元測(cè)驗(yàn)1、問(wèn)題:SparkSQL目前暫時(shí)不支持下列哪種語(yǔ)言:選項(xiàng):A、ScalaB、JavaC、PythonD、Lisp正確答案:【Lisp】2、問(wèn)題:RDD操作分為轉(zhuǎn)換(Transformation)和動(dòng)作(Action)兩種類型,下列屬于動(dòng)作(Action)類型的操作的是:選項(xiàng):A、mapB、filterC、groupByD、count正確答案:【count】3、問(wèn)題:下列說(shuō)法錯(cuò)誤的是:選項(xiàng):A、Spark支持三種類型的部署方式:Standalone,SparkonMesos,SparkonYARNB、在選擇SparkStreaming和Storm時(shí),對(duì)實(shí)時(shí)性要求高(比如要求毫秒級(jí)響應(yīng))的企業(yè)更傾向于選擇流計(jì)算框架StormC、RDD提供的轉(zhuǎn)換接口既適用filter等粗粒度的轉(zhuǎn)換,也適合某一數(shù)據(jù)項(xiàng)的細(xì)粒度轉(zhuǎn)換D、RDD采用惰性調(diào)用,遇到“轉(zhuǎn)換(Transformation)”類型的操作時(shí),只會(huì)記錄RDD生成的軌跡,只有遇到“動(dòng)作(Action)”類型的操作時(shí)才會(huì)觸發(fā)真正的計(jì)算正確答案:【RDD提供的轉(zhuǎn)換接口既適用filter等粗粒度的轉(zhuǎn)換,也適合某一數(shù)據(jù)項(xiàng)的細(xì)粒度轉(zhuǎn)換】4、問(wèn)題:下列關(guān)于常見(jiàn)的動(dòng)作(Action)和轉(zhuǎn)換(Transformation)操作的API解釋錯(cuò)誤的是:選項(xiàng):A、count():返回?cái)?shù)據(jù)集中的元素個(gè)數(shù)B、filter(func):篩選出滿足函數(shù)func的元素,并返回一個(gè)新的數(shù)據(jù)集C、take(n):返回?cái)?shù)據(jù)集中的第n個(gè)元素D、map(func):將每個(gè)元素傳遞到函數(shù)func中,并將結(jié)果返回為一個(gè)新的數(shù)據(jù)集正確答案:【take(n):返回?cái)?shù)據(jù)集中的第n個(gè)元素】5、問(wèn)題:下列大數(shù)據(jù)處理類型與其對(duì)應(yīng)的軟件框架不匹配的是:選項(xiàng):A、復(fù)雜的批量數(shù)據(jù)處理:MapReduceB、基于歷史數(shù)據(jù)的交互式查詢:ImpalaC、基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:StormD、圖結(jié)構(gòu)數(shù)據(jù)的計(jì)算:Hive正確答案:【圖結(jié)構(gòu)數(shù)據(jù)的計(jì)算:Hive】6、問(wèn)題:Apache軟件基金會(huì)最重要的三大分布式計(jì)算系統(tǒng)開(kāi)源項(xiàng)目包括:選項(xiàng):A、HadoopB、SparkC、StormD、Oracle正確答案:【Hadoop#Spark#Storm】7、問(wèn)題:Spark的主要特點(diǎn)包括:選項(xiàng):A、運(yùn)行速度快B、容易使用C、通用性好D、運(yùn)行模式多樣正確答案:【運(yùn)行速度快#容易使用#通用性好#運(yùn)行模式多樣】8、問(wèn)題:下列關(guān)于Scala的說(shuō)法正確的是:選項(xiàng):A、Scala是一種多范式編程語(yǔ)言B、Scala運(yùn)行于Java平臺(tái),兼容現(xiàn)有的Java程序C、Scala具備強(qiáng)大的并發(fā)性,支持函數(shù)式編程D、Scala是Spark的主要編程語(yǔ)言,但Spark還支持Java、Python、R作為編程語(yǔ)言正確答案:【Scala是一種多范式編程語(yǔ)言#Scala運(yùn)行于Java平臺(tái),兼容現(xiàn)有的Java程序#Scala具備強(qiáng)大的并發(fā)性,支持函數(shù)式編程#Scala是Spark的主要編程語(yǔ)言,但Spark還支持Java、Python、R作為編程語(yǔ)言】9、問(wèn)題:Spark的運(yùn)行架構(gòu)包括:選項(xiàng):A、集群資源管理器ClusterManagerB、運(yùn)行作業(yè)任務(wù)的工作節(jié)點(diǎn)WorkerNodeC、每個(gè)應(yīng)用的任務(wù)控制節(jié)點(diǎn)DriverD、每個(gè)工作節(jié)點(diǎn)上負(fù)責(zé)具體任務(wù)的執(zhí)行進(jìn)程Executor正確答案:【集群資源管理器ClusterManager#運(yùn)行作業(yè)任務(wù)的工作節(jié)點(diǎn)WorkerNode#每個(gè)應(yīng)用的任務(wù)控制節(jié)點(diǎn)Driver#每個(gè)工作節(jié)點(diǎn)上負(fù)責(zé)具體任務(wù)的執(zhí)行進(jìn)程Executor】第11章流計(jì)算單元測(cè)驗(yàn)1、問(wèn)題:流計(jì)算秉承一個(gè)基本理念,即數(shù)據(jù)的價(jià)值隨著時(shí)間的流逝而,如用戶點(diǎn)擊流:選項(xiàng):A、降低B、升高C、不變D、不確定正確答案:【降低】2、問(wèn)題:Hadoop運(yùn)行的是MapReduce任務(wù),類似地,Storm運(yùn)行的任務(wù)叫做選項(xiàng):A、TopologyB、BoltC、TupleD、Spout正確答案:【Topology】3、問(wèn)題:對(duì)于一個(gè)流計(jì)算系統(tǒng)來(lái)說(shuō),它應(yīng)達(dá)到如下哪些需求:選項(xiàng):A、高性能B、海量式C、實(shí)時(shí)性D、分布式正確答案:【高性能#海量式#實(shí)時(shí)性#分布式】4、問(wèn)題:數(shù)據(jù)采集系統(tǒng)的基本架構(gòu)包括哪些部分:選項(xiàng):A、AgentB、CollectorC、StoreD、Controller正確答案:【Agent#Collector#Store】5、問(wèn)題:以下哪些是開(kāi)源的流計(jì)算框架:選項(xiàng):A、Yahoo!S4B、TwitterStormC、FacebookPumaD、IBMInfoSphereStreams正確答案:【Yahoo!S4#TwitterStorm】6、問(wèn)題:下面哪幾個(gè)屬于Storm中的StreamGroupings的分組方式:選項(xiàng):A、隨機(jī)分組B、按照字段分組C、廣播發(fā)送D、全局分組正確答案:【隨機(jī)分組#按照字段分組#廣播發(fā)送#全局分組】第12章Flink單元測(cè)驗(yàn)1、問(wèn)題:以下哪個(gè)不是Flink的優(yōu)勢(shì):選項(xiàng):A、同時(shí)支持高吞吐、低延遲、高性能B、同時(shí)支持流處理和批處理C、不支持增量迭代D、支持有狀態(tài)計(jì)算正確答案:【不支持增量迭代】2、問(wèn)題:在Flink中哪個(gè)是基于批處理的圖計(jì)算庫(kù):選項(xiàng):A、FlinkMLB、GellyC、CEPD、SQLTable庫(kù)正確答案:【Gelly】3、問(wèn)題:下面關(guān)于Flink的說(shuō)法正確的是:選項(xiàng):A、Flink不是Apache軟件基金會(huì)的項(xiàng)目B、Flink可以同時(shí)支持實(shí)時(shí)計(jì)算和批量計(jì)算C、Flink起源于Stratosphere項(xiàng)目,該項(xiàng)目是在2010年到2014年間由柏林工業(yè)大學(xué)、柏林洪堡大學(xué)和哈索普拉特納研究所聯(lián)合開(kāi)展的D、Flink是Apache軟件基金會(huì)的5個(gè)最大的大數(shù)據(jù)項(xiàng)目之一正確答案:【Flink可以同時(shí)支持實(shí)時(shí)計(jì)算和批量計(jì)算#Flink起源于Stratosphere項(xiàng)目,該項(xiàng)目是在2010年到2014年間由柏林工業(yè)大學(xué)、柏林洪堡大學(xué)和哈索普拉特納研究所聯(lián)合開(kāi)展的#Flink是Apache軟件基金會(huì)的5個(gè)最大的大數(shù)據(jù)項(xiàng)目之一】4、問(wèn)題:Flink的主要特性包括:選項(xiàng):A、批流一體化B、精密的狀態(tài)管理C、事件時(shí)間支持D、精確一次的狀態(tài)一致性保障正確答案:【批流一體化#精密的狀態(tài)管理#事件時(shí)間支持#精確一次的狀態(tài)一致性保障】5、問(wèn)題:下面論述正確的是:選項(xiàng):A、流處理架構(gòu)需要具備低延遲、高吞吐和高性能的特性,而目前從市場(chǎng)上已有的產(chǎn)品來(lái)看,只有Flink可以滿足要求B、Storm雖然可以做到低延遲,但是無(wú)法實(shí)現(xiàn)高吞吐,也不能在故障發(fā)生時(shí)準(zhǔn)確地處理計(jì)算狀態(tài)C、SparkStreaming通過(guò)采用微批處理方法實(shí)現(xiàn)了高吞吐和容錯(cuò)性,但是犧牲了低延遲和實(shí)時(shí)處理能力D、Flink實(shí)現(xiàn)了GoogleDataflow流計(jì)算模型,是一種兼具高吞吐、低延遲和高性能的實(shí)時(shí)流計(jì)算框架,并且同時(shí)支持批處理和流處理正確答案:【流處理架構(gòu)需要具備低延遲、高吞吐和高性能的特性,而目前從市場(chǎng)上已有的產(chǎn)品來(lái)看,只有Flink可以滿足要求#Storm雖然可以做到低延遲,但是無(wú)法實(shí)現(xiàn)高吞吐,也不能在故障發(fā)生時(shí)準(zhǔn)確地處理計(jì)算狀態(tài)#SparkStreaming通過(guò)采用微批處理方法實(shí)現(xiàn)了高吞吐和容錯(cuò)性,但是犧牲了低延遲和實(shí)時(shí)處理能力#Flink實(shí)現(xiàn)了GoogleDataflow流計(jì)算模型,是一種兼具高吞吐、低延遲和高性能的實(shí)時(shí)流計(jì)算框架,并且同時(shí)支持批處理和流處理】6、問(wèn)題:Flink常見(jiàn)的應(yīng)用場(chǎng)景包括:選項(xiàng):A、事件驅(qū)動(dòng)型應(yīng)用B、數(shù)據(jù)分析應(yīng)用C、地圖應(yīng)用D、數(shù)據(jù)流水線應(yīng)用正確答案:【事件驅(qū)動(dòng)型應(yīng)用#數(shù)據(jù)分析應(yīng)用#數(shù)據(jù)流水線應(yīng)用】7、問(wèn)題:Flink核心組件棧分為哪三層:選項(xiàng):A、物理部署層B、Runtime核心層C、APILibraries層D、Core層正確答案:【物理部署層#Runtime核心層#APILibraries層】8、問(wèn)題:Flink有哪幾種部署模式:選項(xiàng):A、Local模式B、Standalone集群模式C、YARN集群模式D、運(yùn)行在GCE(谷歌云服務(wù))和EC2(亞馬遜云服務(wù))上正確答案:【Local模式#Standalone集群模式#YARN集群模式#運(yùn)行在GCE(谷歌云服務(wù))和EC2(亞馬遜云服務(wù))上】9、問(wèn)題:Flink系統(tǒng)主要由兩個(gè)組件組成,分別為:選項(xiàng):A、JobManagerB、TaskSchedulerC、JobSchedulerD、TaskManager正確答案:【JobManager#TaskManager】10、問(wèn)題:在編程模型方面,F(xiàn)link提供了不同級(jí)別的抽象,以開(kāi)發(fā)流或批處理作業(yè),主要包括哪幾個(gè)級(jí)別的抽象:選項(xiàng):A、狀態(tài)化的數(shù)據(jù)流接口B、DataStreamAPI(有界或無(wú)界流數(shù)據(jù))以及DataSetAPI(有界數(shù)據(jù)集)C、TableAPID、SQL正確答案:【狀態(tài)化的數(shù)據(jù)流接口#DataStreamAPI(有界或無(wú)界流數(shù)據(jù))以及DataSetAPI(有界數(shù)據(jù)集)#TableAPI#SQL】第13章圖計(jì)算單元測(cè)驗(yàn)1、問(wèn)題:Pregel是一種基于模型實(shí)現(xiàn)的并行圖處理系統(tǒng):選項(xiàng):A、BSPB、TSPC、SBPD、STP正確答案:【BSP】2、問(wèn)題:谷歌在后Hadoop時(shí)代的新“三駕馬車(chē)”不包括:選項(xiàng):A、CaffeineB、DremelC、HamaD、Pregel正確答案:【Hama】3、問(wèn)題:下列哪些是以圖頂點(diǎn)為中心的,基于消息傳遞批處理的并行圖計(jì)算框架:選項(xiàng):A、PregelB、HamaC、GiraphD、Neo4j正確答案:【Pregel#Hama#Giraph】4、問(wèn)題:以下關(guān)于Pregel圖計(jì)算框架說(shuō)法正確的是:選項(xiàng):A、通常只對(duì)滿足交換律和結(jié)合律的操作才會(huì)開(kāi)啟Combiner功能B、Aggregator提供了一種全局通信、監(jiān)控和數(shù)據(jù)查看的機(jī)制C、Pregel采用檢查點(diǎn)機(jī)制來(lái)實(shí)現(xiàn)容錯(cuò)D、對(duì)于全局拓?fù)涓淖儯琍regel采用了惰性協(xié)調(diào)機(jī)制正確答案:【通常只對(duì)滿足交換律和結(jié)合律的操作才會(huì)開(kāi)啟Combiner功能#Aggregator提供了一種全局通信、監(jiān)控和數(shù)據(jù)查看的機(jī)制#Pregel采用檢查點(diǎn)機(jī)制來(lái)實(shí)現(xiàn)容錯(cuò)#對(duì)于全局拓?fù)涓淖儯琍regel采用了惰性協(xié)調(diào)機(jī)制】第14章大數(shù)據(jù)在不同領(lǐng)域的應(yīng)用單元測(cè)驗(yàn)1、問(wèn)題:下列說(shuō)法錯(cuò)誤的是:選項(xiàng):A、UserCF算法推薦的是那些和目標(biāo)用戶有共同興趣愛(ài)好的其他用戶所喜歡的物品B、ItemCF算法推薦的是那些和目標(biāo)用戶之前喜歡的物品類似的其他物品C、UserCF算法的推薦更偏向社會(huì)化,而ItemCF算法的推薦更偏向于個(gè)性化D、基于用戶的協(xié)同過(guò)濾算法(簡(jiǎn)稱UserCF算法)是目前業(yè)界應(yīng)用最多的算法正確答案:【基于用戶的協(xié)同過(guò)濾算法(簡(jiǎn)稱UserCF算法)是目前業(yè)界應(yīng)用最多的算法】2、問(wèn)題:推薦方法包括哪些類型:選項(xiàng):A、專家推薦B、基于統(tǒng)計(jì)的推薦C、基于內(nèi)容的推薦D、協(xié)同過(guò)濾推薦正確答案:【專家推薦#基于統(tǒng)計(jì)的推薦#基于內(nèi)容的推薦#協(xié)同過(guò)濾推薦】大數(shù)據(jù)技術(shù)原理與應(yīng)用期末試卷1、問(wèn)題:數(shù)據(jù)產(chǎn)生方式的變革主要經(jīng)歷了三個(gè)階段,以下哪個(gè)不屬于這三個(gè)階段:選項(xiàng):A、運(yùn)營(yíng)式系統(tǒng)階段B、用戶原創(chuàng)內(nèi)容階段C、感知式系統(tǒng)階段D、數(shù)據(jù)流階段正確答案:【數(shù)據(jù)流階段】2、問(wèn)題:第三次信息化浪潮的發(fā)生標(biāo)志是以下哪種技術(shù)的普及:選項(xiàng):A、個(gè)人計(jì)算機(jī)B、互聯(lián)網(wǎng)C、物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)D、CPU正確答案:【物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)】3、問(wèn)題:在Flink中哪個(gè)是基于批處理的圖計(jì)算庫(kù):選項(xiàng):A、FlinkMLB、GellyC、CEPD、SQLTable庫(kù)正確答案:【Gelly】4、問(wèn)題:Hadoop的兩大核心是和選項(xiàng):A、HDFS;MapReduceB、HDFS;HBaseC、MapReduce;HBaseD、GFS;MapReduce正確答案:【HDFS;MapReduce】5、問(wèn)題:HDFS默認(rèn)的一個(gè)塊大小是選項(xiàng):A、64MBB、8KBC、16KBD、32KB正確答案:【64MB】6、問(wèn)題:在分布式文件系統(tǒng)HDFS中,負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和讀取:選項(xiàng):A、數(shù)據(jù)節(jié)點(diǎn)B、主節(jié)點(diǎn)C、名稱節(jié)點(diǎn)D、第二名稱節(jié)點(diǎn)正確答案:【數(shù)據(jù)節(jié)點(diǎn)】7、問(wèn)題:上傳當(dāng)前目錄下的本地文件file.txt到分布式文件系統(tǒng)HDFS的“/path”目錄下的Shell命令是:選項(xiàng):A、hdfsdfs-putfile.txt/pathB、hadoopdfs-put/pathfile.txtC、hdfsdfs-put/pathfile.txtD、hdfsfs-putfile.txt/path正確答案:【hdfsdfs-putfile.txt/path】8、問(wèn)題:在HDFS根目錄下創(chuàng)建一個(gè)文件夾/test,且/test文件夾內(nèi)還包含一個(gè)文件夾dir,正確的shell命令是:選項(xiàng):A、hadoopfs-mkdir-p/test/dirB、hadoopdfs-mkdir/test/dirC、hdfsfs-mkdir-p/test/dirD、hdfsdfs*mkdir-p/test/dir正確答案:【hadoopfs-mkdir-p/test/dir】9、問(wèn)題:下列有關(guān)HBase的說(shuō)法正確的是:選項(xiàng):A、HBase是針對(duì)谷歌BigTable的開(kāi)源實(shí)現(xiàn),是高可靠、高性能的圖數(shù)據(jù)庫(kù)B、HBase是一種NoSQL數(shù)據(jù)庫(kù)C、在向數(shù)據(jù)庫(kù)中插入記錄時(shí),HBase和關(guān)系數(shù)據(jù)庫(kù)一樣,每次都是以“行”為單位把整條記錄插入數(shù)據(jù)庫(kù)D、HBase數(shù)據(jù)庫(kù)表可以設(shè)置該表任意列作為索引正確答案:【HBase是一種NoSQL數(shù)據(jù)庫(kù)】10、問(wèn)題:已知一張表student存儲(chǔ)在HBase中,向表中插入一條記錄{id:2015001,name:Mary,{score:math}:88},其id作為行鍵,其中,在插入數(shù)學(xué)成績(jī)88分時(shí),正確的命令是:選項(xiàng):A、put'student','2015001','score:math','88'B、put'student','2015001','88'C、put'student','2015001','math','88'D、put'student','score:math','88'正確答案:【put'student','2015001','score:math','88'】11、問(wèn)題:NoSQL數(shù)據(jù)庫(kù)的三大理論基石不包括:選項(xiàng):A、CAPB、BASEC、最終一致性D、ACID正確答案:【ACID】12、問(wèn)題:在設(shè)計(jì)詞頻統(tǒng)計(jì)的MapReduce程序時(shí),對(duì)于文本行“hellobigdatahellohadoop”,經(jīng)過(guò)map函數(shù)處理后直接輸出的結(jié)果應(yīng)該是(沒(méi)有發(fā)生combine和merge操作):選項(xiàng):A、hello,1,1、bigdata,1和hadoop,1B、hello,2、bigdata,1和hadoop,1C、hello,1,1、bigdata,1和hadoop,1D、hello,1、hello,1、bigdata,1和hadoop,1正確答案:【hello,1、hello,1、bigdata,1和hadoop,1】13、問(wèn)題:假設(shè)已經(jīng)配置好PATH環(huán)境變量,啟動(dòng)Hadoop的命令是:選項(xiàng):A、start-dfs.shB、start-hadoop.shC、start-fs.shD、start-hdfs.sh正確答案:【start-dfs.sh】14、問(wèn)題:下列說(shuō)法錯(cuò)誤的是:選項(xiàng):A、第二名稱節(jié)點(diǎn)無(wú)法解決單點(diǎn)故障問(wèn)題B、HDFSHA可以解決單點(diǎn)故障問(wèn)題C、第二名稱節(jié)點(diǎn)是熱備份,而HDFSHA不是熱備份D、HDFSFederation使得HDFS的命名服務(wù)能夠水平擴(kuò)展正確答案:【第二名稱節(jié)點(diǎn)是熱備份,而HDFSHA不是熱備份】15、問(wèn)題:RDD操作包括轉(zhuǎn)換(Transformation)和動(dòng)作(Action)兩種類型,下列RDD操作屬于動(dòng)作(Action)類型的是:選項(xiàng):A、mapB、joinC、collectD、groupBy正確答案:【collect】16、問(wèn)題:下列關(guān)于Hive的說(shuō)法正確的是:選項(xiàng):A、Hive支持頻繁數(shù)據(jù)更新B、Hive的可擴(kuò)展性差C、Hive不支持索引D、Hive支持批量導(dǎo)入正確答案:【Hive支持批量導(dǎo)入】17、問(wèn)題:大數(shù)據(jù)的特點(diǎn)包括:選項(xiàng):A、數(shù)據(jù)量大B、數(shù)據(jù)種類繁多C、處理速度快D、價(jià)值密度低正確答案:【數(shù)據(jù)量大#數(shù)據(jù)種類繁多#處理速度快#價(jià)值密度低】18、問(wèn)題:下列適用于批處理計(jì)算的框架有哪些:選項(xiàng):A、MapReduceB、SparkC、StormD、Pregel正確答案:【MapReduce#Spark】19、問(wèn)題:下列適用于流計(jì)算的框架有哪些:選項(xiàng):A、StormB、SparkStreamingC、PregelD、Dremel正確答案:【Storm#SparkStreaming】20、問(wèn)題:Flink核心組件棧分為哪三層:選項(xiàng):A、物理部署層B、Runtime核心層C、APILibraries層D、Core層正確答案:【物理部署層#Runtime核心層#APILibraries層】21、問(wèn)題:從技術(shù)架構(gòu)上來(lái)看,物聯(lián)網(wǎng)可以分為哪幾層:選項(xiàng):A、感知層B、網(wǎng)絡(luò)層C、處理層D、應(yīng)用層正確答案:【感知層#網(wǎng)絡(luò)層#處理層#應(yīng)用層】22、問(wèn)題:HBase需要根據(jù)哪些屬性來(lái)唯一地確定一個(gè)單元格(cell)中的某個(gè)版本數(shù)據(jù):選項(xiàng):A、行鍵B、列族C、列限定符D、時(shí)間戳正確答案:【行鍵#列族#列限定符#時(shí)間戳】23、問(wèn)題:典型的NoSQL數(shù)據(jù)庫(kù)的類型包括:選項(xiàng):A、鍵值數(shù)據(jù)庫(kù)B、列族數(shù)據(jù)庫(kù)C、文檔數(shù)據(jù)庫(kù)D、圖數(shù)據(jù)庫(kù)正確答案:【鍵值數(shù)據(jù)庫(kù)#列族數(shù)據(jù)庫(kù)#文檔數(shù)據(jù)庫(kù)#圖數(shù)據(jù)庫(kù)】24、問(wèn)題:CAP是指:選項(xiàng):A、一致性B、可用性C、持久性D、分區(qū)容忍性正確答案:【一致性#可用性#分區(qū)容忍性】25、問(wèn)題:云計(jì)算主要包括哪3種類型:選項(xiàng):A、IaaSB、PaaSC、SaaSD、CaaS正確答案:【I
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 紡織品質(zhì)量控制與追溯系統(tǒng)考核試卷
- 電聲器件在耳機(jī)與耳塞中的應(yīng)用考核試卷
- 機(jī)床功能部件在石油鉆采設(shè)備中的耐高溫性能考核試卷
- 糕點(diǎn)店經(jīng)營(yíng)風(fēng)險(xiǎn)與應(yīng)對(duì)策略考核試卷
- 私募股權(quán)投資醫(yī)療健康行業(yè)分析考核試卷
- 靜脈治療護(hù)理技術(shù)操作標(biāo)準(zhǔn)2023版解讀
- 3-2組合邏輯電路的設(shè)計(jì)
- 小學(xué)一年級(jí)數(shù)學(xué)20以內(nèi)加減法測(cè)試題
- 內(nèi)蒙古醫(yī)科大學(xué)《室內(nèi)裝修工程》2023-2024學(xué)年第二學(xué)期期末試卷
- 江蘇省南通市海安市十校聯(lián)考2025屆初三畢業(yè)班聯(lián)考(二)數(shù)學(xué)試題試卷含解析
- 國(guó)企管理人員招聘考試題庫(kù)
- 托管老師員工手冊(cè)
- 中醫(yī)養(yǎng)生的健康體重
- (2024版)小學(xué)二年級(jí)孩子如何高效復(fù)習(xí)語(yǔ)文知識(shí)點(diǎn)
- 中石化公司招聘考試真題
- 統(tǒng)編版一年級(jí)語(yǔ)文下冊(cè)部編版第六單元單元教材解讀(素材)(課件)
- 乳腺結(jié)節(jié)手術(shù)后的護(hù)理
- 2024年口腔醫(yī)療相關(guān)項(xiàng)目招商引資方案
- 培訓(xùn)固定資產(chǎn)管理制度
- 電廠灰場(chǎng)環(huán)境風(fēng)險(xiǎn)評(píng)估報(bào)告
- 原子核物理實(shí)驗(yàn)方法課后習(xí)題(附答案)
評(píng)論
0/150
提交評(píng)論