Hadoop平臺構建知到智慧樹期末考試答案題庫2024年秋上海思博職業技術學院_第1頁
Hadoop平臺構建知到智慧樹期末考試答案題庫2024年秋上海思博職業技術學院_第2頁
Hadoop平臺構建知到智慧樹期末考試答案題庫2024年秋上海思博職業技術學院_第3頁
Hadoop平臺構建知到智慧樹期末考試答案題庫2024年秋上海思博職業技術學院_第4頁
Hadoop平臺構建知到智慧樹期末考試答案題庫2024年秋上海思博職業技術學院_第5頁
已閱讀5頁,還剩1頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Hadoop平臺構建知到智慧樹期末考試答案題庫2024年秋上海思博職業技術學院HDFS的Client寫入文件時,數據的第一副本寫入位置是由NameNode確定,其他副本的寫入位置由DataNode確定。()

A:對B:錯

答案:B:錯數據集沒有局部相關特性不適合用深度學習。()

A:對B:錯

答案:B:錯Yarn-client和Yarn-cluster主要區是ApplicationMaster進程的區別.()

A:對B:錯

答案:對Slave節點要存儲數據,所以它的磁盤越大越好。()

A:錯B:對

答案:錯HBase系統并不適合進行多表聯合查詢以及復雜性讀寫操作。()

A:對B:錯

答案:A:對HDFS系統不支持數據的修改。()

A:錯B:對

答案:對一般而言,分布式數據庫是指物理上分散在不同地點,但在邏輯上是統一的數據庫。因此分布式數據庫具有物理上的獨立性、邏輯上的一體性、性能上的可擴展性等特點。()

A:對B:錯

答案:對基于大數據的社會治理更加有效,比如可以運用各個行業的大數據監測品牌形象。()

A:錯B:對

答案:B:對Hbase采用是Key-Value形式的數據庫,模擬于Java中的Map形式。()

A:對B:錯

答案:對在Hadoop集群中,YARN負責任務調度和資源管理。()

A:對B:錯

答案:A:對Hadoop是一種關系型數據庫。()

A:對B:錯

答案:錯導入數據到Hive表時不會檢查數據合法性,只會在讀取數據時候檢查。()

A:對B:錯

答案:錯在Hadoop中,可以使用Flume進行流式數據處理。()

A:錯B:對

答案:B:對如果NameNode意外終止,SecondaryNameNode不會接替它使集群繼續工作。()

A:對B:錯

答案:對HDFS存儲數據時,關鍵數據根據實際業務需要保存在具有高度可靠性的節點中,通過修改Danodo的存儲策略,系統可以將數據強制保存在指定的節點組中。()

A:錯B:對

答案:B:對Hadoop是一種分布式計算平臺。()

A:錯B:對

答案:對今天的世界,一切都可以數據化。數據少了用處不大;數據大了就很有用處。()

A:對B:錯

答案:A:對大數據僅僅是指數據的體量大。()

A:對B:錯

答案:B:錯使用Shell命令insert對HBase中的一張表進行數據添加操作。()

A:錯B:對

答案:錯HDFS支持大文件存儲,同時支持多個用戶對同一個文件的寫操作,以及在文件任意位置進行修改。()

A:對B:錯

答案:B:錯spark是由C編程語言實現的。()

A:錯B:對

答案:錯在Hadoop集群中,Hive用來處理實時數據。()

A:對B:錯

答案:B:錯每個map槽就是一個線程。()

A:錯B:對

答案:錯hive中的“groupby”指的是通過規則將一個數據集劃分為幾個小的數據集,然后根據小的數據集進行分組處理。()

A:對B:錯

答案:對在HadoopHA模式下,主備NameNode之間通過一組JournalNode同步元數據信息,一條數據只要成功寫入多數JournalNode即認為寫入成功。通常配置奇數個JournalNode。()

A:錯B:對

答案:對使用綁定變量是防止數據庫SQL注入的有效手段。()

A:錯B:對

答案:B:對Hbase的最小存儲單元不是Region而是一個Cell單元。()

A:對B:錯

答案:對對高價值高度聚合的信息和知識的批次處理是大數據行業主要商業訴求.()

A:錯B:對

答案:錯MapReduce是分布式并行計算框架,其計算模式屬于流計算,實時性好。()

A:對B:錯

答案:錯Hive是用來處理實時數據的工具。()

A:對B:錯

答案:B:錯數據采集工具不包括()

A:SqoopB:KafkaC:HbaseD:Flume

答案:HbaseZookeeper角色分配不包括()

A:followerB:ObserverC:leaderD:protecter

答案:protecterHadoop的NameNode負責____A_____。

A:存儲HDFS的文件B:運行Hadoop的集群管理C:管理HDFS的數據塊D:處理MapReduce計算任務

答案:管理HDFS的數據塊ETL三個部分中,花費時間最長的是()

A:全部B:TC:LD:E

答案:T關于hadoopMapReduce分片(split)的概念,下列說法不正確的是()

A:大多數情況下,理想的分片大小是一個HDFS塊對應一個splitB:split是一個物理的存儲概念C:hADoop為每個split創建一個mA.p任務D:split的多寡決定了mAp任務的數目

答案:split是一個物理的存儲概念在spark生態組件中,哪個產品可用于復雜的批量數據處理()。

A:sparkstreamingB:sparkcoreC:sparkSQLD:Mlib

答案:sparkcore在思維方式方面,不是大數據顯著影響的是()。

A:全樣而非抽樣B:效率而非精確C:相關而非因果D:存儲而非計算

答案:存儲而非計算Hadoop的核心組件之一是___A______。

A:HBaseB:SparkC:PigD:Hive

答案:Hivehive是以()技術為基礎的數據倉庫。

A:MapReduceB:HDFSC:hadoopD:HBASE

答案:HADOOP關于數據的規范化的錯誤觀點是()

A:方便存儲B:是為了消除量綱對數據結構的影響C:一般包括數據中心化和數據標準化D:一般是一個無量綱的純數值

答案:A:方便存儲zookeeper集群至少需要幾個節點以上()。

A:3B:1C:4D:2

答案:A:3YARN是Hadoop中的___D______。

A:網絡協議B:數據可視化工具C:數據庫系統D:分布式計算框架

答案:D:分布式計算框架Hadoop和Hadoop生態圈的描述中,正確的是()。

A:Hadoop含義范圍大于Hadoop生態圈B:與Hadoop相比,Hadoop生態圈是指Hadoop框架本身C:常見的Hadoop生態圈組件有ZooKeeper、Flume、Redis、Hive、Flink等D:Hadoop生態圈,不僅包含Hadoop,還包括保證Hadoop框架正常高效運行的其他框架

答案:Hadoop生態圈,不僅包含Hadoop,還包括保證Hadoop框架正常高效運行的其他框架以下哪個現象不屬于大數據的典型特征():

A:產生速率高B:數據量大C:數據類型多D:數據包含噪聲及缺失值

答案:D:數據包含噪聲及缺失值。在Hadoop集群中,負責任務調度和資源管理的組件是__D_______。

A:HiveB:SparkC:HBaseD:YARN

答案:D:YARN在Hadoop集群中,負責數據的增刪改查的組件是____A_____。

A:HiveB:HBaseC:SparkD:YARN

答案:A:Hive下面哪條命令可以把f1.txt復制為f2.txt?()

A:cpf1.txt|f2.txtB:catf1.txt|f2.txtC:catf1.txt>f2.txtD:copyf1.txt|f2.txt

答案:catf1.txt>f2.txt基于zookeeper實現主備NN自動切換,不正確的描述是()。

A:ZKFC的作用是監控NameNode健康狀態,當主NN掛掉之后,備用NN的ZKFC會得到消息,然后會將備用NN狀態改為Active,并是原來的主NN改為備用NN。B:備用NN也會幫助主NN合并editsLog文件和fsimage產生新的fsimage,并推送ActiveNN。C:兩臺NN啟動后都會去zookeeper進行注冊,zk會分配主節點Active和備節點Standby;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論