



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精品TDH數據平臺認證工程師試題姓名: _ 分數: _【說明】a) 客觀題 30 題,每題 2 分,總計 60 分b) 主觀題 4 題,每題 10 分,總計 40 分c) 滿分 100 分。【不定項選擇題(每題2 分共 60 分)】1、下列與HDFS有關的說法正確的是()A HDFS DataNode節點上的磁盤需要做 RAID1,用來保證數據的可靠性B HDFS可以在磁盤之間通過 balance 操作,平衡磁盤之間的負載情況CHDFS建議 DataNode 之間的數據盤個數、容量大小不一致,以體現HDFS的負載均衡能力D規劃 HDFS集群時,建議Active NameNode 和 Stand
2、by NameNode 分配在不同的機架上2、以下哪個服務作為HDFS高可靠協調服務的共享存儲?()A. ZooKeeperB. JournalNodesC. NameNodeD. ZKFailoverController3、在集群中配置HDFS的副本數為3,設置數據塊大小為128M ,此時我們上傳一份64M的數據文件,該數據文件占用HDFS空間大小為()A.64MB . 128MC . 384MD . 192M4、在 Yarn 服務中,不包含以下哪種角色()A . ResourceManagerB . NodeManagerC . ApplicationMasterD . Contianer
3、5、ResourceManager 是 YARN的主要組成部分,有關其功能描述不正確的是()A . 它直接將集群所擁有的資源按需分配給運行在YARN上的應用程序B . 它負責將集群中的所有資源進行統一管理和分配C . 它接受各個節點的資源匯報信息D . 它把資源按照策略分配給各應用感謝下載載精品6、當前用戶提交了一個wordcount 詞頻統計的任務,最后任務執行失敗,可能的原因有哪些()A . 當前集群中沒有足夠的資源,不足以滿足當前wordcount 任務的需求B . 執行該任務的用戶沒有權限訪問HDFS上的數據文件C . 用戶在執行任務之前在 HDFS相應的目錄下創建了提交任務時指定的輸
4、出目錄 D . 以上原因都有可能7、以下關于外表和托管表描述正確的是()A、外表的數據存儲在本地,托管表的數據存儲在hdfs 上B、刪除托管表只會刪除 Inceptor 上的元數據不會刪除數據文件, 刪除外表兩者都會被刪除C、刪除外表只會刪除 Inceptor 上的元數據不會刪除數據文件, 刪除托管表兩者都會被刪除D、刪除托管表或外表,incepotr 上的元數據和數據文件都會被刪除8、SQL運行中如果出現maptask 數據特別多,執行時間又很短時可以通過小文件合并來進行優化,以下是合并參數有()A. SET ngmr.partition.automerge = TRUE;B. SET ng
5、mr.partition.mergesize = n;C. SET ngmr.partition.mergesize.mb = m;D. SET mapred.reduce.tasks = N;9、以下關于inceptor 日志信息描述正確的有()A.Inceptor server 日志存放于各節點的/var/log/inceptorsqlx/hive-server.logB. 可以通過 inceptor server 4040 查看 SQL錯誤日志C. Excutor 日志存放于 excutor 節點的 /var/log/inceptorsqlx/spark -excutor.logD Ex
6、cutorGC 日志存放于excutor 節點的 /var/log/inceptorsqlx/spark-excutor.gc.log10、tableA有 10G 的數據, tableB 有 100G 的數據,兩個表通過共有的id 列做關聯查詢name 列,以下方式可以優化計算效率的是()A. select /*+MAPJOIN(a)*/ , from tableA a join tableB b on a.id=b.idB. select /*+MAPJOIN(b)*/ , from tableA a join tableB b on a.id
7、=b.idC. 建表時將 tableA 和 tableB 根據 id 字段分相同數量的桶D. 建表時將 tableA 和 tableB 根據 name 字段分相同數量的桶11、以下屬于HMaster 功能的是()A 為 Region Server 分配 regionB 存儲數據元信息C 對 region 進行 compact 操作D 管理用戶對table 的增刪改查操作感謝下載載精品12、Hyperbase 與 Inceptor 的關系,描述正確的是()A 兩者不可或缺,Inceptor保證 Hyperbase 的服務的正常運行B 兩者沒有任何關系C Inceptor可以訪問 Hyperbas
8、eD 兩者相輔相成13、下列創建全局索引的語句,正確的是()A add_index't1', 'index_name , COMBINE_INDEX|INDEXED=f1:q1:9|rowKey:rowKey:10,UPDATE=true'B add_global_index't1', 'index_name ,'COMBINE_INDEX|INDEXED=f1:q1:9|rowKey:rowKey:10,UPDATE=true'C add_fulltext_index't1', 'index_na
9、me ,'COMBINE_INDEX|INDEXED=f1:q1:9|rowKey:rowKey:10,UPDATE=true'D create_global_index't1', 'index_name ,'COMBINE_INDEX|INDEXED=f1:q1:9|rowKey:rowKey:10,UPDATE=true'14、以下對流處理計算框架描述不正確的是()A Spark Streaming 是基于微批( batch)對數據進行處理的B Apache Storm 是基于時間( event)對數據進行處理的C Transwarp
10、 StreamSQL 可基于微批或事件對數據進行處理D 以上說法都不對15、某交通部門通過使用流監控全市過往24 小時各個卡口數據,要求每分鐘更新一次,原始流為org_stream ,以下實現正確的是()A. CREATE STREAMWINDOW traffic_stream AS SELECT * FROM original_stream STREAM w1 AS (length '1' minute slide '24' hour);B. CREATE STREAM traffic_stream AS SELECT * FROM original_stre
11、am STREAMWINDOW w1 AS (length '1' minute slide '24' hour);C. CREATE STREAM traffic_stream AS SELECT * FROM original_stream STREAMWINDOW w1 AS (length '24' hour slide '1' minute);D. CREATE STREAMtraffic_stream AS SELECT * FROM original_stream AS (length '24' se
12、cond slide '1' minute);16、Zookeeper 服務描述正確的為()A . Zookeeper 中每一個server 互為 leader 。B . Zookeeper 中只有一個leader,并通過備份機制產生。C . Zookeeper 中不存在leader,所有 server 共同提供服務。D . Zookeeper 通過選舉機制確定leader ,有且僅有一個。感謝下載載精品17、通過Hue 修改 HDFS目錄或文件的權限可以通過以下哪些方式實現()AHdfs 相應的權限B通過 Hue 超級用戶 hue 登錄C以 hdfs 用戶登錄D以上都可以18
13、、通過Oozie 使用 ssh,必須滿足以下條件()A以 root 用戶登錄各個節點BOozie 用戶可以免密鑰登錄COozie 用戶必須要有 bash 權限D .所訪問必須是集群的節點19、有關使用 sqoop 抽取數據的原理的描述不正確的是()A .sqoop 在抽取數據的時候可以指定map 的個數, map 的個數決定在hdfs 生成的數據文件的個數B .sqoop 抽取數據是個多節點并行抽取的過程,因此map 的個數設置的越多性能越好C .sqoop 任務的切分是根據 split 字段的(最大值-最小值) /map 數D .sqoop 抽取數據的時候需要保證執行當前用戶有權限執行相應的
14、操作20、在使用sqoop 連接關系型數據時,下面哪個命令可以查看關系型數據庫中有哪些表?()A. sqoop list -databases -username root-password 111111-connect jdbc:mysql:/5:3306/B. sqoop list -databases -username root-P-connect jdbc:mysql:/5:3306/C. sqoop list -databases -username root-password-file file:/root/.pwd-conne
15、ct jdbc:mysql:/5:3306/D. sqoop list -tables- username root- password 111111- connect jdbc:mysql:/5:3306/test感謝下載載精品21、要將采集的日志數據作為kafka 的數據源,則flume sink 需要設置為下列哪項參數()A . hdfsB . kafkaC . org.apache.flume.sink.kafka.KafkaSinkD . topicname22、下列是關于flume 和 sqoop 對比的描述,不正確的是()A .
16、 flume 主要用來采集日志而sqoop 主要用來做數據遷移B . flume 主要采集流式數據而sqoop 主要用來遷移規范化數據C . flume 和 sqoop 都是分布式處理任務D . flume 主要用于采集多數據源小數據而sqoop 用來遷移單數據源數據23、有關 Elasticsearch 描述有誤的一項是()A 它會利用多播形式發現節點。B 主節點 (master node)通過選舉方式產生。C 主節點 (master node) 進行集群的管理,只負責集群節點添加和刪除。D主節點會去讀集群狀態信息,必要的時候進行恢復工作。24、下面措施中,不能保證kafka 數據可靠性的是
17、()A . kafka 會將所有消息持久化到硬盤中保證其數據可靠性B . kafka 通過 Topic Partition 設置 Replication 來保證其數據可靠性C . kafka 通過設置消息重發機制保證其數據可靠性D . kafka 無法保證數據可靠性25、TDH 提供哪幾種認證模式?()A 所有服務使用簡單認證模式所有服務都無需認證即可互相訪問B 所有服務都啟用Kerberos 認證,用戶要提供Kerberos principal和密碼(或者keytab )來訪問各個服務C 所有服務都啟用 Kerberos 同時 Inceptor 啟用 LDAP認證D 所有服務都啟用 LDAP
18、認證26、開啟 LDAP后,應該使用哪個命令連接Inceptor ()A. transwarp -t -h $ip。B.beeline -u jdbc:hive2:/$ip:10000-n $username -p $password。C.beeline -u"jdbc:hive2:/$ip:10000/default;principal=hive/node1TDH"。D.beeline -u"jdbc:hive2:/$ip:10000/default;principal=user1TDH"。感謝下載載精品27、Inceptor server 服務無法啟
19、動時,該如何查看日志是()A 查看 TDH manager 所在節點 /var/log/inceptorsql*/目錄下的 hive-server2.log 日志B 查看 Inceptor server 所在節點 /var/log/inceptorsql*/目錄下的 hive-server2.log 日志C查 看Resource Manager 所在 節 點/var/log/Yarn*/ 目 錄 下 的yarn-yarn-resourcemanager -poc-node1.log 日志D 查看任意節點 /var/log/inceptorsql*/目錄下的 hive-server2.log 日志28、現有一批數據需要進行清洗,要求對其中null 通過 update 轉換為 0,刪除重復的記錄,添加部分新的記錄,則該表應該設計為()A. Tex表B. Orc 表C. Orc 事務表D. Holodesk 表
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三人合伙做生意合同書
- 二零二五地下車位出租協議
- 二零二五產品配方保密協議書
- 擔架工合同模板
- 2025放射性同位素使用合同范文
- 2025年簽訂汽車買賣合同應注意哪些細節
- 2025租房合同樣本:單間出租協議
- 2025房地產合同參考范本
- 河南省鄭州121中學2024-2025學年八年級(下)第一次調研物理試卷(含解析)
- 高壓共軌泵項目運營管理方案(范文參考)
- 2023年軟件正版化工作總結八篇
- 酒店報銷水單經典模板
- 給水泵檢修方案
- 《運營管理》第2版題庫與參考答案
- KEGG代謝通路中文翻譯
- GB∕T 17832-2021 銀合金首飾 銀含量的測定 溴化鉀容量法(電位滴定法)
- 低成本自動化的開展與案例77頁PPT課件
- 梅州市部分飲用水源保護區調整方案
- 地面沉降監測技術要求
- 基本建設項目建設成本管理規定解讀
- 金色的魚鉤課本劇
評論
0/150
提交評論