




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、大數據試卷單選題,每一題只有一個正確選項,共110題第1題,大數據不是要教機器像人一樣思考。相反,它是(A)。A:把數學算法運用到海量的數據上來預測事情發生的可能性B:被視為人工智能的一部分C:被視為一種機器學習D:預測與懲罰第2題,MongoDB是一種NoSQL數據庫,具體地說,是(B)存儲數據庫。A:鍵值B:文檔C:圖形D:XML第3題,以下哪種說法是錯誤的(B)。A:將罪犯的定罪權放在數據手中,借以表達對數據和分析結果的崇尚,這實際上是一種濫用B:隨著數據量和種類的增多,大數據促進了數據內容的交叉檢驗,匿名化的數據不會威脅到任何人的隱私C:采集個人數據的工具就隱藏在我們日常生活所必備的工
2、具當中,比如網頁和智能手機應用程序D:預測與懲罰,不是因為所做,而是因為將做第4題,下列關于MapReduce的說法錯誤的是(D)A:MapReduce將復雜的、運行于大規模集群上的并行計算過程高度地抽象到了兩個函數:Map和ReduceB:MapReduce采用分而治之”策略,一個存儲在分布式文件系統中的大規模數據集,會被切分成許多獨立的分片(split),這些分片可以被多個Map任務并行處理C:MapReduce設計的一個理念就是計算向數據靠攏”,而不是數據向計算靠攏”,因為,移動數據需要大量的網絡傳輸開銷D:MapReduce應用程序必須要用Java來寫第5題,下面與Zookeeper類
3、似的框架是(D)A:ProtobufB:JavaC:Kafka第6題,可以對大數據進行深度分析的平臺工具是(C)A:傳統的機器學習和數據分析工具B:第二代機器學習工具C:第三代機器學習工具D:未來機器學習工具第7題,哪個是HDFS(HadoopDistributedFileSystem)適合做的(B)。A:大量小文件存儲B:流式數據訪問C:隨機寫入D:低延遲讀取第8題,HBase依賴(D)提供強大的計算能力。A:ZookeeperB:ChubbyC:RPCD:MapReduce第9題,工業大數據的主要應用不包括(D)。A:設備狀態分析B:用電分析與預測C:工業原料自動分類D:自然語言處理第10
4、題,建立在相關關系分析法基礎上的預測是大數據的(C)。A:基礎B:前提C:核心D:條件第11題在大數據時代,我們需要設立一個不一樣的隱私彳護模式,這個模式應該更著重于(A)為其行為承擔責任A:數據使用者B:數據提供者C:個人許可D:數據分析者第12題,智慧城市的構建,不包含(C)。A:數字城市B:物聯網C:聯網監控?D:云計算第13題,支撐大數據業務的基礎是(B)。A:數據科學B:數據應用C:數據硬件D:數據人才第14題,機器學習的實質在于(B)。A:想B:找C:判斷D:理解第15題,下列關于大數據的分析理念的說法中,錯誤的是(D)A:在數據基礎上傾向于全體數據而不是抽樣數據B:在分析方法上更
5、注重相關分析而不是因果分析C:在分析效果上更追究效率而不是覺得精準D:在數據規模上強調相對數據而不是絕對數據第16題,Hadoop是由何種語言編寫的(C)。A:ScalaB:ErlangC:JavaD:Python第17題,hadoop中datanode的在作用(A)。A:存儲數據B:管理集群中的節點C:寫入數據D:刪除數據第18題,可視化是將大數據分析結構展示出來的主要方式,不屬于大數據分析與可視化的特性的是(D)A:迭代性B:容錯性C:參數收斂的非均勻性D:擴展性第19題,關于工業大數據與互聯網大數據的比較何者為偽(D)。A:互聯網大數據是大量樣本B:工業大數據盡可能全面使用樣本C:互聯網
6、大數據對資料品質的要求較低D:工業大數據以統計分析為主通過挖掘樣本中各個屬性之間的相關性進行預測第20題,關于Hive與Hadoop其他組件的關系,描述錯誤的是(D)。A:HIVE最終將數據存儲在HDFS中B:HiveSQL其本質是執行的MapReduce任務C:Hive是Hadoop平臺的數據倉庫工具?D:Hive又tHBase有強依賴第21題,下面哪個場景不適合HBase的應用(A)。A:需要完全擁有傳統關系型數據庫所具備的ACID特性B:需要很好的性能伸縮能力C:需要在海量數據中實現高效的隨機讀取D:能夠同時處理結構化和非結構化的數據第22題,大數據的最顯著特征是(A)。A:數據規模大C
7、:數據處理速度快D:數據價值密度高第23題,假設一種基因同時導致兩件事情,一是使人喜歡抽煙,二是使這個人和肺癌就是(A)關系,而吸煙和肺癌則是(A)關系。A:因果;相關B:相關;因果C:并列;相關D:因果;并列第24題,下列關于計算機存儲容量單位的說法中,錯誤的是(C)。A:1KB<1MB<1GBB:基本單位是字節(Byte)C:一個漢字需要一個字節的存儲空間D:一個字節能夠容納一個英文字符第25題以下說法不正確的是(D)oA:HadoopStreaming使用Unix中的流與程序交互B:HadoopStreaming允許我們使用任何可執行腳本語言處理數據流C:采用腳本語言時必須遵
8、從UNIX的標準輸入STDIN,并輸出到STDOUTD:Reduce沒有設定,上述命令運行會出現問題第26題,有關MapReduce的輸入輸出,說法錯誤的是(B)。A:鏈接多個MapReduce作業時,序列文件是首選格式B:FileInputFormat中實現的getSplits()可以把輸入數據劃分為分片,分片數目和大小任意定義C:想完全禁止輸出,可以使用NullOutputFormatD:每個reduce需將它的輸出寫入自己的文件中,輸出無需分片第27題,數據挖掘分為(C)數據挖掘和預測型數據挖掘。A:列舉型B:交換型C:描述型D:重點型第28題,大數據時代,我們是要讓數據自己【發聲】,沒
9、必要知道為什么,只需要知道(B)A:原因B:是什么C:關聯物D:預測的關鍵第29題,當前大數據技術的基礎是由(C)首先提出的。A:微軟B:百度C:谷歌D:阿里巴巴第30題在大數據時代,下列說法正確的是(B)。A:收集數據很簡單B:數據是最核心的部分C:對數據的分析技術和技能是最重要的D:數據非常重要,一定要很好的保護起來,防止泄露第31題,大數據的發展,使信息技術變革的重點從關注技術轉向關注(A)。A:信息B:數字C:文字D:方位第32題,Hadoop的作者是下面哪一位(D)。A:TaskTrackerB:DataNodeC:SecondaryNameNodeD:Jobtracker第33題,
10、HBase會先將數據寫入到(D)。A:MemStoreB:HfileD:HLog第34題,大數據的簡單算法與小數據的復雜算法相比(A)。A:更有效B:相當C:不具備可比性D:無效第35題,下面不屬于Hadoop安裝步驟的是(C)。A:安裝JDK和配置Java環境變量B:設置免密碼登錄C:下載Eclipse集成開發環境D:修改Hadoop配置文件并啟動Hadoop第36題,下列關于聚類挖掘技術的說法中,錯誤的是(B)。A:不預先設定數據歸類類目,完全根據數據本身性質將數據聚合成不同類別B:要求同類數據的內容相似度盡可能小C:要求不同類數據的內容相似度盡可能小D:與分類挖掘技術相似的是,都是要對數
11、據進行分類處理第37題,HDFS無法高效存儲大量小文件,想讓它能處理好小文件,比較可行的改進策略不包括(D)A:利用SequenceFile、MapFile、Har等方式歸檔小文件B:多Master設計C:Block大小適當調小D:調大namenode內存或將文件系統元數據存到硬盤里第38題在數據生命周期管理實踐中,(B)是執行方法。A:數據存儲和備份規范B:數據管理和維護C:數據價值發覺和利用D:數據應用開發和管理第39題,下列關于網絡用戶行為的說法中,錯誤的是(C)。A:網絡公司能夠捕捉到用戶在其網站上的所有行為B:用戶離散的交互痕跡能夠為企業提升服務質量提供參考C:數字軌跡用完即自動刪除
12、D:用戶的隱私安全很難得以規范保護第40題,機器學習的經典定義是(C)。A:利用技術進步改善系統自身的性能B:利用技術進步改善人的能力C:利用經驗改善系統自身的性能D:利用經驗改善人的能力第41題,對線下零售而言,做好大數據分析應用的前提是(C)。A:增加統計種類B:擴大營業面積C:增加數據來源D:開展優惠促銷第42題,HDFS中的block默認保存幾份(A)。A:3份B:2份C:1份D:不確定第43題,下列關于舍恩伯格對大數據特點的說法中,錯誤的是(D)A:數據規模大B:數據類型多樣C:數據處理速度快D:數據價值密度高第44題,關于數據創新,下列說法正確的是(D)。A:多個數據集的總和價值等
13、于單個數據集價值相加B:由于數據的再利用,數據應該永久保存下去C:相同數據多次用于相同或類似用途,其有效性會降低D:數據只有開放價值才能得到真正釋放第45題,數據倉庫的最終目的是(D)。A:收集業務需求B:建立數據倉庫邏輯模型C:開發數據倉庫的應用分析D:為用戶和業務部門提供決策支持第46題,Hadoop的標志物是(A)。A:大象B:長頸鹿C:獅子D:鯊魚第47題,Hadoop1.0默認的調度器策略是哪個(A)。A:先進先出調度器B:計算能力調度器C:公平調度器D:優先級調度器第48題,美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標明了大風與洋流可能發生的地點。這體現了大數
14、據分析理念中的(B)。A:在數據基礎上傾向于全體數據而不是抽樣數據B:在分析方法上更注重相關分析而不是因果分析C:在分析效果上更追究效率而不是絕對精確D:在數據規模上強調相對數據而不是絕對數據第49題,MAPREDUCE適用于(D)。A:任意應用程序B:任意可在WINDOWSSERVER2008上運行的程序C:可以串行處理的應用程序D:可以并行處理的應用程序D)第50題,下列演示方式中,不屬于傳統統計圖方式的是(A:柱狀圖B:餅狀圖C:曲線圖D:網絡圖第51題,一切事物及事物運動的狀態,不僅銷售數據、價格這些客觀標準可以形成大數據,甚至連顧客情緒(如色彩、空間的感知等)都可以測得,這體現了大數
15、據思維維度中的(A)。A:定量思維B:相關思維C:因果思維D:實驗思維第52題,關于Hadoop單機模式和偽分布式模式的說法,正確的是(D)。A:兩者都起守護進程,且守護進程運行在一臺機器上B:單機模式不使用HDFS,但加載守護進程C:兩者都不與守護進程交互,避免復雜性D:后者比前者增加了HDFS輸入輸出以及可檢查內存使用情況第53題,大數據不是要教機器像人一樣思考。相反,它是(A)。A:把數學算法運用到海量的數據上來預測事情發生的可能性。B:被視為人工智能的一部分。C:被視為一種機器學習。D:預測與懲罰。第54題,促進隱私保護的一種創新途徑是(D):故意將數據模糊處理,促使對大數據庫的查詢不
16、能顯示精確的結果。A:匿名化B:信息模糊化C:個人隱私保護D:差別隱私第55題,HFile數據格式中的KeyValue數據格式中Value部分是(C)。A:擁有復雜結構的字符串B:字符串C:二進制數據D:壓縮數據第56題,大數據的核心就是(B)。A:告知與許可B:預測C:匿名化D:規模化第57題,HBase依賴(A)提供消息通信機制。A:ZookeeperB:ChubbyC:RPCD:Socket第58題,HBase是分布式列式存儲系統,記錄按什么集中存放。(A)A:列族B:列C:行D:不確定第59題,HFile數據格式中的Data字段用于(A)。A:存儲實際的KeyValue數據B:存儲數據
17、的起點C:指定字段的長度D:存儲數據塊的起點第60題,采樣分析的精確性隨著采樣隨機性的增加而(C),但與樣本數量的增加關系不大。A:降低B:不變C:提高D:無關第61題根據不同的業務需求來建立數據模型,抽取最有意義的向量,決定選取哪種方法的數據分析角色人員是(C)A:數據管理人員B:數據分析員C:研究科學家D:軟件開發工程師?第62題,storm和sparkstreaming最大的區另1J(C)。A:科學統計支持B:是否具有schemaC:是否是真正的實時計算框架D:不同公司的產品第63題,下列哪項通常是集群的最主要瓶頸(C)oA:CPUB:網絡C:磁盤IOD:內存第64題,(D)反映數據的精
18、細化程度,越細化的數據,價值越高。A:規模B:活性C:關聯度D:顆粒度第65題以下說法錯誤的是哪項(D)。A:大數據是一種思維方式B:大數據不僅僅是講數據的體量大C:大數據會帶來機器智能D:大數據的英文名稱是largedata?第66題,按照大數據的資源觀,大數據研究的關鍵科學問題有(D)A:大數據的獲取方法、加工技術、應用模式B:大數據的產權問題、相關的產業發展問題D:以上都是第67題,大數據元年是指(C)。A:2014年B:2012年C:2013年D:2011年第68題以下(D)選項是目前利用大數據分析技術無法進行有效支持的。A:新型病毒的分析判斷B:天氣情況預測C:個人消費習慣分析及預測
19、D:精確預測股票價格第69題,關于數據估值,下列說法錯誤的是(B)。A:隨著數據價值被重視,公司所持有和使用的數據也漸漸納入了無形資產的范疇;B:無論是向公眾開放還是將其鎖在公司的保險庫中,數據都是有價值的C:數據的價值可以通過授權的第三方使用來實現D:目前可以通過數據估值模型來準確的評估數據的價值評估第70題,HDFS是基于流數據模式訪問和處理超大文件的需求而開發的,具有高容錯、高可靠性、高可擴展性、高吞吐率等特征,適合的t寫任務是(D)oA:一次寫入,少次讀B:多次寫入,少次讀C:多次寫入,多次讀D:一次寫入,多次讀第71題,對大數據使用進行正規評測及正確引導,可以為數據使用者帶來什么切實
20、的好處(A)。A:他們無須再取得個人的明確同意,就可以對個人數據進行二次利用B:數據使用者不需要為敷衍了事的評測和不達標準的保護措施承擔法律責任C:數據使用者的責任不需要強制力規范就能確保履行到位D:所有項目,管理者必須設立規章,規定數據使用者應如何評估風險、如何規避或減輕潛在傷害A)的方法。第72題,大數據是指不用隨機分析法這樣的捷徑,而采用(A:所有數據B:絕大部分數據C:適量數據D:少量數據第73題,大數據的起源是(C)。A:金融B:電信C:互聯網D:公共管理第74題,關于HDFS的文件寫入,正確的是(C)oA:支持多用戶對同一文件的寫操作B:用戶可以在文件任意位置進行修改C:默認將文件
21、塊復制成三份存放D:復制的文件塊默認都存在同一機架上第75題,HBase依靠(A)存儲底層數據。A:HDFSB:HadoopC:MemoryD:MapReduce第76題,下列選項中屬于機器學習的有(A)。A:深度學習B:數據挖掘C:機器翻譯D:自然語言處理第77題,LSM是(A)。A:日志結構合并樹B:二叉樹C:平衡二叉樹D:基于日志結構的合并樹第78題,Pig相當于一個Hadoop的(D)。A:數據庫B:上級C:服務器D:客戶端第79題,HDFS默認BlockSize的大小是(B)。A:32MBB:64MBC:128MBD:256M第80題,國務院在哪一年印發了促進大數據發展行動綱要(A)
22、oA:2015年B:2014年C:2016年D:2013年第81題,安裝Hbase的壓縮包,使用的Linux命令是(A)。A:tar-zxvfB:tar-zxC:tar-sD:tar-nf第82題,隨著數據科學家的崛起,(C)的地位將發生動搖。A:國家領導人B:大型企業C:行業專家和技術專家D:職業經理人第83題,數據分析報告是整個數據分析過程的成果。對數據分析報告的要求不包括(A)A:數據分析必須全部基于權威部門公開發布的數據B:數據分析的推理要有很強的邏輯性和嚴謹性C:每項分析都應有結論,而且結論一定要明確D:分析報告要有很強的可讀性,盡量圖表化第84題,如何應對大數據(D)。A:分布式計
23、算B:虛擬化C:內存計算D:三個選項都是第85題,大數據正快速發展為對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的(B)。A:新一代技術平臺B:新一代信息技術和服務業態C:新一代服務業態D:新一代信息技術第86題,數據清洗的方法不包括(D)。A:缺失值處理B:噪聲數據清除C:一致性檢查D:重復數據記錄處理第87題,下列關于數據交易市場的說法中,錯誤的是(C)。A:數據交易市場是大數據產業發展到一定程度的產物B:商業化的數據交易活動催生了多方參與的第三方數據交易市場C:數據交易市場通過生產數據、研發和分析數據,為數據交易提供幫助D:數據交易
24、市場是大數據資源化的必然產物第88題,下列說法正確的是(C)oA:有價值的數據是附屬于企業經營核心業務的一部分數據;B:數據挖掘它的主要價值后就沒有必要再進行分析了C:所有數據都是有價值的D:在大數據時代,收集、存儲和分析數據非常簡單D),幫助我們進一步接近事實的真相第89題相比依賴于小數據和精確性的時代,大數據因為更強調數據的(A:安全性B:完整性C:混雜性D:完整性和混雜性第90題第一個提出大數據概念的公司是(D)。A:微軟公司B:谷歌公司C:臉譜公司D:麥肯錫公司第91題,LSM更能保證哪種操作的性能(B)oA:讀B:寫C:隨機讀D:合并第92題,2011年,(C)發布大數據:創新、競爭和生產力的下一個新領域報告,大數據開始備受關注。A:微軟公
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《高中校園文化發展》課件
- 《會計實務手工操作》課件
- 《招聘的策略》課件
- 鐵路調車工作實訓無線調車燈顯設備課件
- 鐵路工程安全技術石家莊鐵路44課件
- 鐵路貨物運雜費保價費率相關規定課件
- 《GB 15562.1-1995環境保護圖形標志 排放口(源)》(2025版)深度解析
- 中世紀文化課件
- 股東資金借用合同范例
- 東陽木雕文化課件
- 皮膚病靶向治療專家共識(2025版)解讀課件
- DB37-T 3274.3-2023 日光溫室建造技術規范 第3部分:山東VI型
- 《四輪驅動電動汽車制動系統設計》14000字(論文)
- 鄭州食品工程職業學院《中國宗教史》2023-2024學年第一學期期末試卷
- 新蘇教版一年級數學下冊綜合實踐活動1《抓抓數數》教案
- RoHS知識培訓課件
- 醫學課件痛風性關節炎
- 流程建設培訓課件
- 公共危機管理(本)-第一次形成性考核-國開(BJ)-參考資料
- 跨境電子商務物流優化策略研究
- 統編版2024-2025學年二年級語文(上)期末情景檢測試卷(含答案)
評論
0/150
提交評論