智慧樹知到《大數據算法》章節測試答案_第1頁
智慧樹知到《大數據算法》章節測試答案_第2頁
智慧樹知到《大數據算法》章節測試答案_第3頁
已閱讀5頁,還剩22頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、智慧樹知到大數據算法章節測試答案 智慧樹知到大數據算法章節測試答案1.11.以下關于大數據的特點,敘述錯誤的是()。答案:速度慢A、速度慢B、多元、異構C、數據規模大D、基于高度分析的新價值2.在法華經中,"那由他'描寫的"大'的數量級是()。答案:10A、10B、10C、10D、1083.以下選項中,大數據涉及的領域中包括()。答案:社交網絡計算機藝術醫療數據A、社交網絡B、醫療數據C、計算機藝術D、醫療數據4.大數據的應用包括()。答案:推薦科學研究預測商業情報分析A、預測B、推薦C、商業情報分析D、科學研究5.目前,關于大數據已有公認的確定定義。6.大

2、數據種類繁多,在編碼方式、數據格式、應用特征等方面都存在差異。()1.21.大數據求解計算問題過程的第三步一般是()。答案:算法設計與分析A、判斷可計算否B、判斷能行可計算否C、算法設計與分析D、用計算機語言實現算法2.在大數據求解計算問題中,判斷是否為能行可計算的因素包括()。答案:資源約束數據量時間約束A、數據量B、資源約束C、速度約束D、時間約束3.大數據求解計算問題過程的第一步是確定該問題是否可計算。4.大數據計算模型與一般小規模計算模型一樣,都使用的是圖靈機模型。1.31.資源約束包括()。答案:網絡帶寬外存CPU內存A、CPUB、網絡帶寬C、內存D、外存2.大數據算法可以不是()。

3、答案:精確算法串行算法內存算法A、云計算B、精確算法C、內存算法D、串行算法3.大數據算法是在給定的時間約束下,以大數據為輸入,在給定資源約束內可以生成滿足給定約束結果的算法。4.MapReduce是一種比較好實現大數據算法的編程架構,在生產中得到廣泛應用。5.大數據算法是僅在電子計算機上運行的算法。1.41.眾包算法是用來解決()。答案:計算機計算能力不足或知識不足,需要人來幫忙A、訪問全部數據時間過長B、數據難于放入內存計算C、單個計算機難以保存全部數據,計算需要整體數據D、計算機計算能力不足或知識不足,需要人來幫忙2.大數據算法存在很多難題,對于訪問全部數據時間過長的問題,采用的解決方案

4、是()。答案:讀取部分數據A、將數據存儲到磁盤上B、僅基于少量數據進行計算C、讀取部分數據D、并行處理3.大數據算法的()特點,使其與大數據算法密切相關的。答案:速度快數據量大A、數據量大B、基于高度分析的新價值C、速度快D、多樣性、復雜性4.為解決單個計算機難以保存全部數據的問題,通常會采用并行處理的技術,此技術會涉及到時間亞線性算法。1.51.大數據算法涉及到外存的時候,通常要分析()。答案:IO復雜性A、時間空間復雜性B、IO復雜性C、結果質量D、通訊復雜性2.下列選項中,屬于智能仿生算法的是()。答案:遺傳算法模擬退火算法A、遺傳算法B、近似算法C、模擬退火算法D、數據流算法3.在線算

5、法/數據流算法是面向大數據速度快的特點提出的。()4.對于數據流算法或在線算法,經常要分析結果的近似比。()5.隨機算法是利用隨機化的方法來進行大數據處理,是大數據算法設計技術之一。()2.11.計算在一個給定社交網絡中平均每人的朋友個數,在不訪問所有頂點的情況下,進行精確計算最少需要訪問()個頂點。答案:n-1A、nB、n+1C、2nD、n-12.亞線性是指()等的消耗是輸入規模o。()答案:空間通訊時間IOA、時間B、空間C、IOD、通訊3.性質檢測算法屬于亞線性空間算法的一類。()2.21.在經典的水庫抽樣中,要求空間復雜性為O(k),是指與抽樣大小有關,而與整個數據的數據量無關。2.水

6、庫抽樣算法的采樣是均勻的。2.31.以下()不是衡量分析近似解代價與優化解代價差距的方法。答案:絕對誤差A、RatioBoundB、相對誤差C、絕對誤差D、(1-)-近似2.利用平面圖的直徑近似算法得到的解,在最壞情況下,也不會小于最優解的()。答案:二分之一A、二分之一B、三分之一C、四分之一D、十分之一3.采用平面圖的直徑近似算法的動機是無法在要求的時間內得到()。答案:精確解A、相似解B、完整解C、精確解D、近似解4.在平面圖的直徑近似算法中,要求點之間的距離滿足三角不等式是指在i、j、k三個點中,i到j的距離加上j到k的距離小于i到k的距離。5.近似算法能給出一個優化問題的優化解。6.

7、RatioBound越大,則近似解越壞。()2.41.在判定問題的近似中,對于近似解需要區分的是()。答案:差得很遠是A、是B、否C、差不離D、差得很遠2.全0數組判定的近似算法的證據引理是:如果一次測試以大于等于p的概率獲得一個證據,那么s=2/p輪測試得到證據的概率大于等于1/2。3.判定問題的近似解是指:輸入滿足某種性質或近似滿足某種性質。3.11.Zipf原則是指典型的頻率分布是高度偏斜的,存在很多頻繁元素。()2.在數據流模型中,從數據流中可以計算簡單的函數,如最大值、最小值、求和等,且處理這些函數時通常使用單個寄存器s。()3.數據流模型中,數據流是指來自某個域中的元素序列。()4

8、.在數據流模型中,內存遠遠大于數據的規模。()3.21.頻繁元素計算算法又稱為()算法。答案:MGA、MMB、MGC、GMD、MP2.頻繁元素計算算法有效的原因是源于()。答案:Zipf原則A、取近似解B、證據引理C、錯誤界限和k成反比D、Zipf原則3.在頻繁元素計算算法中,計數器x減少的次數依賴于有幾個減少計數器的步驟。()4.在頻繁元素計算算法中,當數據流中元素的總個數遠大于估計值與真實值相差的最多值時,可以得到頻繁項一個好的估計。3.31.時間亞線性算法的思想是:利用特定子圖聯通分量的數量估計最小生成樹的()。答案:權重A、近似值B、精確值C、權重D、界限2.求最小生成樹是一個貪心法,

9、可以用()算法來解決。答案:PrimeA、PrimeB、并行C、MGD、內存3.對聯通分量個數的估計可以利用隨機化方法。3.41.對于輸入n個數的數組(x1,x2,x3,xn),輸出:這個數組是否有序。遠離意味著必須刪除大于()個元素才能保證剩下的元素有序。答案:nA、-nB、nC、/nD、n/2.如果一次測試以大于等于p的概率獲得一個證據,那么s=2/p輪測試得到證據的概率大于等于3/4。3.關于證明如果輸入遠離有序,則存在大于n個"壞索引'的問題,可以采用證明其逆否命題的方法。4.11.下列選項中敘述正確的是()。DA、磁盤的訪問可以隨機讀、隨機取B、磁盤系統傳輸大規模連

10、續的數據塊的范圍是18-32kC、磁盤訪問比主存訪問的速度快D、大多數程序在RAM模型上運行2.對于大數據而言,標準計算理論模型失效的原因之一是內存是有限的,無法存儲所有的內存。()3.當內存不夠或者算法設計不好時,如果數據量達到一定規模以上,運行時間會急劇增加。4.現代計算機有復雜的存儲層次,存儲單元的訪問是以塊為單位的數據移動。()4.2.11.外存歸并排序,以()為單位進行調度。答案:塊A、比特B、兆C、塊D、層2.排序分為內部排序和外部排序,外部排序是因排序的數據很大,一次不能容納全部的排序內容,在排序過程中需要訪問外存。()4.2.21.在外排序的快速排序中,分割元素的選擇非常重要。

11、答案:正確A、正確B、錯誤4.31.在內存中的二分搜索樹中,通常使用()來維護樹的平衡。()答案:旋轉A、置換B、分裂C、旋轉D、合并2.二叉搜索樹是在n個元素之間搜索的標準方法,一般把元素保存在根處。()3.為更快地保存外部搜索樹,可采取按BFS的順序將其分割。()5.11.如果T是一個(a,b)-樹(a2且b2a-1),其根結點的度在()之間。答案:2到bA、2到aB、2到bC、a到bD、2到42.在(a,b)-樹中,a和b表示的是每個節點當中鍵值的上限和下限。()3.B-樹中右邊的指針指向的是鍵值小于最右鍵值的子數。()5.21.元素都在葉子中的B-樹有時被稱為()。答案:B+-樹A、B

12、+樹B、B-+樹C、B+-樹D、B+-數2.關于(a,b)樹的刪除操作,刪除操作出現問題的情形是:從葉子v刪除元素后,v的兒子小于a-1個。()3.關于(a,b)-樹的插入,插入涉及到的結點最多到樹高+1。()5.31.KD樹在()層使用水平線。AA、偶數層B、奇數層C、最底層D、最高層2.KdB-樹的插入可以使用()的方法。CA、近似B、置換C、對數D、重構3.構建KDB-樹時,完成網格建立之后,計算每個網格中點的個數,并且存儲在()中。AA、外存B、數據庫C、寄存器D、內存4.基于位置的查找實際上是一種三維空間的查找。()X5.KD樹可以看成是兩個二叉樹的交疊。()正確6.11.為數T的每

13、個結點標上子樹大小的I/O復雜度為()。BA、IO(sort(N)B、O(sort(N)C、IO(scan(N)D、O(scan(N)2.前序計數的I/O復雜度為()。BA、IO(sort(N)B、O(sort(N)C、IO(scan(N)D、O(scan(N)3.對給定頂點鄰接鏈表T,其一個歐拉回路可以以()IO復雜性求得。CA、O(sort(N)B、O(scan(N)C、O(scan(N)IOD、IO(scan(N)4.外存算法最壞情況的I/O數位(N)。()X5.圖中的獨立集是指圖當中點的集合,其任意兩點之間不存在邊。()正確6.21.查找規模為N的表L中,每個獨立集(MIS)的大小至少

14、為()。DA、n+1B、2nC、n/2D、n/32.時間前向的處理方法是按照()來訪問邊。CA、歐拉回路B、表排序C、拓撲序D、結點序3.求最大獨立集的基本思想是使用貪心法。()正確6.31.圖算法包含三種計數,其中將圖問題表示為有向無環圖的估值問題的是()。CA、自舉B、縮圖法C、時間前向處理D、連通分量2.半外存算法是假設()。BA、邊放在內存中,頂點在外面B、頂點放在內存中,邊在外面C、頂點和邊都放在內存當中D、頂點和邊都不在內存當中3.圖的連通性算法可擴增為求圖G最小生成樹(MST)的算法。()正確4.在求最小生成樹時,壓縮后圖中某條邊的權值等于該邊代表的所有邊的權值最大值。()X7.

15、11.MapReduce是由()開發的分布式編程模型。BA、MicrosoftB、GoogleC、TencentD、AlibabaGroup2.在實現MapReduce程序時,需要注意的事項不包括()。CA、避免創建對象B、避免緩沖C、避免通信D、避免Mapper和Reducer間的全局變量傳遞3.MapReduce的執行框架處理的內容包括()。ABCDA、調度B、數據分布C、將中間數據進行聚集、排序或洗牌D、進行錯誤處理4.理想的可擴展性有()。BCA、數據加倍,運行時間減半B、數據加倍,運行時間加倍C、資源加倍,運行時間減半D、資源加倍,運行時間加倍5.Map()和Reduce()兩個函數

16、不能夠并行運行。()X7.21.在版本1的字數統計中,在Map里使用了一個數組H,其作用是為每一個出現的單詞作()。BA、序列B、基數C、集合7.31.大部分時候reducer不能用作combiner。()正確biner的運行次數可能有多次。正確7.41.關于單詞共現矩陣的計算,說法正確的是()。ACDA、計算文本集合中詞的共現矩陣B、詞的個數如果為N,輸出為M*N的矩陣C、是一種測量語義距離的方法D、語義距離可用于許多語言處理任務2.用單詞共現矩陣解決大規模計數問題的基本方法是()。ACA、Mapper生成部分計數B、Reducer生成部分計數C、Reducer聚合部分計數D、Mapper聚

17、合部分計數3."條紋法'的優點有()。A、易于實現B、對key-value對的排序和洗牌少得多C、潛在對象更大D、能更好地利用combiner4.在"詞對法'中,每個mapper處理一個句子。()正確5."詞對法'的缺點是不易實現,排序和洗牌代價高。()X6.f(B|A)詞對法必須確定所有a被傳遞到同一個combiner。()X8.11.在repartitionjoin的改進中,說法錯誤的是()。AA、Map函數的輸出鍵作為連接鍵B、Map函數的輸出鍵變化為連接鍵和表名的組合。C、Partition函數中Hashcode僅從組合鍵的連接鍵計

18、算D、Grouping函數僅根據連接鍵分組紀錄2.用MR進行多重集相似連接算法的常見計算包括()。BCDA、三角函數B、單元函數C、合取函數D、析取函數3.自然連接是從兩個關系的笛卡爾積中選取給定屬性間滿足一定條件的元組。()X4.等值連接不必在結果中去掉重復的屬性。()正確8.21.在迭代MapReduce中,reduce的輸出必須和map的輸入兼容。()正確2."推薦好友'是圖算法在社交網絡中的一種實際用例。()正確8.31.找到一個稠密圖的最小生成樹的算法易于并行化的原因是每個子圖的()可以被并行計算。DA、邊B、頂點C、結點D、最小生成樹2.基于路徑的算法的例子不包括

19、()。CA、單源最短路徑B、最小生成樹C、分布式不動點運算D、拓撲排序3.在基于路徑的算法中,邊的標記包括()。ABCA、代價B、距離C、相似性D、屬性4.Dijkstra算法需要并行化。()X9.11.緩存迭代的方法是()。ACDA、在Mapper前加入輸入緩存B、在Mapper后加入輸出緩存C、在Reducer前加入輸入緩存D、在Reducer后加入輸出緩存2.MapReduce是一種非遞歸描述性語言的通用運行平臺。()正確3.Reducer輸入緩存的條件是使用靜態劃分方法,即意味著沒有新的結點。()正確9.21.關于并行節點計算,下列選項中關于節點敘述不準確的是()。DA、每一個節點接受

20、上一個superstep發出的消息B、執行相同的用戶定義函數C、所有節點根據用戶定義函數修改它的值D、沒有額外工作要做時繼續迭代2.Pregel系統中Master的作用不包括()。DA、維護workerB、恢復workers產生的錯誤C、提供Web-UI監督工作進程工具D、與worker交流3.并行結點計算的終止條件是()。BDA、消息傳送到其他點后B、所有頂點同時變為非活躍狀態C、迭代結束D、沒有信息傳遞4.用Pregel計算子圖同構問題,其三個步驟是()。ABDA、查詢分解B、搜索C、迭代D、Join5.Pregel的編程形式,在執行計算的機器上每一階段都利用整個圖的全部狀態。()X10.11.眾包通過一系列的機制和方法來指導

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論