大數據工具應用知到智慧樹章節測試課后答案2024年秋廣東金融學院_第1頁
大數據工具應用知到智慧樹章節測試課后答案2024年秋廣東金融學院_第2頁
大數據工具應用知到智慧樹章節測試課后答案2024年秋廣東金融學院_第3頁
大數據工具應用知到智慧樹章節測試課后答案2024年秋廣東金融學院_第4頁
大數據工具應用知到智慧樹章節測試課后答案2024年秋廣東金融學院_第5頁
已閱讀5頁,還剩11頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大數據工具應用知到智慧樹章節測試課后答案2024年秋廣東金融學院第一章單元測試

2011年麥肯錫研究院提出的大數據定義是:大數據是指其大小超出了常規數據庫工具獲取、儲存、管理和(

)能力的數據集。

A:訪問

B:應用C:計算

D:分析

答案:分析用4V來概括大數據的特點的話,一般是指:Value、Velocity、Volume和(

)。

A:VagaryB:VainlyC:VarietyD:Valley

答案:Variety大數據分析四個方面的工作主要是:數據分類、(

)、關聯規則挖掘和時間序列預測。

A:數據統計

B:數據聚類

C:數據清洗

D:數據計算

答案:數據聚類

新浪和京東聯合推出的大數據商品推薦,是由京東盲目推送到當前瀏覽新浪網站的用戶的頁面上的。

A:錯B:對

答案:錯目前的大數據處理技術只能處理結構化數據。

A:對B:錯

答案:錯

第二章單元測試

我們常用的微軟Office套件中的Access數據庫軟件的數據庫文件格式后綴名是(

)。

A:dbf

B:mdb

C:xls

D:mdf

答案:mdb

大多數日志文件的后綴名是(

)。

A:csv

B:xml

C:txt

D:log

答案:log

本課程重點介紹的weka軟件的專有文件格式是(

)。

A:ARFFB:valueC:MongoDB

D:keymap

答案:ARFF數據清洗工作的目的主要是要解決數據的完整性、唯一性、合法性和(

)。

A:共享性

B:專業性

C:排他性

D:一致性

答案:一致性

八爪魚軟件的“自定義采集”工作方式下,需要在軟件里輸入一個(

)來作為采集的目標。

A:網頁地址

B:用戶名

C:電話號碼

D:關鍵詞

答案:網頁地址

八爪魚軟件的采集規則可以通過文件的形式來導入或者導出,這種文件的后綴名是(

)。

A:otd

B:jpg

C:png

D:gif

答案:otd

Excel可以通過“數據有效性”按鈕操作來規范數據輸入的范圍。

A:對B:錯

答案:對Excel不能導入txt或csv格式的文件。

A:錯B:對

答案:錯八爪魚軟件只能對軟件內建了“簡易采集”規則的網站采集數據。

A:錯B:對

答案:錯八爪魚軟件進行自定義采集時,需要了解對網頁的頁面結構。

A:錯B:對

答案:對

第三章單元測試

使用DBSCAN算法對鳶尾花數據集(Iris.arff)進行聚類,將epsilon參數設置為0.2,minPoints參數設置為5,忽略class屬性,那么將形成(

)個簇。

A:

4B:

1C:

2D:

3

答案:

2使用EM算法對天氣數據集(weather.numeric.arff)進行聚類,將numClusters設置為4,即簇數為4,其他參數保持默認值,忽略play屬性,從結果中可知,下列選項中,(

)是錯誤的。

A:

模型的最大似然估計值是-7.18B:

這組數據用算法迭代15次C:

第四個簇的先驗概率是0.14D:

第四個簇的實例數為4

答案:

第四個簇的實例數為4

使用SimpleKMeans算法對天氣數據集(weather.numeric.arff)進行聚類,保持默認參數,即3個簇以及歐氏距離。選擇play屬性為忽略屬性,從結果中可知,下列選項中,(

)是錯誤。

A:

產生了三個中心點B:

這組數據用算法迭代四次C:

聚合為3個簇,分別有7,3,4個實例D:

平方和誤差為8.928

答案:

這組數據用算法迭代四次使用線性回歸(LinearRegression)分類器和用M5P分類器對cpu.arff分別進行分類,由其輸出的誤差指標可知(

)。

A:

LinearRegression的標準誤差比M5P的標準誤差小B:

LinearRegression的相對誤差比M5P的相對誤差小C:

LinearRegression的平均絕對誤差比M5P的平均絕對誤差小D:

LinearRegression的平均方根誤差比M5P的平均方根誤差大

答案:

LinearRegression的平均方根誤差比M5P的平均方根誤差大

刪去cpu.arff數據文件中的CACH屬性后,使用M5P分類器構建方案,在結果中,到達LM2的實例數有(

)個。

A:

21B:

23C:

30D:

165

答案:

21根據J48分類器訓練weather.nominal.arff所生產的決策樹,當outlook=sunny;temperature=cool;humidity=high;windy=TRUE時,分類的結果是(

)。

A:

NoB:

無法分類

C:

沒有結果D:

Yes

答案:

No根據J48分類器訓練iris.arff所生產的決策樹,當sepallength=4.4;sepalwidth=3.0;petallength=1.3;petalwidth=0.2時,分類的結果是(

)。

A:

Iris-setosaB:

Iris-virginicaC:

Iris-versicolorD:

無法分類

答案:

Iris-setosa關于Weka離散化說明正確的是(

)。

A:

離散化包括無監督離散化和有監督離散化B:

有監督離散化有兩種等寬和等頻方法C:

離散化是將數值屬性轉換為字符串型屬性D:

等寬離散化是使實例分布均勻的

答案:

離散化包括無監督離散化和有監督離散化以下(

)不是Weka的數據類型。

A:

decimalB:

numericC:

stringD:

nominal

答案:

decimal關于Weka的文件類型描述錯誤的是(

)。

A:

Weka可以打開文件格式有.arff、.csv、.xlsxB:

arff是ASCII文件,可以用Word等文本編輯器打開查看C:

Weka處理的數據集類似于關系數據庫橫行實例,豎行屬性D:

@relation定義數據集名稱,@data之后呈現實例,每一行就是一個實例

答案:

Weka可以打開文件格式有.arff、.csv、.xlsx以下屬于關聯分析的是(

)。

A:

購物籃分析B:

CPU性能預測C:

股票趨勢建模D:

自動判斷鳶尾花類別

答案:

購物籃分析大數據時代的到來,使我們無法人為地去發現數據中的奧妙,與此同時,我們更應該注重數據中的相關關系,而不是因果關系。其中,數據之間的相關關系可以通過以下(

)算法直接挖掘。

A:

BayesNetworkB:

C4.5C:

K-meansD:

Apriori

答案:

Apriori某超市研究銷售紀錄數據后發現,買啤酒的人很大概率也會購買尿布,這種屬于數據挖掘的(

)問題。

A:

分類B:

自然語言處理C:

關聯規則發現D:

聚類

答案:

關聯規則發現在進行自動選擇屬性時,必須設立兩個對象,其中確定使用什么方法為每個屬性子集分配一個評估值的對象是下面的(

)。

A:

元分類器B:

搜索方法C:

屬性評估器D:

規則挖掘

答案:

屬性評估器以下屬于屬性空間的搜索方法的是(

)。

A:

SymmetricalUncertAttributeEvalB:

GainRatioAttributeEvalC:

PrincipalComponentsD:

BestFirst

答案:

BestFirst在weka軟件探索者界面中,利用Visualize標簽頁通過更改各個參數來進行數據集的可視化屬性設置后,需要單擊以下(

)按鈕,所有更改才會生效。

A:

SelectAttributeB:

UpdateC:

FastscrollingD:

SubSample

答案:

Update給定關聯規則AB,意味著:若A發生,B也會發生。

A:對B:錯

答案:錯支持度是衡量關聯規則重要性的一個指標。

A:對B:錯

答案:對Ranker方法既可以用于單個屬性評估器,又可以用于屬性子集評估器。

A:對B:錯

答案:錯利用weka軟件進行數據可視化時,用戶可以選擇類別屬性對數據點著色,如果類別屬性是標稱型,則顯示為彩色條。

A:錯B:對

答案:錯

第四章單元測試

貝葉斯網絡中的節點代表(

)。

A:隨機過程B:隨機變量C:隨機函數D:變量

答案:隨機變量貝葉斯網絡中,節點需給出概率分布描述,對于離散型隨機變量而言,可以用(

)的形式表示。

A:正態分布B:條件概率表C:

均勻分布D:條件概率密度函數

答案:條件概率表貝葉斯網絡中節點之間的邊代表(

)。

A:概率因果B:隨機結果C:隨機關系D:組合關系

答案:隨機關系貝葉斯網絡保存的文件格式是(

)。

A:

TXTB:DOCXC:XLSD:XMLBIF

答案:XMLBIF下面(

)不是反向傳播神經網絡的結構。

A:隱含層B:輸入層C:計算層D:輸出層

答案:計算層神經網絡中的節點代表(

)。

A:激勵變量B:隨機變量C:激勵函數D:隨機函數

答案:激勵函數下列(

)不是常見的激勵函數。

A:閾值函數B:線性函數C:正弦函數D:Sigmoid函數

答案:正弦函數在貝葉斯網絡編輯界面時,如果節點的名稱沒法完全顯示,需要從(

)菜單項進行調整。

A:View|ZoomOutB:Tools|SetDataC:View|ZoomInD:Tools|Layout

答案:Tools|LayoutWEKA中選擇神經網絡分類器操作時,應該選擇(

)。

A:默認的分類器B:functions條目下的SGD分類器C:rules條目下的PARTD:functions條目下的MultilayerPerceptron分類器

答案:functions條目下的MultilayerPerceptron分類器下面關于PackageManager安裝后的目錄說明不正確的是(

)。

A:src子目錄存放源代碼文件B:sample-data子目錄存放數據集文件C:doc子目錄存放API文檔D:lib子目錄存放包所需要的說明文件

答案:lib子目錄存放包所需要的說明文件

第五章單元測試

Tableau是一款定位于數據可視化敏捷開發和實現()展現工具。Tableau連續第6年在Gartner分析和商業智能魔力象限中蟬聯領導者殊榮。

A:商業行為B:商務智能C:商業統計D:商務計算

答案:商務智能以下()不是Tableau的數據類型?

A:DateB:StringC:DecimalD:Boolean

答案:DecimalTableau可以用來實現交互的、()的分析和儀表板應用,從而幫助我們快速地認識和理解數據。

A:可視化B:連續性C:離散性D:智能化

答案:可視化下列說法錯誤的是()。

A:Tableau通過內存數據引擎,可以直接查詢外部數據庫同時動態的從數據倉庫抽取實時數據,極大的提高了數據訪問和查詢效率B:用戶僅需要通過輕點鼠標和簡單拖放就可以迅速創建出智能、精美、直觀和具有強交互性的報表和儀表盤C:Tableau允許從多個數據源訪問數據,包括帶分隔符的文本文件、Excel文件、SQL數據庫、Oracle數據庫和多維數據庫等D:Tableau不提供應用編程接口

答案:Tableau不提供應用編程接口度量往往是()字段,度量是我們的指標。度量常常是連續的,連續的字段在圖表中形成軸.將其拖放到功能區時,Tableau默認會進行()。

A:分類,聚合運算B:數值,混合運算C:數值,聚合運算D:分類,混合運算

答案:數值,聚合運算關于數據分層描述錯誤的是()。

A:數據分層的層級結構由數據維度的上下順序決定B:數據分層的層次結構可以手工調整C:數據分層可以實現向上鉆取D:數據分層可以實現向下鉆取

答案:數據分層可以實現向上鉆取以下不屬于集的創建方式的是()。

A:[常規]創建B:[頂部]創建C:[分組]創建D:[條件]創建

答案:[分組]創建Tableau右邊數據目錄欄中,不能單擊右鍵創建參數的緯度是()。

A:度量B:參數C:緯度D:集

答案:集以下不是創建計算字段時的運算邏輯的是()。

A:數字B:表結構C:日期D:用戶

答案:表結構儀表板版面大小設計選項,()不屬于大小設計選項。

A:自動B:固定大小C:范圍D:自定義

答案:自定義

第六章單元測試

Logistic函數的定義域是()。

A:[0,1]B:(-INF,1)C:(0,+INF)D:(-INF,+INF)

答案:(-INF,+INF)下列敘述錯誤的是()。

A:邏輯回歸預測事件發生的概率并分析導致事件發生的因素B:邏輯回歸是一種監督機器學習算法C:邏輯回歸主要用于回歸分析D:邏輯回歸采用Sigmoid函數對樣本數據進行擬合,以構建回歸模型

答案:邏輯回歸主要用于回歸分析使用IBk分類器和SMO分類器對vote.arff分別進行分類,由其輸出的結果可知()。

A:SMO對democrat和republican的分類正確率都比IBk大B:SMO對democrat的分類正確率比IBk小C:IBk正確分類百分比比SMO大D:IBk對republican的分類正確率比SMO大

答案:SMO對democrat和republican的分類正確率都比IBk大

A:true或falseB:0或1C:1或-1D:0或-1

答案:1或-1以下描述錯誤的是()。

A:聚類分析可以看作是一種非監督的分類B:SVM尋找具有最小邊緣的超平面,因此經常被稱為最小邊緣分類器C:SVM對噪聲不具備魯棒性D:k-最近鄰算法(K-NN)是一種消極學習器

答案:SVM尋找具有最小邊緣的超平面,因此經常被稱為最小邊緣分類器線性支持向量機的最大化間隔正確的描述是()。

A:B:C:D:

答案:以下計算距離的公式中,計算歐氏距離的是()。

A:B:C:D:

答案:

第七章單元測試

以下數據和信息的說法,不正確的是()。

A:凡是可以電子化記錄下來的都是數據B:信息是客觀世界各種事物特征的反映C:數據對用戶來說是有價值的D:數據的形式是多樣化的

答案:數據對用戶來說是有價值的以下關于數據分析的方法,正確的是()。

A:所有的分析都是要從“過程”出發,沒有結論的數字羅列并不是分析B:分析是一個過程,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論