




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數據分析與可視化智慧樹知到課后章節答案2023年下山東交通學院山東交通學院
第一章測試
什么是KDD?()
A:領域知識發現
B:文檔知識發現
C:動態知識發現
D:數據挖掘與知識發現
答案:數據挖掘與知識發現
數據挖掘分析是指從海量的數據中抽取感興趣的(有價值的、隱含的、以前沒有用但是潛在有用信息的)模式和知識。()
A:對B:錯
答案:對
數據挖掘分析的步驟包括()
A:創建數據集
B:數據預處理
C:算法分析
D:模型評估
答案:創建數據集
;數據預處理
;算法分析
;模型評估
當今社會,數據挖掘分析被廣泛應用。()
A:錯B:對
答案:對
()是未來大數據分析的發展趨勢。
A:可視化
B:實時性
C:簡單
D:非結構化數據
答案:可視化
;實時性
;非結構化數據
第二章測試
關于描述統計,包括()。
A:其余選項都不是
B:離中趨勢分析
C:相關分析
D:集中趨勢分析
答案:離中趨勢分析
;相關分析
;集中趨勢分析
以下屬于推斷統計的是()。
A:其余選項都不是
B:集中趨勢分析
C:離中趨勢分析
D:參數估計
答案:離中趨勢分析
在數據特征的測度中,描述分布的形狀的值為()
A:偏態
B:峰態
C:眾數
D:中位數
答案:偏態
;峰態
測度集中趨勢就是尋找數據水平的代表值或中心值()
A:對B:錯
答案:對
四分位數可以用于順序數據、數值數據和分類數據()
A:錯B:對
答案:錯
第三章測試
下面哪個屬于映射數據到新的空間的方法?()
A:漸進抽樣
B:維歸約
C:特征加權
D:傅立葉變換
答案:傅立葉變換
將原始數據進行集成、變換、維度規約、數值規約是在以下哪個步驟的任務?()
A:數據預處理
B:分類和預測
C:數據流挖掘
D:頻繁模式挖掘
答案:數據預處理
影響數據質量問題的因素有哪些()
A:其余選項都對
B:相關性、時效性
C:準確性、完整性、一致性
D:可信性、可解釋性
答案:其余選項都對
數據預處理的常見方法有()
A:數據清洗
B:數據變換
C:數據集成
D:其余選項都不對
答案:數據清洗
;數據變換
;數據集成
數據預處理是指在對數據進行挖掘分析以前,需要對原始數據進行清理、集合和變換等一系列處理工作()
A:錯B:對
答案:對
第四章測試
考慮下面的頻繁3-項集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定數據集中只有5個項,采用合并策略,由候選產生過程得到4-項集不包含()
A:1,2,3,5
B:1,2,3,4
C:1,2,4,5
D:1,3,4,5
答案:1,2,4,5
頻繁項集、頻繁閉項集、最大頻繁項集之間的關系是:()
A:頻繁項集頻繁閉項集最大頻繁項集
B:頻繁項集=頻繁閉項集最大頻繁項集
C:頻繁項集頻繁閉項集=最大頻繁項集
D:頻繁項集=頻繁閉項集=最大頻繁項集
答案:頻繁項集頻繁閉項集最大頻繁項集
某超市研究銷售紀錄數據后發現,買啤酒的人很大概率也會購買尿布,這種屬于數據挖掘的哪類問題?()
A:分類
B:聚類
C:關聯規則發現
D:自然語言處理
答案:關聯規則發現
下面購物籃能夠提取的3-項集的最大數量是多少()ID購買項
1牛奶,啤酒,尿布
2面包,黃油,牛奶
3牛奶,尿布,餅干
4面包,黃油,餅干
5啤酒,餅干,尿布
6牛奶,尿布,面包,黃油
7面包,黃油,尿布
8啤酒,尿布
9牛奶,尿布,面包,黃油
10啤酒,餅干
A:2
B:1
C:4
D:3
答案:3
Apriori算法的計算復雜度受(
)影響。
A:事務平均寬度
B:支持度閥值
C:事務數
D:項數(維度)
答案:事務平均寬度
;支持度閥值
;事務數
;項數(維度)
第五章測試
以下哪些算法是分類算法,()
A:C4.5
B:K-Mean
C:DBSCAN
D:EM
答案:C4.5
決策樹中不包含一下哪種結點,()
A:外部結點(externalnode)
B:葉結點(leafnode)
C:根結點(rootnode)
D:內部結點(internalnode)
答案:外部結點(externalnode)
以下哪項關于決策樹的說法是錯誤的()
A:決策樹算法對于噪聲的干擾非常敏感
B:冗余屬性不會對決策樹的準確率造成不利的影響
C:尋找最佳決策樹是NP完全問題
D:子樹可能在決策樹中重復多次
答案:決策樹算法對于噪聲的干擾非常敏感
以下關于人工神經網絡(ANN)的描述錯誤的有()
A:至少含有一個隱藏層的多層神經網絡
B:神經網絡對訓練數據中的噪聲非常魯棒
C:可以處理冗余特征
D:訓練ANN是一個很耗時的過程
答案:神經網絡對訓練數據中的噪聲非常魯棒
貝葉斯信念網絡(BBN)有如下哪些特點,()
A:對模型的過分問題非常魯棒
B:網絡結構確定后,添加變量相當麻煩
C:構造網絡費時費力
D:貝葉斯網絡不適合處理不完整的數據
答案:對模型的過分問題非常魯棒
;構造網絡費時費力
如下哪些不是最近鄰分類器的特點,()
A:分類一個測試樣例開銷很大
B:最近鄰分類器基于全局信息進行預測
C:可以生產任意形狀的決策邊界
D:它使用具體的訓練實例進行預測,不必維護源自數據的模型
答案:最近鄰分類器基于全局信息進行預測
第六章測試
()這些數據特性都是對聚類分析具有很強影響的。
A:高維性
B:噪聲和離群點
C:規模
D:稀疏性
答案:高維性
;噪聲和離群點
;規模
;稀疏性
考慮這么一種情況:一個對象碰巧與另一個對象相對接近,但屬于不同的類,因為這兩個對象一般不會共享許多近鄰,所以應該選擇()的相似度計算方法。
A:余弦距離
B:直接相似度
C:共享最近鄰
D:平方歐幾里德距離
答案:共享最近鄰
在基本K均值算法里,當鄰近度函數采用()的時候,合適的質心是簇中各點的中位數。
A:曼哈頓距離
B:Bregman散度
C:平方歐幾里德距離
D:余弦距離
答案:曼哈頓距離
簡單地將數據對象集劃分成不重疊的子集,使得每個數據對象恰在一個子集中,這種聚類類型稱作()
A:非互斥聚類
B:劃分聚類
C:模糊聚類
D:層次聚類
答案:劃分聚類
K均值是一種產生劃分聚類的基于密度的聚類算法,簇的個數由算法自動地確定。()
A:對B:錯
答案:錯
第七章測試
可視化涉及到的學科包括()
A:計算機圖形學
B:人機交互
C:統計分析
D:數據挖掘
答案:計算機圖形學
;人機交互
;統計分析
;數據挖掘
若有一個數據集,每個數據點有5個屬性,以下哪種可視化技術最適用于表示其屬性涼涼之間的相關性呢?()
A:直方圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 湖北省十堰市2024-2025學年高三下學期四月調研考試數學試題
- 廣西玉林市本年度(2025)小學一年級數學部編版隨堂測試((上下)學期)試卷及答案
- 新疆吐魯番地區本年度(2025)小學一年級數學統編版課后作業((上下)學期)試卷及答案
- 大學生如何制定合理有效的學習計劃書
- 2025春季學期國家開放大學專科《建筑工程計量與計價》一平臺在線形考(作業1至4)試題及答案
- 人工智能核心算法模擬題(附參考答案)
- 職業技術學校軟件與信息服務專業人才培養方案(2024年)
- 2025年山西省晉中市平遙縣中考一模歷史試題(原卷版+解析版)
- 河南省許昌市部分校2024-2025學年高一下學期4月期中考試數學試題(原卷版+解析版)
- 畜牧養殖技術培訓與職業技能提升項目的開展考核試卷
- 供應鏈風險管理組織架構設計
- 《運動處方》課件-糖尿病人群運動處方
- 2025年四川省自然資源投資集團有限責任公司招聘筆試參考題庫附帶答案詳解
- 2025年志愿者服務日知識競賽考試指導題庫150題(含答案)
- 初中學生成長評價方案
- 智慧教育下的小學生德育策略創新實踐案例分享
- 種植土施工方案
- 2025年四川成都農業科技職業學院招聘工作人員16人高頻重點提升(共500題)附帶答案詳解
- 電力工程質量目標、質量保證體系及技術組織措施
- 自然保護地分類分級-知識培訓
- 超聲科室發展規劃
評論
0/150
提交評論