




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)發(fā)掘考試題目——關(guān)系剖析一、10個選擇1.以部下于關(guān)系剖析的是()A.CPU性能展望B.購物籃剖析C.自動判斷鳶尾花類型D.股票趨向建模維克托?邁爾-舍恩伯格在《大數(shù)據(jù)時代:生活、工作與思想的大改革》一書中,連續(xù)重申了一個看法:大數(shù)據(jù)時代的到來,使我們沒法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奇妙,與此同時,我們更應(yīng)當著重數(shù)據(jù)中的有關(guān)關(guān)系,而不是因果關(guān)系。此中,數(shù)據(jù)之間的有關(guān)關(guān)系能夠經(jīng)過以下哪個算法直接發(fā)掘()A.K-meansB.BayesNetworkC.D.Apriori3.置信度(confidence)是權(quán)衡興趣度胸懷()的指標。A.簡短性B.確立性C.適用性D.新奇性算法的加快過程依靠于以下哪個策略()A.抽樣B.剪枝C.緩沖D.并行5.以下哪個會降低Apriori算法的發(fā)掘效率()A.支持度閾值增大B.項數(shù)減少C.事務(wù)數(shù)減少D.減小硬盤讀寫速率算法使用到以下哪些東東()A.格構(gòu)造、有向無環(huán)圖B.二叉樹、哈希樹C.格構(gòu)造、哈希樹D.多叉樹、有向無環(huán)圖7.非屢次模式()A.其置信度小于閾值B.令人不感興趣C.包含負模式和負有關(guān)模式D.對異樣數(shù)據(jù)項敏感8.對屢次項集、屢次閉項集、極大屢次項集的關(guān)系描繪正確的選項是()A.3能夠復(fù)原出無損的1B.2能夠復(fù)原出無損的1C.3與2是完整等價的D.2與1是完整等價的tree在Apriori算法中所起的作用是()A.儲存數(shù)據(jù)B.查找C.加快查找D.剪枝10.以下不屬于數(shù)據(jù)發(fā)掘軟件的是()A.SPSSModelerB.WekaC.ApacheSparkD.Knime二、10個填空1.關(guān)系剖析中表示關(guān)系關(guān)系的方法主要有:和。2.關(guān)系規(guī)則的評論胸懷主要有:和。3.關(guān)系規(guī)則發(fā)掘的算法主要有:和。4.購物籃剖析中,數(shù)據(jù)是以的形式體現(xiàn)。5.一個項集知足最小支持度,我們稱之為。6.一個關(guān)系規(guī)則同時知足最小支持度和最小置信度,我們稱之為。在回歸與有關(guān)剖析中,因變量值隨自變量值的增大(減?。┒鴾p小(增大)的現(xiàn)象叫做。8.極大屢次項集不可以無損復(fù)原出屢次項集,是由于它不包含屢次項集的信息。9.經(jīng)典的Apriori算法是逐層掃描的,也就是說它是(選:深度/寬度)優(yōu)先的。10.數(shù)據(jù)發(fā)掘大體步驟包含:輸入數(shù)據(jù)預(yù)辦理發(fā)掘后辦理輸出知識。此中,輸出的知識能夠有好多種表示形式,兩種極端的形式是:①內(nèi)部構(gòu)造難以被理解的黑匣子,比方說人工神經(jīng)網(wǎng)絡(luò)訓練得出的網(wǎng)絡(luò);②模式構(gòu)造清楚的匣子,這類構(gòu)造簡單被人理解,比方說決策樹產(chǎn)生的樹。那么,關(guān)系剖析中輸出的知識的表示形式主假如(選:黑匣子/清晰構(gòu)造)。三、10個判斷()1.啤酒與尿布的故事是聚類剖析的典型實例。()算法是一種典型的關(guān)系規(guī)則發(fā)掘算法。()3.支持度是權(quán)衡關(guān)系規(guī)則重要性的一個指標。()4.可信度是對關(guān)系規(guī)則的正確度的權(quán)衡。()5.給定關(guān)系規(guī)則AB,意味著:若A發(fā)生,B也會發(fā)生。()6.屢次閉項集可用來無損壓縮屢次項集。()7.關(guān)系規(guī)則能夠用列舉的方法產(chǎn)生。()算法產(chǎn)生的關(guān)系規(guī)則老是確立的。()9.不知足給定評論胸懷的關(guān)系規(guī)則是無趣的。()10.關(guān)于項集來說,置信度沒存心義。四、5個簡答簡述關(guān)系規(guī)則產(chǎn)生的兩個基本步驟。算法是從事務(wù)數(shù)據(jù)庫中發(fā)掘布爾關(guān)系規(guī)則的常用算法,該算法利用屢次項集性質(zhì)的先驗知識,從候選項集中找到屢次項集。請簡述Apriori算法的基來源理。簡述Apriori算法的長處和弊端。針對Apriori算法的弊端,能夠做哪些方面的改良強關(guān)系規(guī)則必定是風趣的嗎為何數(shù)據(jù)發(fā)掘考試題目+參照答案一、10個選擇以部下于關(guān)系剖析的是(B)A.CPU性能展望B.購物籃剖析C.自動判斷鳶尾花類型D.股票趨向建模維克托?邁爾-舍恩伯格在《大數(shù)據(jù)時代:生活、工作與思想的大改革》一書中,連續(xù)重申了一個看法:大數(shù)據(jù)時代的到來,使我們沒法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奇妙,與此同時,我們更應(yīng)當著重數(shù)據(jù)中的有關(guān)關(guān)系,而不是因果關(guān)系。此中,數(shù)據(jù)之間的有關(guān)關(guān)系能夠經(jīng)過以下哪個算法直接發(fā)掘(D)A.K-meansB.BayesNetworkC.D.Apriori置信度(confidence)是權(quán)衡興趣度胸懷(B)的指標。A.簡短性B.確立性C.適用性D.新奇性算法的加快過程依靠于以下哪個策略(B)A.抽樣B.剪枝C.緩沖D.并行以下哪個會降低Apriori算法的發(fā)掘效率(D)A.支持度閾值增大B.項數(shù)減少C.事務(wù)數(shù)減少D.減小硬盤讀寫速率算法使用到以下哪些東東(C)A.格構(gòu)造、有向無環(huán)圖B.二叉樹、哈希樹C.格構(gòu)造、哈希樹D.多叉樹、有向無環(huán)圖7.非屢次模式(D)A.其置信度小于閾值B.令人不感興趣C.包含負模式和負有關(guān)模式D.對異樣數(shù)據(jù)項敏感8.對屢次項集、屢次閉項集、極大屢次項集的關(guān)系描繪正確的選項是(B)A.3能夠復(fù)原出無損的1B.2能夠復(fù)原出無損的1C.3與2是完整等價的D.2與1是完整等價的tree在Apriori算法中所起的作用是(C)A.儲存數(shù)據(jù)B.查找C.加快查找D.剪枝以下不屬于數(shù)據(jù)發(fā)掘軟件的是(C)A.SPSSModeler
B.WekaC.ApacheSpark
D.Knime二、10個填空1.關(guān)系剖析中表示關(guān)系關(guān)系的方法主要有:項集和關(guān)系規(guī)則。2.關(guān)系規(guī)則的評論胸懷主要有:支持度和置信度。3.關(guān)系規(guī)則發(fā)掘的算法主要有:Apriori和FP-Growth。4.購物籃剖析中,數(shù)據(jù)是以不對稱二元變量的形式體現(xiàn)。5.一個項集知足最小支持度,我們稱之為屢次項集。6.一個關(guān)系規(guī)則同時知足最小支持度和最小置信度,我們稱之為強規(guī)則。在回歸與有關(guān)剖析中,因變量值隨自變量值的增大(減?。┒鴾p小(增大)的現(xiàn)象叫做負有關(guān)。8.極大屢次項集不可以無損復(fù)原出屢次項集,是由于它不包含屢次項集的支持度信息。9.經(jīng)典的Apriori算法是逐層掃描的,也就是說它是寬度(選:深度/寬度)優(yōu)先的。10.數(shù)據(jù)發(fā)掘大體步驟包含:輸入數(shù)據(jù)預(yù)辦理發(fā)掘后辦理輸出知識。此中,輸出的知識能夠有好多種表示形式,兩種極端的形式是:①內(nèi)部構(gòu)造難以被理解的黑匣子,比方說人工神經(jīng)網(wǎng)絡(luò)訓練得出的網(wǎng)絡(luò);②模式構(gòu)造清楚的匣子,這類構(gòu)造簡單被人理解,比方說決策樹產(chǎn)生的樹。那么,關(guān)系剖析中輸出的知識的表示形式主假如清楚構(gòu)造(選:黑匣子/清楚構(gòu)造)。三、10個判斷?)1.啤酒與尿布的故事是聚類剖析的典型實例。?)算法是一種典型的關(guān)系規(guī)則發(fā)掘算法。?)3.支持度是權(quán)衡關(guān)系規(guī)則重要性的一個指標。?)4.可信度是對關(guān)系規(guī)則的正確度的權(quán)衡。(?)5.給定關(guān)系規(guī)則AB,意味著:若A發(fā)生,B也會發(fā)生。?)6.屢次閉項集可用來無損壓縮屢次項集。?)7.關(guān)系規(guī)則能夠用列舉的方法產(chǎn)生。?)算法產(chǎn)生的關(guān)系規(guī)則老是確立的。?)9.不知足給定評論胸懷的關(guān)系規(guī)則是無趣的。?)10.關(guān)于項集來說,置信度沒存心義。四、5個簡答簡述關(guān)系規(guī)則產(chǎn)生的兩個基本步驟。答:關(guān)系規(guī)則產(chǎn)生的兩個基本步驟為:①依據(jù)給定的支持度從項集中產(chǎn)生屢次項集;②依據(jù)給定的置信度從屢次項集中產(chǎn)生關(guān)系規(guī)則。算法是從事務(wù)數(shù)據(jù)庫中發(fā)掘布爾關(guān)系規(guī)則的常用算法,該算法利用屢次項集性質(zhì)的先驗知識,從候選項集中找到屢次項集。請簡述Apriori算法的基來源理。答:關(guān)系規(guī)則的產(chǎn)生其實不依靠于Apriori算法,Apriori算法用來加快規(guī)則的產(chǎn)生過程。Apriori算法的加快過程依靠于這樣一個先驗原理:“屢次項集的子集是屢次的”。簡述Apriori算法的長處和弊端。答:Apriori算法的長處:構(gòu)造簡單、易于理解。Apriori算法的弊端:產(chǎn)生大批的候選項集,I/O開支較大。4.針對Apriori算法的弊端,能夠做哪些方面的改良答:Apriori算法的弊端主假如產(chǎn)生的候選項集許多,進而致使I/O開支較
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年小語種學習的新高地試題及答案
- 2025年CFA考試投資風險類型試題及答案
- 理財師考試的復(fù)習計劃試題及答案
- 網(wǎng)絡(luò)編輯師考試高頻考題及答案
- 2024年網(wǎng)絡(luò)編輯師證書考試行業(yè)前景試題及答案
- 畜牧師考試中計算題的試題及答案分享
- 2025年銀行從業(yè)資格證考試過程中的注意事項試題及答案
- 昌東二中考題試卷及答案
- 母嬰護理培訓
- 銀行產(chǎn)品規(guī)劃與管理試題及答案2025年分析
- 直銷隊管理制度
- 股份代持協(xié)議合同6篇
- 2024-2025學年蘇教版七年級生物下冊知識點復(fù)習提綱
- DB32-T 5082-2025 建筑工程消防施工質(zhì)量驗收標準
- 室速的觀察及護理
- 餐飲公司績效考核辦法
- 2025年03月春季河北邯鄲市叢臺區(qū)博碩人才引進50人筆試歷年參考題庫考點剖析附解題思路及答案詳解
- 2025年新高考歷史模擬試卷2(含答案解析)
- 急診一科一品一特色護理
- 物流行業(yè)招聘流程及人員配置
- 液化氣充裝站建站可行性研究報告
評論
0/150
提交評論