南開大學22年春學期《數據分析》在線作業_第1頁
南開大學22年春學期《數據分析》在線作業_第2頁
免費預覽已結束,剩余10頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、-本頁為預覽頁PAGE12-本頁為預覽頁-本頁為預覽頁22春學期(高起本1709-1803、全層次1809-2103)數據分析在線作業-00001第1題. 哪個選項不屬于大數據4V特點?選項A:Volume選項B:Valid選項C:Variety選項D:Value參考答案:B第2題. 使用了隨機函數的算法是哪個算法()選項A:隨機算法選項B:外存算法選項C:并行算法選項D:Anytime算法參考答案:A第3題. 類的Q型聚類是指()選項A:對樣本個體進行聚類選項B:對指標變量進行聚類。參考答案:A第4題. 在鏈接作弊的垃圾農場中,作弊者擁有并完全控制的網頁稱為()選項A:不可達網頁選項B:可達

2、網頁選項C:自有網頁參考答案:C第5題. 類的R型聚類是指()選項A:對樣本個體進行聚類選項B:對指標變量進行聚類。參考答案:B第6題. 評估模型的分類預測準確率,使用()進行評估;選項A:訓練數據集選項B:驗證數據集選項C:測試數據集選項D:未知數據參考答案:C第7題. 并行算法包括()選項A:MapRedce選項B:關聯分析選項C:KNN選項D:Kmeans參考答案:A第8題. 評價分類器效果時,表示正確分類的樣本數與總樣本數之比的指標是()。選項A:準確率選項B:精確率選項C:召回率選項D:F1值參考答案:A第9題. 向量空間模型中,用()來描述一個文檔選項A:詞選項B:詞袋選項C:特征

3、詞選項D:特征向量參考答案:D第10題. 聚合聚類算法的代表是()選項A:AGNES選項B:Apriori選項C:KNN選項D:FP-Growth參考答案:A第11題. 數據產生方式變革中數據產生方式是被動的主要是來自哪個階段( )。選項A:運營式系統階段選項B:用戶原創內容階段選項C:感知式系統階段參考答案:A第12題. Apriori算法使用到以下哪些( )選項A:格結構、有向無環圖選項B:二叉樹、哈希樹選項C:格結構、哈希樹選項D:多叉樹、有向無環圖參考答案:C第13題. 聚類過程為()選項A:數據準備,特征選擇,特征提取,聚類,結果評估選項B:數據準備,特征提取,特征選擇,聚類,結果評

4、估選項C:數據準備,特征提取,聚類,特征選擇,結果評估參考答案:A第14題. 對頻繁項集、頻繁閉項集、極大頻繁項集的關系描述正確的是( )選項A:3可以還原出無損的1選項B:2可以還原出無損的1選項C:3與2是完全等價的選項D:2與1是完全等價的參考答案:B第15題. 潛在語義分析創新地引入了()選項A:單詞維度選項B:文本維度選項C:話題維度參考答案:C第16題. LDA導入先驗分布是為了應對()現象選項A:欠擬合選項B:話題識別不準選項C:過擬合選項D:分詞困難參考答案:C第17題. 樸素貝葉斯中,給定輸入x,求解在x出現的前提下各個類別出現的概率,哪個最大,就認為x屬于哪個類別。即選擇(

5、)最大的類別。選項A:后驗概率選項B:先驗概率選項C:極大似然估計參考答案:A第18題. HITS算法中,網頁的重要性應該依賴于()選項A:每個網頁上的超鏈接個數選項B:用戶提出的查詢請求選項C:網頁上超鏈接重要性參考答案:B第19題. 聚類屬于()選項A:有監督學習選項B:無監督學習選項C:強化學習選項D:對抗學習參考答案:B第20題. 在文本信息處理系統中,所處理的原始數據是()選項A:結構化的自然語言文本選項B:非結構化的自然語言文本選項C:非結構化的編碼選項D:結構化的編碼參考答案:B第21題. 按社團形成機制分類,社團包括()選項A:明顯的社團選項B:預定義社團選項C:自組織社團選項

6、D:隱含的社團參考答案:B,C第22題. 基于分類對象的分類有()選項A:Q型聚類選項B:凝聚方式選項C:R型聚類選項D:分解方式參考答案:B,D第23題. 下列屬于分類算法的有()。選項A:k近鄰法選項B:樸素貝葉斯選項C:支持向量機選項D:隨機森林參考答案:A,B,C,D第24題. 聚類的核心是()選項A:相似度選項B:距離選項C:特征選項D:數據參考答案:A,B第25題. 概率潛在語義分析中,模型生成的是(),但觀測到的是()。選項A:單詞-話題-文本三元組選項B:話題-文本二元組選項C:單詞-話題二元組選項D:單詞-文本二元組參考答案:A,D第26題. 關聯分析的作用是什么()選項A:

7、用于發現存在于大量數據集中的關聯性選項B:用于發現存在于大量數據集中的相關性選項C:描述了一個事物中某些屬性同時出現的規律選項D:描述了一個事物中某些屬性同時出現的模式參考答案:A,B,C,D第27題. 關聯規則挖掘的算法主要有()和()選項A:Apriori選項B:KNN選項C:貝葉斯算法選項D:FP-Growth參考答案:A,D第28題. 聚類方法包括()選項A:劃分方法選項B:層次方法選項C:對象方法選項D:基于密度的方法參考答案:A,B,D第29題. 借助于大數據提供的()和(),政府可為農業生產進行合理引導,依據需求進行生產,避免產能過剩造成不必要的資源和社會財富浪費。選項A:消費能

8、力選項B:趨勢報告選項C:購物結果參考答案:A,B第30題. 層次方法中,自底向上的方法是哪種()選項A:凝聚法選項B:分裂法選項C:K-均值算法選項D:K-中心點算法參考答案:A,B第31題. Apriori算法是一種典型的關聯規則挖掘算法。選項A:對選項B:錯參考答案:A第32題. 效用矩陣的數據可以通過隱式方法獲得,得到的數值中0相比較1表示受喜歡度較低選項A:對選項B:錯參考答案:B第33題. 概率潛在語義分析是一種有監督學習方法。()選項A:對選項B:錯參考答案:B第34題. 啤酒與尿布的故事是聚類分析的典型實例。選項A:對選項B:錯參考答案:B第35題. 監督學習中,模型就是索要學

9、習的聯合概率分布或決策函數選項A:對選項B:錯參考答案:B第36題. 組內平均鏈鎖距離進一步考慮了組內相似性的變化。選項A:對選項B:錯參考答案:A第37題. AGNES算法中,要使用相似矩陣查找最相似的兩個簇。()選項A:對選項B:錯參考答案:A第38題. 大數據的速度快體現在數據產生速度快和要求分析處理速度快選項A:對選項B:錯參考答案:A第39題. 大數據規則性分析用于預測未來時間發生的概率和演化趨勢選項A:對選項B:錯參考答案:B第40題. IDC給出的大數據定義是大數據(Big Data)是需要新的處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資

10、產。選項A:對選項B:錯參考答案:B第41題. 通過大數據的分析將會更精確地預測未來的天氣,幫助農民做好自然災害的預防工作,幫助政府實現農業的精細化管理和科學決策。選項A:對選項B:錯參考答案:A第42題. 中位數的優勢是計算簡便,不受極端值的影響選項A:對選項B:錯參考答案:A第43題. 單詞-文本矩陣是一個稀疏矩陣。()選項A:對選項B:錯參考答案:A第44題. 實際操作中,不能用經驗風險近似期望風險選項A:對選項B:錯參考答案:B第45題. 麥肯錫研究院發布的報告Big Data: The next frontier for innovation, competition, and productivity,第一次給大數據做出了相對清晰的定義選項A:對選項B:錯參考答案:A第46題. 多元邏輯斯諦回歸模型用軟最大函數處理所有類。()選項A:對選項B:錯參考答案:A第47題. 精確率和召回率都高時, F1值也會高。()選項A:對選項B:錯參考答案:A第48題. 如果兩個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論