中南大學《大數據挖掘》2022-2023學年期末試卷_第1頁
中南大學《大數據挖掘》2022-2023學年期末試卷_第2頁
中南大學《大數據挖掘》2022-2023學年期末試卷_第3頁
中南大學《大數據挖掘》2022-2023學年期末試卷_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

自覺遵守考場紀律如考試作弊此答卷無效密自覺遵守考場紀律如考試作弊此答卷無效密封線第1頁,共3頁中南大學《大數據挖掘》2022-2023學年期末試卷院(系)_______班級_______學號_______姓名_______題號一二三總分得分批閱人一、單選題(本大題共20個小題,每小題2分,共40分.在每小題給出的四個選項中,只有一項是符合題目要求的.)1、在大數據中,數據脫敏的主要方法是()A.替換B.加密C.刪除D.以上都是2、以下哪種數據庫屬于NoSQL數據庫?()A.OracleB.SQLServerC.RedisD.DB23、大數據中的數據預處理步驟不包括?()A.數據清洗B.數據轉換C.數據壓縮D.數據刪除4、以下哪種技術用于大數據的實時監控?()A.PrometheusB.GrafanaC.以上都是D.以上都不是5、在大數據中,數據傾斜會導致()A.處理速度加快B.資源浪費C.結果準確D.以上都不是6、在大數據中,數據備份的策略不包括?()A.全量備份B.增量備份C.差異備份D.隨機備份7、以下哪個不是大數據應用的領域?()A.醫療B.金融C.農業D.物理學8、Spark相對于HadoopMapReduce的主要優勢是?()A.內存計算B.磁盤存儲C.處理速度慢D.編程復雜9、以下哪個不是大數據中的數據類型?()A.結構化數據B.半結構化數據C.非結構化數據D.單一結構數據10、在大數據中,數據治理的目標不包括()A.提高數據質量B.保障數據安全C.降低數據存儲成本D.增加數據量11、以下哪種技術用于大數據的搜索?()A.ElasticsearchB.SolrC.LuceneD.以上都是12、在大數據中,數據血緣關系的作用是?()A.追蹤數據來源和流向B.加密數據C.壓縮數據D.美化數據13、以下哪種算法常用于大數據的分類問題?()A.聚類算法B.關聯規則挖掘C.決策樹D.回歸分析14、大數據中的數據去重可以通過()實現。A.哈希表B.排序C.以上都是D.以上都不是15、以下哪個不是大數據中的數據遷移工具?()A.DataXB.SqoopC.KafkaD.Canal16、Spark相對于Hadoop的優勢在于()A.內存計算B.存儲容量大C.處理速度慢D.配置復雜17、大數據中的數據壓縮算法不包括?()A.GzipB.Bzip2C.RARD.LZ418、以下哪個不是大數據中的數據質量問題?()A.缺失值B.重復值C.錯誤值D.小數據量19、大數據中的數據挖掘任務不包括()A.預測B.描述C.關聯D.加密20、大數據中的數據血緣關系是指()A.數據的來源和流向B.數據的分類和組織C.數據的加密和解密D.數據的壓縮和解壓二、簡答題(本大題共4個小題,共40分)1、(本題10分)簡述大數據在氣象預測中的應用。2、(本題10分)說明大數據在物聯網中的應用。3、(本題10分)說明大數據在旅游需求預測中的作用。4、(本題10分)解釋大數據在能源管理中的作用。三、綜合分析題(本大題共2個小題,共20分)1、(本題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論