大數據應用基礎知到智慧樹章節測試課后答案2024年秋山東建筑大學

上傳人：題*** IP屬地：浙江上傳時間：2024-12-14 格式：DOCX 頁數：11 大小：110.99KB 積分：6 舉報 版權申訴

免費預覽已結束，剩余6頁可下載查看

 下載本文檔

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

大數據應用基礎知到智慧樹章節測試課后答案2024年秋山東建筑大學第一章單元測試

數據計量單位中，T是G的（）倍。

A:8B:1000C:16D:1024

答案:1024一般來說，科學實驗產生的數據體量較小，質量不高。（）

A:對B:錯

答案:錯以下行為正確的是（）。

A:及時刪除不明電子郵件的附件B:使用國產替換軟件C:使用簡單的密碼或長時間不修改密碼D:使用破解軟件，以節約成本

答案:及時刪除不明電子郵件的附件；使用國產替換軟件一般來說，和PaaS模式的云服務相比，使用SaaS云服務，用戶需要自行管理更多的資源。（）

A:錯B:對

答案:錯為了快速發展數字經濟，可以允許一些平臺收集用戶的隱私信息。（）

A:錯B:對

答案:錯解決數據倫理問題，最根本的是企業或組織堅守倫理底線，踐行科技向善的原則。（）

A:對B:錯

答案:對

第二章單元測試

下列調查適宜用調查問卷的是（）

A:對你所在班級的學生最喜歡的體育活動進行調查B:對上海市常住人口家庭收入情況進行調查C:電商平臺調查某商品的用戶使用感受D:檢測某城市的空氣質量

答案:對你所在班級的學生最喜歡的體育活動進行調查；對上海市常住人口家庭收入情況進行調查下列選項中,獲取數據的直接來源的方法有（）

A:從《人口普查資料匯編》當中獲取的數據B:某大學、科研機構發布的研究數據C:問卷調查D:某企業發布的經營報表數據E:實驗檢測獲取數據

答案:問卷調查；實驗檢測獲取數據網絡爬蟲能夠爬取互聯網上的任何數據。（）

A:錯B:對

答案:錯Response類對象的下列屬性中，用于表示HTML代碼的是（）

A:textB:status_codeC:encodingD:content

答案:text運行以下程序，結果是（）

A:TrueFalseTrueB:FalseTrueTrueC:TrueTrueFalseD:TrueTrueTrue

答案:TrueTrueTrue利用八爪魚采集器采集數據過程中，如果希望只采集滿足條件的部分數據，可以嘗試通過判斷條件功能來完成。（）

A:對B:錯

答案:對

第三章單元測試

文本文件中的數據的存儲結構依賴應用程序，所以文件不適合管理較大規模的數據。（）

A:錯B:對

答案:對數據庫管理系統的主要功能包括以下幾個方面（）

A:管理計算機的硬件資源B:數據操作C:數據庫的建立與維護D:數據組織、存儲和管理E:數據定義

答案:數據操作；數據庫的建立與維護；數據組織、存儲和管理；數據定義大數據時代，數據類型繁多，半結構化和非結構化的數據成為主流數據形式，而NoSQL數據庫沒有固定的表結構，數據約束也比較寬松，更適合海量的非結構化數據存儲。（）

A:對B:錯

答案:對NoSQL是大數據時代的主流存儲方式，可以全面替代傳統的關系數據庫。（）

A:錯B:對

答案:錯列族數據庫的查找速度快、可擴展性強、復雜性低，代表性的軟件有HBase、Cassandra等。（）

A:對B:錯

答案:對

第四章單元測試

現實世界中直接采集到的數據大多是不完整、結構不一致、含噪聲的數據，無法直接用于數據分析或挖掘。（）

A:錯B:對

答案:對數據預處理的目的（）

A:抽取精準的數據B:盡可能的簡化數據C:調整數據格式D:提高數據質量E:清理“臟”數據

答案:抽取精準的數據；盡可能的簡化數據；調整數據格式；提高數據質量；清理“臟”數據數據集成的過程中需要處理的問題有（）

A:其余選項都是B:冗余與相關性分析。C:數據沖突和檢測D:實體識別

答案:其余選項都是數據歸約指數據降維，是從原有的數據中刪除不重要或不相關的屬性，或者通過對屬性進行重組來減少屬性的個數。（）

A:錯B:對

答案:對pandas庫中的DataFrame對象的replace方法可以替換指定數據。（）

A:錯B:對

答案:對

第五章單元測試

Matplotlib中的（）模塊提供了一系列操作和繪圖函數。

A:plotB:rcparamsC:barD:pyplot

答案:pyplot下列參數中調整后顯示中文的是（）。

A:lines.linewidthB:lines.linestyleC:axes.unicode_minusD:font.sans-serif

答案:font.sans-serif散點圖無法反映特征之間的統計關系。（）

A:對B:錯

答案:錯折線圖的主要功能是查看因變量y隨著自變量x改變的趨勢。（）

A:對B:錯

答案:對在seaborn中要移除圖形中的軸線，使用的方法是despine方法。（）

A:對B:錯

答案:對

第六章單元測試

下面有關回歸分析的描述，不正確的是（）。

A:回歸分析的預測過程是利用得到的模型對新樣本進行預測B:回歸分析包括學習過程和預測過程C:回歸分析屬于無監督學習D:回歸分析的學習過程是利用有標簽的訓練數據集學習得到一個模型

答案:回歸分析屬于無監督學習關于下面這段代碼，描述不正確的是（）。

A:第7行代碼用于查看所估計回歸方程的判定系數R方B:第2行代碼建立了一個名為regr的線性回歸模型C:第6行代碼用于對所建立的回歸模型進行參數估計D:第8行代碼用于查看所估計回歸方程的回歸參數

答案:第7行代碼用于查看所估計回歸方程的判定系數R方下面有關分類的描述，正確的是（）。

A:分類問題的因變量是類別變量B:分類是一種無監督學習C:分類包括學習過程和分類過程D:分類是一種監督學習

答案:分類問題的因變量是類別變量；分類包括學習過程和分類過程；分類是一種監督學習利用邏輯回歸模型進行類別預測的方法是（）。

A:LinearRegression.predict()B:LogisticRegression.predict()C:LogisticRegression.fit()D:LogisticRegression.score()

答案:LogisticRegression.predict()以下關于聚類的描述，正確的是（）

A:聚類的數據集包含特征變量和類別變量B:決策樹方法是一種聚類方法C:聚類的數據集只包含特征變量不包含類別變量D:聚類屬于監督學習

答案:聚類的數據集只包含特征變量不包含類別變量在K-means聚類過程中，計算不同K值時的內平方和WWS如下表所示，請問最優K值是（）。

K值WWS值162.8212.339.449.359.269.1

A:3B:2C:4D:1

答案:3有關K-means聚類命令sklearn.cluster.KMeans()，以下說法不正確的是（）。

A:可通過屬性labels_查看聚類之后的樣本點分類B:可通過屬性cluster_centers_查看聚類之后的質心坐標C:用于計算K-means聚類的方法是fit()D:可通過參數n_clusters指定初始聚類中心位置

答案:可通過參數n_clusters指定初始聚類中心位置關于下面這段代碼，描述不正確的是（）。

A:sklearn.model_selection.train_test_split()方法可用于將數據集分為訓練集和測試集兩部分B:x_test，y_test分別是指測試集的自變量和因變量C:訓練集和測試集的比例為0.25:0.75D:x_train，y_train分別是指訓練集的自變量和因變量

答案:訓練集和測試集的比例為0.25:0.75有關文本分析的描述，不正確的是（）。

A:詞性標注是指為詞語標注相應詞性的過程B:去除停用詞是指去除文本中包含信息較多、使用頻率又很高的詞C:一般而言，進行文本分析的起始步驟是詞語分詞D:詞干提取可用于英文文本分析

答案:去除停用詞是指去除文本中包含信息較多、使用頻率又很高的詞可用于英文分詞的方法是（）。

A:nltk.word_tokenize()B:stopwords.words()C:nltk.FreDist()D:nltk.pos_tag()

答案:nltk.word_tokenize()

第七章單元測試

更改一個文件權限的命令是（）。

A:chmodB:catC:attribD:chown

答案:chmodLinux中權限最大的賬戶是（）。

A:adminB:guestC:superD:root

答案:rootLinux的命令由連續的字符組成，命令和參數之間可以沒有空格。（）

A:對B:錯

答案:錯Linux操作系統的主要特點是（）。

A:安全B:多用戶多任務C:免費D:開源

答案:安全；多用戶多任務；免費；開源從目錄/home/glxy/app切換到目錄/home/glxy/hadoop的相對路徑是（）

A:../hadoopB:hadoopC:./hadoopD:

/home/glxy/hadoop

答案:../hadoop

第八章單元測試

一種典型的數據處理使用模式是：首先使用（）工具對原始海量數據進行分析，產生較小規模的數據集，再使用（）工具對該數據集進行快速查詢，獲取最終結果。

A:批處理、流處理B:流處理、批處理C:批處理、交互式處理D:交互式處理、批處理

答案:批處理、交互式處理大數據管理平臺技術的發展歷程為（）。

A:流處理階段B:內存計算階段C:初始階段D:開源階段

答案:流處理階段；內存計算階段；初始階段；開源階段常用的流數據處理技術有（）。

A:HadoopB:SparkStreamingC:FlinkD:Strom

答案:SparkStreaming；Flink；Strom下述哪些技術不屬于開源技術（）。

A:SparkB:GFSC:HadoopD:Flink

答案:GFS大數據管理平臺技術可以應用到下述哪些領域場景中（）。

A:互聯網B:醫療C:電信D:交通

答案:互聯網；醫療；電信；交通

第九章單元測試

在HDFS中負責保存文件數據的節點被稱為（）。

A:NodeManagerB:DataNodeC:SecondaryNameNodeD:NameNode

答案:DataNode下面與HDFS類似的框架是（）？

A:FAT32B:EXT3C:GFSD:NTFS

答案:GFS下面哪個程序負責HDFS數據存儲（）。

A:NameNodeB:DatanodeC:secondaryNameNodeD:Jobtracker

答案:DatanodeHDFS中的NameNode節點用于存放元數據，數據內容包含（）。

A:客戶端硬件配置數據B:每個數據塊的內容C:文件與數據塊的映射表D:數據塊與數據節點的映射表

答案:文件與數據塊的映射表；數據塊與數據節點的映射表HDFS系統采用NameNode定期向DataNode發送心跳消息，用于檢測系統是否正常運行。（）

A:對B:錯

答案:錯

第十章單元測試

Spark生態系統支持批處理、交互式處理和流處理。（）

A:錯B:對

答案:對以下哪個組件不屬于Spark生態（

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

大數據應用基礎知到智慧樹章節測試課后答案2024年秋山東建筑大學

文檔簡介

溫馨提示

最新文檔

評論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

大數據應用基礎知到智慧樹章節測試課后答案2024年秋山東建筑大學

文檔簡介

溫馨提示

最新文檔

評論

相關文檔