Python數據科學導引知到章節答案智慧樹2023年內蒙古農業大學_第1頁
Python數據科學導引知到章節答案智慧樹2023年內蒙古農業大學_第2頁
Python數據科學導引知到章節答案智慧樹2023年內蒙古農業大學_第3頁
Python數據科學導引知到章節答案智慧樹2023年內蒙古農業大學_第4頁
Python數據科學導引知到章節答案智慧樹2023年內蒙古農業大學_第5頁
已閱讀5頁,還剩13頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Python數據科學導引知到章節測試答案智慧樹2023年最新內蒙古農業大學第一章測試

大數據的起源是()。

參考答案:

互聯網

機器學習的實質是()。

參考答案:

根據現有數據,尋找輸入數據和輸出數據的映射關系/函數

Spark支持的分布式部署方式中哪個是錯誤的()。

參考答案:

Sparkonlocal

以下表述正確的是:()

參考答案:

深度學習是機器學習的一種。

;人工智能是人們長遠以來的目標,期待機器像人一樣有智慧。

;機器學習指機器有學習的能力,是人類達成人工智能目標的手段。

;人或機器表現的很有智慧取決于先天本能/創造者事先設定的規則和后天學習。

有效抑制機器學習過擬合的方法是()

參考答案:

平滑損失函數。

;重新設計損失函數,引入平滑函數。

;加大數據量。

下面表述正確的()

參考答案:

遷移學習指訓練集中包括沒有輸出數據與之對應的輸入數據,但這些輸入數據與其他輸入數據不相干。

;強化學習指只有評價性輸出結果的機器學習。

;監督學習指訓練集所有輸入數據都有相應輸出數據與之對應。

;監督學習指訓練集中包括沒有輸出數據與之對應的輸入數據,且所有輸入數據屬于同類別數據。

關于Spark中的RDD描述正確的()

參考答案:

Destributed:分布式,可以并行在集群計算。

;RDD(ResilientDistributedDatset)叫做彈性分布式數據集,是Spark中最基本的數據抽象。

;Resilient:表示彈性的,彈性表示。

;Datset:就是一個集合,用于存放數據的。

大數據的定義是不唯一的,從不同的角度對大數據都會有不同的理解。()

參考答案:

關系抽取一般在實體抽取任務之后,用于抽取兩個實體之間的句間關系。()

參考答案:

Spark的四大組件為SparkStreaming、Mlib、Graphx、SparkR。()

參考答案:

第二章測試

關于Python語言的變量,以下選項中說法正確的是()。

參考答案:

隨時命名、隨時賦值、隨時使用

以下選項中,不是建立字典的方式是()。

參考答案:

null

下列說法中正確的是()。

參考答案:

break能結束循環,而continue只能結束本次循環

tuple(range(2,10,2))的返回結果為()。

參考答案:

(2,4,6,8)

Python列表中所有元素必須為相同類型的數據。()

參考答案:

在函數內部沒有任何聲明的情況下直接為某個變量賦值,這個變量一定是函數內部的局部變量。()

參考答案:

在定義函數時,某個參數名字前面帶有兩個*符號表示可變長度參數,可以接收任意多個關鍵參數并將其存放于一個字典之中。()

參考答案:

使用內置函數open()且以”w”模式打開的文件,文件指針默認指向文件尾。()

參考答案:

下面代碼的輸出結果是()forsin"abc":

foriinrange(3):

print(s,end="")

ifs=="c":

break

參考答案:

aaabbbc

下面代碼的輸出結果是()x=10y=3print(x%y,x**y)

參考答案:

11000

第三章測試

s=pd.Series(np.random.randint(59,100,5),index=list("ABCDE")),能夠原地刪除s[“A”]的操作是()。

參考答案:

dels["A"]

若有grouped_sc=df.groupby('學校'),則查詢查看分組數量應采用()

參考答案:

grouped_sc.ngroups。

下列方法中,能夠利用pandas.DataFrame()創建DataFrame的是()。

參考答案:

通過Series創建

;通過隨機函數創建

;通過Python字典創建

;通過ndarray對象創建

關于缺失值填充函數pandas.DataFrame.fillna(),正確的說法是()。

參考答案:

value參數用于指示用來填充缺失值的數據。

;method參數為pad表示用缺失值前面的值對缺失值進行填充。

;axis參數表示填充維度,確定從行開始或是從列開始。

df包含"計劃銷售額"和"實際銷售額"兩列數據,若要篩選未完成計劃銷售額但實際銷售額不低于4000的所有月份信息,可用的方式有()。

參考答案:

df[(df["計劃銷售額"]>df["實際銷售額"])&(df["實際銷售額"].ge(4000))]。

;df[(df["計劃銷售額"].gt(df["實際銷售額"]))&(df["實際銷售額"].ge(4000))]。

;df.query("計劃銷售額>實際銷售額&實際銷售額>=4000")。

;df[(df["計劃銷售額"]>df["實際銷售額"])&(df["實際銷售額"]>=4000)]。

下列屬于透視操作的是()。

參考答案:

pivot_table()。

;crosstab()。

;pivot()。

pandas讀取csv文件時可使用usecols參數指定某個列作為索引。()

參考答案:

pandas.DataFrame.sum(axis=1)表示對每行數據求和。()

參考答案:

unstack()可將列旋轉到行,從而將寬表變成長表。()

參考答案:

第四章測試

繪制折線圖時用label參數可為圖表添加圖例,但必須與()配合使用。

參考答案:

legend()。

關于注釋的說法中,正確的是()。

參考答案:

matplotlib.pyplot.text()主要用于無指向型注釋。

繪制折線圖的函數是()。

參考答案:

plot()。

在繪制兩組數據對比的柱形圖時,若希望兩組柱形并列顯示,應通過調整()實現。

參考答案:

參數x和width。

導入matplotlib的可行的做法是()

參考答案:

importmatplotlib.pyplotasplt()。

;importmatplotlib.pyplot。

;frommatplotlibinmportpyplot。

關于雷達圖繪制,正確說法的有()。

參考答案:

使用polar()繪制極坐標系,然后用plot()繪制雷達圖時無需閉合數據。

;xticks()可用來設置弧度信息。

;直接使用polar()繪圖時需使用np.concatenate()使數據閉合。

關于箱線圖繪制,正確說法的有()。

參考答案:

參數whis用于指定上下須與上下四分位的距離,默認為1.5倍的四分位差。

;參數sym用于指定異常點的形狀,默認為+號顯示。

fontdict是用來設置字體屬性的字典型參數。()

參考答案:

bar()函數可通過參數bottom選擇水平/垂直的柱形條的繪制方式。()

參考答案:

氣泡圖本質上仍屬于散點圖。()

參考答案:

第五章測試

兩個變量y與x的回歸模型中,通常用R方來刻畫回歸效果,則正確的敘述是()。

參考答案:

R方越小,殘差平方和大。

如果擬合曲線幾乎通過了所有實測數據點,很有可能出現的現象是()。

參考答案:

過擬合。

以下()是線性回歸方程參數求解常用的方法。

參考答案:

梯度下降法。

線性回歸模型中的損失函數用來估量預測值與()的差異程度。

參考答案:

真實值。

與梯度下降法相比,當輸入變量k較大時,正規方程法求解參數的速度要更慢。()

參考答案:

梯度下降法需要選擇學習率,需要多次迭代求解參數。()

參考答案:

參考答案:

;;

第六章測試

有關聚類分析說法錯誤的是()。

參考答案:

聚類分析無法提取樣本特征

下面算法中,算法分析是建立在凸球形的樣本空間的是()。

參考答案:

凝聚聚類算法

;K中心點算法

;K-means

輪廓系數只能用于K-means算法的評估。()

參考答案:

DBSCAN算法對參數敏感。()

參考答案:

凝聚聚類分析是一種自底向上的聚類分析算法。()

參考答案:

關于K-means聚類說法正確的是()。

參考答案:

K-means需要事先指定K的數目

;K-means實現采用的是貪心策略

;K-means的聚類中心是聚類中心的均值

K中心點算法是異常值敏感的聚類算法。()

參考答案:

K-means算法是異常值敏感的聚類算法。()

參考答案:

下面哪一個算法不是聚類分析算法()

參考答案:

KNN

聚類分析的相似性度量方法,以下哪種方法只考慮了變量之間的方向()

參考答案:

第七章測試

Logistic回歸分析屬于()回歸

參考答案:

非概率型線性回歸

C4.5決策樹構造算法的特征選擇采用()

參考答案:

信息增益

關于樸素貝葉斯分類器,正確的有()

參考答案:

所謂“樸素”假設,即是樣本特征(屬性)的條件獨立假設

;是一種概率分類器

;利用貝葉斯公式將樣本屬于某個類別的概率轉換為后驗概率來計算

支持向量機SVM算法采用的損失函數是()

參考答案:

鉸鏈損失函數

支持向量機分類器求解方法有()

參考答案:

內點法

;隨機梯度下降

;序列最小優化

第八章測試

以下關于Boosting和Bagging說法正確的是()。

參考答案:

Bagging可以用來減小方差

一般情況,在個體學習器性能相差較大時宜使用()結合策略。

參考答案:

加權平均法

集成方法是并行集成方法。()

參考答案:

集成學習只對大規模的數據集有較好的策略。()

參考答案:

以下哪些方法可以減少過擬合(

參考答案:

使用集成學習方法;

降低模型復雜度;正則化;增加更多數據

第九章測試

關于多層感知機的說法正確的是()。

參考答案:

多層感知機是前饋型神經網絡

多層感知機神經網絡的輸入層有2個輸入特征,隱藏層有3個神經元,輸出層有2個神經元,則該網絡中共有多少個參數()。

參考答案:

17

梯度下降是神經網絡參數學習中的一種方法。()

參考答案:

參考答案:

循環神經網絡不具有參數共享性。()

參考答案:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論