機器學習 試卷2套_第1頁
機器學習 試卷2套_第2頁
機器學習 試卷2套_第3頁
機器學習 試卷2套_第4頁
機器學習 試卷2套_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

試卷1填空題(每空1分共20分)機器學習通常是指:為完成某種任務,給定訓練集D,在性能測度P指導下,通過學習獲得一個被稱為模型的映射函數。獲取模型參數是機器學習訓練階段的一個主要目的。機器學習根據訓練集樣本是否標注分為監督學習、弱監督學習和無監督學習。損失函數或代價函數是指在訓練階段基于訓練集D,用來衡量模型預測值yn與真實值yn之間的差異性的一個關于模型參數原始數據樣本集可能出現離群點、數據丟失和屬性量綱不一致情況。不同于遵循奈奎斯特定理的采樣,壓縮采樣則是采用低于奈奎斯特頻率的采樣。給定樣本集D,估計概率密度函數px|?的參數?,通常有極大似然估計分類樣本數量越多,近鄰分類器復雜度越大。利用kd樹可以省去對大部分樣本的搜索,從而減少計算量加速近鄰樣本搜索。嶺回歸是在線性回歸基礎之上,增加了正則項,γw集成學習主要有裝袋、提升和堆疊三類學習機制。ID3采用信息增益選擇屬性,而C4.5采用信息增益比選擇屬性。聚類算法中,確定類簇中心的方法主要有兩種:基于均值的類簇中心和基于密度的類簇中心。從結構上,概率圖模型可表示成有向概率圖和無向概率圖。人工神經元基本模型線性變換和激活模擬了神經元樹突與上一級神經元突觸的連接強度和動作電位。利用反向傳播訓練前饋神經網絡需要計算兩個梯度:?L?尺寸為5×4圖像采用Convn,k,c,s,p,q選擇題(每小題2分共20分)分界線正例反例圖分界線正例反例圖選擇題2如右圖的二類分類結果,計算檢測正例的準確率(D)A.0.90;B.0.75;C.0.45;D.0.818處理量綱不一致問題通常利用屬性值均值和(C)進行歸一化。μ=1NμiC.σD.σ如果有10類,每類20個樣本(每個樣本的原始數據是1000維屬性向量),采用PCA降維,降維后屬性向量維度上限是(B)A.1000;B.199;C.10;D.19設有C個類別,Y=1,…,c,…,C,給定一個未知類別的樣本xn和一種相似度度量。kc為以樣本xnA.yn=argmaxc∈Ykc在原樣本空間中線性不可分問題,SVM(C)。A.無法處理;B.在原空間中尋找線性函數劃分數據;C.采用核函數將樣本映射到核空間后,再進行分類,即KSVMD.在原空間中尋找非線性函數的劃分數據;下列哪種不是決策樹(A)A.KD樹;B.CART樹;C.ID3樹;D.C4.5樹在平面上兩點:A0,0,B(4,3),A.4;B.3;C.5;D.7cabbbba(b)cabbba(b)(c)(d)結點類型caccbaA.(a);B.(b);C.(c);D.(d)Q-learning算法中,Q函數是是(A)A.狀態-動作價值函數;B.狀態函數;C.策略函數;D.獎勵函數是非題(每小題1分共10分)最小二乘法因為通過列方程求解閉合解,所以適合于大數據集。(×)在樣本表征值的空間分布上,類內距離越小和類間距離越大,越有利于實現模式分類。(√)加權最近鄰分類器中的w1,w二分類超平面的梯度,?fx;w?SVM尋找具有最小邊緣的超平面,也被稱為最小間隔分類器。(×)表征學習主要目的是對屬性向量進行降維,核方法則是對線性不可分的樣本屬性向量進行升維。(√)在Adaboost算法訓練階段,可以隨機生成初始化權向量,不需要進行歸一化處理。(×)前饋神經網絡實際上是多隱含層的感知機。(√)在DQN中,求解Q(s,a)時采用的決略時優先采樣(s,a),并通過采樣值估計Q(s,a)。(√)Actor-Critic是一種以價值強化學習和基于策略強化學習為基礎的結合體。(√)20214320214365871091211141316152443658710912111413161521436587109121114131615(10分)設有如右圖所示的10張圖像,請用PCA算法對其進行表征學習,列出其詳細過程。參考答案:第一步,將二維圖像一維化,x第二步,構建數據矩陣Z第三步,計算協方差矩陣S=第四步,對S進行奇異值分解,獲得特征值和對應特征向量,λw第五步,保留前l個最大特征值對應的特征向量,構成映射矩陣,W=(8分)簡答:說說層次聚類中的兩種劃分策略:自底向上的凝聚策略和自頂向下的分拆策略。答:凝聚策略初始時將每個樣本點當做一個類簇,然后依據相似度準則合并相似度最大的類簇,直到達到終止條件。分拆策略初始時將所有的樣本歸為一個類簇,然后依據某種相似度準則找出簇中最不相似的兩個樣本xi和xSIDEGSIDEGIDIDSEGfffffIDSEGfff(10分)用錯誤驅動法學習用于實現與非門的單層感知機參數,y參考答案:213547681092135476810912111413請計算:(1)概率p6,左|5,p6,(2)當狀態價值初始值為零時,計算第1次。解:(1)p6,左|5=0,(2)Vk=0,0.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.0設γ=1k=-1-1-10.0-1-1-1-1-10.0-1-1-1-1-1-1-1V

試卷2填空題(每空1分共20分)屬性又稱為特征,由特征值構成的向量描繪數據的特性,可以分為連續和離散兩種。盡管機器學習任務多種多樣,但機器學習還是可以歸納成分類和回歸兩種基本任務。目標函數是在代價函數基礎之上,加上約束項而建立起來的關于模型參數的函數。表征學習的目的通常是將高維屬性向量經某種變換映射成低維屬性向量,要求:降維前后樣本間的位置關系保持不變。重構稀疏信號的算法有匹配追蹤、正交匹配追蹤和基追蹤等。與嶺回歸區別在于:Lasso回歸用γw11代替對于近似線性可分類,SVM的超平面到決策平面的間隔稱為軟間隔。自助采樣法每次從訓練集D隨機抽一個樣本,然后放回去再抽取。CART決策樹采用基尼指數劃分屬性。在聚類算法中,常用的距離測度是歐氏距離、曼哈頓距離、閔可夫斯基距離和值差異度量。隱馬爾科夫模型和貝葉斯網絡是屬于有向概率圖模型。概率無向圖模型中,條件獨立性有三種形式:全局馬爾可夫性、局部馬爾可夫性和成對馬爾可夫性。y=sigmx=11+強化學習中有三個要素:狀態、動作和獎勵。時序差分學習TD(0)表示向前一個狀態近似計算G選擇題(每小題2分共20分)在多類分類任務,預測值通常通過softmax(y分界線正例反例圖選擇題分界線正例反例圖選擇題2A.0.90;B.0.818;C.0.85;D.0.105如果有10類,每類20個樣本(每個樣本的原始數據是1000維屬性向量),采用LDA降維,降維后屬性向量維度上限是(C)A.1000;B.199;C.9;D.19在表征學習算法中,(D)上被用來展示高維樣本數據的分布情況。A.PCA;B.LDA;C.流形學習;D.t-SNE。壓縮感知理論中,構建或學習字典是一個關鍵環節,其中學習算法很多,其中之一是(A)A.k-SVD;B.LDA;C.OMP;D.MP。設二類分類任務的超平面為w0+w1x1+wA.z=wxnx12C.z=x12+x22+?xd徑向基函數(RadialBasisFunctions,RBF)的公式是(D)A.B.C.D.Adaboost算法中,通過下式計算對某樣本關注度系數,β下列說法不正確的是(C)βt,n與弱分類器如果樣本xn被性能優良的htxn如果樣本xn被性能優差的htxn如果樣本xn被性能優差的htxnx3x1x5xxxxxxx1x2x5xSwish激活函數的表達式(C)A.B.C.D.是非題(每小題1分共10分)在訓練過程中,梯度消失和梯度爆炸都是應該盡量避免的現象。(√)學習率是一個可以動態調整的參數,所以不是超參數。(×)流形學習是一種非線性降維算法。(√)在SVM,位于邊界的正類樣本點為支持向量,而負類樣本點則不是。(×)不增加模型參數,將訓練樣本屬性向量從低維空間非線性映射到高維空間,然后在高維空間學習線性模型,這是核方法的基本思路。(√)決策樹是一種具有樹形結構的非參數監督學習,只能用于分類。(×)集成學習算法中,弱分類器數目越多,整體分類器性能越好。(×)召回率在聚類算法中用來衡量聚類的完整性。(×)感知機學習算法是一種錯誤驅動學習算法.(√)反向傳播只能用于訓練前饋神經網絡,而不能訓練卷積神經網絡。(×)綜合應用題(共50分)(12分)用四個等級衡量學生課后花在《機器學習》上的時間“很少(低于30小時)、較少(介于31-60)、正常(介于61-100)和熱愛(大于100)”。屬性變量x=很少,較少,正常,熱愛,用《機器學習》課程考試2個等級作為類別表1考試情況表隨機變量x很少較少正常熱愛人數153424用功概率分布,P(x)0.010.530.420.04及格優秀及格優秀及格優秀及格優秀103023152704優秀類概率分布,P(x|0.000.430.500.07及格類概率分布,P(x|0.020.650.330.00八戒,屬于較少花時間,P先驗概率:Py=優秀P(12分)設有一個由13個樣本點組成二維樣本集,X={-試構建該樣本集的kd樹。(8分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論