




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
試卷科目:人工智能自然語言技術練習人工智能自然語言技術練習(習題卷15)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然語言技術練習第1部分:單項選擇題,共45題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.線性回歸使用的目標函數是以下哪個A)信息增益B)信息熵C)交叉熵D)均方誤差答案:D解析:[單選題]2.不屬于常用的正則表達式函數的是()。A)matchB)searchC)findallD)matplotlib函數答案:D解析:[單選題]3.語言就是()A)句子的集合B)產生式的集合C)符號串的集合D)句型的集合答案:A解析:[單選題]4.基于直方圖的稀疏特征優化多線程優化。是以下哪個框架做的優化A)LightGBMB)XGBoostC)隨機森林D)GBDT答案:A解析:[單選題]5.TF-DF算法的主要思想是()A)字詞的重要性隨著它在文檔中出現次數的增加而上升,隨著它在語料庫中出現頻率的升高而下降B)字詞的重要性隨著它在文檔中出現次數的增加而下降,隨著它在語料庫中出現頻率的升高而下降C)字詞的重要性隨著它在文檔中出現次數的增加而下降,隨著它在語料庫中出現頻率的升高而上升D)字詞的重要性隨著它在文檔中出現次數的增加而上升,隨著它在語料庫中出現頻率的升高而上升答案:A解析:[單選題]6.貝葉斯定理實質上是對()的陳述。A)聯合概率B)邊際概率C)條件概率D)后驗概率答案:C解析:[單選題]7.XGBoost雖然是在GBDT的基礎上進行的改進但是它可以吧哪些方面發揮到極致A)速度B)代價C)準確率D)以上都是答案:A解析:[單選題]8.結構化數據是()?A)數據庫中的數據B)HTML文檔C)文本D)圖片答案:A解析:[單選題]9.特征的歸一化屬于以下哪個選項中A)特征工程B)分類C)回歸D)聚類答案:A解析:[單選題]10.使用word2vec后會得到的是___?A)得到的是一個向量空間,相似的詞之間距離小,不想近的詞之間距離大B)一個句子出現的概率C)得到一個詞出現的概率D)以上都不是答案:A解析:[單選題]11.下面哪個選項說的不是Batch歸一化的作用A)減少了隱藏值分布變化的數量B)減少了輸入值改變的問題C)有輕微的正則化效果D)增加了輸入值改變的問題答案:D解析:[單選題]12.在Katz回退算法中,將從非零計數中減去的計數量分配給A)計數為零的高元語法B)所有零概率事件C)未知事件D)A和C答案:A解析:[單選題]13.CRF又叫什么A)拉索回歸B)支持向量機C)隱馬爾科夫D)條件隨機場答案:D解析:[單選題]14.EM算法,什么是EM,最大期望算法A)是在概率模型中尋找參數最大似然估計或者最大后驗估計的算法,其中概率模型依賴于無法觀測的隱性變量。B)自變量和因變量之間的關系C)找出最優超平面進行分類D)不確定答案:A解析:[單選題]15.Bagging在做分類的Voting過程中(每個基學習器進行投票)如何做的A)每個基學習器預測結果進行平均B)每個基學習器預測結果進行投票,得票數最多的類為預測類C)從眾多分類結果中,隨機出來一個結果D)不去定答案:B解析:[單選題]16.tf.to_double的作用?A)將張量轉換為float64類型B)轉為32位整型-int32C)轉為64位整型-int64D)字符串轉為數字答案:A解析:[單選題]17.在以下四個選項中,可以將高級語言程序設計語言源程序翻譯成計算機可執行代碼的軟件是?A)匯編程序B)編譯程序C)管理程序D)服務程序答案:B解析:[單選題]18.ELMO是一種什么樣的模型A)語言模型B)基于神經網絡的語言模型C)基于統計的語言模型D)預訓練語言模型答案:D解析:[單選題]19.SVM和LR都可以做分類,那么有什么異同點A)都屬于分類算法B)SVM通過超平面來劃分,進行分類C)LR通過計算樣本屬于哪個類別的概率進行分類D)都屬于回歸算法答案:D解析:[單選題]20.L1正則的特點是:A)A:各個參數的平方和B)B:是模型參數中非零參數的個數C)C:各個參數絕對值之和D)D:以上都不對答案:C解析:[單選題]21.多層長短期記憶人工神經網絡LSTM,組合成多層網絡結構后,可以處理更大范圍的()A)不穩定性B)靜態性C)動態性D)魯棒性答案:C解析:[單選題]22.以下哪一個不是知網描述的關系A)上下位關系B)實體-值關系C)實體-屬性關系D)反義關系答案:C解析:[單選題]23.關于梯度下降最優化方法,以下描述正確的是A)一般情況下不能保證得到全局最優解B)梯度下降速度最快C)目標函數是非凸集,梯度下降的解是最優解D)思想簡單,實現困難答案:A解析:[單選題]24.下面哪個不是編輯距離里的編輯操作A)刪除B)替換C)添加D)相乘答案:D解析:[單選題]25.用戶希望對以下這句話進行預測?我的祖國是中國,我的母語是?,則應該采用以下哪種神經網絡結構進行處理?A)多層感知機B)生成對抗網絡C)循環神經網絡D)卷積神經網絡答案:C解析:[單選題]26.貝葉斯作為常用的理論基礎,它的定理實質上是對()的陳述。A)聯合概率B)邊際概率C)條件概率D)后驗概率答案:C解析:[單選題]27.以下歸一化的描述,正確的是()A)通過中值和均值進行確定B)通過平均值和最小值確定C)通過方差和均值確定D)通過標準差和均值確定答案:C解析:[單選題]28.我們知道在概率圖中有很多的節點,這些節點分別有什么意義A)隨機變量B)關系C)代價D)學習率答案:A解析:[單選題]29.SVM中,若C趨于無窮,以下哪種說法正確?A)數據仍可正確分類B)數據無法正確分類C)不確定D)以上都不對答案:A解析:[單選題]30.tf.mul的作用是什么A)相乘B)相加C)相減D)相除答案:A解析:[單選題]31.下列不是自然語言處理中用到的知識的是()。A)語音學知識B)詞法學知識C)漢語學知識D)話語學知識答案:C解析:[單選題]32.MSE代表什么意思A)信息熵B)均方誤差C)交叉熵D)信息增益答案:B解析:[單選題]33.以下哪種不是文法的表示類型?A)無約束短語結構文法B)上下文有關文法C)上下文無關文法D)反則文法答案:D解析:[單選題]34.以下有關文本分詞的說法正確的是哪個?()A)英文文本不需要分詞。B)分詞算法都需要一個詞典。C)基于統計的分詞方法的性能與訓練語料庫的質量密切相關D)分詞合適與否不會引起句子的歧義答案:C解析:[單選題]35.RNN經典結構的輸人和輸出的序列長度為()。A)多對一~B)一對多C)等長的多對多D)非等長的多對多答案:C解析:[單選題]36.什么是貝葉斯的決策,如何去理解A)就是判斷自變量和因變量之間的關系B)就是在不完全情況下,對部分未知的狀態用主觀概率估計,然后用貝葉斯公式對發生概率進行修正,最后再利用期望值和修正概率做出最有決策。C)不確定D)就是通過選擇最優的超平面去進行最好的分類超平面答案:B解析:[單選題]37.構建或研究語料庫的時候,一般應考慮代表性、結構性、平衡性、()4個特性。A)規模性B)便捷性C)安全性D)高效性答案:A解析:[單選題]38.m階馬爾可夫心愿的狀態是指A)某個信源符號B)m個隨機狀態的某個具體消息C)某一轉移概率D)狀態轉移圖答案:D解析:[單選題]39.直方圖算法,其算法中有一個參數:K,K代表的是什么意義A)代價B)常數C)學習率D)不確定答案:B解析:[單選題]40.語料庫研究屬于()A)實驗研究B)非實驗研究C)田野研究D)化學研究答案:B解析:[單選題]41.ReinforcementLearning是什么網絡A)全連接網絡B)遷移學習C)循環神經網絡D)強化學習答案:D解析:[單選題]42.NLP中CBOW也有很多的應用,下邊關于CBOW說法正確的是A)使用中心詞預測上下文單詞B)與上下問的詞序是相關的C)和Skip-Gram是相同的D)使用上下文單詞預測中心詞答案:D解析:[單選題]43.TextRank是由__演變而來的A)TextrnnB)PageRankC)fastTextD)TextCNN答案:B解析:第2部分:多項選擇題,共21題,每題至少兩個正確答案,多選或少選均不得分。[多選題]44.XGBoost的目標函數由哪些組成A)損失函數B)正則項C)梯度下降D)以上都正確答案:AB解析:[多選題]45.以下幾個選項中,哪些可以用邏輯回歸算法去完成A)電影票房的預測B)垃圾郵件的分類C)房價的預測D)情感分類答案:BD解析:[多選題]46.下面對專家系統敘述錯誤的是:()A)專家系統是運用知識和推理來解決問題的;B)專家系統是把關于問題求解的知識隱含于程序中的;C)專家系統不具有透明性,無法回答用戶?Why?和?How?等問題;D)利用骨架系統開發專家系統,相對于其他開發工具,其效率是最高的,靈活性是最好的,局限性也是最少的。答案:BCD解析:[多選題]47.GPT的缺點有哪些A)適用雙向的LSTM特征提取能力弱B)使用了單向的語言模型C)使用單向的Transformer,會丟失很多信息D)不確定答案:BC解析:[多選題]48.以下哪些是卷積神經網絡的內容A)卷積B)池化C)循環神經結構D)以上都不對答案:AB解析:[多選題]49.N-gram對NLP中的什么任務有不錯的效果A)中文詞性標注B)中文分詞C)中文文本分析D)以上都正確答案:ABCD解析:[多選題]50.下列選項中,關于數據歸一化描述正確的有哪些?A)更容易收斂得到最優解B)權重值較小C)權重值大D)無特點答案:AB解析:[多選題]51.LightGBM有什么優點A)速度快B)支持分布式C)占用內存小D)代碼清晰易懂答案:ABCD解析:[多選題]52.神經網絡中最常用的Dropout,可以起到什么作用A)防止過擬合B)每次訓練,都對每個神經網絡單元,按一定概率臨時丟棄C)將詞向量化D)防止欠擬合答案:AB解析:[多選題]53.Transformer中的decode層是由那幾個構成的A)self-AttentionB)Attention層C)前饋神經網絡D)CNN答案:ABC解析:[多選題]54.以下概率圖模型分類正確的是A)有向圖:貝葉斯網絡B)有向圖:馬爾可夫隨機場C)無向圖:貝葉斯網絡D)無向圖:馬爾可夫隨機場答案:AD解析:[多選題]55.softmax函數的描述以下正確的是哪些選項?A)用于多類別分類B)映射到概率空間C)壓縮數據D)用于卷積層答案:ABC解析:[多選題]56.神經網絡一般包括哪幾層A)輸入層B)隱藏層C)輸出層D)以上都包括答案:ABCD解析:[多選題]57.深度學習文本分類方法有哪些A)特征工程B)TextCNNC)分類器D)FastText答案:BD解析:[多選題]58.梯度消失對于模型的訓練非常重要,會造成模型學不到新的東西。下列說法中,關于其描述正確的選項都有哪些?A)梯度消失對神經網絡無影響B)可以通過激活函數防止梯度消失C)盡量避免梯度消失D)梯度消失反向傳播時,由于梯度值過小或消失的現象答案:BCD解析:[多選題]59.采用EM算法求解的模型有哪些A)混合高斯B)協同過濾C)k-meansD)以上都正確答案:ABCD解析:[多選題]60.神經網絡一般是由多層構成的一個網絡,一般分別由哪些層構成A)隱藏層B)輸入層C)輸出層D)不確定答案:ABC解析:[多選題]61.長短期記憶網絡的門指哪幾項A)輸入門B)遺忘門C)輸出門D)更新門答案:ABC解析:[多選題]62.語料庫的規模取決于()A)語料獲取的可能性B)語料加工的深度C)語料加工能力D)語料成分集合的大小答案:ABCD解析:[多選題]63.DataFrame類型可以由如下類型創建:A)A:二維ndarray對象B)B:由一維ndarray、列表、字典、元組或Series構成的字典C)C:Series類型D)D:其他的DataFrame類型答案:ABCD解析:[多選題]64.語料庫的用途有()A)用于語言研究B)用于編纂工具參考書籍C)用于語言教學D)用于NLP答案:ABCD解析:第3部分:判斷題,共24題,請判斷題目是否正確。[判斷題]65.情感分類主要用于判別自然語言文字中表達的觀點、喜好以及與感受和態度等相關的信息。對A)正確B)錯誤答案:對解析:[判斷題]66.在LSTM中常用的激活函數有sigmoid和tanhA)正確B)錯誤答案:對解析:[判斷題]67.特征歸一化為了消除數據特征之間的量綱影響A)正確B)錯誤答案:對解析:[判斷題]68.NLTK的fdist.plot函數可繪制指定的常用詞累計頻率圖。對A)正確B)錯誤答案:對解析:[判斷題]69.jieba分詞支持精確模式、全模式和搜索引三種模式。對A)正確B)錯誤答案:對解析:[判斷題]70.NNLM和N-Gram是完全相同的A)正確B)錯誤答案:錯解析:[判斷題]71.常用的損失函數之后均方誤差MSEA)正確B)錯誤答案:錯解析:[判斷題]72.SVM既可以做分類也可以做回歸A)正確B)錯誤答案:對解析:[判斷題]73.上下文無關文法(2型)的規則體系便于構造,是研究得最多的一種文法A)正確B)錯誤答案:對解析:[判斷題]74.分布式表示將每個詞根據上下文從高維空間映射到一個低維度、稠密的向量上。對A)正確B)錯誤答案:對解析:[判斷題]75.在做NLP任務的一系列任務時,通常要做去停用詞的處理,否者效果可能就不會很好A)正確B)錯誤答案:對解析:[判斷題]76.Doc2vec不僅提取文本的語義信息,而且提取了文本的語序信息。對A)正確B)錯誤答案:對解析:[判斷題]77.機器學習算法=模型表征+模型評估+優化算法。A)正確B)錯誤答案:對解析:[判斷題]78.感知機和深度學習的神經網絡是相同的A)正確B)錯誤答案:錯解析:[判斷題]79.支持向量機是聚類算法,同時他也可以做分類A)正確B)錯誤答案:錯解析:[判斷題]80.基于情感詞典的情感分析需要找出文檔中的情感詞、否定詞和程度副詞。對A)正確B)錯誤答案:對解析:[判斷題]81.HAL是一個具有高級語言處理能力,并且能夠理解漢語和說漢語的智能計算機。()A)正確B)錯誤答案:錯解析:[判斷題]82.LSA使用到的就是共現矩陣A)正確B)錯誤答案:對解析:[判斷題]83.當數據輸入到決策樹中前,必須要做特征工程A)正確B)錯誤答案:錯解析:[判斷題]84.深度學習是一種隨著經驗積累、自動提高性能、完成特定任務的計算機程序A)正確B)錯誤答案:錯解析:[判斷題]85.GBDT每輪迭代的時候,都去擬合損失函數在當前模型下的負梯度。A)正確B)錯誤答案:對解析:[判斷題]86.基于規則的分詞能夠較好地處理未登錄詞和歧義詞,不需要人為的搭建和維護詞典。錯A)正確B)錯誤答案:錯解析:[判斷題]87.LR能以概率的形式輸出結果,而非只是0,1判定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 種子批發市場客戶關系維護與提升考核試卷
- 取暖初二語文作文
- 看花燈初三語文作文
- 發酵豆醬的抗氧化能力研究考核試卷
- 生態系統穩定性監測與預警考核試卷
- 水電工程案例分析與啟示考核試卷
- 煤炭批發市場供需平衡分析考核試卷
- 2-15邏輯函數的化簡-卡諾圖法4
- 山西農業大學《統計學B》2023-2024學年第二學期期末試卷
- 麗江文化旅游學院《數據描述與可視化》2023-2024學年第二學期期末試卷
- 電商行業10萬字PRD
- 2024-2025學年八年級下學期道德與法治期中模擬試卷(一)(統編版含答案解析)
- 防溺水工作布置教師會議上校長講話:全力防溺水守護學生生命“生命線”
- 高一下學期《雙休時代自由時間背后暗藏殘酷篩選+你是“獵手”還是“獵物”?》主題班會
- 湖南省永州市祁陽市茅竹鎮中心學校2024-2025學年下學期期中監測八年級下冊《物理》試卷(含答案)
- 交互式影像中敘事與視覺表達的融合及其觀眾體驗研究
- 情緒的管理課件
- 重難點05 涉及二次函數的圖形變化類問題與二次函數有關的創新類問題(2種命題預測+77種題型匯-總+專題訓練+3種解題方法)(解析版)
- 江蘇省外國語學校2024-2025學年度高二下學期期中考試歷史試題
- 精神分裂癥個案護理匯報
- 胰島素皮下注射團體標準
評論
0/150
提交評論