2024年人工智能訓練師(初級)職業鑒定理論考試題庫及答案_第1頁
2024年人工智能訓練師(初級)職業鑒定理論考試題庫及答案_第2頁
2024年人工智能訓練師(初級)職業鑒定理論考試題庫及答案_第3頁
2024年人工智能訓練師(初級)職業鑒定理論考試題庫及答案_第4頁
2024年人工智能訓練師(初級)職業鑒定理論考試題庫及答案_第5頁
已閱讀5頁,還剩125頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGEPAGE12024年人工智能訓練師(初級)職業鑒定理論考試題庫及答案一、單選題1.下列關于語音標注注意事項描述錯誤的是()。A、背景噪音過大的,需標為無效B、語音標注過程最好使用降噪耳機C、確定標注文件中是否包含有效語音D、帶有口音的內容,需標為無效答案:D2.數據清洗的基本流程中糾正發現的錯誤的操作不包括()。A、確認并改正B、屬性分離C、定義數據清洗策略D、標準化答案:C3.數據標注可依照標注的構成形式進行分類,下列不屬于其分類的是()。A、結構化標注B、文本標注C、非結構化標注D、半結構化標注答案:B4.以下對于Excel基本操作的說法正確的是()。A、Excel單元格的缺省字體中文為“宋體”,英文為“TimeNewRoman”B、Excel無法設置單元格邊框線的粗細C、在Excel中文字數值類型的水平對齊方式默認為右對齊D、在Excel中字符類型的水平對齊方式默認為右對齊答案:D5.下列不屬于數據標注圖像處理工具的是()。A、BitEdit處理軟件B、Nuendo處理軟件C、PalEdit處理軟件D、Convert處理軟件答案:B解析:Nuendo是音頻制作軟件6.下列關于數據集劃分后,各數據集對應作用描述正確的是()。A、測試集用來查看訓練效果的B、驗證集是用來測試模型的實際學習能力的C、訓練集是用來訓練算法模型的D、分析集是用來分析模型運算情況答案:C解析:測試集用來檢驗最終選擇最優的模型的性能如何7.以下關于數據清洗中重復數據的處理方法,描述不正確的選項是()。A、在數據庫中,對于屬性值相同的記錄,可以將其看作是重復記錄數據,相等的記錄可以合并為一條記錄B、合并或消除是處理重復數據的基本方法C、重復數據檢測主要分為基于字段和基于記錄的重復檢測D、對于屬性值相同的記錄一般是將它們的記錄時間進行修改以進一步區分答案:D8.下列關于大規模非結構化數據存儲的描述錯誤的是_____。A、非結構化數據沒有預定義的模型B、文本、圖片和音頻屬于典型的非結構化數據C、非結構化數據適用于關系型數據庫存儲D、大規模的非結構化數據存儲需要使用非關系型數據庫答案:C9.以下對遵紀守法的意義敘述錯誤的是()。A、遵紀守法可能導致社會混亂和動蕩B、遵紀守法是社會活動的基本準則C、遵紀守法是公平和正義的基石D、遵紀守法有助于建立社會信任答案:A10.數據倉庫中基于數據源的“臟”數據質量問題可分為兩類,即()。A、單因素數據源和多因素數據源問題B、單構數據源與異構數據源問題C、單數據源問題和多數據源問題D、單階數據源問題和多階數據源問題答案:C11.下列不屬于ETL(數據倉庫技術)常用的數據加載方法是()。A、旁路加載B、全量加載C、增量加載D、批量加載答案:A12.下列屬于數據標注文本處理工具的是()。A、PalEdit編輯器B、EmEditor編輯器C、GoldWave編輯器D、AdobeAudition編輯器答案:B13.以下對Windows10文件資源管理器文件夾選項操作描述正確的是()。A、默認情況下文件資源管理器左側有【用戶文件夾】項目B、默認情況下文件資源管理器左側有【回收站】項目C、在Windows10中,文件資源管理器默認打開【快速訪問】窗口D、可以通過訪問【文件夾選項】選項下的【搜索】選項卡設置“顯示所有文件夾”答案:C14.數據采集時,應當注意的事項包含:()、采集質量。A、深度理解、及時溝通B、深度理解、建立采集規范C、建立規范、及時去重D、及時溝通、及時去重答案:A15.以下關于Windows10“郵件”應用的操作的說法正確的是()。A、“郵件”應用無法設置個性化界面顏色B、“郵件”應用不可以自定義賬戶在應用中的名稱C、“郵件”應用可以通過【管理賬戶】選項添加郵件賬戶D、“郵件”應用發送郵件無法插入圖片、文件等附件答案:C16.介于完全結構化數據和完全無結構化數據之間的數據被稱為()。A、半結構化數據B、非結構化數據C、單結構化數據D、復雜結構化數據答案:A17.以下關于自然語言處理相關描述不正確的選項是()。A、自然語言處理的研究目的是實現自然語言通信的計算機系統B、自然語言處理是計算機科學領域與人工智能領域中的一個重要方向C、自然語言處理是一門機械工程學、計算機科學、數學于一體的科學D、自然語言處理研究的是人與計算機之間用自然語言進行有效溝通的各種理論和方法答案:C18.在統計學中,用()去估計總體參數的過程稱為參數估計。A、樣本均值B、樣本中位數C、總體均值D、樣本統計量答案:D19.關于PowerBI(商業智能)連接數據庫并導入數據庫數據的過程,下列說法不正確的是()。A、在使用“DirectQuery”選項時,在每次查看數據時不需要每次手動刷新數據B、在使用“導入”選項時,PowerBI獲取最新數據后會斷開與數據庫連接C、在使用“DirectQuery”時,PowerBI不會將數據裝載到內部數據庫D、“DirectQuery”適用于數據經常更新的情況答案:D20.對于數據清洗方法,以下說法錯誤的是()。A、使用排序與合并是錯誤值的清洗方法之一B、數據缺失值的清洗方法主要分為忽略缺失值數據和填充缺失值數據C、使用簡單規則庫是錯誤值的清洗方法之一D、清洗重復值的方法主要有相似度計算和基于基本近鄰排序算法等方法答案:A21.()的道德準則強調避免傷害或侵犯他人權利。A、誠實與誠信B、肩負個人責任C、保證公共利益D、自由和尊重個人權利答案:D22.數據庫設計步驟依次是:系統需求的調查與分析、()。A、邏輯設計、概念設計、物理設計、實施與測試、運行維護B、物理設計、邏輯設計、概念設計、實施與測試、運行維護C、概念設計、邏輯設計、物理設計、運行維護、實施與測試D、概念設計、邏輯設計、物理設計、實施與測試、運行維護答案:D23.以下過程不屬于數據資源生命周期管理的是()。A、數據獲取B、數據利用C、數據加工D、數據決策答案:D24.對于常用的Excel函數,以下說法錯誤的是()。A、SUMIF函數用于多條件求和B、COUNTIFS用于多條件計數C、AVERAGEIFS用于多條件計算平均值D、LARGE函數用于計算第K個最大值答案:A解析:A范圍內求和25.()不是數據倉庫系統組成部分之一,但是在數據倉庫系統開發與應用中是出發點。A、存儲層B、分析工具層C、數據源D、定義層答案:C26.以下關于客服機器人的評價維度中業務識別率和準確率的說法錯誤的是()。A、業務識別率的定義是在整個人機對話中,被機器人識別為業務問題的數量占總提問數的比例B、在計算準確率時,回復是否正確可以由機器人進行判斷,無需人工介入C、業務識別率計算公式中的業務匹配數等于總提問數減去拒識問題數減去非業務回復數D、準確率=回復正確的對話數/考察范圍內的對話數答案:B27.以下關于Windows10常用輸入法基本設置操作的說法正確的是()。A、Windows10不允許安裝第三方輸入法B、Windows10可以通過【字體】選項設置微軟拼音輸入法按鍵C、Windows10可以通過【日期和時間】選項刪除輸入法D、使用Windows鍵+空格可以快速切換輸入法答案:D28.商用數據標注平臺對人臉標注建立可配置模板一般不需要考慮()。A、性別B、年齡類別C、人臉膚色D、說話聲音答案:D29.以下屬于商業智能(BI)核心作用的選項是()。A、數據的鉆取分析B、數據的自動標注C、取代傳統的數據報表分析D、濾除不符合要求的數據答案:A30.以下對于數據資源管理的意義描述不正確的是()。A、企業取得競爭優勢的關鍵B、解決企業內部數據不一致問題的根本途徑C、是幫助企業降本增效的唯一途徑D、是信息系統進入成熟階段的重要標志答案:C31.在SQL(結構化查詢語言)的基本功能中,對數據庫安全性和可用性的控制管理體現了SQL的()功能。A、數據操作B、數據定義C、數據控制D、數據建模答案:C32.對于數字可視化技術的定義和基本概念,以下說法不正確的是()。A、數據可視化中的數據開發是指利用一定算法和工具對數據進行定量的推演和計算B、數據可視化中的數據分析是指對多維數據進行切片、塊、旋轉等動作剖析數據C、數據可視化是利用數據分析和開發工具發現數據中已知信息的處理過程D、數據可視化中的數據空間是指由n維屬性和m個元素組成的數據集所構成的多維信息空間答案:C33.以下對于網絡運營者辦理入網手續時的要求的說法錯誤的是()。A、網絡運營者為用戶提供即時通訊服務不需要用戶提供身份信息B、網絡運營需要對用戶身份信息進行審核C、用戶不提供真實身份信息的,網絡運營者不得為其提供相關服務D、網絡運營者辦理入網手續時需要用戶提供真實身份信息答案:A34.以下關于SQL(結構化查詢語言)的相關操作,描述正確的選項是()。A、UPDATEXXXSETXXX的SQL操作可以實現數據庫字段的追加功能B、在SQL中,DELETE關鍵字被用在刪除表中的數據記錄的語句中C、定義SQL索引的時候關鍵詞ASC表示降序D、INSERTINTOXXXVALUESXXX操作是用來實現數據庫字段的更新功能答案:B35.從信息系統的發展過程來看,信息系統進入成熟階段的重要標志是()。A、數據資源有效管理B、數據采集技術的成熟C、由人工處理數據轉向計算機處理數據D、數據采集渠道的增加答案:A36.以下對于Windows10常用系統維護工具使用的說法正確的是()。A、【可靠性監視程序】只能用于監測系統中的軟件問題B、在命令行輸入eventvwr命令可以打開【事件查看器】C、使用Ctrl+Shift+Esc可以打開【資源查看器】D、在命令行輸入resmon命令可以打開【任務管理器】答案:B37.()是商用數據標注平臺不需要支持管理的數據來源。A、來自本地的文本數據集B、預訓練模型的結構與參數C、來自共享存儲的語音數據集D、來自云存儲的圖像數據集答案:B解析:二、判斷題38.以下關于Windows10文件管理器的基本操作描述錯誤的是()。A、文件資源管理器可以對文件搜索結果進行保存B、文件資源管理器可以對文件按照名稱進行分組C、在文件資源管理器窗口按Ctrl+A可以刪除文件或文件夾D、在文件資源管理器窗口按Ctrl+Shift+N鍵可以快速創建新文件夾答案:C39.數據倉庫的()特征體現在數據倉庫隨時間變化不斷增加新的數據內容,刪去舊的無用的數據內容。A、面向主題B、集成C、隨時間不斷變化D、不可更改答案:C40.以下關于客服機器人的評價維度中平均對話輪次的說法正確的是()。A、平均對話輪次是某類任務的對話中斷數占某類任務的對話總數的比例B、平均對話輪次衡量了產品推薦的精準度C、平均對話輪次衡量了客服機器人的對話流程健康度D、平均對話輪次是反饋給用戶的正確結果數占反饋結果總數的比例答案:C41.數據標注的正確流程為()、數據質檢。A、數據清洗、數據標注、數據采集B、數據標注、數據采集、數據清洗C、數據采集、數據標注、數據清洗D、數據采集、數據清洗、數據標注答案:D42.下列屬于常見的位圖圖像格式的是()。A、XML格式B、SVG格式C、JPG格式D、MP4格式答案:C43.數據抽取的數據源不包含()。A、Web數據B、文本數據C、圖層數據D、數據庫數據答案:C44.數據標注最常見的分類方法是根據待標注數據類型進行分類,下列不屬于其分類的是()。A、標注框標注B、文本標注C、視頻標注D、圖像標注答案:A45.以下關于Word的操作的說法錯誤的是()。A、Word可以通過【段落】選項進行字體設置B、Ctrl+E可以將段落進行中間對齊C、Word可以通過水平標尺的調整調節段落文字的縮進D、Word可以通過【插入】選項卡下的【符號】選項插入特殊符號答案:A46.從事數據標注需要了解其基本概念,下列關于其基本概念描述不正確的是()。A、標簽主要就是標識數據特征、類別和屬性等B、標注任務是指按個人對任務的理解對數據集進行標注的過程C、數據標注員負責對文本、圖像、語音、視頻等待標注數據進行歸類、整理、編輯、糾錯、標注和批注D、標注標注員負責對文本、圖像、語音、視頻等數據進行標注答案:B47.空缺值數據清洗分為三個步驟,步驟的順序為()。A、空缺值數據的處理、輸出完整數據、空缺值數據的檢測B、空缺值數據的檢測、空缺值數據的處理、輸出完整數據C、空缺值數據的處理、空缺值數據的檢測、輸出完整數據D、輸出完整數據、空缺值數據的處理、空缺值數據的檢測答案:B48.()是商業智能(BI)具備的功能。A、人工數據整理B、自動數據預處理C、制作自動化報表D、聯機事務處理答案:C49.數據清洗的基本流程一共分為5個步驟,下列不屬于數據清洗步驟的是()。A、數據分析B、數據合并C、干凈數據回流D、定義數據清洗策略與規則答案:B50.面向主題的、集成的、不可更改的、隨時間不斷變換的數據集合我們稱之為()。A、數據庫B、數據倉庫C、數據資源D、數據中心答案:B51.采集到的數據要進行質量檢查,同時也要注意數據采集的()和數據質量。A、可解釋度B、價值密度C、完整性D、時效性答案:D52.以下對于ETL(數據倉庫技術)增量加載與全量加載區別說法正確的是()。A、全量加載能夠將業務系統中的變化數據按一定的頻率準確地捕獲并加載到目標表中B、全量加載不會對業務系統造成太大的壓力C、增量加載相比全量加載技術實現更簡單D、增量加載不會影響現有業務答案:D53.根據預防系統藍屏的方法,以下做法不恰當的是()。A、系統能正常運行無需升級驅動、BIOS等軟件B、不需要定期對電腦進行病毒掃描C、定期對重要的注冊表文件進行備份D、在關機時要盡量通過系統的關機按鈕進行關機答案:B54.以下關于微軟edge瀏覽器操作的說法正確的是()。A、微軟edge瀏覽器的閱讀視圖無法調節頁面主題B、微軟edge瀏覽器的網頁筆記無法使用熒光筆C、微軟edge瀏覽器的標簽頁無法顯示網頁預覽D、微軟edge瀏覽器無法將網頁固定到【開始】菜單答案:C55.下列關于詞云圖的優點描述不正確的是()。A、用途范圍單一B、突出文本主旨C、過濾低頻文本信息D、提煉關鍵信息答案:A56.商業智能(BI)工具主要有兩種用途,分別是()。A、進行數據采集和進行聯機事務處理B、進行數據抽樣和進行可視化分析C、進行自動化報表的制作和進行可視化分析D、進行聯機事務處理和進行自動化報表的制作答案:C57.數據庫實體聯系(Entity-Relationship,E-R)模型需要轉化為()才能被數據庫管理系統所支持。A、物理結構B、邏輯模型C、外模式D、關系模型答案:D58.對于各種數據結構的存儲方式,以下說法錯誤的是()。A、財務系統的數據屬于大規模非結構化數據B、非結構化數據沒有預定義的模型C、MPP可以用來管理計算高質量的結構化數據D、采用MPP并行數據庫集群與Hadoop集群的混合可以實現對PB量級、EB量級數據的存儲和管理答案:A59.下列屬于常見的數據標注結果文件格式的是()。A、xls格式B、doc格式C、ra格式D、XML格式答案:D60.DB2數據庫系統屬于()。A、傳統的桌面數據庫系統B、面向對象數據庫系統C、流行的關系數據庫系統D、其他數據源答案:C61.在中文分詞技術中,搜索引擎模式是在精確模式的基礎上對長詞再次拆分提高()。A、召回率B、精準率C、精確率D、準確率答案:A62.()是PowerBI(商業智能)支持的自然語言查詢語言。A、英語B、西班牙語C、俄語D、漢語答案:A63.以下不屬于語音智能客服機器人的主要功能特點的選項是()。A、通過進行表情監測識別情緒變化B、人機協助C、智能意圖識別D、數據統計答案:A64.()不是進行系統備份的合適時機。A、安裝了重要軟件后B、對系統優化后C、進行可能損壞系統的操作前D、當系統感染計算機病毒后答案:D65.愛崗敬業的具體要求不包括()。A、樹立職業理想B、積極進行創新C、消極怠工D、強化職業責任答案:C66.下列關于相關分析的描述不正確的是()。A、相關分析是研究兩個或兩個以上處于同等地位的隨機變量間的相關關系的統計分析方法B、相關分析中所有的變量都必須是隨機變量C、相關分析中相關系數是確定的D、相關分析是研究從變量群中提取共性因子的統計技術答案:D67.下列關于圖像標框標注的質量標準相關內容描述正確的是()。A、標框的四周要與標注物最邊緣像素點誤差在3個像素以內B、標框標注的四周邊框需要覆蓋住標注物并且標注框需要貼合目標C、標框的四周要與標注物最邊緣像素點大于4個像素,圖片即為不合格D、標注物最邊緣像素點不需要進行判定答案:B68.以下對于系統藍屏可能的原因與解決方法說法錯誤的是()。A、一些計算機病毒會導致系統藍屏,可以使用殺毒軟件進行殺毒B、在硬件問題上可以檢查硬件是否插牢與是否出現氧化現象C、系統藍屏可以基本排除BIOS的問題D、某些硬件驅動不兼容也會發生藍屏錯誤,此時應進入安全模式將其禁用并安裝兼容的硬件驅動答案:C69.下列關于多重抽樣檢驗方法的的優缺點描述正確的是()。A、不能彌補其他檢驗方法的疏漏B、需要耗費大量人力精力集中進行C、能夠合理調配質檢員的工作重心D、能夠提高質檢員的工作效率答案:C70.在數據標注質量檢驗方法中,多重抽樣檢驗方法輔助實時檢驗第一階段數據全樣檢驗不合格,則第二階段()。A、質檢員繼續對標注員標注的數據進行全樣檢驗B、質檢員只需對標注員標注數據的25%進行檢驗C、質檢員只需對標注員標注數據的50%進行檢驗D、質檢員將不再對標注員標注的數據進行檢驗答案:A71.以下不屬于自然語言處理技術中中文分詞切分歧義類型的選項是()。A、嵌套型歧義B、交集型歧義C、混合型歧義D、組合型歧義答案:A72.下列不屬于文本標注需要注意的事項是()。A、嚴格的審核制度B、只能使用單一語言進行相關標注C、充分了解語言學D、迭代式標注答案:B73.以下關于Windows10網絡基本設置方法的說法正確的是()。A、一般情況下設置電腦的IP只需要設置IPv4協議版本的地址B、Windows10可以通過【時鐘與區域】功能設置IP地址與DNS地址C、Windows10只能手動設置IP地址D、Windows10只能手動設置DNS地址答案:A74.下列不屬于常見的圖像數據標注類型的是()。A、多邊形拉框B、OCR文本識別C、語義分割D、語音轉寫標注答案:D75.SQL(結構化查詢語言)具有(),用于對表和關系、索引、查詢的定義與維護。A、數據定義功能B、數據控制功能C、數據操作功能D、數據建模功能答案:A76.下列不屬于數據庫系統三級模式的是()。A、虛擬模式B、內模式C、外模式D、模式答案:A77.在數據預處理步驟中,數據歸約的作用是()。A、得到數據集的規約表示以減少數據量并且使規約前后結果幾乎相同B、將數據轉換為適用于數據挖掘的形式C、使數據格式標準化、清除異常數據、清除重復數據、錯誤糾正D、將多個數據源中的數據結合起來并統一存儲答案:A78.如圖所示的統計圖的可以用于()。A、展示數據的聚類分析結果B、展示公司年度各項支出額度C、比較多組數據隨時間變化的趨勢D、展示兩組數據之間的變化關系答案:B79.在數據預處理中,去除數據中的噪聲并將連續數據離散化的過程被稱為()。A、數據規范化B、屬性構造C、數據聚集D、數據平滑答案:D80.在數據標注質量檢驗方法中,多重抽樣檢驗方法輔助全樣檢驗第一輪數據抽樣檢驗全部合格,則第二輪()。A、抽樣檢驗的標注數據量較第一輪減少50%B、抽樣檢驗的標注數據量較第一輪減少30%C、抽樣檢驗的標注數據量較第一輪增加50%D、抽樣檢驗的標注數據量較第一輪增加30%答案:A81.在Excel中,TRIMMEAN函數的作用是()。A、按單個條件計算平均值B、計算算術平均值C、按多個條件計算平均值D、計算內部平均值(修剪平均值)答案:D82.下列不屬于數據倉庫的數據質量評價指標的是_____。A、差異性B、適用性C、完整性D、準確性答案:A83.非結構化數據可以使用()進行存儲。A、結構化數據庫B、多結構化數據庫C、非結構化數據庫D、半結構化數據庫答案:C84.()不是數據標注質量實時檢驗方法的優點。A、及時發現問題并解決問題B、有效減少標注過程中重復錯誤的重復出現C、提高數據質檢員的工作效率D、提高數據質檢員的工作效率答案:D85.以下不屬于云存儲模式組織框架的是()。A、數據通信層B、基礎管理層C、存儲層D、應用接口層答案:A86.在Excel中,()可以完成多區間的判斷。A、COUNT函數B、RANK函數C、IFS函數D、MATCH函數答案:C87.以下對于微軟edge瀏覽器的歷史記錄功能的說法正確的是()。A、微軟edge瀏覽器無法刪除對某個網站的所有訪問記錄B、微軟edge瀏覽器只能刪除最近30分鐘的歷史瀏覽記錄C、微軟edge瀏覽器沒有按鍵可以快速清除歷史訪問記錄D、微軟edge瀏覽器可以一次刪除多條歷史訪問記錄答案:D88.下列關于因子分析的作用描述錯誤的是()。A、因子分析常用于因子降維B、因子分析可以用于描述同一變量各個類別之間的差異C、因子分析可以找出隱藏且具有代表性的因子D、因子分析可以按照權重計算出綜合得分再進行回歸或聚類分析答案:B解析:因子分析是指研究從變量群中提取共性因子的統計技術。89.下列關于Excel2019數據透視表自定義計算功能描述不恰當的選項是()。A、百分比選項的功能是值區域顯示為基本字段和基本項的百分比B、差異選項的功能是值區域字段顯示為與基本字段項的差異百分比C、無計算選項的功能是值區域字段顯示為數據透視表中的原始數據D、父行匯總的百分比是值區域字段顯示每個數據項占該列父級項總和的百分比答案:B90.下列不屬于常用的數據清洗轉換方法的是()。A、多數據源的合并B、復雜數據的轉換C、數據粒度的轉換D、數據的商務規則計算答案:B91.()是在Windows10系統下常用的即時通訊軟件。A、Excel表格編輯軟件B、MicrosoftEdge瀏覽器C、Xmind思維導圖工具D、釘釘答案:D92.在數據采集渠道中組織與組織之間的合作,交換或購買數據來整合行業資源的渠道被稱為()。A、網絡數據采集B、自行采集C、共享行業數據D、第三方合作答案:D93.以下對于數據質量問題的分類說法錯誤的是()。A、數據倉庫中基于清洗方式的“臟”數據質量問題可分為規律型“臟”數據和隨機型“臟”數據B、數據質量的問題可以分為基于數據源的“臟”數據質量問題與基于清洗方式的“臟”數據質量問題C、基于數據源的“臟”數據質量問題可分為單數據源問題和多數據源問題D、在基于數據源的“臟”數據質量問題中,單數據源情況下出現的問題在多數據源情況下會變得更嚴重答案:A94.()情況下,用人單位不得解除勞動合同。A、勞動者在試用期間被證明不符合錄用條件的B、勞動者不能勝任工作,經過培訓或者調整工作崗位,仍不能勝任工作的C、勞動者嚴重違反用人單位的規章制度D、女職工在孕期、產期、哺乳期的答案:D95.以下不屬于大數據的五大特征的選項是()。A、多樣B、大量C、低速D、低價值密度答案:C96.以下不屬于常見的數據質量問題的是()。A、缺失值B、重復值C、錯誤值D、重疊值答案:D97.對于空缺值、異常值與重復值的處理方法,以下說法錯誤的是()。A、孤立點分析屬于數據清洗中的異常值處理方法B、重復數據檢測主要分為基于字段和基于記錄的重復檢測C、回歸是數據清洗中的空缺值處理方法之一D、合并或消除是處理重復數據的基本方法答案:C98.以下關于客服機器人的評價維度中推薦結果點擊率的說法正確的是()。A、推薦結果點擊率衡量了客服機器人的產品設計友好度B、推薦結果點擊率是使用了客服機器人產品的用戶數占用戶總數或者曝光用戶數的比例C、推薦結果點擊率衡量了客服機器人的對話流程健康度D、推薦結果點擊率是推薦答案或內容的點擊(或采納)次數占推薦次數的比例答案:D99.以下不屬于商業智能(BI)核心作用的選項是()。A、數據的上鉆和下鉆B、獲取數據的多維度分析C、數據的切片D、取代傳統的數據報表分析答案:D100.以下屬于數據清洗中常見的異常值處理方法的選項是()。A、隨機森林B、排序與合并C、回歸D、平均值填充答案:C101.對于在Windows10應用商店安裝、更新與卸載軟件的操作,下列說法正確的是()。A、可以通過【下載與更新】選項卸載應用B、通過Windows10應用商店安裝的應用無法更新C、Windows10應用商店無法查看已經獲得的應用D、Windows10應用商店可以通過關鍵字快速搜索相關應用答案:D102.下列關于停用詞表的構成相關描述恰當的選項是()A、停用詞表中含有需要使用的關鍵詞B、停用詞表中含有已經在書面與口語中不再使用的詞語C、停用詞表內容可自行定義D、停用詞表一般使用DOC格式文件存儲答案:C103.下列關于數據標注質量全樣檢驗方法的描述錯誤的是()。A、全樣檢驗不合格的數據需要標注員進行返工改正B、數據標注質量全樣檢驗方法需要耗費大量的人力精力集中進行C、完成全樣檢驗后,質檢員需要將標注有問題的數據移交給標注員D、數據標注質量全樣檢驗在數據標注任務完成交付前可以不做答案:D104.下列關于數據倉庫管理層的功能描述錯誤的是()。A、完成數據庫的定義B、完成數據的歸檔、備份、維護、恢復C、完成數據的抽取、轉換、裝載D、元數據的管理答案:A105.職業道德的特點不包括()。A、持久不變的永恒性B、適用范圍的有限性C、發展的歷史繼承性D、紀律性答案:A106.在Excel2019中,()可以用來生成隨機數且需要輸入參數。A、RAND函數B、MATCH函數C、RANDBETWEEN函數D、RANK函數答案:C107.道德的功能不包括()。A、認識功能B、進化功能C、調節功能D、評價功能答案:B108.對于自然語言處理中停用詞的分類說法正確的是()。A、停用詞一般可分為功能詞和判定詞B、搜索的短語中包含功能詞不會使搜索結果出現問題C、詞匯詞的使用十分廣泛,不會降低搜索的效率D、功能詞不具有實際含義答案:D109.下列關于回歸分析的描述不正確的是()。A、回歸分析研究的是因變量(目標)和自變量(預測器)之間的關系B、回歸分析是研究確定兩種或兩種以上變量間相互依賴的定量關系的統計分析方法C、回歸分析通過分析由定性變量構成的交互匯總表來揭示變量之間的聯系D、回歸分析可以用于研究人的身高與體重之間的相關關系答案:C110.以下對于PowerPoint2019基本操作的說法錯誤的是()。A、在PowerPoint中,通過“SmartArt圖形”功能插入的形狀不能設置文字B、在PPT模板中大多含有占位符,可以通過占位符導入多種可顯示對象C、可以通過直接粘貼的方式在幻燈片中插入圖表D、在PowerPoint中,不可以通過“SmartArt圖形”功能插入表格答案:A111.關于PowerBI(商業智能)中的查詢編輯器,下列說法正確的是()。A、查詢編輯器只能查詢并顯示原始數據的全部列B、數據源的隱私級別設置錯誤會影響查詢的性能C、自定義列一般不需要定義數據類型D、查詢編輯器的默認聯接種類是右外部連接答案:B112.關系模型中最重要的概念是關系,下列關于關系的特點描述正確的是()。A、關系中元組是有先后順序的B、關系中屬性是有先后順序的C、關系中的每個屬性可以再分D、關系中的每個屬性是同質的答案:D113.在Excel中,下列日期函數相關功能描述不正確的是()。A、EDATE函數用于返回指定日期之前或之后指定月份數的日期B、DAYS360函數按每年360天返回兩個日期間相差的天數(每月30天)C、DATEDIF函數用于返回日期中的月份D、WORKDAY函數返回指定工作日之前或之后的日期答案:C114.以下關于申請專利權力歸屬方的規定的說法不正確的是()。A、兩個以上單位所完成的發明創造,除另有協議的以外,申請專利的權利屬于完成或者共同完成的單位B、對發明人或者設計人的非職務發明創造專利申請,任何單位或者個人不得壓制C、非職務發明創造,申請專利的權利屬于單位D、職務發明創造申請專利的權利屬于單位,申請被批準后,單位為專利權人答案:C115.下列對于數據庫與數據倉庫的區別描述正確的是()。A、數據倉庫相比數據庫可以更直觀地對數據源中的數據進行操作B、數據庫中的數據是經過整理并按分析主題重新組織起來的C、數據倉庫和數據庫兩者之間無任何關聯D、數據倉庫的基本目標是減少數據冗余和增加數據的獨立性答案:A116.以下關于客服機器人的評價維度中業務覆蓋率的說法正確的是()。A、業務覆蓋率越高則客服機器人可以理解更多的用戶意圖B、業務覆蓋率衡量了客服機器人的接待能力C、業務覆蓋率衡量了客服機器人回復問題的準確程度D、業務覆蓋率衡量了客服機器人產品推薦的精準度答案:A117.在數據質量的評價指標中,()的評價標準要求盡量選擇數據重要的本質屬性并消除冗余。A、適用性B、簡潔性C、完整性D、準確性答案:B118.數據清洗的基本流程中糾正發現的錯誤的操作不包括()。A、確認并改B、屬性分離C、定義數據清洗策略D、標準化答案:C119.早期數據標注工作是由()完成。A、研究數據標注的工程師B、研究數據統計的工程師C、研究人工智能算法的工程師D、進行數據采集的工程師答案:C120.下列數據庫實體聯系(Entity-Relationship,E-R)模型向關系模型的轉化敘述正確的是()。A、1:n的聯系必須與聯系的任意一端實體所對應的關系模式合并B、1:1的聯系可以單獨成為一個關系模式C、m:n的連續可以與任何一方實體合并D、實體聯系模型中的聯系可以直接被DBMS(數據庫管理系統)支持和執行答案:B121.以下關于Windows10“照片”應用的操作的說法錯誤的是()。A、“照片”應用無法將圖片合成視頻B、“照片”應用可以通過文件夾導入圖片C、“照片”應用可以對圖片進行編輯美化D、“照片”應用可以根據關鍵詞搜索圖片答案:A122.以下不屬于電話機器人的優勢的選項是()。A、相比電銷人員可以快速學習營銷話術B、可以通過表情監測識別情緒變化并改變溝通方式C、提高撥打電話效率D、可以快速采集大量數據用于數據分析答案:B123.數據標注可以根據標注者類型進行分類,下列屬于該分類的是()。A、拼音標注B、結構化標注C、文本標注D、機器標注答案:D124.下列屬于數據標注圖像處理工具的是()。A、EditPlus處理軟件B、GoldWave處理軟件C、BitEdit處理軟件D、Protools處理軟件答案:C125.數據集市可分為()。A、獨立數據集市和從屬數據集市B、串行數據集市和獨立數據集市C、并行數據集市和虛擬數據集市D、虛擬數據集市和嵌入數據集市答案:A126.下列屬于SQL(結構化查詢語言)常用查詢的是()。A、操作查詢B、視圖查詢C、定義查詢D、嵌套子查詢答案:D解析:SQL是一種數據庫查詢和程序設計語言。127.以下對于云存儲模式的概念與整體架構說法錯誤的是()。A、云存儲模式組織框架自底向上依次是存儲層、基礎管理層應用接口層以及訪問層B、云存儲的概念和云計算的概念是兩種不同的概念C、云.存儲就是將存儲資源放到云上為人們服務的一種新興方案D、云存儲通常由具有完備數據中心設施的第三方提供答案:B128.以下對于微軟edge瀏覽器的收藏夾功能的說法正確的是()。A、微軟edge瀏覽器的收藏夾功能默認是處于隱藏狀態的B、微軟edge瀏覽器無法導入IE瀏覽器中收藏的網頁C、微軟edge瀏覽器不能調整收藏夾欄的按鈕次序D、添加到收藏夾的網頁無法重命名答案:A129.以下不屬于Python數值分析常用軟件庫的選項是()。A、Websockets庫B、NumPy庫C、Matplotlib庫D、Pandas庫答案:A130.()規則限定了子關系中外鍵的取值。A、實體完整性B、參照完整性C、域完整性D、用戶自定義完整性答案:B131.()的數據直接來自中央數據倉庫。A、整合數據集市B、虛擬數據集市C、獨立數據集市D、從屬數據集市答案:D132.()規則分別限定了在關系中每一列屬性都有確定的取值范圍與關系中主鍵的唯一性。A、參照完整性與域完整性B、用戶自定義完整性與實體完整性C、域完整性與實體完整性D、實體完整性與參照完整性答案:C133.數據標注的工作特點是由()所決定的。A、數據標注員的標注習慣B、數據標注項目的特點C、數據標注項目的周期D、數據標注項目的進度答案:B134.下列屬于數據標注質量檢驗方法的是()。A、隨機檢驗B、定時檢驗C、相互檢驗D、實時檢驗答案:D135.在數據標注基本概念中,數據標注工具按照自動化程度不同可分為()。A、語音標注工具、文本標注工具、圖像標注工具B、客戶端標注工具、網頁端標注工具C、手動標注工具、半自動標注工具、自動標注工具D、區域標注工具、拉框標注工具、分類標注工具答案:C解析:自動化程度136.在自然語言處理中,下列關于分詞標準描述恰當的是()。A、分詞可按照操作員習慣進行分詞B、分詞標準中粗粒度切分最常應用的領域是搜索引擎C、中文分詞比英文分詞更簡單D、分詞標準可分為粗粒度和細粒度答案:D137.以下關于Windows10常用輸入法基本設置操作的說法錯誤的是()。A、Windows10可以安裝第三方輸入法B、Windows10默認系統自帶輸入法沒有微軟五筆C、Windows10可以對輸入法進行外觀設置D、Windows10可以設置啟用模糊拼音答案:B138.以下關于授予專利權的相關條件規定的說法不正確的是()。A、在申請專利前六個月內,在國家出現緊急狀態或者非常情況時,為公共利益目的首次公開的發明不喪失新穎性B、授予專利權的發明和實用新型,應當具備新穎性、創造性和實用性C、授予專利權的外觀設計不得與他人在申請日以前已經取得的合法權利相沖突D、疾病的診斷和治療方法可以授予專利權答案:D139.在Windows10輸入法中,v模式的作用是()。A、方便輸入中文數字、羅馬數字與年份B、進行筆畫篩選C、方便輸入時間日期D、拆分不認識的漢字答案:A140.數據倉庫的管理部分由()、數據管理部件和元數據管理部件4部分組成。A、數據集市定義部件、數據獲取部件B、數據集市定義部件、數據庫定義部件C、數據倉庫定義部件、數據資源部件D、數據倉庫定義部件、數據獲取部件答案:D141.以下對于Word中段落縮進方式的說法正確的是()。A、左縮進是指段落所有行均向左移動一定的距離B、右縮進是指段落所有行均向右移動一定的距離C、懸掛縮進是指除段落第一行外其余各行縮進一定的距離D、首行縮進是指段落中第一行文字從右向左縮進一定的距離答案:C142.在商用數據標注平臺中,預識別引擎識別的結果最適合使用()格式存儲。A、JSONB、TXTC、XLSD、RAR答案:A解析:哈哈哈,其他3個我都知道是啥143.下列關于聚類和分類相關內容描述錯誤的是()。A、分類要求劃分的類別是已知的B、聚類的結果是確定的C、分類是有監督的學習D、聚類是無監督的學習答案:B144.()是數據采集的主要來源之一。A、數據填充B、機器生成C、模擬仿真D、頁面表單數據答案:B145.在Excel中,使用()可以直接計算眾數并且只返回一個結果。A、MODB、SNGL函數C、MATCH函數D、MULT函數E、ROUND函數答案:A146.()不屬于數據清洗的基本流程中搜尋并確定錯誤實例的檢測方法。A、基于統計的方法B、均值填充方法C、聚類方法D、關聯規則方法答案:B147.數據倉庫系統通常被分為()、分析工具層3個部分。A、存儲層、操作層B、管理層、存儲層C、表現層、管理層D、處理層、管理層答案:B148.下列關于Access數據庫中常見的數據類型描述正確的是()。A、貨幣型用來存儲貨幣值,在計算中可以四舍五入B、長文本用于注釋與說明,最長為16384個字符C、長整型數字占用4個字節的存儲空間D、短文本用于處理文本字符信息,最長為128個字符答案:C149.以下關于客服機器人的評價維度中攔截率的說法錯誤的是()。A、用戶與機器人的一次交互算作一次會話B、攔截率衡量了客服機器人的接待能力C、攔截率的計算必須基于有效會話數D、由于業務特點或者用戶習慣產生的轉人工會話不屬于有效的轉人工會話答案:A150.以下關于Word的審閱功能的說法錯誤的是()。A、在Word中可以通過【視圖】選項卡在文檔中添加腳注B、批注內容在打印的文件中不會顯示C、在Word中可以通過更改組中的“接受”與“拒絕”功能來確認接受或者拒絕修訂D、在Word中使用修訂功能的情況下,修訂過的文字會被突出顯示答案:A151.數據倉庫的數據質量評價指標主要包括數據的準確性、()、適用性。A、多樣性、完整性B、完整性、簡潔性C、特殊性、簡潔性D、復雜性、唯一性A答案:B152.一般認為語音標注的質量標準是標注與發音時間軸誤差在()語音幀以內。A、1個B、3個C、5個D、7個答案:A153.在Excel中,不能直接計算極值或條件極值的函數是()。A、MAXIFS函數B、MIN函數C、OUNT函數D、LARGE函數答案:C154.下列屬于數據標注質量檢驗方法的是()。A、定時檢驗B、抽樣檢驗C、定量檢驗D、間接檢驗答案:B155.在Office快捷鍵操作中,Ctrl+B的功能是()。A、字符變為粗體B、段落居中C、左對齊D、打印文檔答案:A156.關于PowerBI(商業智能)連接數據庫并導入數據庫數據的過程,下列說法正確的是()。A、在使用“導入”模式時總能看到最新的數據B、PowerBI在使用“導入”模式時需要保持與數據庫連接C、“DirectQuery”不適用于數據經常更新的情況D、在使用“DirectQuery”選項時,在每次查看數據時需要手動刷新數據答案:C157.對于在Windows10應用商店安裝、更新與卸載軟件的操作,下列說法錯誤的是()。A、可以通過【設置】窗口下的【應用】選項卸載應用B、在【我的資料庫】中可以查看已經獲得的應用C、通過Windows10應用商店安裝的應用無法更新D、可以通過Windows10應用商店中的【集錦】選項按照類別快速查找并安裝應用答案:C158.關于PowerBI(商業智能)中查詢編輯器的默認聯接種類是()。A、左外部連接B、整合連接C、右外部連接D、內連接答案:A159.在Excel中,TREND函數與FORECAST函數的主要作用是()。A、計算方差B、計算中位數C、計算樣本標準差D、利用線性回歸進行插值計算答案:D160.以下對于數據庫實體聯系(Entity-Relationship,E-R)模型基本概念描述正確的是()。A、每個實體的屬性構成可以是不相同的B、屬性的取值范圍的限定被稱為實體C、用于唯一確定或區分實體集中每一個實體的屬性或屬性組合稱為實體碼D、將同類實體的屬性構成加以抽象可以得到屬性型的概念答案:C161.以下對于Word中表格的邊框與底紋設置的說法正確的是()。A、可以通過選中表格并在【插入】選項卡中進行邊框樣式選擇B、在表格屬性中可以設置表格邊框顯示的位置C、在表格屬性中不能設置表格線的粗細D、在表格屬性中可以設置邊框與底紋答案:D162.在統計學中,以下關于中心極限定理相關內容描述正確的選項是()。A、中心極限定理指出了隨著樣本數的增大,樣本均值分布曲線越來越接近均勻分布B、中心極限定理能否發揮作用,主要看樣本量的大小C、中心極限定理指出了大量隨機變量近似服從泊松分布的條件D、一般認為中心極限定理的標準定義的樣本量n≥15時,樣本量足夠大答案:B163.關于自然語言處理技術中詞頻統計,以下描述錯誤的是()。A、詞頻統計是對某一些給定的詞語在某文件中出現的次數進行統計B、詞頻統計是指將一個漢字序列切分成一個個單獨的詞的過程C、詞頻統計是文本分析的重要方法之一D、詞頻統計是文本挖掘的重要手段答案:B164.以下關于PowerBI(商業智能)自然語言查詢,描述不正確的是()。A、PowerBI支持使用英文實現自然語言查詢B、PowerBI不支持使用中文實現自然語言查詢C、PowerBI支持使用日語實現自然語言查詢D、PowerBI的在線版支持自然語言查詢答案:C165.關于大數據處理面臨的難題,下列描述錯誤的是()。A、數據體量過大B、維護成本昂貴C、響應速度慢D、并發讀寫量小答案:D166.以下關于客服機器人業務的目標說法錯誤的是()。A、了解用戶的問題需要客服機器人準確知道用戶問題的意圖,若意圖缺失,還需要與用戶確認B、了解問題的解法需要客服機器人知道大部分業務問題的答案,能夠在識別到用戶意圖之后給出解法C、解答用戶的問題需要客服機器人提高回答客戶問題的效率D、客服機器人的業務目標是了解用戶的問題、了解問題的解法與解答用戶的問題答案:C167.以下屬于云存儲優點的是()。A、易丟失B、分類存儲C、易訪問D、存儲空間小答案:C168.下列不屬于數據標注公共服務領域應用場景的是()。A、機器審核B、欺詐檢測C、視頻審核D、文本審核答案:B169.以下關于Windows10系統還原功能的操作描述錯誤的是()。A、不能使用U盤啟動盤還原系統B、Ghost備份還原是以硬盤的扇區為單位進行的C、開啟系統還原后,系統會定期自動創建還原點D、用戶可以使用系統映像備份來還原系統答案:A170.在數據標注質量檢驗方法中,多重抽樣檢驗方法輔助全樣檢驗第一輪數據抽樣檢驗存在不合格數據,則第二輪()。A、抽樣檢驗中檢驗的標注數據量與第一輪相同B、抽樣檢驗中檢驗的標注數據量較第一輪減少50%C、抽樣檢驗中檢驗的標注數據量較第一輪增加75%D、抽樣檢驗中檢驗的標注數據量較第一輪增加100%答案:D171.以下對道德的定義說法不正確的是()。A、人類的道德觀念是受到宣傳教育及社會輿論的長期影響而逐漸形成的B、道德是一種社會意識形態,它是人們共同生活及其行為的準則和規范C、道德觀念是永恒不變的D、道德不是人類先天具備的答案:C172.下列屬于數據標注常用的語音標注工具是()。A、Nuendo軟件B、Labelbox軟件C、Praat軟件D、BRAT軟件答案:C173.對于數據庫備份的一般做法描述錯誤的是()。A、數據庫備份一般備份在與數據庫同一磁盤或同一文件夾目錄下B、數據經常變化的數據庫需要經常進行備份C、數據庫可以在安全的情況下上傳到云端備份D、數據庫備份的重命名一般需要在文件名中添加日期答案:A174.下列屬于數據標注常用的文本標注工具是()。A、BRAT軟件B、NotePad軟件C、LogViewer軟件D、EmEditor軟件答案:A175.下列關于數據標注質量全樣檢驗方法的優缺點描述錯誤的是()。A、需要耗費大量人力精力集中進行B、能夠對數據集做到無遺漏檢驗C、能夠有效減少標注過程中重復錯誤的重復出現D、可以對數據集進行準確率評估答案:C176.對于業務數據采集流程以下說法正確的是()。A、Hive數據倉庫工具屬于實時數據采集流程步驟之一B、Tensorflow機器學習框架屬于實時數據采集流程步驟之一C、日志文件屬于離線數據采集流程步驟之一D、Ajax異步更新網頁技術離線數據采集流程步驟之一答案:C177.在數據標注質量檢驗方法中,一般安排在數據標注任務完成交付前實施的質量檢驗方法是()。A、實時檢驗B、全樣檢驗C、相互檢驗D、抽樣檢驗答案:B178.數據預處理中的()是指構造新屬性并添加到屬性集的過程。A、數據規范化B、數據泛化C、屬性構造D、數據平滑答案:C179.以下屬于數據清洗中常見的重復數據處理方法的選項是()。A、孤立點分析B、消除C、數據補齊D、分箱答案:B180.以下關于客服機器人的評價維度中滿意度和差評數的說法錯誤的是()。A、滿意度衡量了客服機器人的服務滿意度B、由于影響用戶使用體驗的因素很多,滿意度無法直接指明問題所在C、多數客戶只會在不滿意時給出反饋,所以關注差評率更加客觀D、滿意度只能實施于會話維度答案:D181.一般認為上下左右邊框與標注物最邊緣像素點誤差均要在()是圖像標框標注的合格標準。A、0像素以內B、1像素以內C、2像素以內D、3像素以內答案:B182.下列關于多音字標注的質量標準相關內容描述正確的是()。A、多音字標注只要標注常用的幾個讀音,對于不常用的可以不標注B、多音字標注的審核不需要借助字典等專業性工具進行檢驗C、多音字標注需要標注一個字的全部讀音,方言發音過多、復雜不考慮D、多音字標注需要標注一個字的全部讀音,有時包括方言發音答案:D183.以下關于SQL(結構化查詢語言)的相關操作,描述錯誤的選項是()。A、定義SQL索引的時候關鍵詞DESC表示升序B、SQL的追加數據操作要遵守創建表格時的完整性約束C、使用SQL進行數據表更改與刪除操作時務必小心謹慎D、SQL的更新操作不增加、減少表中的記錄,而是更改記錄的字段值答案:A184.在Windows10系統下常用的即時通訊軟件不包括()。A、微信B、騰訊文檔C、釘釘D、QQ答案:B185.誠實守信的具體要求不包括()。A、遵守合同與契約B、有意或無意地欺騙他人C、信守諾言和保守秘密D、遵守法律和法規答案:B186.在Excel中,以下不可以用來計數或條件計數的函數是()。A、COUNT函數B、RANK函數C、OUNTA函數D、COUNTIF函數答案:B解析:RANK是排名函數187.斯坦福大學教授李飛飛于2007年啟動的()項目,加深了人們對人工智能領域的認知,數據對人工智能的重要性,從而推進了數據標注的發展。A、CityScapesB、COCOC、ImageNetD、ADE20K答案:C188.職業道德的作用不包括()。A、有助于提高全社會道德水平B、有助于企業形成行業領導地位C、規范約束職業內部人員的行為D、促進本行業發展答案:B189.在數據標注質量檢驗方法中,多重抽樣檢驗方法輔助實時檢驗第一階段數據全樣檢驗合格,則第二階段()。A、質檢員繼續對標注員標注的數據進行全樣檢驗B、質檢員對數據進行抽樣檢驗C、質檢員對標注員標注數據的25%進行檢驗D、質檢員對標注員標注數據的50%進行檢驗答案:B190.下列關于圖像區域標注的質量檢驗標準相關內容描述錯誤的是()。A、圖像中轉折拐角的邊緣像素點噪聲最容易產生標注誤差B、區域標注的難點在于對標注物的每一個邊緣像素點都要進行檢驗C、圖像中轉折拐角的邊緣像素點噪聲最大,需要仔細進行檢查D、區域標注像素點與標注物像素點誤差要在4個像素以內答案:D解析:1給像素以內191.對于數據標注的基本流程說法不正確的是()。A、通過數據質檢環節才算是真正完成了數據標注工作B、數據采集是整個數據標注基本流程的首要環節C、完成數據采集后,每一條數據都能夠直接使用D、完成數據清洗后即可進入數據標注環節答案:C192.下列屬于語義標注的檢驗方式的選項是()。A、針對語音數據中的音量進行檢驗B、針對語音數據中的語速進行檢驗C、針對上下文的情景環境進行檢驗D、針對語音數據中的聲音頻率進行檢驗答案:C193.下列關于數據庫與數據倉庫的區別描述錯誤的是()。A、數據倉庫中的數據是企業一段時間的歷史數據B、數據庫中的數據與當前業務相關C、數據庫就是數據倉庫,數據倉庫就是數據庫,只是兩者稱呼不同D、數據庫中的數據是經過整理并按分析主題重新組織起來的答案:C194.在數據倉庫的組織方式中,()存儲了過去的詳細數據,反映真實的歷史情況,老化的數據將進入該級別。A、當前細節級B、早期細節級C、高度綜合級D、輕度綜合級答案:B195.以下無法在典型的實時數據采集流程環節得到應用的是()。A、HDFS分布式文件系統B、Pytorch機器學習框架C、Socket通信技術和Ajax網頁更新技術D、Flume分布式日志收集系統答案:B196.以下不屬于數據預處理步驟的是()。A、數據歸約B、數據標注C、數據清理D、數據變換答案:B197.下列處理方法中最適合處理詞云圖中干擾詞的方法是()。A、進行命名實體標注B、手動去除干擾詞C、進行詞性分析D、使用停用詞表過濾干擾詞答案:D198.文本數據處理中,關于詞性分析應用描述正確的選項是()。A、詞性標注可應用在語音識別預處理B、詞性分析可應用在分詞結果篩選和過濾C、詞性分析對英語文本和中文文本的分析分類結果是一致的D、詞性分析只適合于英語,不適合中文領域答案:B199.以下關于微軟edge瀏覽器操作的說法錯誤的是()。A、在搜索欄輸入搜索文字可以彈出搜索建議B、在【高級設置】中可以更換默認搜索引擎C、使用InPrivate窗口可以無痕瀏覽網頁D、微軟edge瀏覽器不能創建超過4個標簽頁答案:D200.下列不屬于文本標注需要注意的事項是()。A、嚴格的審核制度B、只能使用單一語言進行相關標注C、制定文本標注規則D、明確文本用途答案:B201.數據采集又稱(),是指從各類數據庫、機器設備、傳感器等自動采集信息的過程。A、數據生成B、數據獲取C、數據填充D、數據模擬答案:B202.以下關于語音智能客服機器人的說法正確的是()。A、語音智能客服機器人一般不支持隨時打斷的功能B、語音智能客服機器人只能替代客服回答專業性較高的提問C、語音智能客服機器人可以幫助企業提高服務效率D、語音智能客服機器人可以通過表情監測識別情緒變化答案:C203.數據倉庫中基于清洗方式的“臟”數據質量問題可分為兩類,即()。A、模式型“臟”數據與實例型“臟”數據B、規律型“臟”數據和隨機型“臟”數據C、單峰型“臟”數據和長尾型“臟”數據D、獨立型“臟”數據和依賴型“臟”數據答案:D204.以下關于Access數據庫中數字類型的存儲空間大小的說法錯誤的是()。A、單精度數字占用4個字節的存儲空間B、雙精度數字占用4個字節的存儲空間C、長整型數字占用4個字節的存儲空間D、整型數字占用2個字節的存儲空間答案:B解析:單精度4字節,雙精度8字節205.采集數據的質量可以從()、范圍、可信性4個指標來衡量數據質量。A、及時性、關聯度B、關聯度、時效性C、唯一性、及時性D、時效性、完整性答案:B206.廣義的數據資源涉及產生、()的整個過程。A、處理、傳播、交換B、處理、傳播、決策C、管理、傳播、交換D、處理、存儲、決策答案:A207.以下文件的擴展名與文件類型相匹配的是()。A、pdf便攜式文件B、datCD音頻文件C、xml可執行文件D、ra壓縮文件答案:A208.數據倉庫的特征不包括()。A、面向主題的B、隨時間不斷變化的C、集成的D、可以修改的答案:D209.在統計學中,對于正態分布曲線特征描述正確的是()。A、正態分布的眾數小于中位數B、正態分布曲線被稱為雙峰曲線C、正態分布的眾數等于均值D、正態分布的均值大于中位數答案:C210.以下不屬于數據清洗中常見的異常值處理方法的選項是()。A、回歸B、分箱C、孤立點分析D、特殊值填充答案:D解析:回歸常見,特殊應該不常見吧211.下列不屬于數據標注常用的語音處理工具的選項是()。A、GoldWave編輯軟件B、Nuendo編輯軟件C、Protools處理軟件D、PalEdit編輯器答案:D212.以下不屬于數據標注文本處理工具的是()。A、PilotEdit編輯器B、EmEditor編輯器C、JSONViewer編輯器D、Protools編輯器答案:D213.下列關于數據庫的備份與恢復描述正確的是()。A、一般來說備份的數據庫文件可以和當前數據庫文件在同一磁盤上B、數據庫備份是一次性的工作C、不能利用操作系統的文件復制功能將數據庫文件復制到另一個位置存儲D、數據庫備份和恢復可以用于保護數據庫中的關鍵數據答案:D214.在數據分析方法中,用于兩個及兩個以上樣本均數差別的顯著性檢驗的分析方法是()。A、方差分析B、回歸分析C、關聯分析D、因子分析答案:A解析:差別215.ETL(數據倉庫技術)數據增量抽取方式包含全表比對方式、()、時間戳方式。A、觸發器方式、日志表方式B、全量抽取方式、日志表方式C、全量抽取方式、全表比對方式D、日志表方式、數據遷移方式答案:A216.下列不屬于數據標注應用領域的是()。A、金融領域B、公共服務領域C、建筑領域D、電子商務領域答案:C217.在Excel2019中制作Z值百分位表可使用()函數。A、NORMSDISTB、NORC、DISTD、AVERAGE函數E、MODE函數答案:A解析:EXCEL中的NORMDIST是指返回指定平均值和標準偏差的正態分布函數。218.下列關于數據倉庫中ETL(數據倉庫技術)的概念描述不正確的是()。A、ETL是實現商務智能(BI)的核心B、ETL用來描述將數據從源端經過抽取、轉換、加載至目的端的過程C、ETL只能對單個源數據進行抽取D、ETL可以對多種結構的源數據進行抽取答案:C219.根據人工智能訓練師國家職業標準,五級工不需要掌握()。A、對原始數據進行清洗和標注的方法B、數據分類與統計工具的使用C、數據采集工具的使用方法D、對標注后的數據進行審核的方法答案:D220.下列關于語音標注的質量標準描述正確的是()。A、標注與語音數據發音的時間軸盡量保持一致,控制誤差值在4個語音幀內B、標注與發音速度需要控制在每秒小于或等于3個字C、標注與發音時間軸誤差在1個語音幀以內D、標注與語音發音分貝數據控制在60分貝以內答案:C221.早期數據標注工作是由()完成。A、研究人工智能算法的工程師B、研究數據分析的工程師C、研究數據標注的工程師D、研究數據清洗的工程師答案:A222.在數據清洗轉換方法中,()主要是將不同業務系統中的相同類型的數據進行統一。A、多數據源的合并B、數據粒度的轉換C、不一致數據轉換D、數據的商務規則計算答案:C223.在中文分詞技術中,關于全模式分詞的描述正確的選項是()。A、Jieba分詞工廠的標記模式參數默認是全模式分詞B、全模式分詞不能解決歧義問題C、對于同一段文本,全模式分詞處理比精確模式分詞要慢D、全模式分詞把文本中所有可能的詞語都掃描處理且不存在冗余答案:B224.下列不屬于自然語言處理技術在語音方面應用的選項是()。A、語法校對B、機器同聲傳譯C、聊天機器人D、多媒體信息提取與文本轉化答案:A225.以下不屬于常用的數據分析方法是()。A、聚類分析B、相關分析C、方差分析D、實體關系分析答案:D226.在自然語言處理技術中,()的準確率已經成為評價一個分詞系統好壞的重要標志之一。A、分詞B、詞性分析C、新詞識別D、詞頻統計答案:C227.以下對于Word圖片布局的說法正確的是()。A、浮于文字上方是將圖片浮在文字上方但不會遮蓋其他對象B、環繞型是將文字或其他對象環繞在圖片周圍C、嵌入型是將圖片作為一個對象嵌入在一列中D、上下環繞型是將圖片獨占一列或多列,其他對象位于圖片的左右側答案:B228.下列不屬于關聯分析應用場景的是()。A、流量定量分析B、促銷設計C、產品定位D、地質研究答案:A229.下列關于SQL(結構化查詢語言)特點描述錯誤的是()。A、運算的對象和結果都是表B、高度過程化C、表達簡單,使用詞匯少D、具有較好移植性答案:B230.在數據庫管理系統的基本功能中,數據的安全性和完整性檢驗、故障恢復和并發操作體現了數據庫管理系統的()功能。A、數據庫操作B、數據庫運行控制C、數據庫定義D、數據庫維護答案:B231.數據庫實體聯系(Entity-Relationship,E-R)模型的構成要素是()。A、實體、屬性、聯系B、實體、操作、連接C、對象、控制、連接D、對象、實體、聯系答案:A232.下列關于數據標注質量實時檢驗過程相關描述不恰當的是()。A、當標注員對標注存在疑問時可以由質檢員進行現場溝通和指導B、質檢員會對自己所在小組的標注員的標注習慣、標注速度、準確度進行現場實時檢驗C、標注員對分段數據開始標注時,質檢員就可以對標注員進行實時檢驗D、需要標注的數據除了按照小組進行劃分之外還要將每組需要標注的數據按照階段進行劃分答案:B233.下列關于回歸分析和相關分析的區別描述不正確的是()。A、相關分析中所有的變量都必須是隨機變量,回歸分析中自變量必須是確定的B、回歸分析側重于研究隨機變量間的依賴關系,相關分析側重于發現隨機變量間的種種相關特性C、相關分析中相關系數是確定的,回歸分析中可以存在多個回歸方程D、相關分析中需要對變量進行自變量與因變量劃分,而回歸分析中的變量關系是對等的答案:D234.在Excel2019中,下列不屬于查找引用類函數的選項是()。A、MIN函數B、VLOOKUP函數C、INDIRECT函數D、OFFSET函數答案:A235.以下關于客服機器人的評價維度中解決率的說法錯誤的是()。A、解決率是由客服機器人解決問題的會話數占總有效會話數的比例B、解決率衡量了客服機器人接待能力C、解決率衡量了客服機器人的數據分析能力D、解決率=解決問題的會話數/總有效會話數答案:C236.當WHERE子句中的查詢條件也含有查詢語句時,該SQL語句屬于()。A、基于單數據源的簡單查詢B、基于多數據源的連接查詢C、嵌套子查詢D、派生表查詢答案:C237.如圖所示的統計圖的不適合在可視化()時使用。A、某商品在2023年銷售總額的占比B、某商場各門店2023年的每個月營業額C、某商場各部門2023年每個月的業績D、某商品2023年不同地區的銷售額答案:A238.以下對于ETL(數據倉庫技術)數據增量抽取方式描述正確的是()。A、觸發器方式在增量抽取時逐條比對源表和目標表的記錄,將新增或修改等變化的記錄過濾讀取出來B、全表比對方式在增量抽取時通過比較指定抽取時間與抽取源表的時間戳字段值決定要抽取的數據C、時間戳方式根據抽取要求在數據源表上建立插入、修改、刪除3種觸發器D、ETL的增量抽取是從增量日志中抽取,而不是直接在源表中抽取數據答案:D239.下列關于回歸分析分類描述不正確的是()。A、按照涉及的變量多少,回歸分析可分為一元回歸分析和多元回歸分析B、按照自變量的取值,回歸分析可分為實數回歸分析和虛數回歸分析C、按照自變量和因變量之間的關系類型,回歸分析可分為線性回歸分析和非線性回歸分析D、按照因變量的多少,回歸分析可分為簡單回歸分析和多重回歸分析答案:B240.以下關于Word的多級編號功能的說法正確的是()。A、普通文本在加上多級編號后不再是普通文本B、多級編號列表被定義后可以非常簡便地固化樣式C、文檔中的各個級別的段落在復制到新文檔,多級編號標題樣式不會被帶進新文檔中D、在新建文檔的樣式中,即便是標題段落也不具備編號答案:B241.以下關于客服機器人的評價維度中最終結果觸達率的說法正確的是()。A、最終結果觸達率是反饋給用戶的正確的結果數占反饋結果總數的比例B、最終結果觸達率衡量了對話流程的流暢度C、最終結果觸達率設計的目的是分析用戶對于產品的感興趣度D、最終結果觸達率的指標含義是某一類任務的對話輪次的平均數答案:B242.下列關于數據庫系統三級模式之間關系描述正確的是()。A、內模式是模式的部分抽取,模式表示物理級數據庫B、模式表示物理級數據庫,內模式表示概念級數據庫C、模式表示概念級數據庫,外模式是模式的部分抽取D、模式是內模式的物理實現,外模式是內模式的部分抽取答案:C243.下列屬于需要了解語音標注相關概念分類正確的是()。A、振幅屬于語音的基礎概念B、聲速屬于語音的基礎概念C、分貝屬于聲學的基礎概念D、信噪比屬于聲學的基礎概念答案:C244.在數據庫設計過程中,最主要的工作是進行()。A、邏輯設計B、物理設計C、系統需求的調查與分析D、概念設計答案:C245.商用數據標注平臺一般分為標注任務平臺和系統管理平臺兩部分,()不屬于系統管理平臺。A、績效管理B、標注任務列表C、流程管理D、資產管理答案:B246.圖像區域標注的質量標準是根據()判定的。A、物體尺寸大小B、顏色飽和度C、像素點D、圖像對比度答案:C247.在Excel2019中,離散趨勢分析可使用()進行數據組的四分位數計算。A、MEDIAN函數B、QUARTILC、EXC函數D、STDEE、P函數F、STDEG、S函數答案:B248.在ETL(數據倉庫技術)中,數據需要從源端經過()至目的端。A、抽取、轉換、加載B、轉換、抽取、加載C、加載、轉換、抽取D、轉換、加載、抽取答案:A249.以下不屬于數據標注質量檢驗方法的是()。A、實時檢驗B、間接檢驗C、抽樣檢驗D、全樣檢驗答案:B250.下列關于大規模結構化數據存儲的描述不正確的是____。A、可實現對PB量級的存儲和管理B、ERP(企業資源計劃)和HIS(醫院信息系統)數據庫都是結構化數據存儲C、MPP可以用來管理計算高質量的結構化數據D、設計時尤其要注意存儲特性和規模,一旦設計完成很難進一步擴展答案:D251.圖像區域標注質量檢驗中需要特別注意的是()。A、檢驗標框貼合程度B、檢驗轉折拐角C、檢驗圖片像素D、檢驗尺寸大小答案:B252.下列屬于常用視頻基本屬性術語的選項是()。A、時基B、信噪比C、信息熵D、保真度答案:A解析:時基,時間顯示的基本單位253.在Kettle(數據倉庫技術)軟件中,獲取文本數據可采用的數據抽取方法是()。A、CSV文件抽取B、HTML網頁抽取C、XML文件抽取D、JSON文件抽取答案:A254.一般的數據清洗策略分類中,通過人工直接修改“臟”數據的策略是()。A、自動清洗策略B、特定應用領域的清洗策略C、與特定應用領域無關的清洗策略D、手工清洗策略答案:D255.以下關于專利的申請程序相關規定的說法錯誤的是()。A、國務院專利行政部門收到專利申請文件之日為申請日,如果申請文件是郵寄的,以寄出的郵戳日為申請日B、申請人申請發明、實用新型專利優先權的,應當在第一次提出申請之日起三個月內,提交第一次提出的專利申請文件的副本C、申請外觀設計專利的,應當提交請求書、該外觀設計的圖片或者照片以及對該外觀設計的簡要說明等文件D、申請發明專利的請求書應當寫明發明或者實用新型的名稱,發明人的姓名,申請人姓名或者名稱、地址,以及其他事項答案:B解析:B十二個月內256.下列不屬于商業智能(BI)操作步驟的是()。A、Dashboard整合B、數據標注C、數據關聯D、數據清洗答案:B257.數據轉換是數據清洗過程的重要步驟之一,它的主要任務是進行不一致數據轉換、()及一些商務規則的計算。A、缺失數據的轉換B、異常數據的轉換C、復雜數據的轉換D、數據粒度的轉換答案:D258.下列關于語音合成描述錯誤的是()。A、語音合成是從文本轉換為語音的過程B、語音合成的英文簡拼為ASRC、語音合成廣泛應用在電話機器人上D、語音合成最主要的指標是自然度答案:B解析:語音合成的英文簡拼為TTS259.下列屬于數據標注常用的圖像標注工具是()。A、PalEdit軟件B、LabelImg軟件C、YEDDA軟件D、Photoshop軟件答案:B260.在數據集的劃分中,()是用來測試模型的實際學習能力的,測試集用來查看訓練效果的。A、驗證集B、訓練集C、分析集D、測試集答案:D261.以下不屬于數據清洗中的空缺值處理方法的選項是()。A、回歸B、數據補齊C、不處理D、忽略元組答案:A262.在數據分析方法中,可以揭示同一變量的各個類別之間的差異,以及不同變量各個類別之間的對應關系的分析方法是()。A、方差分析B、回歸分析C、關聯分析D、因子分析答案:C263.數據倉庫工具集主要由一些分析工具組成,包括()。A、OLTP聯機事務處理工具、智能分析工具、檢索查詢工具B、檢索查詢工具、仿真軟件、多維數據的OLAP聯機分析處理工具C、OLTP聯機事務處理工具、檢索查詢工具、統計分析及數據挖掘工具D、多維數據的OLAP聯機分析處理工具、檢索查詢工具、統計分析及數據挖掘工具答案:D264.在數據標注質量檢驗方法中,多重抽樣檢驗方法輔助實時檢驗的操作方法錯誤的是()。A、標注員第一階段數據全樣檢驗合格,第二階段轉換為抽樣檢驗不合格,第三階段繼續為抽樣檢驗B、標注員第一階段數據全樣檢驗不合格,第二階段轉換為全樣檢驗合格,第三階段繼續為抽樣檢驗C、標注員第一階段數據全樣檢驗合格,第二階段轉換為抽樣檢驗合格,第三階段繼續為抽樣檢驗D、標注員第一階段數據全樣檢驗合格,第二階段轉換為抽樣檢驗不合格,第三階段繼續為全樣檢驗答案:A265.在統計學中,如果分布曲線的峰值低于標準的正態分布,我們稱之為()。A、單峰分布B、高峰分布C、雙峰分布D、平峰分布答案:D266.以下對于Excel基本操作的說法正確的是()。A、Excel單元格的缺省字體中文為“黑體”,英文為“Arial等線體”B、Excel可以通過數據分列設置單元格的數字格式C、可以右鍵單元格區域選擇【設置單元格格式】通過【對齊】選項卡設置合并單元格D、可以右鍵單元格區域通過【字體】選項卡設置單元格自動換行答案:C267.描述兩個變量關系的散點圖有時可以做出近似直線,當該直線從左下向右上方傾斜時,則稱兩個變量()。A、弱相關B、不相關C、正相關D、負相關答案:C268.在Excel2019中,返回某個數值在一個數據集中的百分比排位并且百分比值范圍不包括0和1的函數是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論