




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數據應知應會試題及答案一、大數據(單選)1、 題目:大數據是指不用隨機分析法這樣的捷徑,而采用0的方法[單選題]*所有數據(正確答案絕大部分數據適量數據少量數據2、 題目:大數據環境下的隱私擔憂,主要表現為0[單選題]*個人信息的被識別與暴露三礁答案)用戶畫像的生成惡意廣告的推送病毒入侵3、 題目:大數據基于云計算進行數據的分析,那么云計算按照提供的服務類型進行分類,包括laaS、PaaS、()[單選題]*XenSaaSilE確答案.)KVMDocker4、 題目:以下哪個不是海量大數據的常用處理工具()[單選題1*HadoopExcel正確答案)SparkHive5、題目:當前社會中,最為突出的大數據環境是()[單選題]*互聯網(正確答案物聯網綜合國力自然資源6、 題目:根據電信客戶的特征對客戶進行打標分類主要用到()算法[單選題]*分類聚類(正確答案)降維回歸7、 題目:以下哪一項屬于非結構化數據()[單選題]*視頻監控數據(正確答案)企業ERP數據財務系統數據日志數據8、 題目:大數據的起源是()[單選題]*金融電信C互聯網(正確答案)D.公共管理9、題目:統計分組時,若某標志值剛好等于相鄰兩組上下限數值時()[單選題]*將此數值歸入上限所在組將此數值歸入下限所在組(正確空案C-歸入這兩組中任意一組均可D.另立一組10、題目:有200家公司每位職工的工資資料,如果要調查這200家區水泥總產量的80%的五個大型水泥廠的生產情況進行調查,這種調查方式是()。[單選題]*普查典型調查C抽樣調查D.重點調查(正確答案)11、題目:某連續變量數列,其末組為開口組,下限為200,又知其鄰組的組中值為170,則末組組中值為()[單選題]*260215230IZ確答案)18512、題目:當一組數據屬于左偏分布時.則()[單選題]*平均數'中位數與眾數是合而為一的眾數在左邊、平均數在右邊眾數的數值較小,平均數的數值較大眾數在右邊'平均數在左邊王礁答案)13、 題目:要通過移動平均法消除季節變動得到趨勢值,則移動平均項數()[單選題]*應選擇奇數應和季節周期長度一致三確空案)應選擇偶數可取4或1214、題目:不重復抽樣平均誤差()。[單選題]*總是大于重復抽樣平均誤差總是小于重復抽樣平均誤差E確答案總是等于重復抽樣平均誤差以上情況都可能發生15、 題目:如果你的業務是銷售運動衫,哪一種運動衫號碼的度量對你更為有用0[單選題1*均值中位數眾數(正確答案)四分位數16、 題目:某年末某地區城市人均居住面積為20平方米,標準差為8.4平方米,鄉村人均居住面積為30平方米,標準差為11.6平方米,則該地區城市和鄉村居民居住面積的離散程度0【單選題1*鄉村較大城市較大正確答案城市和鄉村一樣不能比較17、 題目:重點調查的實施條件是()[單選題]*被調查的單位總數相當多存在少數舉足輕重的單位(正確答案調查結果能夠用于推算總體數據被調查的現象總量在各總體單位之間的分布極其不均勻18、 題目:抽樣平均誤差與極限誤差間的關系是()【單選題1*抽樣平均誤差大于極限誤差抽樣平均誤差等于極限誤差C抽樣平均誤差小于極限誤差D.抽樣平均誤差可能大于、等于或小于極限誤差[確筆案19、 題目:進行單側檢驗時,利用P值進行判斷,拒絕原假設的條件是0[單選題]*P值(正確答案)P值,P值P值>220、 題目:假設檢險中,第二類錯誤的概率表示()【單選題1*為真時拒絕的概率為真時接受的概率不真時拒絕的概率不真時接受的概率(正確答案)21、題目:時間序列在長時期內呈現出來的某種持續向上或持續下降的變動稱為趨勢:王碓答案)季節性C周期性D,隨機性22、 題目:根據各處的季度數據計算季節指數,各季節指數的平均數應等于()[單選題]*100%正確答案)400%25%023、 題目:如下哪些不是最近鄰分類器的特點。()[單選題]*它使用具體的訓練實例進行預測,不必維護源自數據的模型分類一個測試樣例開銷很大最近鄰分類器基于全局信息進行預測 :案可以生產任意形狀的決策邊界24、 題目:推薦系統為客戶推薦商品,自動完成個性化選擇商品的過程'滿足客戶的個性化需求,推薦基于網站最熱賣商品'客戶所處城市'()、推測客戶將來可能的購買行為。[單選題]*客戶的朋友客戶的個人信息客戶的興趣愛好客戶過去的購買行為和購買記錄(王確答案)25、題目:()的目的縮小數據的取值范圍,使其更適合于數據挖掘算法的需要,并且能夠得到和原始數據相同的分析結果?!締芜x題1*數據清洗數據集成數據變換數據歸約(正確答案26、 題目:某超市研究銷售紀錄數據后發現,買啤酒的人很大概率也會購買尿布,這種屬于數據挖掘的哪類問題?。[單選題]*關聯規則發現正哨答案)聚類分類自然語言處理27、 題目:以下兩種描述分別對應哪兩種對分類算法的評價標準?()(a)警察抓小偷,描述警察抓的人中有多少個是小偷的標準。(b)描述有多少比例的小偷給警察抓了的標準。[單選題]*Precision,RecallIE確答案)RecalLPrecisionPrecision,ROCRecalLROC28、 題目:將原始數據進行集成、變換、維度規約、數值規約是在以下哪個步驟的任務?0[單選題1*頻繁模式挖掘分類和預測數據預處理(正確答案)數據流挖掘29、 題目:當不知道數據所帶標簽時,可以使用哪種技術促使帶同類標簽的數據與帶其他標簽的數據相分離?0[單選題]*分類聚類(正確答案)關聯分析隱馬爾可夫鏈30、 題目:建立一個模型,通過這個模型根據已知的變量值來預測其他某個變量值屬于數據挖掘的哪一類任務?0【單選題1*根據內容檢索建模描述預測建模(正確答案)尋找模式和規則31、 題目:下面哪種不屬于數據預處理的方法?()[單選題]*變量代換離散化聚集估計遺漏值確答案)32、 題目:假設12個銷售價格記錄組已經排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內?0[單選題1*第一個第二個(正確答案)第三個第四個33、 題目:下面哪個不屬于數據的屬性類型()[單選題]*標稱序數區間相異(正確答案)34、 題目:只有非零值才重要的二元屬性被稱作()[單選題]*計數屬性離散屬性非對稱的二元屬性E確答案對稱屬性35、 題目:以下哪種方法不屬于特征選擇的標準方法:()[單選題]*嵌入過濾C包裝D.抽樣(正確答案)36、 題目:下面不屬于創建新屬性的相關方法的是:()[單選題]*特征提取特征修改映射數據到新的空間特征構造(正確答案)37、 題目:下面哪個屬于映射數據到新的空間的方法?()[單選題]*傅立葉變換ZZ碓答案)特征加權漸進抽樣維歸約38、 題目:假設屬性income的最大最小值分別是12000元和98000元。利用最大最小規范化的方法將屬性的值映射到。至1的范圍內。對屬性income的73600元將被轉化為:()[單選題]*0821(正確答案)TOC\o"1-5"\h\z1.2241.4580.71639、 題目:一所大學內的各年紀人數分別為:一年級200人,二年級160人,三年級130人,四年級110人。則年級屬性的眾數是:()|單選題]*—年級,正確答案二年級三年級四年級40、 題目:下列哪個不是專門用于可視化時間空間數據的技術()[單選題]*等高線圖餅圖(正確答案)曲面圖矢量場圖41'題目:在抽樣方法中,當合適的樣本容量很難確定時,可以使用的抽樣方法是0[單選題1*有放回的簡單隨機抽樣無放回的簡單隨機抽樣分層抽樣D漸進抽樣(正確答案)42、 題目:數據倉庫是隨著時間變化的.下面的描述不正確的是()[單選題]*數據倉庫隨時間的變化不斷增加新的數據內容捕捉到的新數據會覆蓋原來的快照數據倉庫隨事件變化不斷刪去舊的數據內容正確筆案數據倉庫中包含大量的綜合數據,這些綜合數據會隨著時間的變化不斷地進行重新綜合43、 題目:下面關于數據粒度的描述不正確的是()[單選題1*粒度是指數據倉庫小數據單元的詳細程度和級別數據越詳細,粒度就越小,級別也就越高數據綜合度越高,粒度也就越大,級別也就越高IZ峰空案粒度的具體劃分將直接影響數據倉庫中的數據量以及查詢質量44'題目:有關數據倉庫的開發特點.不正確的描述是:0[單選題]*數據倉庫開發要從數據出發正確答案)數據倉庫使用的需求在開發出去就要明確數據倉庫的開發是一個不斷循環的過程、是啟發式的開發在數據倉庫環境中、并不存在操作型環境中所固定的和較確切的處理流,數據倉庫中數據分析和處理更靈活.且沒有固定的模式45'題目:關于OLAP的特性,下面正確的是()[單選題]*(l)(2)(3)(2)(3)(4)(D(2)(3)⑷(l)(2)(3)(4)(5)(正確答案)46、 題目:關于OLAP和OLTP的區別描述,不正確的是:()[單選題]*OLAP主要是關于如何理解聚集的大量不同的數據.它與OTAP應用程序不同與OLAP應用程序不同QLTP應用程序包含大量相對簡單的事務OLAP的特點在于事務量大,但事務內容比較簡單且重復率高一OLAP是以數據倉庫為基礎的.但其最終數據來源與OLTP一樣均來自底層的數據庫系統.兩者面對的用戶是相同的47、 題目:關于OLAP和OLTP的說法,下列不正確的是:()[單選題]*OLAP事務量大,但事務內容比較簡單且重復率高確絲案)OLAP的最終數據來源與OLTP不一樣OLTP面對的是決策人員和高層管理人員OLTP以應用為核心,是應用驅動的48、 題目:設X={1,2,3}是頻繁項集,則可由X產生()個關聯規則。()[單選題]*TOC\o"1-5"\h\z456E確答案)749、 題目:考慮下面的頻繁3-項集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定數據集中只有5個項,采用合并策略,由候選產生過程得到4-項集不包含()[單選題]*1,2,3,41,2,3,51,2,4,5(1,3,4,550、 題目:在圖集合中發現一組公共子結構,這樣的任務稱為()[單選題]*頻繁子集挖掘頻繁子圖挖掘(正確答案)頻繁數據項挖掘頻繁模式挖掘51、 題目:下列度量不具有反演性的是()[單選題1*系數幾率Cohen度量興趣因子正確答案)二'大數據(多選)1、 題目:數據質量的問題體現在()*完整性正確答案一致性正確答案合法性正確答案)精確性(正確答案2、 題目:大數據平臺建設原則為()*統一數據入湖:全網數據統一采集到大數據湖,利用大數據分布式計算'存儲能力實現跨域數據處理正確答案)統一技術架構:采用全網統一的PaaS架構構建大數據平臺,統一組件標準,通過全網統一調度管控兩級資源正確答案)統一數據服務:對外提供統一數據服務,通過API'標簽'模型'指標'卡片等方式全網開放使用(正確答案)統一開發平臺:提供基于專區'Al、跨域數據的統一開發平臺,打造全網生態化大數據應用敏捷開發生態正二角答案)3、題目:大數據平臺的業務目標為()*全面、客觀、真實、及時反映業務運營情況,為各級領導提供企業經營的決策依據正確答案)快速支撐精確管理、精準營銷、精細服務等各類需求正確答案)c.實現企業數據和應用的有效共享,降本增效(E確答案)D.建立數據全生命周期的安全保障體系,降低數據泄露的風險已匕然;案4、 題目:下列指標屬于離散變量的有()*客戶移動上網流量員工年齡正確答案)基站電費基站數量(正確答案5、 題目:目前中國電信企業級大數據平臺包含()等架構()*大數據平臺采集系統王礁答案)大數據平臺基礎能力系統正確答案)大數據平臺核心處理能力系統E燒答案大數據平臺安全管理系統正確答案I大數據應用三確答案)6、 題目:大數據在電信行業有哪些應用()*網絡運維優化一確空案網絡規劃建設;正確”案)太空通信市場推送(正確答案)7、 題目:以下關于非頻繁模式說法,正確的是()*其支持度小于閾值正確答案)都是不讓人感興趣的包含負模式和負相關模式對異常數據項敏感8、題目:以下屬于分類器評價或比較尺度的有:()*預測準確度工確答案召回率(正確答案)模型描述的簡潔度計算復雜度工確答案)9、 題目:貝葉斯信念網絡(BBN)有如下哪些特點。()*構造網絡費時費力E確答案)對模型的過分問題非常魯棒三確專案貝葉斯網絡不適合處理不完整的數據網絡結構確定后,添加變量相當麻煩10、 題目:以下屬于聚類算法的是()。*K-Means3.W答案DBSCAN笞案AprioriKNN11、 題目:()都屬于簇有效性的監督度量。0*輪廓系數共性分類相關系數C炳(正確答案)D.(正確答案)F度量12、題目:()這些數據特性都是對聚類分析具有很強影響的。()*高維性(正確答案規模(正確答案)稀疏性(正確答案)噪聲和離群點(正確答案)13、 題目:在聚類分析當中,()等技術可以處理任意形狀的簇。()*MIN(單鏈)(正確答案)MAX(全鏈)組平均Chameleon磔答案14、 題目:()都屬于分裂的層次聚類算法。()*A二分K均值(正確答案)MST(正確答案)Chameleon組平均15、 題目:數據挖掘的挖掘方法包括:()*文本總結正確答案)文本分類(正確答案文本聚類(正確答案)關聯規則正確答案)16、 題目:基于內容的推薦生成推薦的過程主要依靠()*A.內容分析器王礁答案)推薦系統文件學習器正確答案)過濾部件正確答案i17、題目:云計算的服務方式有()*IaaS正確答案)RaasPaaS(正確答案)SaaSi王礁答案)18、 題目:數據預處理方法主要有()。*數據清洗(正確答案)數據集成(正確答案C數據變換(正確答案)D.數據歸約(正確答案)19、 題目:與傳統的分布式程序設計相比,M叩reduce封裝了()等細節,還提供了一個簡單而強大的接口。()*并行處理(正確答案)容錯處理(正確答案本地化計算E確答案)負載均衡正確答案)三、大數據(判斷)1、題目:預測腫瘤細胞是良性還是惡性屬于回歸問題。。[單選題1*正確錯誤2、 題目:大數據平臺安全管理系統的功能為:從各系統獲取曰志,同時為各系統提供安全控制策略。0[單選題1*A.正確正確答案)B.錯誤3、 題目:大數據平臺基礎能力系統的功能為:作為整個大數據平臺的基礎框架,為其他系統提供二次開發、管理的工具和組件。0[單選題]*正確正確答案)錯誤4、 題目:對于大數據而言,最基本、最重要的要求就是減少錯誤)'保證質量。因此,大數據收集的信息量要盡量精確。0[單選題]*正確錯誤(正確答案)5'題目:有監督學習不需要進行數據標注。0[單選題]*正確錯誤(正確答案)6、題目:數據分析時,數據維度越多越好。0[單選題]*A.正確B.錯誤(正確答案)7、題目:信息化主要是產生和整合數據,大數據是把對經驗的挖掘和利用做到極致,智能化的核心是會學習的機器、可對未知的事件進行模擬。0【單選題1*A.正確正確答案)B.錯誤8、 題目:運營商大數據不能識別記錄手機終端型號。0【單選題1*正確錯誤(正確答案)9、 題目:運營商數據整合困難,數據都是短期的,不穩定的。0[單選題]*正確錯誤(正確答案)10、 題目:大數據平臺核心處理能力系統的功能為:對接口層數據進行加工處理,形成按照主題域組織的整合層數據和按照客戶和企業管理視角組織的中間層數據。0[單選題1*A.正確正確答案)B.錯誤11、 題目:企業級大數據平臺可實現統一調度任務管理'加工流程'監控分析、跨集群、跨租戶的調度能力進行封裝打包產品化,形成可訂閱的大數據產品能力,提供給開發用戶及合作伙伴使用。0【單選題1*A.正確正確答案)B.錯誤12、 題目:數據來源多處,可以避免數據完整性問題。0[單選題]*正確錯誤正確答案13、 題目:大數據與云計算兩者結合起來,將給世界帶來一場深刻的管理技術革命和社會治理創新。0[單選題1*正確正確答案)錯誤14、 題目:企業級的數據中心,基于“集中、開放、云化”原則,按照平臺與應用分離的設計思路,打造企業級的大數據平臺,有序推進企業的大數據戰略。0[單選題]*正確正確答案)錯誤15、 題目:數據科學的關鍵要素包括數據源、模型和計算能力及廣泛的應用場景。0[單選題]*正確正確答案)錯誤16、 題目:數據按每分鐘提供,就是滿足數據的及時性要求。0[單選題]*正確錯誤(王確答案17、 題目:中國電信基于云網一體的大數據湖,建設邏輯統一、物理分散中國電信特色的大數據平臺,匯聚融合IT、CT全域數據,實現“大數據+AI”開發生態全網統一賦能、平臺統一管理、全網PaaS平臺統一、全網數據統一接入、全網應用共建共享,助力企業數字化轉型。0【單選題1*A.正確(正確答案)B.錯誤18、 題目:信息化、大數據、智能化是相輔相成的。0[單選題]*A.正確正確答案)B.錯誤19、 題目:大數據平臺采集系統的功能為:匯聚不同來源的數據,接口數據清洗、稽核校臉'模型規范后,將數據規整到相關域,統一存放在大數據平臺指定地方,形成接口層數據。0[單選題]*A.正確(正確答案)B.錯誤20、 題目:大數據和AI的方法最終目的是使得整個社會的運轉效率顯著提高。0[單選題1*A.正確正確答案)B.錯誤21、 題目:深度學習是機器學習的一部分,機器學習又是人工智能的一部分。0[單選題]*A.正確正確答案)B.錯誤22'題目:對于大型'中等'小型規模的公司而言,大數據對中等規模的公司幫助最大。0[單選題]*正確錯誤(正確答:23、 題目:當前,企業提供的大數據解決方案大多基于Hadoop開源項目。0【單選題1*A.正確正確答案)B.錯誤24、 題目:中國電信的疫情防控行程查詢助手為翼知疫行,為政府及個人提供了包括區域風險查詢、疫情預測查詢、返程報告查詢、行程查詢和接觸查詢等功能。0【單選題1*A.正確正確答案)B.錯誤25、 題目:大數據平臺專區是基于集團大數據平臺為省公司打造的一站式數據應用開發平臺,能夠為各省開發者提供從底層(計算、存儲、工具能力)、中間(OpenAPI,模型)到上層應用快速數據科學探索的一條龍服務。0[單選題1*A.正確正確答案)B.錯誤26、 題目:數據存儲是大數據平臺的根本,沒有存儲平臺,數據也就沒有了載體。0【單選題1*A.正確正確答案)B.錯誤27、 題目:大數據平臺數據管理系統的功能為:為核心處理能力系統提供監控管理'調度管理等功能,并為采集系統和應用提供相應的數據質量'主數據管理等功能支持。0[單選題]*A.正確(正確答案)B.錯誤28、 題目:中國電信大數據平臺數據沙箱為一站式大數據和數據科學實訓競賽平臺。0[單選題]*A.正確正確答案)B.錯誤29、 題目:對存在上升或下降趨勢的時間序列,季節比率大于1,表明在不考慮其他因素影響時,由于季節因素的影響使實際值高于趨勢值。0[單選題1*A.正確正確答案)B.錯誤30、 題目:在大量觀察的情況下,系統性誤差在數據匯總后可相互抵消。0【單選題1*正確錯誤王確答案I31、 題目:評價點估計的有效性是指:對同一總體參數的兩個無偏點估計量,有更小標準差的估計量更一致。0【單選題1*A.正確正確答案)B.錯誤32、 題目:相關系數r為。表示兩個變量之間不存在任何關系。0【單選題1*正確錯誤(正確答案)33、 題目:對季度數據序列,用移動平均法測定其長期趨勢值時,可采用四項移動平均。0[單選題1*A.正確正確答案)B.錯誤34、 題目:統計學這一名詞是由威廉配第最早提出的。0[單選題1*正確錯誤(正確答案)35、 題目:若要通過隨機抽樣調查了解某大學在校學生的通訊費用支出情況,抽樣框可以是全部在校學生的手機號碼,也可以是全部在校學生的學號。0[單選題]*正確錯誤(正確答案)36、 題目:算術平均數易受數列中極端值的影響,中位數次之,眾數幾乎不受極端值的影響。0[單選題1*A.正確正確答案)B.錯誤37、題目:峰度是用于衡量分布的不對稱程度或偏斜程度的指標。0[單選題]*正確錯誤(正確答案)38、 題目:所謂小概率原理,即指概率很小的事件實際上不可能出現;這種事件稱為“實際不可能事件:0[單選題1*正確錯誤(正確答案)39、 題目:分類是預測數據對象的離散類別,預測是用于數據對)象的連續取值。0[單選題1*A.正確正確答案)B.錯誤40、 題目:時序預測回歸預測一樣,也是用已知的數據預測未來的值,但這些數據的區別是變量所處時間的不同。0[單選題]*正確錯誤(正確答案)41'題目:數據挖掘的主要任務是從數據中發現潛在的規則,從而能更好的完成描述數據、預測數據等任務。0[單選題1*A.正確正確答案)B.錯誤42、題目:對遺漏數據的處理方法主要有:忽略該條記錄;手工填補遺漏值;利用默認值填補遺漏值;利用均值填補遺漏
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 微生物培養基的配制試題及答案
- 項目溝通管理的信息流動性試題及答案
- 高分攻略的證券從業資格證試題及答案
- 2025年會計決策模型試題及答案
- 逐步提高2025年證券從業資格證考試試題及答案
- 財務深度分析案例研究試題及答案
- 2025年國際金融理財師考試的多元化投資策略試題及答案
- 專家論證施工方案的流程
- 2025年審計核心技能試題及答案
- 2024年微生物實驗室的統計應用試題及答案
- 國家森林公園景區信息化建設規劃方案
- 盤扣式腳手架安全管理課件
- 大學生應征入伍學費補償申請表
- 6-4協同進化與生物多樣性的形成教案
- 2025年燒烤店創業計劃書
- 光伏強條執行計劃
- 《立體裁剪電子教案》課件
- 2024-2030年中國高等教育行業發展策略及投資改革創新模式分析報告
- 生產安全事故報告及處置制度模版(3篇)
- 《教育系統重大事故隱患判定指南》知識培訓
- 牡蠣養殖及深加工項目可行性研究報告
評論
0/150
提交評論