




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試卷科目:大數(shù)據(jù)CDA考試大數(shù)據(jù)CDA考試(習(xí)題卷10)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)CDA考試第1部分:?jiǎn)雾?xiàng)選擇題,共47題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.以下對(duì)眾數(shù)的說(shuō)法中,不對(duì)的是()。A)眾數(shù)是出現(xiàn)的次數(shù)B)眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)數(shù)C)一組數(shù)據(jù)中的眾數(shù)可能不存在D)D一組數(shù)據(jù)中可能存在多個(gè)眾數(shù)答案:A解析:當(dāng)有幾個(gè)數(shù)的個(gè)數(shù)相等而且在這組數(shù)中是個(gè)數(shù)最多的數(shù)時(shí),眾數(shù)可能是某幾個(gè)數(shù)而不一定僅僅是某一個(gè)數(shù)。[單選題]2.將總體分成均衡的幾個(gè)部分,然后按照預(yù)先定出的規(guī)則,從每一部分抽取一個(gè)個(gè)體,得到所需要的樣本,這種抽樣方法叫做()。A)隨機(jī)抽樣B)分層抽樣C)整群抽樣D)系統(tǒng)抽樣答案:D解析:[單選題]3.Hive中的數(shù)據(jù)類型,下面說(shuō)正確的是()。A)TINYINT,1個(gè)字節(jié)(8位)有符號(hào)整數(shù)B)SMALLINT,2個(gè)字節(jié)(16位)有符號(hào)整數(shù)C)INT,4個(gè)字節(jié)(32位)有符號(hào)整數(shù)D)以上都正確答案:D解析:[單選題]4.如下哪項(xiàng)不是ZooKeeper的關(guān)鍵特性()?A)最終一致性B)延時(shí)性C)可靠性D)等待無(wú)關(guān)性答案:B解析:[單選題]5.關(guān)于fusioninsightmaster界面hive日志收集的描述中,哪個(gè)不對(duì)?A)可指定實(shí)例進(jìn)行日志收集,比如指定收集metastore的日志B)可指定節(jié)點(diǎn)ip進(jìn)行下載某個(gè)ip的日志C)可指定特定用戶進(jìn)行日志收集,例如僅下載用戶的日志D)可指定時(shí)間進(jìn)行日志收集,如:只收集2016-1-1到20161-10的日志答案:C解析:[單選題]6.以下關(guān)于DBSCAN算法說(shuō)法錯(cuò)誤的是()。A)如果樣本集的密度不均勻、聚類間距差相差很大時(shí),聚類質(zhì)量較差;B)如果樣本集較大時(shí),聚類收斂時(shí)間較長(zhǎng);C)調(diào)參相對(duì)復(fù)雜,不同的參數(shù)組合對(duì)最后的聚類效果有較大影響。D)聚類結(jié)果可能有偏倚。答案:D解析:[單選題]7.在很多小文件場(chǎng)景下,Spark會(huì)起很多Task,當(dāng)SQL邏輯中存在Shuffle操作時(shí),會(huì)大大增加hash分桶數(shù),嚴(yán)重影響性能。Fusioninsight中,針對(duì)小文件的場(chǎng)景通常采用()算子,來(lái)對(duì)Table中的小文件生成的partition進(jìn)行合并,少partition數(shù),從而避免在shuffle的時(shí)候,生成過(guò)多的hash分桶,提升性能?A)groupbyB)CoaleaseC)connectD)join答案:D解析:[單選題]8.HBase依賴()技術(shù)框架提供消息通信機(jī)制。A)ZookeeperB)ChubbyC)RPCD)Socket答案:A解析:[單選題]9.Apriori算法使用哪個(gè)指標(biāo)篩選項(xiàng)目集(Itemset)?()A)交易編號(hào)(TransactionID)B)最小支持度(MinimumSupport)C)最小信賴度(MinimumConfidence)D)購(gòu)買數(shù)量答案:B解析:[單選題]10.Flume支持多級(jí)級(jí)聯(lián)的sink類型是()?A)hdfssinkB)avrosinkC)filerollsinkD)hbasesink答案:B解析:[單選題]11.HBase表中每個(gè)cell的多版本是通過(guò)()表示的。A)timestampB)rowkeyC)blockidD)cellid答案:A解析:[單選題]12.結(jié)構(gòu)化程序設(shè)計(jì)所規(guī)定的三種基本控制結(jié)構(gòu)是()A)輸入、處理、輸出B)樹形、同形、環(huán)形C)順序、選擇、循環(huán)D)主程序、子程序、函數(shù)答案:C解析:[單選題]13.下面與Zookeeper類似的框架是?A)ProtobufB)JavaC)KafkaD)Chubby答案:D解析:[單選題]14.下列情境中,數(shù)據(jù)分析師不正確的做法是()A)客戶行為分析中決策數(shù)據(jù)化均需謹(jǐn)慎B)數(shù)據(jù)挖掘分析中勢(shì)必強(qiáng)調(diào)模型的精確性,模型都不精確談何決策支持C)數(shù)據(jù)分析師需要具備建構(gòu)模型和數(shù)據(jù)展示的能力D)業(yè)務(wù)問(wèn)題的洞察與模型的理解同樣重要答案:B解析:本題A和B產(chǎn)生疑惑,A項(xiàng)決策數(shù)據(jù)化均需謹(jǐn)慎不僅僅在客戶行為分析中,在其他數(shù)據(jù)分析中也是同樣,B項(xiàng)?數(shù)據(jù)挖掘分析中,模型都不精確談何決策支持?模型的精確性是一個(gè)很模糊的字眼,況且使用?勢(shì)必?顯然不合適。在不同行業(yè)中,對(duì)精確性的要求不同,此外如果模型精確度不夠,但卻能發(fā)現(xiàn)有用的商業(yè)知識(shí)也是可以接受。多選題共20題,共40、0分[單選題]15.RDD有Transformation和Action算子,下列屬于Action算子的是?()A)mapB)saveASTexFileC)FilterD)reducebykey答案:B解析:[單選題]16.在Fusioninsiehtaanarer界面中,對(duì)Loader的操作不包括下列哪個(gè)選項(xiàng)新)A)切換Loader主備節(jié)點(diǎn)B)啟動(dòng)Loader實(shí)例C)配置Loader參數(shù)D)查看Loader服務(wù)狀態(tài)答案:A解析:[單選題]17.YARN中設(shè)置隊(duì)列Queue的最大使用資源量,需要配置哪個(gè)參數(shù)?A)yarnschedulercapacity.root.Queueaminimum-user-limitmpercentB)yarn.schedulercapacity.root.Queueamaximum-capacityC)yam.schedulercapacity.root.Queuea,minimum.user-limit-factorD)yarnschedulercapacity.root.Queuea/stat答案:B解析:[單選題]18.在進(jìn)行缺失值填補(bǔ)時(shí),若數(shù)據(jù)呈明顯的偏態(tài)分布,則可考慮采用下列哪種方法?()A)將存在缺失值的樣本刪除B)將存在缺失值的變量刪除C)中位數(shù)填補(bǔ)D)均值填補(bǔ)答案:C解析:中位數(shù)不受具體數(shù)據(jù)分布的影響[單選題]19.一家電商抽取了36個(gè)消費(fèi)者年齡作為隨機(jī)樣本,得到樣本均值為40,樣本標(biāo)準(zhǔn)差為6。該電商客戶年齡90%的置信區(qū)間為()z0、05=1、65A)(34,46)B)(38、35,41、65)C)(39、1,40、9)D)(39、15,40、95)答案:B解析:>[單選題]20.如果數(shù)據(jù)量較大,哪種聚類算法比較適合?()A)系統(tǒng)聚類B)快速聚類(k-means)C)A和B都可以D)A和B都不可以答案:B解析:[單選題]21.在Spark生態(tài)組件中,哪個(gè)產(chǎn)品可用于基于歷史數(shù)據(jù)的交互式查詢。()A)SparkCoreB)SparkSqlC)SparkStreamingD)MLlib答案:B解析:[單選題]22.Zookeeper的Scheme認(rèn)證方式不包括以下哪項(xiàng)?()A)digestB)saslC)authD)world答案:B解析:[單選題]23.Hive不適用于以下哪個(gè)場(chǎng)景A)非實(shí)時(shí)分析,例如日析B)數(shù)據(jù)挖掘,例如用戶析,區(qū)域展示C)數(shù)據(jù)匯總,例如母天,每擊數(shù),點(diǎn)擊排行D)實(shí)時(shí)在線數(shù)答案:D解析:[單選題]24.以下哪個(gè)channel類型的數(shù)據(jù)不會(huì)持久化()?A)FileChanneB)MemoryChannelC)JDBCChannelD)HDFSChannel答案:B解析:[單選題]25.數(shù)據(jù)挖掘算法中,下列關(guān)于聚類的說(shuō)法中,錯(cuò)誤的是()A)不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別B)要求同類數(shù)據(jù)的內(nèi)容相似度盡可能小C)要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能小D)與分類挖掘技術(shù)相似的是,都是要對(duì)數(shù)據(jù)進(jìn)行分類處理答案:B解析:[單選題]26.神經(jīng)網(wǎng)絡(luò)是()算法的一種。A)分類B)聚類C)關(guān)聯(lián)D)回歸答案:A解析:[單選題]27.在Flink的運(yùn)行流程中,負(fù)責(zé)申請(qǐng)資源的角色是?A)ResourcemanagerB)JobmanagerC)ClientD)Taskmanager答案:B解析:[單選題]28.以下哪種說(shuō)法不是K-Means算法的優(yōu)點(diǎn)。()A)收斂較快B)選代次數(shù)一般為幾次,較神經(jīng)網(wǎng)絡(luò)簡(jiǎn)單C)中心點(diǎn)的個(gè)數(shù),通常值是在3-5個(gè)之間D)算法可能收斂到局部最優(yōu)點(diǎn)答案:D解析:[單選題]29.分析師小A想要對(duì)多元線性回歸y=b0+b1x1+b2x2+…+bnxn+ε進(jìn)行線性關(guān)系檢驗(yàn)時(shí),他設(shè)定的原假設(shè)可以是()A)b0=b1=……=bn=0B)b1=……=bn=0C)b0,b1,……,bn中存在任意一個(gè)不為0D)b1,……,bn中存在任意一個(gè)不為0答案:B解析:與一元線性回歸不同在于,多元線性回歸的原假設(shè)為所有自變量前的參數(shù)同時(shí)為0。[單選題]30.Hadoop組件在企業(yè)應(yīng)用中,能用于大數(shù)據(jù)集實(shí)時(shí)查詢的產(chǎn)品有()。A)HiveB)PigC)MahoutD)Hbase答案:D解析:[單選題]31.HBase中的批量加載底層使用()實(shí)現(xiàn)。A)MapReduceB)HiveC)CoprocessorD)BloomFilter答案:A解析:[單選題]32.假設(shè)每個(gè)用戶最低資源保障設(shè)置為yarn,scheduler,capacity,root,QueueAminimum-user-limit-percent=24,則以下說(shuō)法錯(cuò)誤的是?()A)第3個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得33.33%的資源B)第2個(gè)用戶提交住務(wù)時(shí),每個(gè)用戶最多獲得50%的資源C)第4個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得25%的資源D)第5個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得20%的資源答案:D解析:[單選題]33.以下關(guān)于HiveSQL基本操作描述正確的是?()A)創(chuàng)建外部表必須要指定Location信息B)創(chuàng)建外部表使用external關(guān)鍵字,創(chuàng)建普通表需要指定internal關(guān)鍵字C)加教數(shù)據(jù)到Hive時(shí)源數(shù)據(jù)必列是HDFS的一個(gè)路徑D)創(chuàng)建表時(shí)可以指定列分割符答案:D解析:[單選題]34.隨機(jī)抽取一家企業(yè)的25個(gè)產(chǎn)品樣品,測(cè)得樣品長(zhǎng)度為60厘米。已知產(chǎn)品長(zhǎng)度分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為5厘米。那么該批產(chǎn)品平均長(zhǎng)度的置信區(qū)間為()注:置信水平為95%,z0.025=1.96A)(58.04,B)(55,C)(54.45,D)(54.46,答案:A解析:>[單選題]35.下列論據(jù)中,能夠支撐?大數(shù)據(jù)無(wú)所不能?的觀點(diǎn)的是()。A)互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為B)大數(shù)據(jù)存在泡沫C)大數(shù)據(jù)具有非常高的成本D)個(gè)人隱私泄露與信息安全擔(dān)憂答案:D解析:[單選題]36.邏輯回歸屬于()A)無(wú)監(jiān)督學(xué)習(xí)B)有監(jiān)督學(xué)習(xí)C)半監(jiān)督學(xué)習(xí)D)非監(jiān)督學(xué)習(xí)答案:B解析:邏輯回歸是有監(jiān)督學(xué)習(xí)的算法。[單選題]37.偏自相關(guān)函數(shù)ACF呈現(xiàn)緩慢的趨近于零,我們稱ACF具有()A)長(zhǎng)尾性B)短尾性C)收斂性D)拖尾性答案:D解析:如果偏自相關(guān)函數(shù)ACF在n階之后迅速趨近于零,我們稱ACF具有n階截尾性;呈現(xiàn)緩慢的趨近于零,稱為拖尾性。[單選題]38.數(shù)據(jù)分析挖掘是非常有價(jià)值的,它與現(xiàn)實(shí)生活是密切相關(guān)的,以下哪些是在銀行中的應(yīng)用場(chǎng)景?A)信用卡的審批額度B)掌銀對(duì)消費(fèi)者的產(chǎn)品推薦C)貴賓客戶的流失預(yù)測(cè)D)以上全是答案:D解析:[單選題]39.Flink中的(接口用于流數(shù)據(jù)處理,()接口用于批處理?A)DatabatchAPI,DatastreamAPIB)StreamAPI,BatchAPIC)DatastreamAPI,DatasetAPID)BatchAPI,StreamAPI答案:C解析:[單選題]40.分析師在研究中發(fā)現(xiàn)ABC公司的銷售額滿足公式y(tǒng)()=3×y()+2×y()。那么請(qǐng)問(wèn)這是一個(gè)幾階的時(shí)間序列呢()A)1B)2C)3D)4答案:C解析:時(shí)間序列方程中最多包含到y(tǒng)(t-p)項(xiàng),則這個(gè)時(shí)間序列是p階的。[單選題]41.FusioninsightHD系統(tǒng)審計(jì)日志不可以記錄下面哪些操作?A)手動(dòng)清除告警B)啟停服務(wù)實(shí)例C)查詢歷史監(jiān)控D)除服務(wù)實(shí)例答案:C解析:[單選題]42.WTForms中用來(lái)驗(yàn)證數(shù)據(jù)是否有效使用的是A)DataRequired()B)RequiredC)InputRequired()D)Optional()答案:A解析:[單選題]43.滿足最小支持度閾值(minsup)的所有項(xiàng)集稱為()。A)項(xiàng)B)項(xiàng)集C)頻繁項(xiàng)集D)頻繁K項(xiàng)集答案:C解析:[單選題]44.在MapReduce中,()組件是用戶不指定也不會(huì)有默認(rèn)的。A)CombinerB)OutputFormatC)PartitionerD)InputFormat答案:A解析:[單選題]45.層次聚類中,聚類的變量類型是()A)連續(xù)變量B)分類變量C)兩者都可以D)不確定答案:C解析:層次聚類的變量可以是連續(xù)變量,也可以是分類變量。[單選題]46.在查看中國(guó)電商市場(chǎng)的交易數(shù)據(jù)時(shí),會(huì)發(fā)現(xiàn)由于雙11的存在,中國(guó)電商市場(chǎng)的交易額會(huì)在每年第四季度有很大的增幅。這一特征體現(xiàn)了電商市場(chǎng)成交數(shù)據(jù)的()A)長(zhǎng)期趨勢(shì)變動(dòng)B)季節(jié)變動(dòng)C)周期變動(dòng)D)以上都是答案:B解析:周期變動(dòng)一般是指2-3年以上的循環(huán)。[單選題]47.分析師小A發(fā)現(xiàn)某產(chǎn)品銷量數(shù)據(jù)有明顯的長(zhǎng)期趨勢(shì)變動(dòng),則小A可以考慮采用()A)移動(dòng)平均值法B)向量自回歸法C)差分法D)固定效應(yīng)法答案:A解析:移動(dòng)平均法是測(cè)定長(zhǎng)期趨勢(shì)變動(dòng)的一種常用方法。第2部分:多項(xiàng)選擇題,共29題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]48.下列()可以作為集群的管理工具。A)PuppetB)Rsync+ssh+scpC)PdshD)ClouderaManager答案:ABCD解析:[多選題]49.分析消費(fèi)者購(gòu)買行為模型的特征變量有()。A)自然社會(huì)因素B)文化因素C)產(chǎn)品因素D)個(gè)人因素答案:ABCD解析:[多選題]50.scala語(yǔ)言中一個(gè)函數(shù)可以定義在A)構(gòu)造函數(shù)里B)class內(nèi)C)object內(nèi)D)main函數(shù)內(nèi)答案:ABCD解析:[多選題]51.HBase官方版本可以安裝在()操作系統(tǒng)上。A)CentOSB)UbuntuC)RedHatD)Windows答案:ABC解析:[多選題]52.HadoopHDFS自身的局限性包括()。A)不適合做低延遲、細(xì)粒度訪問(wèn)B)無(wú)法高效存儲(chǔ)大量的小文件C)不支持多文件的寫入及任意修改文件D)無(wú)法實(shí)現(xiàn)數(shù)據(jù)的冗余備份存儲(chǔ)答案:ABC解析:[多選題]53.大數(shù)據(jù)4V特征包括()。A)數(shù)據(jù)規(guī)模大,數(shù)據(jù)量巨大(Volume)B)數(shù)據(jù)種類繁多,包括半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)(Variety)C)價(jià)值密度低,如同沙里淘金(Value)D)數(shù)據(jù)處理速度快,能實(shí)時(shí)獲取信息(Velocity)答案:ABCD解析:[多選題]54.大數(shù)據(jù)處理流程可以概括為以下哪幾步?A)挖掘B)采集C)統(tǒng)計(jì)和分析D)導(dǎo)入和預(yù)處理答案:ABCD解析:[多選題]55.下面選項(xiàng)中,哪些不是mysql數(shù)據(jù)庫(kù)的引擎A)InnodbB)OLTPC)MemoryD)OLAP答案:BD解析:[多選題]56.下列關(guān)于基于大數(shù)據(jù)的營(yíng)銷模式和傳統(tǒng)營(yíng)銷模式的說(shuō)法中錯(cuò)誤的是()。A)傳統(tǒng)營(yíng)銷模式比基于大數(shù)據(jù)的營(yíng)銷模式投入更小B)傳統(tǒng)營(yíng)銷模式比基于大數(shù)據(jù)的營(yíng)銷模式針對(duì)性更強(qiáng)C)傳統(tǒng)營(yíng)銷模式比基于大數(shù)據(jù)的營(yíng)銷模式轉(zhuǎn)化率低D)基于大數(shù)據(jù)的營(yíng)銷模式比傳統(tǒng)營(yíng)銷模式實(shí)時(shí)性更強(qiáng)答案:AB解析:[多選題]57.數(shù)據(jù)清理中,處理缺失值的方法是?A)估算B)整例刪除C)變量刪除D)成對(duì)刪除答案:ABC解析:[多選題]58.關(guān)于HadoopHDFS的冗余數(shù)據(jù)存儲(chǔ)設(shè)計(jì)的優(yōu)點(diǎn),下面說(shuō)話正確的是()。A)加快數(shù)據(jù)的傳輸速度,冗余備份可以并行訪問(wèn)數(shù)據(jù),加快了操作訪問(wèn)效率B)容易的檢查數(shù)據(jù)錯(cuò)誤,冗余備份機(jī)制可以用來(lái)互相參照,容易檢查數(shù)據(jù)錯(cuò)誤C)容易保持?jǐn)?shù)容易保持?jǐn)?shù)據(jù)的一致性,冗余備份機(jī)制使得即使有一個(gè)副本壞掉了,只要副本量低于預(yù)設(shè)值,系統(tǒng)會(huì)自動(dòng)復(fù)制副本達(dá)到預(yù)設(shè)值據(jù)的一致性/冗余備份機(jī)制使得即使有一個(gè)副本壞掉只D)提升磁盤空間的利用率,冗余備份機(jī)制使得磁盤空間有效利用答案:ABC解析:[多選題]59.Excel是MicrosoftOffice的組件之一,可以實(shí)現(xiàn)(A)數(shù)據(jù)處理B)統(tǒng)計(jì)分析C)數(shù)據(jù)可視化顯示D)輔助決策答案:ABCD解析:[多選題]60.一個(gè)理想的決策樹需要滿足的條件是()。A)葉子結(jié)點(diǎn)數(shù)最少B)葉子結(jié)點(diǎn)深度最小C)葉子結(jié)點(diǎn)數(shù)最多D)葉子結(jié)點(diǎn)深度最大答案:AB解析:[多選題]61.關(guān)于眾數(shù)說(shuō)法正確的是(1。A)不受分布數(shù)列的極大或極小值的影響B(tài))若將無(wú)眾數(shù)的分布數(shù)列重新分組或各組頻數(shù)依序合并,又會(huì)使分配數(shù)列再現(xiàn)出明顯的集中趨勢(shì)C)如果與眾數(shù)組相比鄰的上下兩組的次數(shù)相等,則眾數(shù)組的組中值就是眾數(shù)值,以此類推D)缺乏敏感性答案:ABCD解析:[多選題]62.以下關(guān)于Hadoop的HDFS描述正確的有?A)HDFS由NameNode,DataNode,client組成B)HDFS備NameNode上的元數(shù)據(jù)是主NameNode同步過(guò)去的C)HDFS采用就近的機(jī)架節(jié)點(diǎn)進(jìn)行數(shù)據(jù)的第一副本存儲(chǔ)D)HDFS適適合寫一次,多次讀取的讀寫答案:ACD解析:[多選題]63.數(shù)據(jù)分析結(jié)果呈現(xiàn)需要做哪些準(zhǔn)備工作。()A)確定表達(dá)的主題B)確定對(duì)比關(guān)系C)選擇圖形D)講解與說(shuō)明答案:ABC解析:[多選題]64.下列關(guān)于數(shù)生命周期管理的核心認(rèn)識(shí)中,正確的是()A)數(shù)據(jù)從產(chǎn)生到被刪除銷毀的過(guò)程中,具有多個(gè)不同的數(shù)據(jù)存在階段B)在不同的數(shù)據(jù)存在階段,數(shù)據(jù)的價(jià)值是不同的C)根據(jù)數(shù)據(jù)價(jià)值的不同應(yīng)該對(duì)數(shù)據(jù)采取不同的管理策略D)數(shù)據(jù)生命周期管理旨在產(chǎn)生效益的同時(shí),降低生產(chǎn)成本答案:ABC解析:[多選題]65.可以用于企業(yè)競(jìng)爭(zhēng)環(huán)境和行業(yè)分析的方法有()。A)4P理論B)PEST分析法C)SWOT分析法D)波特五力競(jìng)爭(zhēng)分析答案:BCD解析:[多選題]66.HBase的數(shù)據(jù)文件HFile中一個(gè)Keyvalue格式包含哪些信息?A)KevB)valueC)TimeStampD)Keytype答案:ABCD解析:[多選題]67.分析宏觀環(huán)境從以下哪些方面來(lái)收集信息。()A)政策法律環(huán)境B)經(jīng)濟(jì)環(huán)境C)社會(huì)文化環(huán)境D)技術(shù)環(huán)境答案:ABCD解析:[多選題]68.Hbase的數(shù)據(jù)文件HFile中一個(gè)Keyvalue格式包括哪些信息?A)keyB)valueC)TimestampD)KeyType答案:BC解析:[多選題]69.時(shí)間序列建模是一種應(yīng)用很廣的統(tǒng)計(jì)建模方法,可用在以下哪幾種情況。()A)系統(tǒng)描述B)系統(tǒng)分析C)預(yù)測(cè)未來(lái)D)決策和控制答案:ABCD解析:[多選題]70.對(duì)于HBase分布式存儲(chǔ)系統(tǒng),下面說(shuō)法正確的是()A)高可靠性B)高性能C)面向列D)可伸縮答案:ABCD解析:[多選題]71.傳統(tǒng)數(shù)據(jù)密集型行業(yè)積極探索和布局大數(shù)據(jù)應(yīng)用的表現(xiàn)是()。A)投資入股互聯(lián)網(wǎng)電商行業(yè)B)打通多源跨域數(shù)據(jù)C)提高分析挖掘能力D)自行開(kāi)發(fā)數(shù)據(jù)產(chǎn)品答案:BC解析:[多選題]72.下列數(shù)據(jù)結(jié)構(gòu)不具有記憶功能的是?A)隊(duì)列B)循環(huán)隊(duì)列C)棧D)順序表答案:AC解析:[多選題]73.數(shù)據(jù)分析挖掘流程不包括哪些?A)基層調(diào)查B)數(shù)據(jù)收集C)構(gòu)建模型和模型評(píng)估D)分析師培養(yǎng)答案:AD解析:[多選題]74.Flink的兼容性體現(xiàn)在以下哪些方面?A)YARN能夠作為F1ink集群的資諒調(diào)度管理器B)能夠與Hadoop原有的Mappers和Reducers混合使C)能夠使用Hadoop的格式化輸入和輸出口D)能夠從本地獲取數(shù)據(jù)答案:ACD解析:[多選題]75.建立大數(shù)據(jù)需要設(shè)計(jì)一個(gè)什么樣的大型系統(tǒng)?A)能夠把應(yīng)用放到合適的平臺(tái)上B)能夠開(kāi)發(fā)出相應(yīng)應(yīng)用C)能夠處理數(shù)據(jù)D)能夠存儲(chǔ)數(shù)據(jù)答案:ABCD解析:[多選題]76.分類測(cè)試集的選取方法可以有以下哪些。()A)均分法B)保持法C)隨機(jī)二次抽樣法D)交叉驗(yàn)證答案:BCD解析:第3部分:判斷題,共24題,請(qǐng)判斷題目是否正確。[判斷題]77.在保證數(shù)據(jù)準(zhǔn)確的前提下,數(shù)據(jù)是絕對(duì)正確的,因此可以完全依賴數(shù)據(jù)直接得出分析的結(jié)論。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]78.HBase系統(tǒng)適合進(jìn)行多表聯(lián)合查詢以及復(fù)雜性讀寫操作。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]79.機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]80.8種基本數(shù)據(jù)類型的類型名全為小寫A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]81.scala中基本數(shù)據(jù)類型和java完全一致A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]82.?大數(shù)據(jù)?是指存儲(chǔ)量超過(guò)100TB的數(shù)據(jù)集。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]83.數(shù)據(jù)分析挖掘的目的是把隱藏在一大批看似雜亂無(wú)章的數(shù)據(jù)中的有價(jià)值的信息進(jìn)行整合并提煉出來(lái),找出所研究對(duì)象的內(nèi)在規(guī)律。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.Flume的tertises配置文件中可以配置多個(gè)channel來(lái)傳輸數(shù)據(jù)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]85.Java源程序經(jīng)編譯后生成字節(jié)碼文件A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]86.一般而言,分布式數(shù)據(jù)庫(kù)是指物理上分散在不同地點(diǎn),但在邏輯上是統(tǒng)一的數(shù)據(jù)庫(kù)。因此分布式數(shù)據(jù)庫(kù)具有物理上的獨(dú)立性、邏輯上的一體性、性能上的可擴(kuò)展性等特點(diǎn)。A)正確
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 主軸安裝施工方案
- 天棚找補(bǔ)施工方案
- 2025至2030年中國(guó)便攜貴金屬檢測(cè)儀數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年中國(guó)透明音箱線市場(chǎng)調(diào)查研究報(bào)告
- 人行跑道施工方案
- 人教版初中化學(xué)九年級(jí)上冊(cè) 第三單元課題3 元素 教學(xué)設(shè)計(jì)(1)001
- 8我們受特殊保護(hù) 課時(shí)3《特殊關(guān)愛(ài) 助我成長(zhǎng)》教學(xué)設(shè)計(jì)-2024-2025學(xué)年道德與法治六年級(jí)上冊(cè)統(tǒng)編版
- 《孤獨(dú)的小螃蟹》導(dǎo)讀課(教學(xué)設(shè)計(jì))-2024-2025學(xué)年統(tǒng)編版語(yǔ)文二年級(jí)上冊(cè)
- 球罐拆除施工方案
- 佳木斯2024年黑龍江佳木斯大學(xué)招聘27人筆試歷年參考題庫(kù)附帶答案詳解
- 第11課遼宋夏金元的經(jīng)濟(jì)社會(huì)與文化教學(xué)設(shè)計(jì)-高中歷史必修中外歷史綱要上冊(cè)2
- 給小學(xué)生講橋梁課件
- 《超市員工服務(wù)培訓(xùn)》課件
- 《創(chuàng)業(yè)之星》學(xué)創(chuàng)杯賽前培訓(xùn)教材
- (完整)中醫(yī)癥候積分量表
- 小區(qū)安全培訓(xùn)課件
- 勒索軟件防范應(yīng)對(duì)指南
- 煙花爆竹生產(chǎn)企業(yè)安全生產(chǎn)風(fēng)險(xiǎn)監(jiān)測(cè)預(yù)警系統(tǒng)建設(shè)方案
- 清單及控制價(jià)編制服務(wù)方案
- 北京長(zhǎng)城的歷史簡(jiǎn)介和資料500字
- 真空排水系統(tǒng)施工方案設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論