




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
試題說明
本套試題共包括1套試卷
每題均顯示答案和解析
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案19(500題)
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案19
L[單選題]在比較模型的擬合效果時,甲、乙、丙三個模型的相關(guān)指數(shù)中2的值分別約為0.71、
0.85、0.90,則擬合效果較好的模型是()
A)甲
B)乙
C)丙
答案:C
解析:
2.[單選題]HDFS默認BlockSize
A)32MB
B)64MB
C)128MB
答案:B
解析:HDFS默認塊大小64MB,block默認保存3份。記住即可
3.[單選題]有一個文件記錄了1000個人的高考成績總分,每一行信息長度是20個字節(jié),要想只
讀取最后10行的內(nèi)容,不可能用到的函數(shù)是:
A)seek()
B)read()
C)open()
D)readline()
答案:B
解析:
4.[單選題]以下哪些選項屬于實時檢索的特點?
A)處理時間要求不高
B)全文檢素功能
C)高并發(fā)
D)查詢響應(yīng)要求較高
答案:D
解析:
5.[單選題]當閔可夫斯基距離公式中的系數(shù)p值為2時,可得到(_)的公式。
A)歐氏距離
B)曼哈頓距離
C)街區(qū)距離
D)切比雪夫距離
答案:A
解析:
6.[單選題]對數(shù)值型輸出,最常見的結(jié)合策略是()
A)投票法
B)平均法
C)學(xué)習(xí)法
D)排序法
答案:B
解析:
7.[單選題]Flume中的JDBCChannel內(nèi)置數(shù)據(jù)庫是哪個?
A)Derby
B)Oracle
C)sqlServer
D)MySql
答案:A
解析:
8.[單選題]如果想刪除字符串兩端的空白字符使用字符串方法
A)strip
B)replace
C)lower
D)upper
答案:A
解析:
9.[單選題]以下描述不正確的是(_)。
A)診斷性分析是描述性分析的基礎(chǔ)
B)診斷性分析和描述性分析是預(yù)測性分析的基礎(chǔ)
C)預(yù)測性分析是規(guī)范性分析的基礎(chǔ)
D)規(guī)范性分析是數(shù)據(jù)分析的最高階段
答案:A
解析:
10.[單選題]根據(jù)《承德銀行大數(shù)據(jù)貸后風險預(yù)警信號管理辦法(試行)》,域外分行的紅色級信號
,轄內(nèi)支行管戶客戶經(jīng)理應(yīng)在接收到系統(tǒng)所推送信號當日立即聯(lián)系客戶開展預(yù)警信號風險核實工作
,限期()個工作日內(nèi)制定出針對性的處置措施。
A)1
B)B.3
C)C.5
D)D.10
答案:B
解析:
IL[單選題]D、IKW金字塔(D、IKWPyrA、miD、)模型揭示了數(shù)據(jù)、信息、知識和()之間的區(qū)別與聯(lián)
系。
A)、資料
B)、能源
C)、智商
D)、智慧
答案:D
解析:
12.[單選題]執(zhí)行以下代碼段print("www","google","com",sep="」)時,輸出為(—)。
A)www
B)wwwgooglecom
C)www,google,com
D)www-google-com
答案:D
解析:
13.[單選題]下列關(guān)于BigTable的描述,哪個是錯誤的?
A)爬蟲持續(xù)不斷地抓取新頁面,這些頁面每隔一段時間地存儲到BigTable里
B)BigTable是一個分布式存儲系統(tǒng)
OBigTable起初用于解決典型的互聯(lián)網(wǎng)搜索問題
D)網(wǎng)絡(luò)搜索應(yīng)用查詢建立好的索引,從BigTable得到網(wǎng)頁
答案:A
解析:
14.[單選題]下列命令中(在zookeeper安裝文件夾的bin目錄下執(zhí)行),哪項是停止ZooKeeper
的正確命令()
A)start-al.sh
B)start-stop,sh
C)zkServe.sh
D)zkServer,shstart
答案:C
解析:
15.[單選題]關(guān)于混合模型聚類算法的優(yōu)缺點,下面說法正確的是
A)當簇只包含少量數(shù)據(jù)點,或者數(shù)據(jù)點近似協(xié)線性時,混合模型也能很好地處理
B)混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇
C)混合模型比K均值或模糊c均值更一般,因為它可以使用各種類型的分布
D)混合模型在有噪聲和離群點時不會存在問題
答案:C
解析:
16.[單選題]數(shù)據(jù)加工的本質(zhì)是0
A)、探索數(shù)據(jù)分析
B)、將低層次數(shù)據(jù)轉(zhuǎn)換為高層次數(shù)據(jù)
C)、處理數(shù)據(jù)
D)、生成新的數(shù)據(jù)
答案:B
解析:
17.[單選題]為提高計算性能,Spark中Transformation操作采用的是()計算模式。
A)活性
B)惰性
C)實時
D)非實時
答案:B
解析:Spark的所有Transformation操作采取的都是"情性計算模式"。
18.[單選題]大數(shù)據(jù)計算服務(wù)的數(shù)據(jù)倉庫的管理員發(fā)現(xiàn)用戶表user沒有備注信息,為了方便其他人員
的使用,可以通過()方式給這張表加上備注。
A)altertableusersetcomment'mycomment);
B)刪除表user,在重建時指定comment選項
C)touchtableusersetcommnt'mycomment';
D)changetableusersetcomment'mycomment;
答案:A
解析:
19.[單選題]在存儲過程中有如下代碼:DECLAREiD、INTDEFAULT0;REPEATSETid=id+l;UNTIL
id〉=10;END、REPEAT;下面選項中,對于代碼的功能描述正確的是()°—
A)實現(xiàn)之間的數(shù)字累加
B)實現(xiàn)1~10之間的數(shù)字遍歷
C)當id=10時循環(huán)就會退出執(zhí)行
D)以上代碼會出現(xiàn)語法錯誤
答案:D
解析:
20.[單選題]以下哪項不屬于圖像分割的目的。()
A)、把不同類標分開。
B)、提取不同區(qū)域的特征。
0、識別圖像內(nèi)容,或?qū)D像進行分類。
D)、對未處理噪聲的圖像進行平滑。
答案:D
解析:
21.[單選題]以下對于概率圖模型的敘述,錯誤的是:
A)動態(tài)貝葉斯網(wǎng)是結(jié)構(gòu)最簡單的隱馬爾科夫模型
B)概率圖模型可分為有向圖模型和無向圖模型
C)概率圖模型可分為貝葉斯網(wǎng)和馬爾可夫網(wǎng)
D)隱馬爾科夫模型是一種著名的有向圖模型,主要用于時序數(shù)據(jù)建模
答案:A
解析:
22.[單選題]在使用numpy進行排序時,按照降序排序需要用到哪個關(guān)鍵詞?
A)freeze
B)reverse
C)label
D)input
答案:B
解析:
23.[單選題]在Hive的連接查詢中,左外連接通過關(guān)鍵字()進行標識
A)innerjoin
B)leftouterjoin
C)rightouterjoin
D)fullouterjoin
答案:B
解析:
24.[單選題]在Hadoop上提交Job時不涉及哪個實體()
A)客戶端
B)HDFS
OSecondaryNode
D)JobTracker
答案:C
解析:涉及TaskTracker不是SecondaryNode
一個job的運行,涉及4個實體:客戶端,JobTracker,TaskTracker,HDFS
25.[單選題]以下關(guān)于HBase中HRegionServer的功能描述不正確的是哪一項?
A)管理所有的Region,Regiont可以在RegionServer之間遷移。
B)HBase的數(shù)據(jù)處理和計算單元.
C)RegionServer是HBase的數(shù)據(jù)服務(wù)進程,負責處理用戶數(shù)據(jù)的讀寫請求。
D)RegionServer—般與HDFS集群的NameNodei部署在一起,實現(xiàn)數(shù)據(jù)的存儲功能。
答案:B
解析:
26.[單選題]每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場景,以下()是用于批處理的。
A)MapReduce
B)Dremel
C)Storm
D)Pregel
答案:A
解析:
27.[單選題]以下程序的輸出結(jié)果是:imgl=[12,34,56,78]img2=[l,2,3,4,5]defdisplO:
print(imgl)defmodi():imgl=img2modi()displ()
A)[1,2,3,4,5]
B)([12,34,56,78])
C)([1,2,3,4,5])
D)[12,34,56,78]
答案:D
解析:
28.[單選題]HDFS集群中的NameNode職責不包括()。
A)維護HDFS集群的目錄樹結(jié)構(gòu)
B)維護HDFS集群的所有數(shù)據(jù)塊的分布、副本教和負載均衡
C)負責保存客戶端上傳的數(shù)據(jù)
D)響應(yīng)客戶端的所有讀寫數(shù)據(jù)請求
答案:C
解析:
29.[單選題]以下哪項不屬于大數(shù)據(jù)在零售領(lǐng)域的應(yīng)用()。
A)大數(shù)據(jù)征信
B)發(fā)現(xiàn)關(guān)聯(lián)購物行為
C)客戶群體劃分
D)供應(yīng)鏈管理
答案:A
解析:
30.[單選題]支撐大數(shù)據(jù)業(yè)務(wù)的基礎(chǔ)是()
A)數(shù)據(jù)科學(xué)
B)數(shù)據(jù)應(yīng)用
C)數(shù)據(jù)硬件
D)數(shù)據(jù)人才
答案:B
解析:
31.[單選題]刪除在my_ns命名空間下my_table表中,行鍵為1的一行數(shù)據(jù)的命令為()
A)deleteall'my_ns:my_table','1'
B)delete'my_ns:my_table','1'
C)delete'my_ns:my_table'wherekey=l
D)deleteall'my_ns:my_table'wherekey=l
答案:A
解析:
32.[單選題]數(shù)據(jù)產(chǎn)品開發(fā)的關(guān)鍵環(huán)節(jié)是(_)。
A)數(shù)據(jù)加工
B)數(shù)據(jù)柔術(shù)
C)數(shù)據(jù)歸約
D)數(shù)據(jù)清洗
答案:A
解析:
33.[單選題]Hive中的解釋器(complier)、優(yōu)化器(optimizer),執(zhí)行器(executor)組件用于
HQL語句從詞法分析、語法分析、編譯、優(yōu)化以及查詢計劃的生成。生成的查詢計劃存儲在()中
,并在隨后由()調(diào)用執(zhí)行。
A)內(nèi)存、MapReduce
B)HBase、Yarn
C)HDFS、Tez
D)HDFS、Yarn
答案:D
解析:
34.[單選題]FusioninsightHD中Loader從SFTP服務(wù)器導(dǎo)入文件時,不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換
且速度最快的文件類型是以下哪項?
A)graph-file
B)binary-file
C)text-file
D)sequence-file
答案:B
解析:
35.[單選題]信息增益對可取值數(shù)目()的屬性有所偏好,增益率對可取值數(shù)目()的屬性有所偏好。
A)較高,較高
B)較高,較低
C)較低,較高
D)較低,較低
答案:B
解析:
36.[單選題]()包含Spark的主要基本功能。
A)SPARKCORE
B)SparkSQL
C)SparkStreaming
D)Mllib
答案:A
解析:
37.[單選題]將屬性縮放到一個指定的最大和最小值之間使用下列哪個函數(shù)。
A)MeanScaler
B)StandardScaler
OMinMaxScaler
D)以上方法都不是
答案:C
解析:
38.[單選題]Python如何定義一個函數(shù):()
A)class
B)function
Odef
D)template
答案:C
解析:
39.[單選題]Redis不適用于以下哪個應(yīng)用場景?
A)獲取PB級Value數(shù)據(jù)
B)獲取T0PN操作
C)獲取手機驗證碼
D)獲取最新N個數(shù)據(jù)的操作
答案:A
解析:
40.[單選題]關(guān)于數(shù)據(jù)整合和分組的說法,不正確的是()。
A)數(shù)據(jù)連接可以用concat或merge函數(shù)
B)axis=l表示軸向連接
C)數(shù)據(jù)分組可以使用mean函數(shù)
D)使用agg可以自定義多個聚合函數(shù)
答案:C
解析:數(shù)據(jù)分組不可以使用mean函數(shù),mean函數(shù)為求平均數(shù)函數(shù)。
41.[單選題]()負責MapReduce任務(wù)調(diào)度。
A)NameNode
B)Jobtracker
C)TaskTracker
D)SecondaryNameNode
答案:B
解析:Jobtracker負責MapReduce任務(wù)調(diào)度,TaskTracker負責任務(wù)執(zhí)行。
42.[單選題]我們在做實驗時,會經(jīng)常用到“日期”轉(zhuǎn)換器,下列不屬于“日期”轉(zhuǎn)換器的一項是()
A)Choice
B)DateFormat
C)DatePart
D)StringToDateTime
答案:A
解析:
43.[單選題](一)進程運行在源端和目標端,用于啟動、監(jiān)控、重啟GoldenGate的其他進程。
A)Manager
B)Extract
C)Pump
D)Replicat
答案:A
解析:
44.[單選題]以下()不屬于Maxcompute計算層的模塊。
A)Nuwa
B)0TS
C)Pangu
D)Fuxi
答案:B
解析:
45.[單選題]圖靈獎獲得者吉姆?格雷提出的科學(xué)研究的第四范式-數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)
(D、A、tA、-intensiveSC、ientifiC,D、isC^overy)描述了數(shù)據(jù)科學(xué)的()。
A)、三世界原則
B)、三要素原則
0、數(shù)據(jù)復(fù)雜性原則
D)、從簡原則
答案:A
解析:
46.[單選題]HDFS是Hadoop平臺上的分布式文件系統(tǒng),那么它是由()構(gòu)成的。
A)由一個NameNode和多個DataNode組成
B)由一個DataNode和多個NameNode組成
C)由多個NameNode和多個DataNode組成
D)由一個NameNode和一個DataNode組成
答案:A
解析:
47.[單選題]Sqoop將導(dǎo)入或?qū)С雒罘g成什么程序來實現(xiàn)導(dǎo)入導(dǎo)出()
A)Spark
B)Storm
C)MapReduce
D)Tez
答案:C
解析:
48.[單選題]以下說法中:
①一個機器學(xué)習(xí)模型,如果有較高準確率,總是說明這個分類器是好的;
②如果增加模型復(fù)雜度,那么模型的測試錯誤率總是會降低;
③如果增加模型復(fù)雜度,那么模型的訓(xùn)練錯誤率總是會降低,正確的是()。
A)1
B)2
03
D)l、3
答案:C
解析:如果增加模型復(fù)雜度,那么模型的測試錯誤率總是會降低,訓(xùn)練錯誤率可能降低,也可能增高。
49.[單選題]下列關(guān)于特征編碼的敘述中,不正確的是()
A)特征編碼是將非數(shù)值型特征轉(zhuǎn)換成數(shù)值型特征的方法
B)數(shù)字編碼與特征的排序無關(guān)
C)One-Hot編碼中,原始特征有n種取值,轉(zhuǎn)換后就會產(chǎn)生n列新特征
D)啞變量編碼解決了One-Hot編碼中存在線性關(guān)系的問題
答案:B
解析:
50.[單選題]FusioninsightHD系統(tǒng)中,哪個不屬于集群節(jié)點的磁盤分區(qū)?
A)OS分區(qū)
B)數(shù)據(jù)分區(qū)
C)元數(shù)據(jù)分區(qū)
D)管理分區(qū)
答案:D
解析:
51.[單選題]在加強數(shù)據(jù)安全技術(shù)保護方面,要注意落實數(shù)據(jù)安全技術(shù)保護與信息系統(tǒng)的“三同步
”原則,其中不包括(一)o
A)同步規(guī)劃
B)同步建設(shè)
C)同步使用
D)同步檢查
答案:D
解析:
52.[單選題](_)先將數(shù)據(jù)集中的每個樣本看做一個初始聚類簇,然后在算法運行的每一步找到距
離最近的兩個聚類簇進行合并,該過程不端重復(fù),直至達到預(yù)設(shè)的聚類簇個數(shù)。
A)原型聚類
B)密度聚類
C)層次聚類
D)AGNES
答案:D
解析:
53.[單選題]在Fusioninsight產(chǎn)品中,關(guān)于KafkaTopic,以下描述不正確的有?
A)每個Topic只能被分成一個partition(區(qū))
B)Topic的partition數(shù)量可以在創(chuàng)建時配置
C)每個Partition的存儲層面對應(yīng)一個log文件,log文件中記錄了所有的信息數(shù)據(jù)
D)每條發(fā)布到Kafka的消息都有一個類別,這個類別被稱為Topic,也可以理解為一個存儲消息的隊
列
答案:A
解析:
54.[單選題]下面組件哪個是負責在Hadoop和關(guān)系數(shù)據(jù)庫之間實現(xiàn)數(shù)據(jù)導(dǎo)入導(dǎo)出的:()
A)MySQL
B)HDFS
C)Sqoop
D)Flume
答案:C
解析:
55.[單選題]如果只寫open(1ename),那就是用()模式打開。
A)r
B)w
C)a
D)b
答案:A
解析:默認以讀模式打開。
56.[單選題]執(zhí)行以下代碼段a=3b=4print(a**b)時,輸出為(__)。
A)3
B)4
012
D)81
答案:D
解析:
57.[單選題]在同一個問題中,錯誤率和精度的關(guān)系是(_)。
A)錯誤率等于精度值加1
B)錯誤率加精度等于1
C)精度減錯誤率等于1
D)兩者之間沒有關(guān)系
答案:B
解析:
58.[單選題]為了提高測試的效率,應(yīng)該
A)集中對付那些錯誤群集的程序
B)隨機選取測試數(shù)據(jù)
C)在完成編碼以后制定軟件的測試計劃
D)取一切可能的輸入數(shù)據(jù)作為測試數(shù)據(jù)
答案:A
解析:
59.[單選題]執(zhí)行以下程序,輸入la,輸出結(jié)果是:la='python'try:s=eval(input('請輸
入整數(shù):'))Is=s*2print(Is)except:print('請輸入整數(shù)')
A)pythonpython
B)la
C)請輸入整數(shù)
D)python
答案:A
解析:
60.[單選題]下列關(guān)于支持向量回歸說法,錯誤的是()
A)支持向量回歸是將支持向量的方法應(yīng)用到回歸問題中
B)支持向量回歸同樣可以應(yīng)用核函數(shù)求解線性不可分的問題
C)同分類算法不同的是,支持向量回歸要最小化一個回函數(shù)
D)支持向量回歸的解是稀疏的
答案:C
解析:
61.[單選題]Spark集群搭建中,配置集群免密登錄時,需要用到的命令是(_)。
A)ssh-key-trsa
B)ssh-gen-trsa
C)ssh-kygen-trsa
D)ssh-keygen-trsa
答案:D
解析:
62.[單選題]有關(guān)數(shù)據(jù)倉庫的開發(fā)特點,不正確的描述是()。
A)數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)
B)數(shù)據(jù)倉庫使用的需求在開發(fā)初期就要明確
C)數(shù)據(jù)倉庫的開發(fā)是一個不斷循環(huán)的過程,是啟發(fā)式的開發(fā)
D)在數(shù)據(jù)倉庫環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)十倉庫中數(shù)據(jù)分析
和處理更靈活,且沒有固定的模式
答案:A
解析:
63.[單選題]sklearn.decomposition.PCA()的作用是()。
A)因子分析
B)數(shù)據(jù)降維
C)稀疏編碼
D)唯一編碼
答案:B
解析:PCA()是一種常用的降維方法,在數(shù)據(jù)維度較高時使用。
64.[單選題]@app.route的作用是()。
A)程序代碼的規(guī)范,沒什么作用
B)ask裝飾器,返回本地網(wǎng)絡(luò)測試地址
C)返回127005000
D)以上答案都不正確
答案:B
解析:@app.route是ask裝飾器,調(diào)用后返回本地網(wǎng)絡(luò)測試地址。
65.[單選題]關(guān)于圖像放大處理,下列說法不正確的是
A)從物理意義上講,圖像的放大是圖像縮小的逆操作
B)當放大的倍數(shù)比較大時,使用基于像素放大原理的圖像放大方法會導(dǎo)致馬賽克現(xiàn)象。
C)對于因放大后的圖像子塊與子塊之間的過渡因不平緩而導(dǎo)致畫面效果不自然的問題,可以采用雙
線性插值方法可以用來解決。
D)圖像的放大不會引起圖像的畸變。
答案:D
解析:
66.[單選題]下列關(guān)于數(shù)據(jù)分析的說法正確的是()。
A)描述性分析和預(yù)測性分析是診斷性分析的基礎(chǔ)
B)診斷性分析是對規(guī)范性分析的進一步理解
C)預(yù)測性分析是規(guī)范性分析的基礎(chǔ)
D)規(guī)范性分析是數(shù)據(jù)分析的最高階段,可以直接產(chǎn)生產(chǎn)業(yè)價值
答案:C
解析:在數(shù)據(jù)分析中,流程分為以下方式:描述性分析、診斷性分析、預(yù)測性分析、規(guī)范性分析。
67.[單選題]大數(shù)據(jù)審計的發(fā)展過程中的靈魂所在是()
A)技術(shù)創(chuàng)新
B)審計人員培養(yǎng)
C)法制健全
D)審計方法轉(zhuǎn)變
答案:B
解析:
68.[單選題]關(guān)于數(shù)據(jù)產(chǎn)品,以下說法錯誤的是()。
A)數(shù)據(jù)產(chǎn)品的存在形式是數(shù)據(jù)集
B)與傳統(tǒng)物質(zhì)產(chǎn)品不同的是,數(shù)據(jù)產(chǎn)品的消費者不僅限于人類用戶.還可以是計算機以及其他軟硬
件系統(tǒng)
C)數(shù)據(jù)產(chǎn)品不僅包括數(shù)據(jù)科學(xué)項目的最終產(chǎn)品,也包括其中間產(chǎn)品以及副產(chǎn)品
D)數(shù)據(jù)產(chǎn)品開發(fā)涉及數(shù)據(jù)科學(xué)項目流程的全部活動
答案:A
解析:
69.[單選題]Python機器學(xué)習(xí)方向的第三方庫是
A)PIL
B)PyQt.5
C)TensorFlow
D)random
答案:C
解析:
70.[單選題]關(guān)于循環(huán)神經(jīng)網(wǎng)絡(luò)設(shè)計的敘述中,錯誤的是(一)o
A)能處理可變長度的序列
B)基于圖展開思想
C)基于參數(shù)共享思想
D)循環(huán)神經(jīng)網(wǎng)絡(luò)不可應(yīng)用于圖像數(shù)據(jù)
答案:D
解析:
71.[單選題]邏輯回歸將輸出概率范圍限定為[0,1]0()函數(shù)能起到這樣的作用
A)Smoid函數(shù)
B)tanh函數(shù)
C)ReLU函數(shù)
D)LeakyReLU函數(shù)
答案:A
解析:
72.[單選題]執(zhí)行以下代碼段classA:def_init_(self):self,multiply(15)print(self,i)
defmultiply(self,i):self,i=4*i;classB(A):def—init—(self):
super().init()defmultiply(self,i):self,i=2*i;obj=B()時,輸出為(.)0
A)10
B)20
030
D)40
答案:C
解析:
73.[單選題]以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述錯誤的有()
A)神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒
B)可以處理冗余特征
C)訓(xùn)練ANN是一個很耗時的過程
D)至少含有一個隱藏層的多層神經(jīng)網(wǎng)絡(luò)
答案:A
解析:
74.[單選題]以下哪個不是技術(shù)組的職責()
A)負責組織編制泛在電力物聯(lián)網(wǎng)建設(shè)方案和規(guī)劃
B)組織審核各單位泛在電力物聯(lián)網(wǎng)建設(shè)方案
C)負責泛在電力物聯(lián)網(wǎng)組織優(yōu)化診斷
D)統(tǒng)一組織項目管控和架構(gòu)管控
答案:C
解析:
75.[單選題]關(guān)于RDD,下列說法錯誤的是?
A)RDD具有血統(tǒng)機制(Lineage)
B)RDD默認存儲在磁盤
ORDD是一個只讀的,可分區(qū)的分布式數(shù)據(jù)集
D)RDD是Spark對基礎(chǔ)數(shù)據(jù)的抽象
答案:B
解析:
76.[單選題]以下對網(wǎng)絡(luò)空間的看法,對的是:()
A)網(wǎng)絡(luò)空間是虛擬空間,不需要法律
B)網(wǎng)絡(luò)空間雖然與現(xiàn)實空間不同,但同樣需要法律
C)網(wǎng)絡(luò)空間是一個無國界的空間,不受一國法律約束
D)網(wǎng)絡(luò)空間與現(xiàn)實空間分離,現(xiàn)實中的法律不適用于網(wǎng)絡(luò)空間
答案:B
解析:
77.[單選題]決策樹中的葉結(jié)點對應(yīng)于()
A)屬性
B)樣本
C)決策結(jié)果
D)標簽值
答案:C
解析:
78.[單選題]計算兩個日期之間的差的日期函數(shù)是0
A)DateDiff
B)DateFormat
C)DateInc
D)DatetimeToString
答案:A
解析:
79.[單選題]下列算法中:①K-NN最近鄰算法:②線性回歸;③邏輯回歸,可以用神經(jīng)網(wǎng)絡(luò)構(gòu)建的算法
是()
A)①②
B)②③
C)①②③
D)以上都不是
答案:B
解析:
80.[單選題]以下說法正確的是:
A)一個機器學(xué)習(xí)模型,如果有較高準確率,總是說明這個分類器是好的
B)如果增加模型復(fù)雜度,那么模型的測試錯誤率總是會降低
C)不可以使用聚類“類別id”作為一個新的特征項,用監(jiān)督學(xué)習(xí)進行學(xué)習(xí)
D)ABC全錯
答案:D
解析:
81.[單選題]下列關(guān)于Pandas中g(shù)roupby方法的說法正確的是()。
A)groupby能夠?qū)崿F(xiàn)分組聚合
B)groupby方法的結(jié)果能夠直接查看
C)groupby是Pandas提供的一個用來分組的方法
D)groupby方法是Pandas提供的一個用來聚合的方法
答案:C
解析:groupby是分組函數(shù),分組的結(jié)果是一個group對象,結(jié)果需要進行聚合或迭代操作才能查
看。
82.[單選題]Hbase中數(shù)據(jù)存儲的文件格式是:()。
A)Hlog
B)TextFile
OHfile
D)SequenceFile
答案:C
解析:
83.[單選題]在IBMPASS中,聚類算法分為分層聚類、Kohonennetwork,K均值聚類和()四種
O
A)系統(tǒng)聚類
B)兩步聚類
C)模型聚類
D)其他聚類
答案:B
解析:
84.[單選題]HBase是一種“NoSQL”數(shù)據(jù)庫,支持大型()數(shù)據(jù)存儲
A)集中式
B)集合式
C)分布式
D)分散式
答案:C
解析:
85.[單選題]以下()不是加載數(shù)據(jù)到Maxcompute的合理方法。
A)dship
B)tunnel
C)DTtask
D)mapreduce
答案:C
解析:
86.[單選題]關(guān)于SecondaryNameNode哪項是正確的?
A)它是NameNode的熱備
B)它對內(nèi)存沒有要求
C)它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間
D)SecondaryNameNode應(yīng)與NameNode部署到一個節(jié)點。
答案:C
解析:a.它是NameNode的熱備[SecondaryNameNode:并非NameNode的熱備。當NameNode掛掉
的時候,它并不能馬上替換NameNode并提供服務(wù)。1、輔助NameNode,分擔其工作量。2、定期
合并fsimage和fsedits,并推送給NameNode。]
b.它對內(nèi)存沒有要求【肯定對內(nèi)存有要求】
c.它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間【確實,起到輔助NameNode功能
1
d.SecondaryNameNode應(yīng)與NameNode部署到一個節(jié)點【不能部署到一個節(jié)點,因為單節(jié)點內(nèi)存大小
有物理限制】
87.[單選題]以下關(guān)于Flink關(guān)鍵特性描述不正確的是?
A)SparkStreaming與Flink相比,時延更低
B)Flink流式處理引擎能夠同時提供支持流處理和批處理應(yīng)用的功能
C)與FusionlnghtHD中的Streaming相比,F(xiàn)link具有更高的吞吐量
D)checkpoint實現(xiàn)了Flink的容錯
答案:A
解析:
88.[單選題]以下()不屬于“加強人才隊伍建設(shè)”的范疇。
A)加強數(shù)據(jù)管理崗位培訓(xùn),重點開展數(shù)據(jù)管理體系、數(shù)據(jù)管理理論、數(shù)據(jù)管理實踐等知識培訓(xùn)。
B)搭建數(shù)據(jù)管理交流平臺,根據(jù)工作推進情況定期舉辦數(shù)據(jù)管理工作交流座談。
C)充分發(fā)揮大數(shù)據(jù)中心、科研產(chǎn)業(yè)單位作用,構(gòu)建數(shù)據(jù)專業(yè)支撐團隊。
D)組織各種形式的數(shù)據(jù)知識競賽等活動。
答案:D
解析:
89.[單選題]下列關(guān)于Hive基本操作命令的解釋錯誤的是()
A)createtableifnotexistsusr(idbigint,namestring,ageint);〃如果usr表不存在,創(chuàng)建
表usr,含三個屬性id,name,age
B)loaddatalocalinpath'/usr/local/data'overwriteintotableusr;//把目錄
'/usr/local/data)下的數(shù)據(jù)文件中的數(shù)據(jù)以追加的方式裝載進usr表
C)createdatabaseuserdb;〃創(chuàng)建數(shù)據(jù)庫userdb
D)insertoverwritetablestudentselect*fromuserwhereage>10;〃向表usrl中插入來自
usr表的age大于10的數(shù)據(jù)并覆蓋student表中原有數(shù)據(jù)
答案:B
解析:
90.[單選題]以下關(guān)于異常處理的描述,正確的是:
A)Python中允許利用raise語句由程序主動引發(fā)異常
B)try語句中有except子句就不能有finally子句
0Python中,可以用異常處理捕獲程序中的所有錯誤
D)引發(fā)一個不存在索引的列表元素會引發(fā)NameError錯誤
答案:A
解析:
91.[單選題]一個關(guān)系數(shù)據(jù)庫文件中的各條記錄()
A)前后順序不能任意顛倒,一定要按照輸入的順序排列
B)前后順序可以任意顛倒,不影響庫中的數(shù)據(jù)關(guān)系
C)前后順序可以任意顛倒,但排列順序不同,統(tǒng)計處理的結(jié)果就可能不同
D)前后順序不能任意顛倒,一定要按照關(guān)鍵字段值的順序排列
答案:B
解析:
92.[單選題]云計算包括3種類型。面向所有用戶提供服務(wù),只要是注冊付費的用戶都可以使用,這
種云計算屬于:()
A)公有云
B)私有云
0混合云
D)獨立云
答案:A
解析:
93.[單選題]用戶有實時的曰志數(shù)據(jù)需要采集到MaxCompute中,()方法是合適的。
A)通過Tunnel接口
B)通過DataHub接口
C)通過SDK調(diào)用SQL執(zhí)行insert語句
D)通過調(diào)用LogviewAPI實現(xiàn)
答案:B
解析:
94.[單選題]如果我使用數(shù)據(jù)集的全部特征并且能夠達到100%的準確率,但在測試集上僅能達到70%左
右,這說明().
A)欠擬合
B)模型很棒
C)過擬合
D)以上答案都不正確
答案:C
解析:當學(xué)習(xí)器把訓(xùn)練樣本學(xué)得太好了的時候,很可能已經(jīng)把訓(xùn)練樣本自身的一些特點當作了所有潛
在樣本都會具有的一般性質(zhì),這樣就會導(dǎo)致泛化性能下降這種現(xiàn)象在機器學(xué)習(xí)中稱為過擬合。
95.[單選題](_)用于將非線性引入神經(jīng)網(wǎng)絡(luò)。它會將值縮小到較小的范圍內(nèi)。
A)損失函數(shù)
B)優(yōu)化函數(shù)
C)激活函數(shù)
D)目標函數(shù)
答案:C
解析:
96.[單選題]在Shuffle的整個處理過程中,一部分處理過程是在Map端,另一部分的處理過程是在
()端。
A)Combiner
B)Partition
C)Reduce
D)Split
答案:C
解析:
97.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,擔保圈鏈模塊,頁面右側(cè)的擔保篩選選項卡的
風險(連通)路徑中,()指連通路徑覆蓋的節(jié)點數(shù)最多;()指的是連通路徑節(jié)點的擔保總額之
和最大;()指的是連通路徑中節(jié)點的授信業(yè)務(wù)總額之和最大。
A)最大擔保額度、覆蓋最多授信戶、最大授信總額
B)B.最大擔保額度、最大授信總額、覆蓋最少授信戶
C)C.覆蓋最少授信戶、最大擔保額度、最大授信總額
D)D.覆蓋最多授信戶、最大擔保額度、最大授信總額
答案:D
解析:
98.[單選題]當()時,可以不考慮RDD序列化處理。
A)完成成本比較高的操作后
B)執(zhí)行容易失敗的操作之前
ORDD被重復(fù)使用
D)實時性要求高
答案:D
解析:
99.[單選題]當云主機模板出現(xiàn)通用漏洞,將產(chǎn)生以下哪種風險:。
A)主機不穩(wěn)定
B)網(wǎng)絡(luò)性能下降
C)該模板創(chuàng)建的云主機被批量入侵
D)沒有影響
答案:C
解析:
100.[單選題]以下哪個組件樣式是在所有的可視化圖表中普遍存在的?
A)圖例
B)軸線
C)標題
D)網(wǎng)格線
答案:C
解析:
101.[單選題]下列關(guān)于HadoopAPI的說法錯誤的是()
A)Hadoop的文件API不是通用的,只用于HDFS文件系統(tǒng)
B)Configuration類的默認實例化方法是以HDFS系統(tǒng)的資源配置為基礎(chǔ)的
OFileStatus對象存儲文件和目錄的元數(shù)據(jù)
D)FSDataInputStream是java.io.DatalnputStream的子類
答案:A
解析:
102.[單選題]就數(shù)據(jù)的量級而言,1PB數(shù)據(jù)是()TB。
A)1000
B)1024
0512
D)2048
答案:B
解析:
103.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,在【大數(shù)據(jù)貸后預(yù)警處置】菜單的【待處置
1節(jié)點,用戶選中一個客戶填寫處置措施時,若在【填寫處置措施】環(huán)節(jié)中的()一欄選擇為“是
“,系統(tǒng)會在提交處置措施時校驗是否上傳了影像,若未上傳影像,則彈出提示。
A)客戶名稱
B)B.證件號碼
C)C.必選措施
D)D.是否上傳影像
答案:D
解析:
104.[單選題]下列關(guān)于關(guān)鍵詞提取的說法錯誤的是?
A)關(guān)鍵詞提取是指借用自然語言處理方法提取文章關(guān)鍵詞
B)TFTDF模型是關(guān)鍵詞提取的經(jīng)典方法
C)文本中出現(xiàn)次數(shù)最多的詞最能代表文本的主題
D)這個問題設(shè)計數(shù)據(jù)挖掘,文本處理,信息檢索等領(lǐng)域
答案:C
解析:
105.[單選題]下列算法中,不屬于外推法的是()
A)移動平均法
B)回歸分析法
C)指數(shù)平滑法
D)季節(jié)指數(shù)法
答案:B
解析:
106.[單選題]關(guān)于Streaming的拓撲(Topology),下面描述錯誤的是:()。
A)一個Topology是由一組Spout組件和Bolt組件通過StreamGroupings進行連接的有向無環(huán)圖
(DAG)
B)Topology會一直運行,直到它被顯式kill
C)業(yè)務(wù)邏輯都被封裝Topology中
D)一個Topology只可以指定啟動一個Worker進程
答案:D
解析:
107.[單選題]在數(shù)據(jù)庫建模的過程中,E-R圖屬于()的產(chǎn)物。一
A)物理模型
B)邏輯模型
C)概念模型
D)以上答案都不正確
答案:C
解析:
108.[單選題]相互關(guān)聯(lián)的數(shù)據(jù)資產(chǎn)標準,應(yīng)確保銜接和匹配。數(shù)據(jù)資產(chǎn)標準存在沖突或銜接中斷時
,O,變更相應(yīng)數(shù)據(jù)資產(chǎn)標準。
A)前序環(huán)節(jié)應(yīng)遵循和適應(yīng)后序環(huán)節(jié)的要求
B)后序環(huán)節(jié)應(yīng)遵循和適應(yīng)前序環(huán)節(jié)的要求
C)前、后序環(huán)節(jié)應(yīng)遵循和適應(yīng)新的、統(tǒng)一的要求
D)前、后序環(huán)節(jié)應(yīng)根據(jù)情況遵循和適應(yīng)合適的要求
答案:B
解析:
109.[單選題]用onehot對某個只有一個屬性的樣本進行編碼,下面可能是編碼結(jié)果的是()
A)1010
B)1100
01111
D)1000
答案:D
解析:
110.[單選題]HBase中的所有數(shù)據(jù)文件都存儲在HadoopHDFS上,主要有HFile格式與()格式
A)HTXT
B)HLog
OHLogFile
D)HFileLog
答案:C
解析:
111.[單選題]如果要在某個模式下創(chuàng)建對象,該用戶對此模式應(yīng)具有:()權(quán)限。
A)EXECUTE
B)SELECT
C)CREATE
D)USAGE
答案:C
解析:
112.[單選題]使用給定模塊的程序代碼稱為模塊的(—)。
A)客戶端
B)文檔字符串
C)接口
D)模塊化
答案:A
解析:
113.[單選題]關(guān)于欠擬合(under-fitting),正確的是()
A)訓(xùn)練誤差較大,測試誤差較小
B)訓(xùn)練誤差較小,測試誤差較大
C)訓(xùn)練誤差較大,測試誤差較大
D)訓(xùn)練誤差較小,刷試誤差較小
答案:C
解析:
114.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,財務(wù)智能分析中的財務(wù)科目異動分析模塊
,()部分按照時間軸順序,用折線展示財務(wù)科目的變動趨勢,分析的財務(wù)科目可被用戶在頁面右
側(cè)表格部分中自由選擇。
A)表格
B)B.圖表
OC.文字
D)D.以上都不對
答案:B
解析:
115.[單選題]having,where,groupby的正確執(zhí)行順序是()。
A)having,where,groupby
B)where,groupby,having
C)where,having,groupby
D)groupby,having,where
答案:B
解析:
116.[單選題]下列關(guān)于圖像中的噪聲特性的說法錯誤的是()。
A)具有隨機性
B)具有規(guī)律性
C)具有疊加性
D)具有不可預(yù)測性
答案:B
解析:噪聲是干擾和妨礙人類認知和理解信息的重要因素,而圖像噪聲則是圖像中干擾和妨礙人類認
識和理解圖像信息的重要因素。由于噪聲本身具有不可預(yù)測性,可以將它當作一種隨機誤差(這種
誤差只有通過概率統(tǒng)計的方法來識別)。因此,圖像噪聲可以視為一種多維隨機過程,可以選擇隨
機過程的概率分布函數(shù)和概率密度函數(shù)來作為對圖像噪聲進行描述的方法。
117.[單選題]執(zhí)行以下代碼段total={}definsert(items):ifitemsintotal:total[items]+=
1else:total[items]=1insert('Apple')insert('Bal1')insert('Apple')print
(len(total))時,輸出為(____)0
A)1
B)2
03
D)4
答案:B
解析:
118.[單選題]以下哪一項不屬于Hadoop可以運行的模式()o
A)單機(本地)模式
B)偽分布式模式
C)互聯(lián)模式
D)分布式模式
答案:C
解析:
119.[單選題]以下選項中,不是Python對文件的讀操作方法的是
A)readline
B)readall
C)readtext
D)read
答案:C
解析:
120.[單選題]社交網(wǎng)絡(luò)產(chǎn)生了海量用戶以及實時和完整的數(shù)據(jù),同時社交網(wǎng)絡(luò)也記錄了用戶群體的
(),通過深入挖掘這些數(shù)據(jù)來了解用戶,然后將這些分析后的數(shù)據(jù)信息推給需要的品牌商家或是
微博營銷公司
A)地址
B)行為
C)情緒
D)來源
答案:C
解析:
121.[單選題]一般將原始業(yè)務(wù)數(shù)據(jù)分為多個部分,()用于模型的構(gòu)建。
A)訓(xùn)練集
B)測試集
C)驗證集
D)全部數(shù)據(jù)
答案:A
解析:
122.[單選題]下列關(guān)于MapReduce說法不正確的是()。
A)MapReduce是一種計算框架
B)MapReduce來源于google的學(xué)術(shù)論文
C)MapReduce程序只能用java語言編寫
D)MapReduce隱藏了并行計算的細節(jié),方便使用
答案:C
解析:
123.[單選題]數(shù)據(jù)清洗的方法不包括
A)缺失數(shù)據(jù)處理
B)噪聲數(shù)據(jù)清除
C)數(shù)據(jù)的一致性檢查
D)數(shù)據(jù)的可視化
答案:D
解析:
124.[單選題]通過DMS管理后臺或者數(shù)據(jù)庫客戶端,連接RDS數(shù)據(jù)庫時,提示錯誤信息
umax_user_connectionsw,代表()含義。
A)IOPS超出極限
B)RDS空間滿了
C)網(wǎng)絡(luò)中斷
D)RDS數(shù)據(jù)庫的連接數(shù)滿了
答案:D
解析:
125.[單選題]通過線條起伏展示數(shù)據(jù)變化,并通過面積渲染引起對總值關(guān)注的圖表是?()
A)折線圖
B)面積圖
C)雙軸圖
D)瀑布圖
答案:B
解析:
126.[單選題]以下不屬于大數(shù)據(jù)重要意義的是()。
A)大數(shù)據(jù)成為推動經(jīng)濟轉(zhuǎn)型發(fā)展的新動力
B)大數(shù)據(jù)成為重塑國家競爭優(yōu)勢的新機遇
C)大數(shù)據(jù)成為提升政府治理能力的新途徑
D)大數(shù)據(jù)會增加經(jīng)濟發(fā)展的成本
答案:D
解析:
127.[單選題]運用機器學(xué)習(xí)的相關(guān)技術(shù)對詞語的情感進行分類。機器學(xué)習(xí)的方法通常需要先讓分類
模型學(xué)習(xí)訓(xùn)練數(shù)據(jù)中的規(guī)律,然后用訓(xùn)練好的模型對測試數(shù)據(jù)進行預(yù)測。以上描述屬于哪種類型的
詞語級情感分析
A)基于詞典的分析方法
B)基于網(wǎng)絡(luò)的分析方法
C)基于語料庫的分析方法
D)其他
答案:C
解析:
128.[單選題]下面不屬于數(shù)據(jù)科學(xué)家的主要職責有(_)。
A)進行“探索型數(shù)據(jù)分析”
B)完成“數(shù)據(jù)加工”
C)提出“基于數(shù)據(jù)的好問題”
D)數(shù)據(jù)分析的執(zhí)行
答案:D
解析:
129.[單選題]英文如何分詞?()
A)、利用空格對句子分詞
B)、利用逗號分詞
C)、根據(jù)英文短語分詞
D)、根據(jù)詞性分詞
答案:A
解析:
130.[單選題]小王正在使用Maxcompute進行自然語言分析,他從門戶網(wǎng)站上搜集了1000篇新聞報道
,然后每篇存成一條紀錄,然后基于這些紀錄去做分詞,即將每條紀錄中的內(nèi)容拆成很多獨立的詞
語,保存到另一張表中,每個詞語一條記錄。小王對自定義函數(shù)比較熟悉,他想通過編寫自定義函
數(shù)實現(xiàn)分詞功能。請幫小王做一下選擇,從功能角度來看,()自定義函數(shù)更適合處理這種場景。
A)UserDefinedScalarFunction
B)UserDefinedTableValuedFunction
C)UserDefinedSplittedFunction
D)UserDefinedAggregationFunction
答案:B
解析:
131.[單選題]下面哪一項不是Hadoop的特性?
A)可擴展性高
B)只支持少數(shù)幾種編程語言
C)成本低
D)能在linux上運行
答案:B
解析:
132.[單選題]某籃運動員在蘭分線投球的命中率是2(1),他技球10次,恰好技進3個球的概率為()
A)128(15)
B)16(3)
08(5)
D)16(7)
答案:A
解析:
133.[單選題]()可在一個關(guān)系中從垂直方向去掉不需要的屬性,保留需要的屬性。~
A)選擇
B)笛卡爾積
C)連接
D)投影
答案:D
解析:
134.[單選題]智能數(shù)據(jù)湖運營平臺指的是以下哪個選項?
A)VAS(videoAnalysisService)
B)ModelArts
C)cSS
D)DAYU
答案:D
解析:
135.[單選題](_)是分類正確的樣本數(shù)占樣本總數(shù)的比例。
A)精度
B)錯誤率
C)偏差
D)誤差
答案:A
解析:
136.[單選題]關(guān)于Hive建表基本操作,描述正確的是:()。
A)一旦表建好,不可再修改表名
B)一旦表建好,不可再增加新列
C)創(chuàng)建外表時需要指定external關(guān)鍵字
D)一旦表建好,不可再修改列名
答案:C
解析:
137.[單選題]做卷積運算的缺點是,卷積圖像的大小會不斷縮小,另外圖像的左上角的元素只被一
個輸出所使用,所以在圖像邊緣的像素在輸出中采用較少,也就意味著你丟掉了很多圖像邊緣的信
息。為了解決這個問題,在卷積過程中引入了()。
A)pooling
B)padding
C)convolution
D)FC
答案:B
解析:
138.[單選題]以下關(guān)于random庫的描述,正確的是:
A)設(shè)定相同種子,每次調(diào)用隨機函數(shù)生成的隨機數(shù)不相同
B)通過fromrandomimport*引入random隨機庫的部分函數(shù)
C)uniform(0,1)與uniform(0.0,1.0)的輸出結(jié)果不同,前者輸出隨機整數(shù),后者輸出隨機小數(shù)
D)randint(a.b)是生成一個[a,b]之間的整數(shù)
答案:D
解析:
139.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【
征信報告查詢管理】二級菜單,用戶可在此菜單下的【待處理的征信報告】節(jié)點中點擊()按鈕
,新增查詢征信任務(wù)并補充查詢原因。
A)新增查詢
B)B.上傳授權(quán)書
c)c.取消申請
D)D.提交
答案:A
解析:
140.[單選題]當往往一本書中其實通常使用到的詞匯表是非常小的,這就會導(dǎo)致一本書的表示向量
中存在大量的0.這樣的向量稱為()。
A)零向量
B)滿秩向量
C)稀疏向量
D)普通向量
答案:C
解析:
141.[單選題]HBase依賴提供強大的計算能力。
A)Zookeeper
B)Chubby
ORPC.
D)MapReduce
答案:D
解析:記住即可
142.[單選題]以下關(guān)于增益率說法正確的是(―)
A)ID3算法使用增益率選擇最優(yōu)劃分屬性
B)增益率準則對可取值數(shù)目較多的屬性有所偏好
C)屬性a的可能取值數(shù)目越多,IV(a)的值通常越大
D)C4.5算法先從候選劃分屬性中找出信息增益低于平均水平的屬性,再從中選擇增益率最高的
答案:C
解析:
143.[單選題]idea中查看類的結(jié)構(gòu)的快捷鍵是()。
A)ctrl+0
B)Shift+Enter
C)Ctrl+D
D)Shift+Enter
答案:A
解析:
144.[單選題]在HBase中,禁用表的命令是()
A)close'my_ns:my_table'
B)disable'my_ns:my_table'
C)no'my_ns:my_table'
D)closed'my_ns:my_table'
答案:B
解析:
145.[單選題]下列國家的大數(shù)據(jù)發(fā)展行動中,集中體現(xiàn)“重視基礎(chǔ)、首都先行”的國家是()。
A)美國
B)日本
C)中國
D)韓國
答案:D
解析:
146.[單選題]()負責MapReduce任務(wù)調(diào)度。
A)NameNode
B)Jobtracker
C)TaskTracker
D)SecondaryNameNode
答案:B
解析:
147.[單選題]下列關(guān)于回歸算法,不正確的是()
A)回歸算法可以用最小二乘法求解
B)最大似然估計可以得到和最小二乘法相同的結(jié)果
C)回歸算法加入絕對值項是嶺回歸
D)回歸算法也會產(chǎn)生過擬合問題
答案:C
解析:
148.[單選題]結(jié)構(gòu)化程序設(shè)計的三種基本語句是?
A)函數(shù)結(jié)構(gòu)、分支結(jié)構(gòu)、判斷結(jié)構(gòu)
B)函數(shù)結(jié)構(gòu)、嵌套結(jié)構(gòu)、平行結(jié)構(gòu)
C)順序結(jié)構(gòu)、分支結(jié)構(gòu)、循環(huán)結(jié)構(gòu)
D)分支結(jié)構(gòu)、循環(huán)結(jié)構(gòu)、嵌套結(jié)構(gòu)
答案:C
解析:
149.[單選題]以下不是開源工具特點的是
A)免費
B)可以直接獲取源代碼
C)用戶可以修改源代碼并不加說明用于自己的軟件中
D)開源工具一樣具有版權(quán)
答案:C
解析:
150.[單選題]有數(shù)組n=np.arange(24).reshape(2,-1,2,2),則np.shape的返回結(jié)果是
()o
A)(2,3,2,2)
B)(2,2,2,2)
C)(2,4,2,2)
D)(2,6,2,2)
答案:A
解析:reshape()里-1的作用是可以先不計算,由數(shù)組size和其他的reshape參數(shù)確定這個數(shù)
值,此處用24除以其他不是-1的值得到3o
151.[單選題]在Hadoop項目結(jié)構(gòu)中,HDFS指的是什么?
A)分布式文件系統(tǒng)
B)分布式并行編程模型
C)資源管理和調(diào)度器
D)Hadoop上的數(shù)據(jù)倉庫
答案:A
解析:
152.[單選題]scipy.stats模塊中隨機變量的生存函數(shù)是什么?
A)cdf
B)rvs
C)pdf
D)sf
答案:D
解析:
153.[單選題]()用于將非線,性引入神經(jīng)網(wǎng)絡(luò),它會將值縮小到較小的范圍內(nèi)。
A)損失函數(shù)
B)優(yōu)化函數(shù)
C)激活函數(shù)
D)目標函數(shù)
答案:C
解析:
154.[單選題]MapReduce適用于()
A)任意應(yīng)用程序
B)任意可以在Windows
C)可以串行處理的應(yīng)用程序
D)可以并行處理的應(yīng)用程序
答案:D
解析:
155.[單選題]Hadoop生態(tài)系統(tǒng)中,HBase是一種()。
A)分布式文件系統(tǒng)
B)數(shù)據(jù)倉庫
C)實時分布式數(shù)據(jù)庫
D)分布式計算系統(tǒng)
答案:C
解析:HBase是一個面向列的實時分布式數(shù)據(jù)庫。
156.[單選題]一般而言,在個體學(xué)習(xí)器性能相差較大時宜使用(),而在個體學(xué)習(xí)器性能相近時宜使用
()0
A)簡單平均法,加權(quán)平均法
B)加權(quán)平均法,簡單平均法
C)簡單平均法,簡單平均法
D)加權(quán)平均法,加權(quán)平均法
答案:B
解析:
157.[單選題]神經(jīng)網(wǎng)絡(luò)感知機只有()神經(jīng)元進行激活函數(shù)處理,即只擁有一層功能神經(jīng)元
A)輸出層
B)輸入層
C)感知層
D)網(wǎng)絡(luò)層
答案:A
解析:
158.[單選題]數(shù)據(jù)質(zhì)量以()為監(jiān)控對象,目前支持對離線數(shù)據(jù)的監(jiān)控。
A)數(shù)據(jù)群
B)數(shù)據(jù)集
C)數(shù)據(jù)列
D)數(shù)據(jù)模塊
答案:B
解析:
159.[單選題]云計算是對()技術(shù)的應(yīng)用和發(fā)展?
A)并行計算
B)網(wǎng)格計算
C)分布式計算
D)以上三項都是
答案:D
解析:
160.[單選題](一)的主要目標是提供可擴展的機器學(xué)習(xí)算法及其實現(xiàn),旨在幫助開發(fā)人員更加方
便快捷地創(chuàng)建智能應(yīng)用程序。
A)Mahout
B)Flume
C)Sqoop
D)HBase
答案:A
解析:
161.[單選題]在k近鄰學(xué)習(xí)算法中,隨著k的增加,上界將逐漸降低,當k區(qū)域無窮大時,上界和下界碰到
一起,k近鄰法就達到了()。
A)貝葉斯錯誤率
B)漸進錯誤率
C)最優(yōu)值
D)上界
答案:A
解析:
162.[單選題]以下哪項方法不屬于漢語分詞方法?()
A)雙向掃描法
B)正向最大匹配法
C)逐詞遍歷法
D)詞向量匹配法
答案:D
解析:
163.[單選題](一)用于將關(guān)系型數(shù)據(jù)庫或者其他結(jié)構(gòu)化的數(shù)據(jù)導(dǎo)入到Hadoop的生態(tài)系統(tǒng)中。
A)Oozie
B)Flume
C)Sqoop
D)Hue
答案:C
解析:
164.[單選題]使用OTSJavaSDK進行表操作時需要創(chuàng)建,以下()不屬于構(gòu)造此對象時必須提供的
信息。
A)實例名稱
B)AccountID
C)Endpoint
D)AccessKeySecret
答案:B
解析:
165.[單選題]關(guān)于HDFS的文件塊的描述不準確的是?
A)文件塊越大尋址時間越知短。
B)文件塊(片)被存在哪個集群;誰有權(quán)限查看.修改這個文件等信息放在元數(shù)據(jù)Metadata中。
C)文件塊的大小設(shè)置原則:最大化尋址開銷。
D)HDFS文件塊的大小在1.0版本時是64,在2.0的時候是128M。
答案:A
解析:
166.[單選題]下列哪些不是ZooKeeper的特點()
A)順序一致性
B)原子性
C)多樣系統(tǒng)映像
D)可靠性
答案:C
解析:
167.[單選題]傳統(tǒng)RNN有什么特別大的弊端?
A)無法進行長久記憶
B)精度太低
C)速度太慢
D)效果太差
答案:A
解析:
168.[單選題]當zookeeper集群的節(jié)點數(shù)為5節(jié)點時,請問集群的容災(zāi)能力和多少節(jié)點是等價的?
A)3
B)4
05
D)以上全不正確
答案:D
解析:
169.[單選題]數(shù)據(jù)安全技術(shù)保護與信息系統(tǒng)"蘭同步"原則不包括以下哪項()。
A)同步規(guī)劃J
B)同步建設(shè)
C)同步使用
D)同步運維
答案:D
解析:
170.[單選題]利用到每個聚類中心和的遠近判斷離群值的方法,可以基于的算法為()。
A)K-mens
B)KNN
OSVM
D)LinearRegression
答案:A
解析:
171.[單選題]屬于卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用方向的是()
A)圖像分類
B)目標檢測
C)圖像語義分割
D)以上答案都正確
答案:D
解析:
172.[單選題]當()時,可以不考慮RDD序列化處理。
A)完成成本比較高的操作后
B)執(zhí)行容易失敗的操作之前
ORDD被重復(fù)使用
D)實時性要求高
答案:D
解析:RDD的序列化處理主要在完成成本比較高的操作之后、執(zhí)行容易失敗的操作之前、當RDD被
重復(fù)使用或者計算其代價很高時進行。
173.[單選題]以下變量名中錯誤的是(一)。
A)my_string_l
B)1ststring
C)foo
D)_
答案:B
解析:
174.[單選題]列對于PCA說法:①我們須在使用PCA前標準化數(shù)據(jù);②我們應(yīng)該選擇使得模型有最大
variance的主成分③我們應(yīng)該選擇使得模型有最小vanance的主成分;④我們可以使用PCA在低維度上
做數(shù)據(jù)可視化正確的是()
A)①、②、④
B)②、④
C)③、④
D)①、③
答案:A
解析:
175.[單選題]閱讀以下代碼,回答問題1deftotal(n):2s=03i=14while(i
A)這行代碼表示求i個數(shù)的和
B)這行代碼表示求s個數(shù)的和
C)這行代碼表示求s+i個數(shù)的和
D)這行代碼表示求1+2+...+n的和
答案:D
解析:
176.[單選題]大數(shù)據(jù)的4V特征中的Volume是指()。
A)價值密度低
B)處理速度快
C)數(shù)據(jù)類型繁多
D)數(shù)據(jù)體量巨大
答案:D
解析:
177.[單選題]在野外部署有許多傳感器,用于實時采集空氣質(zhì)量數(shù)據(jù),當數(shù)據(jù)傳回數(shù)據(jù)中心后,在
存儲之前需要進行數(shù)據(jù)的預(yù)處理操作,那么如下哪些操作部署于數(shù)據(jù)預(yù)處理所采用的方法()。
A)數(shù)據(jù)變換
B)缺失數(shù)據(jù)填充
C)數(shù)據(jù)不一致性檢測
D)以上都是
答案:D
解析:
178.[單選題]HBase使用一個()節(jié)點協(xié)調(diào)管理一個或多個regionserver從屬機。
A)namenode
B)datanode
C)jobtracker
D)master
答案:D
解析:
179.[單選題]以等可能性為基礎(chǔ)的概率是()
A)古典概率
B)經(jīng)驗概率
0已試驗概率
D)主觀概率
答案:A
解析:
180.[單選題]Flink快照機制的核心是barriers不包含以下哪個特點?
A)將前后周期快照數(shù)據(jù)分隔
B)攜帶所屬快照周期的ID
C)嚴格的按照線性流動
D)會阻斷數(shù)據(jù)流,重量級元組
答案:D
解析:
181.[單選題]Fusioninsight系統(tǒng)中,HDFS的Block默認保存幾份?
A)3份.
B)2份
01份
D)不確定
答案:A
解析:
182.[單選題]機器學(xué)習(xí)中L1正則化和L2正則化的區(qū)別是()
A)使用L1可以得到稀疏的權(quán)值,使用L2可以得到平滑的權(quán)值
B)使用L1可以得到平滑的權(quán)佳,使用L2可以得到平滑的權(quán)值
C)使用L1可以得到平滑的權(quán)佳,使用L2可以得到稀疏的權(quán)值
D)使用L1可以得到稀疏的權(quán)值,使用L2可以得到稀疏的權(quán)值
答案:A
解析:
183.[單選題]()負責HDFS數(shù)據(jù)存儲。
A)NameNode
B)JobTracker
ODataNode
D)SecondaryNameNode
答案:C
解析:DataNode負責HDFS的數(shù)據(jù)塊存儲。
184.[單選題]當訓(xùn)練數(shù)據(jù)很多時,一種更為強大的結(jié)合策略是使用(一),通過另一個學(xué)習(xí)器來進
行結(jié)合。
A)投票法
B)平均法
C)學(xué)習(xí)法
D)排序法
答案:C
解析:
185.[單選題]循環(huán)神經(jīng)網(wǎng)絡(luò)適合處理什么數(shù)據(jù)。()
A)、節(jié)點數(shù)據(jù)
B)、序列數(shù)據(jù)
C)、結(jié)構(gòu)化數(shù)據(jù)
D)、圖像數(shù)據(jù)
答案:B
解析:
186.[單選題]Scipy中,線性模塊是()模塊。
A)fftpack
B)signal
C)linalg
D)ndimage
答案:C
解析:fftpack是傅里葉變換模塊,signal是信號處理模塊,linalg是線性代數(shù)模塊,
Ndimage是多維圖像處理模塊。
187.[單選題]下列關(guān)于MapReduce說法不正確的是。
A)MapReduce是一種計算框架
B)MapReduce來源于google的學(xué)術(shù)論文
C)MapReduce程序只能用java語言編寫
D)MapReduce隱藏了并行計算的細節(jié),方便使用
答案:C
解析:C項rhadoop是用R語言開發(fā)的,MapReduce是一個框架,可以理解是一種思想,可以使用其他
語言開發(fā)。
188.[單選題]長短時記憶神經(jīng)網(wǎng)絡(luò)緩解梯度消失問題采取的措施是()。
A)增加網(wǎng)絡(luò)深度
B)減少網(wǎng)絡(luò)神經(jīng)元
C)使用雙向的網(wǎng)絡(luò)結(jié)構(gòu)
D)增加一個用來保存長期狀態(tài)的單元
答案:D
解析:
189.[單選題]()是指幾組不同的數(shù)據(jù)中均存在一種趨勢,但當這些數(shù)據(jù)組組合在一起后,這種趨
勢將消失或反轉(zhuǎn)。
A)辛普森悖論
B)大數(shù)據(jù)悖論
C)大數(shù)據(jù)偏見
D)幸存者偏差
答案:A
解析:
190.[單選題]Spark比MapReduce快的原因不包括()。
A)Spark基于內(nèi)存迭代,而MapReduce基于磁盤迭代
B)DAG計算模型相比MapReduce更有效率
0Spark是粗粒度的資源調(diào)度,而MapReduce是細粒度的資源調(diào)度
D)Spark支持交互式處理,MapReduce善于處理流計算
答案:D
解析:A、B、C是Spark比MapReduce快的原因。MapReduce不善于處理除批處理計算模式之外的其
他計算模式,如流計算、交互式計算和圖計算等。
191.[單選題]有數(shù)組n=np.arange(24).reshape(2,-1,2,2),np.shape的返回結(jié)果是什么?。
A)(2,3,2,2)
B)(2,2,2,2)
C)(2,4,2,2)
D)(2,6,2,2)
答案:A
解析:
192.[單選題]二維圖像可用二維函數(shù)表示,則
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國剪板機用刀數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國冷藏船板數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國再生絨數(shù)據(jù)監(jiān)測研究報告
- 互聯(lián)網(wǎng)醫(yī)院的信息技術(shù)與安全保障
- 大隊出售建設(shè)用地合同協(xié)議
- 國外公司入股合同協(xié)議
- 國企塔吊租賃合同協(xié)議
- 堆垛機招標采購合同協(xié)議
- 工程上用工合同協(xié)議
- 國際貿(mào)易礦產(chǎn)合同協(xié)議
- 2025年陜西省漢中市寧強縣中考一模道德與法治試題(含答案)
- 2024年阜陽太和縣第二人民醫(yī)院招聘筆試真題
- 工地分紅合同協(xié)議
- 變配電工多選試題及答案
- 零售業(yè)智能轉(zhuǎn)型:DeepSeek驅(qū)動的消費行為分析與推選系統(tǒng)
- 招商引資知識培訓(xùn)課件
- 癌癥治療協(xié)議書模板
- 2025年平頂山文化藝術(shù)職業(yè)學(xué)院高職單招職業(yè)技能測試近5年常考版參考題庫含答案解析
- 弘揚航天精神中國航天日主題宣教課件
- 上海市寶山區(qū)上海交大附中2024-2025學(xué)年高考生物試題模擬試卷(8)生物試題含解析
- 私募基金財務(wù)管理制度版本
評論
0/150
提交評論