




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第頁ACP大數據工程師復習試題含答案1.tbl_p為一個ODPS的分區表,包含一個p1='1'的分區,現在想把該分區上的數據刪除,達到使用select*fromtblwherepi='1'查詢時,返回結果為空的目的。以下哪個SQL可以實現該功能?A、truncatetabletbl;B、altertabletbldroppartition(p1='1');C、insertintotabletblselect*fromtblwhere1=2;D、deletefromtabletbl;【正確答案】:B解析:
MaxCompute不支持直接對表數據進行刪除(DELETE)操作。您可以通過如下方法進行刪除:通過刪除(DROP語句)表,達到刪除數據的目的。2.以下哪種對RDS的描述是正確的?A、一個實例可以創建多個數據庫B、在實例內數據庫命名可重復C、數據庫不會共享該實例下的資源D、以上都不對【正確答案】:A解析:
RDS中數據庫名稱是唯一的,相同庫名是無法創建的;RDS下數據庫資源是可以共享的。3.Bob使用java開發了一個大數據計算服務的MapReduce,用來對海量交易數據做時序分析,結果該MR性能較差,某些map存在明顯的長尾效應,__________方法可以有效的消除長尾效應。A、只關心處理的列,忽略其余的多余列B、合理使用combiner,適當的減少數據交互量C、通過set命令或者Jobconf修改MR參數,增大map/reduce的內存D、通過set命令或者Jobconf修改MR參數,影響分片的大小和個數【正確答案】:B解析:
無4.大數據計算服務中的日志表log是一張分區表,分區鍵是dt,每天產生一個分區用于存儲當天新增的數據,現在共有dt='20160101'至dt='20160131'共31個分區的數據,為了刪除20160101當天新增的數據,可以通過_____方式實現。A、deletefromlogwheredt='20160101'B、altertablelogdroppartition(dt=20160101')C、truncatetablewheredt='20160101'D、droppartitionlog(dt='20160101')【正確答案】:B解析:
刪除分區表分區數據:使用drop關鍵字;刪除非分區表數據:使用truncate關鍵字;不支持delete操作;5.作為技術人員,小王被ODPS的大數據處理能力吸引,想體驗一下,他快速注冊了阿里云賬號,進入官網后試圖創建一個名字為test.project的ODSPproject,結果沒有成功,試分析,小王出錯的最有可能的原因是()A、項目空間名稱已存在B、賬號未開通ODPS的使用權限C、賬號未充值,余額不足導致出錯D、未創建合適的accesslD和accessKey【正確答案】:A解析:
未開通服務是無法使用的;未充值也不影響創建項目;是否創建合適的accessid和創建項目空間沒有直接關系。如果項目空間名稱已存在,則不會創建成功。6.ADS的普通表的一級分區數量最多有多少個()A、無限制B、128個C、256個D、1000個【正確答案】:C解析:
正確答案C。一般來講,每個分區的數據不超過800萬條為宜,當然也不絕對,分區數不能超過256個7.在大數據計算服務的數據倉庫中的訂單表fact_order,建表語句如下:createtablefact_order(order_idstring,order_amtdouble,order_dtstring)partitionedby(dtstring);此表中的數據是從ods_order加工而來,ods_order建表語句如下:createtableods_order(order_idstring,order_amtbigint,order_dtstring);ods_order中有一條記錄數據值是order_idorder_amtorder_dt000110020160301。運行SQL語句將數據從ods_order加載到fact_order中:insertoverwritetablefact_orderpartition(dt='20160301')select*fromods_order;對此語句的執行結果描述正確的是___。A、提交SQL時會報語法錯誤B、語句可以執行,order_amt的值會被自動的轉為double類型C、語句可以執行,但是這條數據會被當作臟數據丟棄D、目標表與源表中的數據類型不一致,執行出錯【正確答案】:B解析:
隱式轉換int會轉換成double,語法不會報錯,可以正常執行。int類型的值是可以轉換double類型8.在ADS中,為了更高效的進行表關聯,兩個事實表進行Join的必要條件不包括以下哪些項?A、這兩個表的joinkey至少有一列建立了主鍵B、這兩個表在一個表組C、這兩個表的joinkey是hash分區列D、兩個表的Hash分區數必須一致【正確答案】:A解析:
為了更高效的進行表關聯,分析型數據庫對表關聯操作在分析型數據庫中,兩個事實表進行Join的充要條件是:(1)這兩個表在一個表組;(2)這兩個表的JoinKey是Hash分區列;(3)兩張表的Hash分區數必須一致,否則Join結果不準確;(4)兩張表的JoinKey至少有一列建立了HashMap索引,推薦建立在數據量較小的一側。9.大數據開發治理平臺DataWorks中,周期性調度任務是指按配置的時間周期進行自動調度的任務,以下場景中,()不適合配置成周期性調度任務。A、MaxCompute中基于商品庫存表每隔一小時生成一張庫存盤點的匯總表B、每隔5分鐘對MaxCompute中的訪問日志表進行一次數據清洗C、今天市場部經理臨時要求分析師基于MaxCompute中的用戶交易表生成一份昨天有成交記錄的品牌列表D、把云數據庫RDS中的用戶登錄記錄表每天0點30分同步到MaxCompute表中【正確答案】:C解析:
根據題目臨時要求,臨時要求一般為一次性任務,很明顯不需要周期調度。10.以下哪些應用場合適合RDS只讀實例來完成()A、擴大RDS的存儲能力B、分擔RDS主實例的寫壓力C、緩解RDS主實例的寫壓力D、實現兩天前的數據回溯【正確答案】:B解析:
/yiqiu3812/article/details/10...11.2只讀實例能分擔RDS主實例的寫壓力11.有關DDoS攻擊的描述,最準確的是?A、主要是攻擊目標是數據庫B、黑客自己夠買了大量服務器,專門從事破壞活動C、攻擊的目的是讓服務超負載,然后竊取機密信息D、攻擊的主要目的是讓指定目標無法提供正常服務,甚至從互聯網上消失,是目前最強大、最難防御的攻擊之一【正確答案】:D解析:
無12.從ODPS導入數據到ADS的時候,導入路徑的格式為?A、odps://project_nameltable_name:partition_specB、odps://project_nameltable_name/partition_specC、odps://project_nameltable_name(partition_spec)D、odps://project_nameltable_namepartition_spec【正確答案】:B解析:
無13.DataIDE的數據管理模塊主要是對項目空間中的表的元數據、權限申請等進行管理操作,以下說法錯誤的是()A、可以通過數據管理模塊查看項目空間中的表的生命周期B、可以通過數據管理模塊查看項目空間中的表的結構C、可以通過數據管理模塊申請項目空間中的表的查詢權限D、可以通過數據管理模塊查看項目空間中的表的數據.【正確答案】:D解析:
數據管理模塊:全局預覽,查找數據(此頁面功能為搜索數據表),數據表管理,權限管理。可以查看表的基本信息(表名,項目名稱,負責人,描述,權限),存儲信息(物理存儲量,生命周期,是否分區表,表的創建時間,ddl時間,數據最后變更時間),字段信息,分區信息,產出信息,變更歷史,血緣信息,申請授權D、支持在數據管理模塊預覽數據,這道題有待考究14.Hadoop主要組成不包括以下哪個選項?A、MapReduceB、YARNC、HIVED、HDFS【正確答案】:C解析:
主要組成:MapReduce、YARN和HDFS15.大數據計算服務(MaxCompute,原ODPS)的開發人員在做數據探查時,想要從nginx日志表nginx_access_log中取10條記錄,可以____通過實現。A、selectfromnginx_access_logwhererownumc=10B、selecttop10*fromnginx_access_logC、select"fromnginx_access_loglimit10;D、select"fromnginx_access_logorderby_rownum_limit10;【正確答案】:C解析:
取10條數據的方式:1、selectlimit10;前10條;2、Readtable_name10;隨機10條;16.您希望通過管理控制臺進行阿里云的專有網絡VPC內的云服務器ECS實例的私網IP地址的修改,但發現操作的菜單不可用,是________原因引起的。A、該云服務器ECS實例所在的VPC類型是默認專有網絡B、該云服務器ECS實例沒有綁定IPC、沒有針對該云服務器ECS實例進行停止操作,且該云服務器ECS實例不是停止狀態D、該云服務器ECS實例不是運行狀態【正確答案】:C解析:
修改私網IP需要保證ECS處于已停止的狀態。17.數據工場DataWorks中,task1和task2都是按天調度的周期性調度任務,task1生成分區表table1,task2生成分區表table2,每天task2取table1最新分區的數據進行統計,而task1有部分數據來源是table2前一天分區的數據。task1和task2的依賴關系需要如何配置?A、只需要task1依賴屬性的上游任務配置為task2B、task1和task2都不需要配置依賴屬性C、task1跨周期依賴選擇“等待自定義任務的上一周期結束,才能繼續運行”,自定義任務填寫task2,task2依賴屬性的上游任務配置為task1D、只需要task2依賴屬性的上游任務配置為task1【正確答案】:C解析:
調度周期配置按題意應該是task2依賴task1,task1依賴task2的前一天數據,要保證依賴關系正常執行,需要task1等待前一周期結束,然后task2才能正常執行。A、如果只設置task1依賴屬性的上游任務配置為task2,那么task2無法取table1最新分區數據進行統計;B、不依賴是無法完成題目中復雜的邏輯運算的;D、只設置task2依賴屬性的上游任務配置為task1,那么無法實現task1部分數據取字table2的前一天分區。18.OTS中可以使用拼接的分片鍵,拼接就是把幾個屬性拼接成一個屬性。拼接是為了解決什么問題()A、解決數據生命周期的問題B、解決寫壓力過于集中的問題C、解決單個分片鍵下數據量過大的問題D、解決OTS預留讀寫量不足的問題【正確答案】:C解析:
正確答案CTableStore建議單個分片下的數據量大小不超過1GB,如果您的表中單個分片鍵的所有行的總數據量大小可能超過1GB,在設計表時可以將原來的多個主鍵列拼接成分片鍵。19.關于Maxcompute,說法不正確的是()A、在很多方面并不具備數據庫的特征B、適用于海量數據,實時性要求不高的場合C、每個作業的準備,提交等階段要花費較長時間D、大部分標準SQL的功能都支持,但是不支持窗口函數、rownum等【正確答案】:D解析:
Maxcompute不支持事務,索引等數據庫特征,批量離線處理,對實時性不高;不能處理實時性特別高的事務,響應時間長,需要花費時間長。是支持窗口函數的。20.數據工場DataWorks(原DatalDE)中的調度任務可以通過配置依賴屬性來控制任務運行的先后順序,下列說法不正確的是()。A、同一個組織的不同數據工場DataWorks(原DatalDE)項目空間中的調度任務不能配置成上下游依賴的關系B、多個調度任務可以配置成依賴同一個上游任務C、同一個項目空間中的節點任務和工作流任務可以配置成上下游依賴的關系D、一個調度任務可以配置多個上游依賴任務【正確答案】:A解析:
官網文檔中:數據開發-調度配置-依賴關系中說明,DataWorks目前支持同區域下的跨項目依賴21.ODPS的命令行工具odpscmd可以使用以下哪個參數調用某個文件中的命令集?A、kB、eC、fD、C【正確答案】:C解析:
odpscmd-fxxx.sql22.在服務器上手動安裝云盾客戶端安騎士時需要什么權限?A、系統管理員權限B、FTP服務權限C、數據庫權限D、系統普通用戶權限【正確答案】:A解析:
登錄阿里云帳號,進入服務器安全(安騎士)控制臺-安裝Agent頁面,根據頁面提示獲取最新版本下載地址,以管理員權限在服務器上運行并安裝,點擊進入安裝頁面。23.在MaxCompute中,根據業務需要有時需要優化SQL語句,下列關于SQL語句優化方法的說法中,正確的是()。A、在多個去重逾矩的場景中,可能發生數據膨脹,建議多使用groupby而不是distinctB、將groupby語句拆成兩部分會降低SQL執行效率C、在進行Mapper優化時,當input的文件都很大,任務邏輯復雜,map執行非常慢的時候,可以考慮減少Map數D、分區裁剪過濾分區列,可以避免SQL執行時完整表掃描,通過logview檢查分區裁剪是否有效【正確答案】:A解析:
當input的文件都很大,任務邏輯復雜,map執行非常慢的時候,可以考慮增加Map數,來使得每個map處理的數據量減少,從而提高任務的執行效率。groupby:數據量大時比distinct效率更高,且使用場景更大。24.ADS創建普通表時,關于updateType屬性那種說法是錯誤的?A、合法的取值為realtime或者batch,該值不顯式指定時,默認取batchB、該值為realtime時,對應的表必須指定合法的主鍵并且必須指定二級分區C、通過該屬性指定數據的更新方式D、該值為batch時,如果要支持增量導入,必須指定二級分區【正確答案】:B解析:
根據表的數據更新方式不同,分析型數據庫的表根據updateType分為批量更新表(僅能夠離線批量更新數據)和實時更新表(能夠通過insert/delete實時更新數據),用updateType以區分,如果updateType選項不填則默認為批皇更新表。需要注意的是,updateType=realtime暨為實時更新表時,必須指定合法的主鍵并且不能有二級分區。25.以下不屬于基于Dataworks的數據倉庫建設的優勢?A、全托管B、高性能C、免運維D、高成本【正確答案】:D解析:
高性能、低成本、免運維、全托管/document_detail/73016.html?spm=a2c4g.143996.0.i1026.關于ADS的ECU,說法正確的是?A、可以動態的擴容或者縮容,兩者都是瞬間的同步操作B、通過參數設置,可以使同一個ADS的庫同時使用兩種類型的ECUC、可以通過查詢表information_schema.resource_request獲得目前的ECU的狀態D、可以通過DDL語句alterdatabasesetecu_count=N來修改ECU的個數【正確答案】:D解析:
A、動態擴容或縮容不能瞬間完成;B、兩種類型ECU需要根據業務需求指定一種使用:(1)高性能:以字母C或者H開頭的ECU為高性能實例,數據全部存儲在SSD磁盤中。適用于對性能要求高、查詢并發高的業務場景。(2)大存儲:以字母S開頭的ECU為大存儲實例,采用SSD/HDD分層存儲架構,熱點數據存儲在SSD磁盤中,冷數據存儲在HDD磁盤中。適用于并發稍低、性能要求不高(可接受數據查詢響應時間受超過10秒以上)的業務場景。CD、如果當前ECU配置無法滿足需求,您可以變更ECU配置。注意:當遇到特殊情況需要手動擴縮容時,請登錄ads_ag容器,執行以下命令即可,[$ECU_Type]為ECU的類型,[$ECU_Count]為ECU的數量。27.關于ADS的權限模型,下列哪些描述是正確的()A、每個權限級別能聚合其下面級別的所有權限B、導出數據時需要DUMPDATA、DESCRIBE和SELECT權限,同時需要數據導出目的地的數據寫入相關權限C、查詢表數據需要SELECT權限,最小級別是表D、ADS的授權模型和Mysql非常相似,比如ADS支持針對用戶在host上授權【正確答案】:A解析:
正確答案A。A、聚合:Database–>Table[Group)]-->Column,即每個權限級別能聚合其下面級別的所有權限。B、導出數據同時需要DUMPDATA和SELECT權限,同時需要數據導出目的地的數據寫入相關權限,并非所有查詢都需要該權限,例如SELECTnow()C、最小查詢級別是列級;D、任何分析型數據庫支持的賬號類型均可視為一個用戶。和Mysql略有不同的是,分析型數據庫目前不支持針對用戶在host上授權。28.在進行數據分析之前,需要對數據進行處理,以下屬于數據處理操作的是()A、構建數據分析模型,進行預測分析,評估模型B、確定數據范圍,獲取目標數據,并整合相關數據C、整理組合信息,通過圖表展現信息D、處理缺失數據,清洗不一致數據【正確答案】:D解析:
缺失值處理、異常值處理、重復值處理等數據清洗操作屬于數據處理,所以選擇D。29.大數據計算服務(MaxCompute,原ODPS)的MapReduce在正式執行Map前,需要將輸入數據進行"片"(split)。關于分片的說法中錯誤的是A、分片會對輸入文件進行實際的物理切分,即分片數據會被存成多個大小相同的物理文件B、一個輸入分片就是能夠被單個map操作處理的輸入塊C、每一個map操作只處理一個輸入分片D、可以通過參數控制分片的大小【正確答案】:A解析:
map的分片是邏輯上的分片,只是一種標記,不會是物理上的分片MapReduce是處理數據的一種編程模型,通常用于大規模數據集的并行運算。您可以使用MapReduce提供的接口(JavaAPI)編寫MapReduce程序,來處理MaxCompute中的數據。編程思想是將數據的處理方式分為Map(映射)和Reduce(規約)。在正式執行Map前,需要將輸入的數據進行分片。所謂分片,就是將輸入數據切分為大小相等的數據塊,每一塊作為單個MapWorker的輸入被處理,以便于多個MapWorker同時工作。每個MapWorker在讀入各自的數據后,進行計算處理,最終通過Reduce函數整合中間結果,從而得到最終計算結果。30.DRDS的產品定位不包括以下哪項?A、基于RDS的分布式數據存儲和檢索產品B、海量數據的多維分析C、降低用戶使用分布式數據庫的難度D、解決用戶單RDS無法支撐業務的困難【正確答案】:B解析:
海量數據多維分析適合使用大數據計算服務完成。31.大數據計算服務(MaxCompute,原ODPS)tunnel命令提供了豐富的參數,可以通過參數設置,對上傳或者下載操作進行控制,現在有一個大文件要上傳至odps某表中,想先檢查一下該文件內容是否和表的定義匹配,并不實際上傳,以免文件中有錯誤記錄會導致上傳出錯。可以使用哪個參數實現這個功能?A、錯誤記錄丟棄:-dbrB、字段分隔符:-fdC、掃瞄選項:-SD、空字符串顯示:-ni【正確答案】:C解析:
無32.阿里云QuickBI報表工具支持多種數據源,方便用戶基于自己來自不同數據源的數據進行分析和展現。目前還不支持作為數據源。A、OSSB、MaxComputeC、AnalytieDBD、RDSMySQL【正確答案】:A解析:
支持如下數據源:目前自助取數功能可以支持的數據庫類型有限,只支持MySQL、MaxCompute、Oracle、AnalyticDBforMySQL3.0、Clickhouse、Impala等六種類型的數據庫。如果您有導出近百萬條數據的需求,只能將數據存儲于這幾類數據庫中,然后通過這幾種數據庫建數據集,再制作交叉表,供導出場景使用。33.某在線廣告APP采用了阿里云的技術,通過對網上搜集的海量數據的分析,給企業主提供精準的廣告投放人群。該app的產品經理介紹該系統能實現以下技術指標:1-能存儲海量數據,單表大小超過10TB2-支持多張上億的表進行Join3-支持多種篩選條件,包括連續范圍篩選、取值篩選、and/or/not條件組合等4-支持快速(3秒以內)對數十個維度分別進行透視分析根據以上信息,請判斷該app最有可能使用的是阿里云的哪一款產品?A、分布式關系型數據庫(DRDS)B、表格存儲(TableStore,原OTS)C、分析型數據庫(AnalyticDB,原ADS)D、大數據計算服務(MaxCompute,原ODPS)【正確答案】:C解析:
分析型數據庫支持sql規范規則并響應速度快。所以最合適。需要區別不同數據庫的性能差異;分布式關系型數據庫,主要基于RDS的分布式數據存儲和檢索產品,快速響應不及分析性數據庫;表格存儲NoSQL,海量結構化數據存儲和實時訪問,彈性資源預留,實時監控顯示。
大數據計算服務主要是海量數據存儲計算。34.在數據工場DataWorks中使用數據同步任務進行數據同步時,數據同步任務讀源頭表需要權限,寫目標表也需要權限,如數據同步任務日志提示:ODPS-0420095:AccessDenied-AuthorizationFailed[4019],YouhaveNOprivilege'odps:Describe'on{acs:odps:*:projects/xxx_prj/tables/xxx_table}.ContextD:2ac7aac3-0928-45d2-98c0-4085fbc6ba88.]通過該提示日志,可以得到信息。A、從該日志可以看出該任務是寫表xxx_prj/tables.xxx_tableB、從該日志可以看出具體哪個云賬號沒有權限C、從該日志可以看出該任務是讀表xxx_prj/tables.xxx_tableD、從該日志提示可以看出是對MaxCompute(原ODPS)表xxx_prj/tables.xxx_table沒有describe權限【正確答案】:A解析:
無35.某Bl系統構建在大數據計算服務MaxCompute上,某數據分析員在分析訂單的地域分布時,需要把訂單表order(占用存儲空間約10G)與地域維表region(占用存儲空間100M)關聯起來,兩張表的結構如下:createtableorder(order_idstring,region_idstring,orderamtbigint);createtableregion(region_idstring,region_namestring)在運行時發現由于訂單大量集中在上海地區,數據的傾斜導致整體運行時間較長,運行的SQL語句如下:selectregion_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;此時可以考慮通過優化SQL的運行效率。A、使用mapjoinhint:select/*+mapjoin(t2)*/region_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;B、使用mapjoinhint:select/*+mapjoin(t1)*/region_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;C、調整兩張表的位置:selectregion_name,sum(order_amt)amtfromregiont1joint2ont1.region_id=t2.region_id;D、減小SQL的splitsize,增加計算資源【正確答案】:A解析:
使用Mapjoin小表放內存里可以提高運行速率Mapjoin應該把小表放內存,把大表放內存不符合調換位置不影響計算速度數據傾斜問題時減少splitsize不能解決的36.使用大數據計算服務tunnel命令上傳log.txt文件到表t_log中去,t_log為分區表,分區列為(p1string,p2string)。下列命令中正確的是?A、tunneluploadlog.txtt_log/p1="b1"/p2="b2"B、tunneluploadlog.txtt_log/(p1="b1",p2="b2")C、tunneluploadlog.txtt_log/p1="b1",p2="b2"D、tunneluploadlog.txtt_log(p1="b1",p2="b2")【正確答案】:C解析:
upload:上傳數據到MaxCompute的表中。支持文件或目錄(指一級目錄)的上傳,每一次上傳只支持數據上傳到一張表或表的一個分區。分區表一定要指定上傳的分區,多級分區一定要指定到末級分區。37.數據工場DataWorks(原DataIDE)中,按天調度的周期性任務task1的定時調度時間設置為2點0分;按天調度的周期性任務task2的定時調度時間設置為0點0分,task1依賴屬性的**任務設置為task2,關于task1以下說法正確的是?A、每天0點0分開始執行B、每天2點0分一定開始執行C、每天只要task2當前周期執行狀態為成功,則task1馬上開始執行D、每天2點0分后task2當前周期執行狀態為成功,則task1可以開始執行【正確答案】:D解析:
無38.大數據計算服務(MaxCompute,原ODPS)的MapReduce編程框架中,Reduce是把Map的輸出結果進行“規約”(有時稱作“化簡”),得到最終結果的過程,關于Reduce過程,以下說法正確的是_________。A、Map后必須有至少一次的Reduce,對于擴展MR,Map后可以支持連續多次的ReduceB、對于MapReduce來講,可以沒有Map過程,但是Reduce是必須的C、Reduce的個數和Map的個數一定相同,由分片的個數決定D、在某些特殊情況下,可以沒有Reduce過程【正確答案】:D解析:
Reduce是接收Map的輸出結果進行后續的“化簡”,所以Reduce可以沒有,特殊情況下只需要Map輸出就可以實現需求,排除選項A和B,且reduce個數可以進行人工設置,排除C。39.大數據計算服務中的fact_order表的生命周期屬性設置成了30天,開發人員通過以下命令創建了一張新的fact_lottery_order表:createtablefact_lottery_orderlikefact_order;對于新表的描述正確的是____A、fact_lottery_order的生命周期屬性是無窮大B、fact_lottery_order的生命周期屬性不會被設置C、fact_lottery_order的生命周期屬性是30D、fact_lottery_order的生命周期屬性是0【正確答案】:A解析:
like復制表fact_order結構,但是并不會復制生命周期,所以fact_lottery_order表的生命周期為默認,而默認周期是永久的。40.資源((Resource)是大數據計算服務(MaxCompute,原ODPS)的特有概念。用戶如果想使用MaxCompute的MapReduce或自定義函數(UDF)功能,需要依賴資源來完成。DataIDE中,可以通過數據開發面板的資源管理上傳資源,目前支持的資源類型有()。A、jar、file、archiveB、jar、file、pythonC、jar、archive、pythonD、file、archive、python【正確答案】:A解析:
無41.以下哪個不屬于Maxcompute的訪問策略的訪問控制元素()A、效果B、操作C、權限D、主體【正確答案】:C解析:
每次權限管理操作均是對效果(授權、撤銷)、對象(如表、資源等)、主體(用戶或是角色)、操作(讀、寫、刪除等)的組合描述
/document_detail/104028.html?spm=a2c4g.27935.0.i042.大數據計算服務(MaxCompute,原ODPS)的開發人員在建模時需要使用內置函數floor對某表的value字段進行取整,在數據表中有兩條記錄,value字段的值是1.2和-3.3,則結果數據是A、1和-3B、2和-3C、1和-4D、2和-4【正確答案】:C解析:
正確答案C。內置函數考察floor是表示取下,1.2的下值為1,-3.3的下值為-443.下列對于ADS中表和表組的描述正確的是()A、維度表在創建時不需要指定表組,但是需要配置分區信息B、維度表可以和除維度表組外的任意表組中的表關聯C、批量插入的表如果只有一級分區,每次導入數據是會覆蓋掉已有數據D、維度表組有且只有一個,用戶可以修改表組屬性,但是不能刪除【正確答案】:C解析:
維度表可以和任意表組的任意表進行關聯,并且創建時不需要配置分區信息,但是對單表數據量大小有所限制,并且需要消耗更多的存儲資源。
維度表組有且僅有一個,并且在分析型數據庫數據庫建立時會自動創建,用戶不可修改和刪除44.您希望通過華北2(北京)地域的阿里云專有網絡VPC中的云服務器ECS實例通過內網訪問OSS,但是連接(華北2(北京)地域的通用內網地址)失敗,可以通過________解決。A、只能通過外網地址進行訪問B、其他方式都不能解決C、換其他地域的內網地址進行訪問,如華北1(青島)地域的通用內網地址()D、通過VPC專用的OSS內網地址進行訪問,【正確答案】:D解析:
在VPC的環境中ECS連接這個地址不通。這個是因為OSS針對VPC是有一套自己的內網地址,所以需要用北京:45.大數據計算服務(MaxCompute,原ODPS)的開發人員需要創建一個自定義函數用以評估客戶的經營情況,輸入參數的兩個字段類型是double,則在開發JavaUDF函數時,這兩個字段對應的輸入參數類型應該是A、基礎類型doubleBigDecimal類型C、String類型Double類型【正確答案】:D解析:
正確答案D。ODPS和Java的數據類型基本相似,在ODPS中的類型都是封裝類型。ODPS中DOUBLE數據類型是對應java.lang.Double46.數據工場DataWorks(原DatalDE)中工作流任務支持一次性調度和周期調度兩種類型,對于周期性調度可以設置不同時間粒度的調度周期,最小的調度周期為()A、5分鐘B、1分鐘C、10分鐘D、30分鐘【正確答案】:A解析:
正確答案A目前分鐘僅支持最小5分鐘的粒度,時間表達式根據上面選擇的時間生成,不能手動修改。47.AlphaGO.自動駕駛等場景實現都使用了比較復雜的機器學習算法,這些算法的特點是:一個系統和外界環境不斷地交互,獲得外界反饋,然后決定自身的行為,達到長期目標的最優化。對這類算法的歸類中,最恰當的一個是.A、增強學習(reinforcementlearning)B、無監督學習(umsypervisedlearning)C、集成學習(ensemblelearning)D、經典學習(cassiolearning)【正確答案】:A解析:
是一種自反饋,自激勵性學習,屬于強化學習48.以下acl授權里,哪種是對ODPS的表賦予select權限?A、grantselectontabletable_nametouserB、grantdesconprojectproject_nametouserC、grantreadonprojectproject_nametouserD、grantreadontabletable_nametouser【正確答案】:A解析:
無49.如果在非阿里云的服務器安裝了安騎士,如何在管理控制臺查看報告?A、在安裝安騎士的過程中需要輸入“安裝驗證key",通過此key關聯用戶的管理控制臺B、通過阿里云官網賬號關聯C、報告無法體驗在阿里云的管理控制臺D、非阿里云服務器不支持安騎士【正確答案】:A解析:
對于非阿里云服務器,在安裝過程中會提示輸入驗證Key,這個驗證Key用于關聯阿里云賬號,通過阿里云賬號在安騎士控制臺使用相關功能,驗證key會顯示在安裝頁面中。50.阿里云數據湖構建(DataLakeFormation,簡稱DLF)是一款全托管的快速幫助用戶構建云上數據湖及Lakehouse的服務,可無縫對接多種計算引擎,其元數據管理是核心功能之一,下列描述,哪些不屬于元數據管理的功能?A、元數據抽取B、元數據產生C、元數據備份D、元數據管理【正確答案】:C解析:
/document_detail/183492.html?spm=a2c4g.1962a943bbfVaNV5S元數據備份不屬于元數據管理的功能。51.某企業的數據倉庫運行在大數據計算服務上,開發人員在加工數據時發現用戶表user中的用戶標識字段user_id有部分臟數據,正確的格式應該是8位的字符串。可以使用SQL語句_________將臟數據過濾出來。A、select*fromuserwherelength(userid)8B、select*fromuserwherelength(userid)>8C、select*fromuserwherelength(userid)D、select*fromuserwherelength(userid)8oruseridisnull【正確答案】:D解析:
表示不等于,只有d中可以把長度不等于8的,值為null的過濾出來A、只過濾了不等于8的,沒過濾掉null的B、只過濾了大于8的,邏輯不正確C、之過濾了小于8的,邏輯不正確52.ODPS中,哪個命令可查看角色role_test的權限()A、listrolerole_testB、showgrantsforrolerole_testC、descrolerole_testD、showaclforrolerole_test【正確答案】:C解析:
查看角色中的權限:describerole;A、listroles查詢role角色B、Showgrantsforuserusername;不適合roleD、語法不對53.Hologress是阿里巴巴自主研發的一站式實時數倉引擎(Real-TimeDataWarehouse),關于Hologress,錯誤的描述是()?A、支持海量數據實時寫入、實時更新、實時分析,支持標準SQL,兼容Postgre大部分函數,兼容MySQL全部函數B、支持高并發低延遲的在線數據服務(Serving)C、支持PB級數據多維分析(OLAP)與即席分析(AdHoc)D、與MaxCompute、Flink、DataWorks深度融合,提供企業級離在線一體化全棧數倉解決方案?!菊_答案】:A解析:
Hologres是阿里巴巴自主研發的一站式實時數倉引擎(Real-TimeDataWarehouse),支持海量數據實時寫入、實時更新、實時加工、實時分析,支持標準SQL(兼容PostgreSQL協議和語法,支持大部分PostgreSQL函數),支持PB級數據多維分析(OLAP)與即席分析(AdHoc),支持高并發低延遲的在線數據服務(Serving),支持多種負載的細粒度隔離與企業級安全能力,與MaxCompute、Flink、DataWorks深度融合,提供企業級離在線一體化全棧數倉解決方案。/document_detail/113648.html?spm=a2c4g.183492.0.i654.在DataIDE中配置數據同步任務時,將云數據庫RDS(Mysql)中的數據同步至大數據計算服務(MaxCompute,原ODPS)分區表對應的日期分區中,采用數據同步任務周期性的調度向不同分區中寫入數據,把yyyymmdd的數據寫入對應的yyyy-mm-dd分區中,如20160308的數據需要寫入MaxCompute表的"2016-03-08分區中,MaxCompute的分區可以通過()實現。A、在MaxCompute側中使用系統內置參數$bizdateB、在MaxCompute側中使用變量${datetime},并在節點參數出賦值datetime=${YYYY/MM/DD}C、在MaxCompute側的分區中寫入常量值2016-03-18即可D、在MaxCompute側中使用變量${datatime},并在節點參數出賦值datetime=${YYYY-MM-DD}【正確答案】:D解析:
datetime=${YYYY-MM-DD}符合要求格式55.下面關于冷熱數據的說法,錯誤的是()A、在同一張表可以對不同的分片設置不同的預留讀寫吞吐量,對于冷數據所在的片,設置較低的預留讀寫吞吐量B、可以用不同的表來區分冷熱數據,并設置不同的預留讀寫吞吐量C、表中存在大量冷數據會導致數據訪問壓力不均勻,從而導致表上配置的預留讀寫吞吐量無法被充分利用D、對冷數據對應的表,可以設置較小的預留讀寫吞吐量【正確答案】:A解析:
無56.某視頻直播公司采用阿里云彈性伸縮(AutoScaling)來實現動態添加或者減少云服務器ECS實例,以應對業務量的變化。由于該公司的系統剛上線不久,沒有歷史數據做參考,同時也不能預估業務量的變化,他們希望通過ECS實例資源的使用情況(比如CPU利用率、系統負載Load等)來彈性伸縮計算資源。他們應該選擇以下哪種伸縮模式?A、動態模式B、定時模式C、固定數量模式D、lazy模式【正確答案】:A解析:
用戶沒有歷史數據作為參考,故使用動態模式配置彈性伸縮服務更為靈活。57.DataIDE的數據同步任務Task1,將數據從大數據計算服務(MaxCompute,原ODPS)同步到云數據庫RDS(MySQL)中,數據表中存在數據質量問題,加載的時候會有部分出錯記錄,Task1中已經配置了容錯記錄條數,為了保證正確記錄能夠保留,在數據加載與控制中,還需要對Task1配置A、數據過濾條件B、視為臟數據,保留原有數據(insertinto)C、作業速率上限D、源表切分主鍵.【正確答案】:B解析:
A、數據過濾是完成數據篩選以及增量上傳;C、作業速率上限只同步速率,不涉及容錯;D、切分鍵是為了增加同步線程,增加同步速率。58.某企業需要一個能夠從身份證號中分析得出所屬省份的自定義函數,哪種自定義函數適用于這種場景?A、UserDefinedSplittedFunction(用戶自定義分組函數)B、UserDefinedScalarFunction(用戶自定義標量函數)C、UserDefinedTableValuedFunction(用戶自定義表值函數)D、UserDefinedAggregationFunction(用戶自定義聚組函數)【正確答案】:B解析:
無59.同步任務有一二級調度的概念,真正抽取數據的機器是哪級調度的機器?如何查看某個同步任務的真正抽取數據的機器是哪臺?A、同步任務有一二級調度的概念,真正抽取數據的機器是哪級調度的機器?如何查看某個同步任務的真正抽取數據的機器是哪臺?B、一級;任務日志中搜索onnode關鍵字得到的第二條結果C、二級;任務日志中搜索onnode關鍵字得到的第二條結果D、一級;任務日志中搜索onnode關鍵字得到的第一條結果【正確答案】:C解析:
針對數據同步任務,DataWorks的調度資源分為一級調度資源和二級運行資源。一級調度資源:可以進入運維中心>周期任務運維>周期實例頁面,右鍵單擊相應節點,選擇查看更多詳情,即可查看該節點的屬性。二級運行資源:可以進入數據集成>同步資源管理>資源組頁面,新增和查看二級任務運行資源。同步任務的真正抽取數據的機器是哪臺是通過二級運行資源onnode關鍵字得到的第二條結果。60.數據質量模塊中配置監控規則時,需要先進行分區表達式配置,對于非分區表的分區規則應選擇()?A、NULLB、NOTC、NOTAPARTITIONTABLED、$yyyymmdd【正確答案】:C解析:
數據質量通過分區表達式來確定需要配置的規則:如果您的檢查對象為非分區表,可以配置分區表達式為NOTAPARTITIONTABLE。如果您的檢查對象為分區表,可以配置為業務日期的表達式(例如$[yyyymmdd])。/document_detail/73690.html?spm=a2c4g.468043.0.i1461.用戶A是公司的系統管理員,經常去上海出差,每當他在上海遠程登錄服務器時系統就會發出報警信息,提示“有人異地登錄,請注意服務器安全”,有什么方法可以快速、自動解決這個問題?A、登錄阿里云管理控制臺,在安騎士配置項里添加“常用登錄地點”B、向我的朋友電話求助,他是業界有名的黑客高手C、向公司領導請求幫助D、立即提交工單,咨詢阿里云工程師【正確答案】:A解析:
無62.大數據計算服務(MaxCompute,原ODPS)中的訂單表fact_order是一張分區表,有order_id及order_amt兩個字段,分區鍵是dt,每天新增的訂單存儲在當天的分區中,對應的源表是ods_order,源表中可能包括多天的訂單,需要按照訂單生成的日期(order_dt)將數據保存到fact_order表中,執行以下SQL語句:insertoverwritetablefact_orderspartition(dt)selectorder_id,order_amt,order_dtasdtfromods_order;在語句執行之前fact_order表中有dt='20160301'及dt='20160302'兩個分區,在這個語句執行時ods_order表是空的,沒有任何記錄。對這個語句的執行結果,以下說法正確的是A、執行完以后fact_order表會被清空,所有的分區都會被刪除B、執行完以后fact_order表中有三個分區,包括dt='20160301',dt="20160302'及dt="C、執行完以后fact_order中仍然有dt=*20160301"及dt='20160302'兩個分區,但是數據會被清空D、執行完以后fact_order中的數據未受影響,仍然是dt='20160301'及dt='20160302'兩個分區【正確答案】:D解析:
A、該語句是使用動態分區的方式插入數據,即會根據查詢的最后一個字段確認分區值,因ods_order表是空的,而分區表操作相當于針對對應文件目錄操作,所以并不會影響其他分區數據,其他分區無變化;
B、同A,同時dt="是語法不支持的,不支持空作為分區
C、同A,數據不受影響
D、正確63.大數據計算服務提供了大數據的存儲和計算服務,非常適合應用于大數據分析的領域。以下說法中錯誤的是哪一項?A、可以實現大型互聯網企業的數據倉庫和BI分析B、提供了便捷的分析處理海量數據的手段,用戶可以不必關心分布式計算細節,從而達到分析大數據的目的C、可以支持實時OLAP分析D、可以基于歷史數據,進行用戶特征和興趣挖掘【正確答案】:C解析:
大數據計算服務屬于批量、離線處理。OLAP對實時性要求較高,一般不適合使用。64.云盾DDoS基礎防護功能如何開啟?A、提交工單,24小時之內開通B、自動開通C、聯系客戶經理線下開通D、需要從管理控制臺申請開通【正確答案】:B解析:
無65.大數據計算服務(MaxCompute,原ODPS)的開發人員需要創建一張用戶消費習慣表,其中一個字段想要命名為like,則以下說法正確的是A、可以將字段命名為like,無需特殊處理B、可以將字段名命名為like,在創建表及引用該字段時,需要用括起來,即表示為'like'C、在創建表時無需特殊處理,但是在引用該字段時需要表示為'like’(注:沒有測試成功)D、無法將字段命名為like,因為這是關鍵字【正確答案】:D解析:
無66.DataIDE的數據同步任務Task1,將數據從大數據計算服務(MaxCompute,原ODPS)同步到云數據庫RDS(MySQL)中,源數據表中存在數據質量問題,加載的時候會有部分出錯記錄,Task1中已經配置了容錯記錄條數,為了保證正確記錄能夠保留,在數據加載與控制中,還需要對Task1配置()A、數據過濾條件B、視為臟數據,保留原有數據(insertinto)C、作業速率上限D、源表切分主鍵【正確答案】:B解析:
無67.對于OTS表的主鍵描述正確的是哪一個()A、由四個屬性組成B、建表的時候可以暫時不指定,之后用altertable修改C、組成主鍵的屬性只能是string或者integerD、主鍵本身就是表的分片鍵【正確答案】:D解析:
表格存儲(TableStore)是構建在阿里云飛天分布式系統之上的NoSQL數據存儲服務。TableStore支持1~4個主鍵,主鍵類型為STRING、INTEGER和BINARY,其中第一個主鍵為分區鍵。主鍵屬性一般有2個,分別是名稱和類型;建表必須指定名稱;主鍵類型有三種:STRING、INTEGER和BINARY;數據分區的劃分粒度為主鍵的第一列,該列即為數據分區鍵。“主鍵本身就是分區鍵”沒問題68.在實際應用中,哪種性能指標表示RDS實例磁盤空間的使用量?A、磁盤空間B、CPU利用率C、IOPSD、連接數【正確答案】:A解析:
無69.阿里云機器學習的標準化組件可以對數值型的字段進行標準化處理,以字段x為例,其標準化的計算為______。A、x字段整列的最大值減掉該列的最小值得到一個差,然后每一行的x值除以這個差:x/[max(x)-min(x)]B、每一行的x值除以該列最大的x值:x/max(x)C、每一行的x值減掉x字段整列的平均值,然后除以x字段整列的平均值:[xmean(x)]/mean(x)D、每一行的x值減掉x字段整列的平均值,然后除以x字段整列的標準差:[xmean(x)]/std(x)【正確答案】:D解析:
標準化所使用的公式:(X-Mean)/(standarddeviation)。70.在ODPS表T中添加一個新的列col,類型為bigint,最簡單易行的辦法是?A、將表T刪掉重建B、altertabletaddcolumns(cbigint)C、新建一張表,將原有數據插入Daltertableaddcbigint【正確答案】:B解析:
增加字段最簡單的方式是適用alter修改,D選項語法不對71.RDS采用的主備M-M的高可用架構,其主備之間的數據同步依靠日志的方式實現,MySQL數據庫和SQLServer分別使用的日志是什么?A、均為事務日志B、MySQL數據庫為事務日志,SQLServer為BINLOG日志C、MySQL數據庫為BINLOG日志,SQLServer為事務日志D、均為BINLOG日志【正確答案】:C解析:
此題為常識題,Mysql數據庫為BINLOG日志,SQLServer為事務日志。72.某圖書管理系統使用ODPS進行離線數據分析,現在他們要將同一類目的書籍的名稱拼成一個字符串,即將屬于同一分組的字符串合并在一列展示,以下哪個內置函數可以實現這一功能?A、wm_concatB、split_partC、concatD、regexp_instr【正確答案】:A解析:
wm_concat聚合函數,用途:用指定的separator做分隔符,鏈接str中的值。其輸入與輸出是多對一的關系,即將多條輸入記錄聚合成一條輸出值??梢耘cSQL中的groupby語句聯用。split_part:split_part()切割函數對按分隔符去取某個特定位置上的值concat用途:返回值是將參數中的所有字符串連接在一起的結果。regexp_instr:返回字符串source從start_position開始,和pattern第n次(nth_occurrence)匹配的子串的起始/結束位置。任一輸入參數為NULL時返回NULL。73.DRDS的服務可用性不低于百分之多少?A、95B、99.95C、99.99D、99【正確答案】:B解析:
無74.OTS中某秒內發生了10次讀操作,其中5次每次操作讀出當行數據大小為2.78KB,另外5次操作讀出當行數據大小為5.36KB,則共消耗多少()A、11CUB、20CUC、10CUD、15CU【正確答案】:D解析:
一、計算過程:
5次讀操作:2.78k<4k,即使用5CU
5次寫操作:5.36k>4K,即1<5.36/4<2,向上取整2*5=10CU
總共消耗:5+10=15CU
二、讀/寫吞吐量的單位為讀服務能力單元和寫服務能力單元,簡稱CU(CapacityUnit),是數據讀寫操作的最小計費單位。
CU消耗說明
1、PutRow操作消耗的讀CU和寫CU說明如下:
消耗的寫CU為修改的行主鍵數據大小與屬性列數據大小之和除以4KB向上取整。
如果指定條件檢查不為IGNORE,則消耗行主鍵數據大小除以4KB向上取整的讀CU。
如果操作不滿足指定的行存在性檢查條件,則操作失敗并消耗1單位寫CU和1單位讀CU。
2、UpdateRow操作消耗的讀CU和寫CU說明如下:
消耗的寫CU為修改的行主鍵數據大小與屬性列數據大小之和除以4KB向上取整。操作中包含的需要刪除的屬性列,只有屬性列的列名計入屬性列數據大小。
如果指定條件檢查不為IGNORE,則消耗行主鍵數據大小除以4KB向上取整的讀CU。
如果操作不滿足指定的行存在性檢查條件,則操作失敗并消耗1單位寫CU和1單位讀CU。
3、DeleteRow操作消耗的讀CU和寫CU說明如下:
消耗的寫CU為刪除的行主鍵數據大小除以4KB向上取整。
如果指定條件檢查不為IGNORE,則消耗行主鍵數據大小除以4KB向上取整的讀CU。
如果操作不滿足指定的行存在性檢查條件,則操作失敗并消耗1單位寫CU。
/document_detail/27284.html
/document_detail/54519.html75.大數據計算服務MaxCompute中,用戶登錄表user_login的建表語句如下createtableuser_login(user_idstring,logindatedatetime,loginipstring);表中包含了近3個月的用戶登錄信息,為了統計每天的用戶登錄次數,可以用()實現。A、Selectdatetrunc(login_date,’dd’),count(*)fromuser_logingroupbydatetrunc(login_date,’dd’)B、selectdatetrunc(login_date,hh"),count(*)fromuser_logingroupbydatetrunclogin_date,’hh’);C、Selectdatetrunc(login_date,’mm’),count(*)fromuser_logingroupbydatetrunc(login_date,’mm’);D、Selectdatetrunc(login_date,’yyyy’),count(*)fromuser_logingroupbydatetrunc(login_date,’yyyy’)【正確答案】:A解析:
內置函數考察76.MaxCompute體系架構中,負責計算的是(),由邏輯層的Executor負責向該master提交SQL/MR任務。A、SchedulerB、SparkC、FlinkD、Fuxi【正確答案】:A解析:
Scheduler負責instance的調度:包括將instance分解為task、對等待提交的task進行排序、以及向計算集群的Fuximaster詢問資源占用情況以進行流控(Fuxislot滿的時候,停止響應Executor的task申請)。/apsara/enterprise/v_3_13_0_20201215/odps/enterprise-product-introduction/product-architecture.html77.大數據計算服務中,通常情況下,prj1項目空間的成員若要訪問prj2項目空間的數據,則需要prj2項目空間管理員執行繁瑣的授權操作:首先需要將prj1項目空間中的用戶添加到prj2項目空間中,再分別對這些新加入的用戶進行普通授權。實際上prj2項目空間管理員并不期望對prj1項目空間中的每個用戶都進行授權管理,而期望有另一種更高效的機制能使得prj1項目空間管理員能對許可的對象進行自主授權控制。以下哪種授權方式可以幫助prj2項目空間管理員實現他的預期目標?A、LabelSecurityB、RoleC、PackageD、ProjectProtection【正確答案】:C解析:
通過打包的方式把授權給另外一個項目,然后有另外一個項目的管理員再分配權限,這樣更高效,更利于團隊的合作。A、LabelSecurity支持列級別的權限授權;B、Role是角色,使用戶的集合;D、項目空間數據安全,開啟后禁止數據流出。78.從優化角度來看,大數據計算服務的MapReduce對于哪個節點處理哪個分片這個問題,采用了_______策略。A、本地性原理,即數據在哪臺機器上,就在哪臺機器上啟動mapB、能者多勞原理,將數據移動到計算能力最強的節點上,啟動map.C、基于歷史處理信息的優化原理,即將數據移到從歷史執行信息看處理效果最好的機器上D、負載均衡原理,即將數據放在當前負載最小的節點上啟動map【正確答案】:A解析:
map拉取數據遵從數據本地化原則79.數據工場DataWorks(原DataIDE)中,大數據計算服務(MaxCompute,原ODPS)的表可以通過數據管理模塊的可視化建表功能創建,也可以通過開發面板或者調度執行建表語句創建。兩種建表方式中,數據管理模塊的可視化建表特有的功能點是________。A、可以設置表生命周期B、可以設置表類目C、可以設置表字段描述D、可以設置表描述【正確答案】:B解析:
除了設置表類目,其他都可以通過執行語句創建80.OTS中以什么方式來存儲數據?A、二維表B、鍵值對C、對象D、聚簇列【正確答案】:B解析:
表格存儲支持將主鍵列設置為自增列,每張表只能設置一個主鍵列為自增列,且分區鍵不能設置為自增列。主鍵列設置為自增列后,在寫入一行數據時,該主鍵列無需填值,表格存儲會自動生成該主鍵列的值。自動生成的主鍵列的值在分區鍵內嚴格遞增且唯一。綜上所述,OTS是類似于HBase存儲方式以鍵值對的方式存儲數據。81.ABC電商公司非常關心用戶從瀏覽到下單到支付的轉化率,他們想分析不同性別的人在該流程中的轉化率的差異,可以通過很好的實現該需求。A、漏斗圖B、餅圖C、對比漏斗D、樹圖【正確答案】:C解析:
正確答案C。A、漏斗圖適用于分析具有規范性、周期長、和環節多的業務流程。通過漏斗各環節業務數據的比較,能夠直觀地發現和說明問題所在。漏斗圖還可以用來展示各步驟的轉化率,適用于業務流程多的流程分析,例如通過漏斗圖可以清楚地展示用戶從進入網站到實現購買的最終轉化率。漏斗圖是由漏斗層標簽和漏斗層寬決定的,漏斗層標簽由數據的維度決定,如區域;漏斗層寬度由數據的度量決定,如訂單金額。B、餅圖顯?的是?個數據系列,每個數據系列具有?個顏?或圖案(當餅圖的扇區數量超過12個時,會出現顏?重復)。餅圖可?來展?數據中各項的?小與各項總和的?例,例如展?五險??在個人收入中的比例等。C、旋風漏斗圖可被看做是旋風圖和漏斗圖的結合體,本題更適合使用旋風漏斗圖;D、樹圖是通過樹形結構來展現層級數據的組織關系,以??層次結構來組織對象,是枚舉法的?種表達?式,例如查看某個省份下各地級市的收?狀況,那么省份與地級市之間的關系就可以看做是??層次結構。樹圖適?于與組織結構有關的分析,如公司的?員組織結構,或者醫院的科室組織結構。82.哪個字符集是目前RDSforMySQL不支持的()A、gbkB、big5C、latin1D、utf8【正確答案】:B解析:
支持utf8、gbk、latin1或utf8mb483.下列關于ADS用戶的說法,哪些是正確的?A、對用戶的授權支持ACL和policy兩種B、在授權給一個用戶之前,需要使用adduseron.*將用戶添加到ADS庫dbname中來C、數據庫擁有者可以刪除用戶,意味著被刪除用戶無法再使用ADS的任何服務D、用戶是被授權的數據庫用戶,由數據庫擁有者授權時添加,無須開通ADS服務【正確答案】:D解析:
支持ACL,不支持policy授權進行授權SQL語法GRANTprivilege_type[(column_list)][,privilege_type[(column_list)]...ON[object_type]privilege_levelTOuser[,user]...不可以刪除用戶,可以回收用戶84.某業務部門計劃使用ApacheFlink來實現QPS比較少且非核心業務的流式計算能力,下面哪種部署方式可以保證業務的高可用性?A、部署1個JobManager節點和1個TaskManger節點B、部署1個JobManager節點和若干TaskManger節點C、部署若干JobManager節點和1個TaskManger節點D、部署若干JobManager節點和若干TaskManger節點【正確答案】:D解析:
部署若干JobManager節點和若干TaskManager節點可以保證業務的高可用性。因為在這種部署方式下,如果某個節點出現故障,其他節點可以接管其任務,保證業務的持續運行。而其他部署方式可能會因為單點故障而導致業務中斷。85.查詢數據需要select權限。目前ADS中對select權限的管理的最小級別是?A、表組B、表C、列D、數據庫【正確答案】:C解析:
查詢數據的權限:查詢表數據需要SELECT權限,最小級別是列并非所有查詢都需要該權限,例如SELECTnow()導出數據的權限:導出數據同時需要DUMPDATA和SELECT權限同時需要數據導出目的地的數據寫入相關權限86.OTS是構建在阿里飛天系統之上的產品,它提供的是什么服務?A、在線高并發事務服務B、海量數據的非結構化讀寫服務C、在線NoSQL數據庫服務D、在線關系型數據庫服務【正確答案】:C解析:
無87.ODPS中提供了別名命令ALIAS,可以為哪些對象設置別名()A、資源B、列C、行D、表【正確答案】:A解析:
用途:為資源創建別名。88.使用ODPSSQL:createtablet1liket2:建表時,表t1不會具有表t2的哪種屬性()A、分區B、生命周期C、二級分區D、字段的注釋【正確答案】:B解析:
lifecycle指明此表的生命周期,createtablelike語句不會復制源表的生命周期屬性。除生命周期屬性外,列名、列注釋以及表注釋等均相同。備注:Createas同樣不會具有表t2的生命周期。但會獲取t2表的數據。89.ADS的普通表最多包含多少個列?A、2048個B、1024個C、4096個D、512個【正確答案】:B解析:
(1)一張事實表至少有一級Hash分區并且分區數不能小于8個;(2)一個事實表組最多可以創建256個事實表;(3)一個事實表最多不能超過1024個列。90.數據工場DataWorks(原DatalDE)中,SQL任務task1是按小時調度的周期性調度任務,任務配置為每1小時執行次,結果會插入到表table1中去,table1為一個有兩個分區鍵(ds和hh)的分區表,其中ds取前一個小時的年月日(格式為yyyymmdd),hh取前一-小時的小時(格式為hh24),要使用調度系統提供的時間參數定義分區,使得task1每次調度運行時自動替換時間值,task1應該如何配置?A、task1代碼里table1的分區ds=${cdate},hh=$(h),.任務參數配置:hh=$[hh24]B、task1代碼里table1的分區ds=${date},h=${h).任務參數配置:hh=$[hh24-1/24]C、task1代碼里table1的分區ds=${daytime},hh={h).任務參數配置:daytime=[yyyymmd-1/24]hh=$hh24-1/24]D、task1代碼里table1的分區ds=${daytime},hh=${h),任務參數配置:daytime=[yyyymmdd]hh=$[hh24-1/24]【正確答案】:D解析:
正確答案D。
符合yyyymmdd和hh24格式的,而且小時數需要減1的,只有一個選項“task1代碼里table1的分區ds=${daytime},hh=${h),任務參數配置:daytime=[yyyymmdd]hh=$[hh24-1/24]”A、ds=${date}指業務日期,每小時執行的任務應取當前日期即cyctime或自定義參數;
hh=$[hh24],無法滿足跨天執行,hour的計算公式仍然是$[hh24-1/24]。B、同A,ds=${date}指業務日期,及前一天C、任務參數配置:daytime=[yyyymmd-1/24],無中生有不合理D、ds=${daytime},自定義參數,通過自定義類型daytime=[yyyymmdd],[]代表取當前日期,yyyymmdd是日期格式化,如果想取前一天可采用${yyyymmdd},{}代表取前一天,yyyymmdd是日期格式化
91.使用數據工場DataWorks(原DataIDE)進行數據開發時,往往需要經過數據抽取、加工和裝載的過程,即ETL過程,其中數據的抽取和裝載可以使用數據同步節點實現。關于數據同步說法錯誤的是()。A、支持毫秒級數據同步B、支持全量導入C、支持增量導入D、支持多表數據同步【正確答案】:A解析:
同步屬于離線同步,相應毫秒級一般無法達到,最細粒度5分鐘。92.DRDS和普通的關系型數據庫(如Mysql)相比,SQL優化要特別考慮的是()A、磁盤IO開銷B、內存開銷C、并發度D、網絡IO開銷【正確答案】:D解析:
DRDS是一個高效穩定的分布式關系數據庫系統。但是,由于其處理的是分布式的關系查詢,因而它對于SQL的查詢優化與傳統的單一數據庫(如Mysql,oracle)的查詢優化有所不同。后者在查詢優化時,主要考慮的就是磁盤IO的開銷,但前者在優化時還需要考慮另外一個更為重要的IO開銷-網絡。93.針對ODPSSQL做邏輯分析的時候,會進行一些優化,不包括以下哪種優化()A、掃描方式B、列映射C、謂語動詞下沉D、常量表達式【正確答案】:A解析:
odps自帶的優化引擎會對sql作業做一定的優化處理,如列裁剪、分區裁剪和謂詞下推、常量表達式94.在大數據開發治理平臺Dataworks數據同步任務(云數據庫RDS數據同步至MaxCompute)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025廣州市購銷合同范本(定版)
- 幼兒早期學習支持知到課后答案智慧樹章節測試答案2025年春山東省文登師范學校
- 2025合同法的新發展與實踐應用
- 2025年家庭裝修工程合同范本
- 2025年設備的租賃合同范本
- 2024年鄭州市保安服務集團有限公司招聘真題
- 總復習 數的運算第4課時 教案2024-2025學年數學六年級下冊-北師大版
- 2024年邵陽市民政局所屬事業單位招聘工作人員真題
- 2024年衢州市衢江區綜合事業單位招聘真題
- 2024年樂山市五通橋區人民醫院中醫醫院招聘真題
- 一封雞毛信的故事課件
- 病歷書寫規范
- 基于自監督學習的圖像增強方法
- 民生銀行社招在線測評題
- 團購房實施方案
- 湘少版六年級小升初英語綜合練習測試卷-(含答案)
- 高中生物選擇性必修一2.3神經沖動的產生和傳導
- 施耐德電氣EcoStruxure:智能電網技術教程.Tex.header
- 5維11步引導式學習地圖-人才研修院
- 配電線路工(中級)技能鑒定理論考試題庫(濃縮400題)
- 2024年重慶市中考英語試卷真題B卷(含標準答案及解析)+聽力音頻
評論
0/150
提交評論