




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
簡答題(第一章)數據庫與數據倉庫的不同:數據庫用于事物處理,數據倉庫用于決策分析;數據庫保持事物處理的當前狀態,數據倉庫既保存過去的數據也保存當前的數據;數據倉庫的數據是大量數據庫的集成;對數據庫的操作比較明確,操作數量少。(第三章)廣義OLAP功能如何提高多維數據分析能力:絕對模型(靜態數據分析,通過比較歷史數據值或行為來描述過去發生的事實)該模型查詢比較簡單,綜合路徑是預先定義好的,用戶交互少;解釋模型(屬于靜態數據分析,分析人員利用系統已有的多層次的綜合路徑層層細化(進行向下鉆取操作),找出事實發生的原因);思考模型(屬于動態數據分析,旨在說明在一維或多維上引入一組具體變量或參數后將會發生什么。)分析人員在引入確定的變量或公式關系時,須創建大量的綜合路徑;公式模型(它的動態分析能力更強,該模型表示在多個維上,需要引入那些變量或參數,以及引入后所產生的后果。)(第四章)概念模型的特點:能真實反映現實世界,能滿足用戶對數據的分析,達到決策支持的要求,它是現實世界的一個真實模型;易于理解,有利于和用戶交換意見,在用戶的參與下,能有效地完成數據倉庫的成功設計;易于更改,當用戶要求發生變化時,容易對概念模型進行修改和擴充;易于向數據倉庫的數據模型轉換。(第五章)數據倉庫增長的原因:數據倉庫收集歷史數據;數據倉庫包含滿足未知需求的數據收集;數據倉庫不僅有詳細數據,還有占數據存儲比例很大的匯總數據;數據倉庫包括外部數據,用來支持多種可預測的數據挖掘任務其他題型:(第一章)數據倉庫的定義與特點(選擇或判斷)數據倉庫是面向主題的、集成的、穩定的、不同時間的數據集合,用于支持經營管理中決策制定過程。特點:是面向主題的,集成的,穩定的,是隨時間變化的,數據倉庫的數據量很大,數據倉庫軟硬件要求較高(需要一個巨大的硬件平臺,需要一個并行的數據庫系統)。OLAP與OLTP的區別:OLAP專門用于支持復雜的分析操作,側重對分析員和高層管理人員的決策支持,(基本思想是從決策者的多方面多角度以多維的形式還觀察企業的狀態和了解企業的變化)OLTP(是事務處理從單機到網絡環境的發展新階段。主要應用于銀行,航空,郵件訂單,超級市場和制造業的輸入數據和取回交易數據。)在于事務處理量大,應用要求多個并行處理,事務處理內容比較簡單且重復率高。(第二章)數據倉庫結構的了解(圖):數據倉庫是在原有關系型數據庫基礎上發展形成的但由于不同于數據庫系統的組織形式,它從原有的大量業務數據中獲得的數據,經過轉換后形成當前基本數據層,它經綜合后形成輕度綜合數據層,輕度綜合數據在經過綜合形成高度綜合數據層,數據倉庫結構包括前基本數據,歷史基本數據,輕度綜合數據,高度綜合數據和元數據當前基本數據是最近時期的業務數據,是數據倉庫用戶最感興趣的部分,數據量大。當前基本數據隨著時間的推移,由數據倉庫的時間控制機制轉為歷史基本數據,一般被轉存于介質中,如磁盤。輕度綜合數據是從當前基本數據中提取出來的,設計這層數據結構時會遇到綜合處理數據的時間段選取,綜合數據包含哪些數據屬性和內容等問題。最高一層是綜合數據層,該層數據十分精煉,是一種準決策數據。粒度(選擇或判斷):(粒子度與綜合)指數據倉庫的數據單元中保存數據的細化活綜合程度的級別,細化程度越詳細,粒度級就越低。粒度大綜合級別高,粒度小詳細級別高。在低粒度級上,紀錄詳細。高粒度級只需要少得多的字節存放數據,且只需要較少的索引項。數據存儲效率高。當提高數據力度時,數據所能回答查詢的能力降低。且小粒度的數據可以回答任何問題,但高粒度數據回答的問題具有宏觀性。當提高數據粒度級時,數據所能回答查詢的能力就會隨之降低。換句話說,在一個很低的粒度級上,實際可以回答任何問題,但在高粒度級上,數據所能處理的問題的數量是有限的。元數據(選擇判斷,綜合分析):在數據倉庫建設過程中產生的有關數據源定義、目標定義、轉換規則等關鍵數據,是定義數據倉庫對象的數據。包含的信息有:數據倉庫的目錄信息、數據從業務環境向數據倉庫環境轉換時的目錄內容、指導從當前基本數據到輕度綜合數據的算法選擇、輕度綜合數據到高度綜合數據的綜合算法的選擇。(第三章)OLAP基本概念:變量:變量是數據的實際意義,即描述數據“是什么”。例如:銷售量、銷售額,……而具體數據(如“10000”)是變量的一個值維:維是人們觀察數據的特定角度。如產品維、顧客維、時間維,地理位維等。維的層次:數據的細節不同程度為維的層次。特定角度的不同細節程度,通常稱這描述的多個方面叫維的層次,一個微往往具有很多個層次,例如,描述時間維時,日期,季度,年,就是時間維的層次。城市,地區國家就地理維的層次。維成員:維的一個取值(稱為該維的一個成員)或不同維層次的取值的集合(對多層次情況)?例如:時間維:三個層次,日、月、年維成員:1999年5月20日?可以在某些層次上不取值,如1999年5月;5月20日;1999年?維成員是數據在該維上的位置描述例如:1999年5月20日銷售額表示銷售額數據在時間維上的位置(相當于時間軸上的某一點或某一區間)多維數組:一個多維數組可以表示為:(維1,維2,……,維n,變量)一個4維的結構,即(產品,地區,時間,銷售渠道,銷售額)。數據單元(單元格):多維數組的取值。如:4維數據單元(牙膏,上海,1998年12月,批發,銷售額為100000)多維數據分析的基本操作(判斷選擇)OLAP的目的是為決策管理人員通過一種靈活的多維數據分析手段,提供輔助決策信息。基本的多維數據分析操作包括切片、切塊、旋轉、鉆取等。(1)切片(slice)選定多維數組的一個二維子集的操作叫切片,即選定多維數組(維1,維2,…,維n,變量)中的兩個維,設為維i和維j,在這兩個維上取某一區間或任意維成員,而將其余的維都取定一個維成員,得到的就是多維數據在維i和維j上的一個二維子集,稱為多維數據在維i和維j上的一個切片,表示為(維i,維j,變量)。切片就是在某兩個維上取一定區間的維成員或全部成員,而在其余的維上選定一個維成員的操作。(2)切塊切塊有兩種情況:?在多維數組的某一個維上選定某一區間的維成員的操作。切塊可以看成是在切片的基礎上,確定某一個維成員的區間得到的片段,也即由多個切片疊合起來。?選定多維數組的一個三維子集的操作。在多維數組(維1,維2,……,維n,變量)中,選定3個維,維i、維j、維k,在這3個維上分別取一個區間或任意維成員,而其它維都取定一個維成員。(下面2圖了解)(3)鉆取(drill)鉆取有向下鉆取(drilldown)和向上鉆取(drillup)操作。向下鉆取是使用戶在多層數據中能通過導航信息而獲得更多的細節性數據。向上鉆取獲取概括性的數據。(下面圖了解)(4)旋轉(pivot)通過旋轉可以得到不同視角的數據。旋轉操作相當于平面數據將坐標軸旋轉。例如,旋轉可能包含了交換行和列,或是把某一個行維移到列維中去;或是把頁面顯示中的一個維和頁面外的維進行交換(令其成為新的行或列中的一個)改變一個頁面顯示的維方向的操作稱為旋轉(或轉軸)。索引數據分析模型分為四類:絕對模型(categoricalmodel)屬于靜態數據分析,通過比較歷史數據值或行為來描述過去發生的事實。解釋模型(exegeticalmodel)屬于靜態數據分析,利用系統已有的多層次的綜合路徑層層細化,找出事實發生的原因。思考模型(contemplativemodel)屬于動態數據分析,說明在一維或多維上引入一組具體變量或參數后將會發生什么。公式模型(formulaicmodel)公式模型的動態數據分析能力很高,它表示在多個維上,需要引入哪些變量或參數,以及引入后所產生的結果。休眠數據:休眠數據是那些存在于數據倉庫中當前不使用,將來也很少使用或不使用的數據。隨著時間的推移,數據傾向于兩種狀態之一,頻繁被使用的活動數據(每個月2~3次)和很少被使用的休眠數據(每年不到0.5次)(第六章)知識發現(KDD)是從數據中發現有用知識的整個過程。它是從大量數據中提取出可信的、新穎的、有用的并能被人理解的模式的高級處理過程。KDD過程可以分為三部分:數據準備,數據挖掘,結果的解釋和評價。知識發現過程:數據挖掘的對象有:關系數據庫、文本、圖像與視頻數據、Web數據等。(第九章)神經元的幾何意義:神經元起
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 食品營養學知識重點及試題集
- 其他股東出資合同樣本
- 公司招員工合同樣本
- Module 3 Unit 7 Open day Period 3(教學設計)-2023-2024學年滬教牛津版(深圳用)英語五年級下冊
- 2024年秋九年級歷史上冊 第四單元 古代日本和阿拉伯帝國 第10課 日本大化改新教學設計 川教版
- 2024-2025年高中化學 第3章 第4節 課時2 溴與海水提溴教學設計 魯科版必修1
- 公寓設計合同樣本
- 一年級語文上冊 第4單元 課文(一)1《秋天》同步教學設計 新人教版
- 2024年系統架構設計師知識點探討試題及答案
- 2024年管理師考試試題準確解析
- 涉密和非涉密計算機保密管理制度
- DB32T 5061.1-2025中小學生健康管理技術規范 第1部分:心理健康
- 糖尿病酮癥酸中毒患者的護理查房
- 網絡周期竊取演變-洞察分析
- 《excel學習講義》課件
- 醫療質量與安全管理和持續改進評價考核標準
- 2025年湖南常德煙機公司招聘筆試參考題庫含答案解析
- 2025年中國聯通招聘筆試參考題庫含答案解析
- 2025年日歷(日程安排-可直接打印)
- 大學生職業規劃大賽《土木工程專業》生涯發展展示
- 智慧派出所綜合治理大數據平臺建設方案
評論
0/150
提交評論