數據倉庫的數據存儲與處理.ppt_第1頁
數據倉庫的數據存儲與處理.ppt_第2頁
數據倉庫的數據存儲與處理.ppt_第3頁
數據倉庫的數據存儲與處理.ppt_第4頁
數據倉庫的數據存儲與處理.ppt_第5頁
已閱讀5頁,還剩7頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2019/11/5,數據倉庫與數據挖掘,1,第2章 數據倉庫的數據存儲與處理,謝紅俠,2019/11/5,數據倉庫與數據挖掘,2,2.1 數據倉庫的三層數據結構,2019/11/5,數據倉庫與數據挖掘,3,2.2 數據倉庫的數據特征,狀態數據與事件數據 當前數據與周期數據 數據倉庫中的元數據,2019/11/5,數據倉庫與數據挖掘,4,2.3 數據倉庫的數據ETL過程,ETL概念 ETL過程前后數據的特征 數據的ETL過程描述 抽取(Capture/Extract) 清洗(Scrub/Cleanse) 轉換(Transform) 加載和索引(Load/Index),2019/11/5,數據倉庫與數據挖掘,5,ETL的概念,數據ETL是用來實現異構數據源的數據集成,即完成數據的抓取/抽取(Capture/Extract)、清洗(Scrub or data cleansing)、轉換(Transform)、裝載與索引(Load and Index)等數據調和工作,2019/11/5,數據倉庫與數據挖掘,6,數據的ETL過程描述,2019/11/5,數據倉庫與數據挖掘,7,數據ETL過程的實施要點,ETL過程是一個數據流動的過程,中間的“T”(轉換)是關鍵 ; ETL工具的選擇非常重要,運用合適的工具會事半功倍 ; 如何保證數據質量?數據質量在一定程度上決定了數據倉庫的價值 。,2019/11/5,數據倉庫與數據挖掘,8,2.4 多維數據模型和星模式,多維數據模型及其相關概念 多維數據模型的物理實現 多維建模技術簡介 一個星模式的例子,2019/11/5,數據倉庫與數據挖掘,9,多維數據模型及其相關概念,有關多維數據模型的幾個概念:維、維類別、維屬性、度量、粒度及分割等 關于數據綜合級別與粒度的確定:一般把數據分成四個級別:早期細節級、當前細節級、輕度綜合級、高度綜合級,2019/11/5,數據倉庫與數據挖掘,10,多維數據模型的物理實現,多維數據庫(MDDB),其數據是存儲在大量的多維數組中,而不是關系表中 ,與之相對應的是多維聯機分析處理(MOLAP) 關系數據庫是存儲OLAP數據的另一種主要方式。與之對應的是關系聯機分析處理(ROLAP),2019/11/5,數據倉庫與數據挖掘,11,多維建模技術簡介,兩種主流建模技術 :由Inmon提出的企業級數據倉庫模型和由Kimball提出的多維模型 ; 基于關系數據庫的多維數據建模,如星型,雪花和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論