




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1決策支持系統
主講:彭柳芬公共郵箱:tpenglf@163.com
密碼:peng123第六章數據倉庫、聯機分析處理和數據挖掘傳統數據庫應用的局限性數據倉庫聯機分析處理數據挖掘Weka數據挖掘軟件傳統數據庫應用的局限性企業在其業務活動中,積累了大量的關于客戶、產品、銷售、庫存、供應商等方面的數據,也可以收集到來自于企業所處行業和競爭對手以及外部環境中的數據,為了支持企業或組織管理人員的決策分析,必須把日益龐大的數據轉化為知識,這就需要對數據進行聯機分析處理OLAP(OnlineAnalyticalProcessing)。傳統的數據庫應用主要是針對數據的聯機事務處理OLTP(OnlineTransactionProcessing),包括定期的數據查詢、插入、刪除和更新操作,以及基本的統計分析如使用交叉表、圖表或圖形進行報表的展示。要在一個系統中同時滿足OLTP和OLAP這兩種需求是有問題的。一、決策支持系統決策支持系統(DSS)中“決策”就是決策者根據所掌握的信息為決策對象選擇行為的思維過程。為決策者提供支持的信息成為決策支持信息,相應的信息系統稱為決策支持系統,我們將決策支持領域分成OLTP、MIS、LDSS及HDSS四個層次:OLTPMISLDSSHDSSDWOLAPDM1、
OLTP(聯機事物處理)最基本的數據庫應用系統,是更高級的MIS系統和DSS系統的基礎,OLTP系統一般具有底層信息采集(數據錄入功能)、一定的信息查詢以及信息庫更新維護功能,OLTP面向的是操作人員和低層管理人員其主要功能在于對數據庫中的信息進行錄入、存儲、更新、刪除等操作,是最基本的管理細節信息的數據庫應用系統。6OLAP定義1.OLAP理事會給出的定義聯機分析處理(OLAP)是一種軟件技術,它使分析人員能夠迅速、一致、交互地從各個方面(多維)觀察信息,以達到深入理解數據的目的。這些信息是從原始數據轉換過來的,按照用戶的理解,它反映了企業真實的方方面面。7OLAP的簡單定義
聯機分析處理是共享多維信息的快速分析。它體現了四個特征:(1)快速性:用戶對OLAP的快速反應能力有很高的要求。(2)可分析性:OLAP系統應能處理任何邏輯分析和統計分析。(3)多維性:系統必須提供對數據分析的多維視圖和分析。(4)信息性:OLAP系統應能及時獲得信息,并且管理大容量的信息。
8OLAP的數據模型
MOLAP數據模型——MOLAP是基于多維數據庫存儲方式建立的OLAP;表現為“超立方”結構,采用類似于多維數組的結構。ROLAP數據模型——ROLAP是基于關系數據庫的OLAP。它是一個平面結構,用關系數據庫表示多維數據時,采用星型模型。MOLAP與ROLAP的比較HOLAP數據模型——即混和OLAP介于MOLAP和ROLAP之間。在HOLAP中,對最常用的維度和維層次,使用多維數據表來存儲,對于用戶不常用的維度和數據,采用ROLAP星型結構來存儲。9MDDB(二維)數據組織北京上海廣州衣服600700500鞋800900700帽子1002008010產品名地區銷售量衣服北京600衣服上海700衣服廣州500鞋北京800鞋上海900鞋廣州700帽子北京100帽子上海200帽子廣州80關系數據庫RDBMS數據組織2、基于OLTP的MIS系統這是較高一級的數據庫應用系統,這類系統在OUP的基礎上進一步擴展,包括提高信息訪問功能,報表生成能力等。MIS系統由若干個功能相對獨立的OLTP系統集成而成,當前的信息服務系統基本屬于MIS系統。3、LDSS(低級決策支持系統)
LDSS處于比MIS更高一層的位置,直接為決策者提供決策支持服務,它的關鍵在于信息的有效提取并加以分析而不在于信息的收集與更新(這些操作由基礎層的OLTP系統完成)。目前決策支持系統絕大部分屬于LDSS的層次,它存在著如下功能局限:(1)隨機性的綜合信息提取功能較弱;(2)對查詢得到的信息的分析功能較弱;(3)不是基于海量數據庫。4、HDSS〔高級決策支持系統)
HDSS是決策支持系統的最高形式,能夠真正使用戶利用DSS工具直接從企業信息池中隨機地提取、分析數據,有效地服務于企業的全方位決策。它由三個主要部件構成:數據倉庫技術(DW,DataWarehousing)聯機分析處理技術(OLAP,On-lineAnalyticalProcessing)數據挖掘技術(DM,DataMining)二數據挖掘數據挖掘是從大型數據庫或數據倉庫中發現并提取隱藏在其中的信息或知識的過程,目的是幫助分析人員尋找數據間潛在的關聯,發現忽略的要素,而這些信息對預測趨勢和決策行為是十分有用的,所以它屬于決策支持系統的范疇。
1預處理數據通過消除噪聲、推導計算缺值數據、消除重復記錄、完成數據類型轉換(如把連續值數據轉換為離散型的數據,或是把離散型的數據轉換為連續值數據)等來收集和凈化來自數據源的信息,并加以存儲,一般是將其存放在數據倉庫中。
2模型搜索利用數據挖掘工具在數據中查找模型,這個搜尋過程可以由系統自動執行,自底向上搜尋原始事實以發現它們之間的某種聯系,也可以加入用戶交互過程,由分析人員主動發問,從上到下地找尋以驗證假定的正確性,對于一個問題的搜尋過程可能用到許多工具,例如神經網絡、基于規則的系統、基于實例的推理、機器學習、統計方法等。3評價輸出結果數據挖掘階段發現出來的模式,經過用戶或機器的評估,可能存在冗余、價值不大的或無關的模式,這時需要將其剔除,把重要的模式形成知識存儲到知識庫中,也有可能模式未能滿足用戶要求,這時則需要整個發現過程回到發現階段之前,如重新選取數據、采用新的數據變換方法、設定新的數據挖掘參數值,甚至換一種挖掘算法。可見數據發掘的搜尋過程一般需要反復多次,因為當分析人員評價輸出結果后,他們可能會形成一些新的問題或要求對某一方面作更精細的查詢。
4生成最后的結果報告
DM由于最終是面向人類用戶的,因此可能要對發現的模式進行可視化,或者把結果轉換為用戶易懂的另一種表示。
5解釋結果報告對結果進行解釋,依據此結果采取相應的商業措施,這是一個人工過程。數據挖掘的相關技術:為了簡化和加快數據挖掘過程,使數據挖掘真正方便、實用,還需其他的技術支持,如數據凈化、數據倉庫技術、強大的平行處理技術和存儲技術。三、數據挖掘與決策支持系統的聯系傳統的DSS系統通常是在某個假設的前提下通過數據查詢和分析來驗證或否定這個假設,而數據挖掘技術則能夠自動分析數據,進行歸納整理,從中發現潛在的模式,或產生聯想,建立新的業務模型,幫助決策者調整市場策略,并找出正確的決策。例如在銷售業數據庫中,數據挖掘工具回答“哪些客戶最可能對促銷作出反應,為什么他會這樣?”、“哪些商品之間具有潛在的聯系?”、“下一個月,在天津的銷售部門的情況將會如何?為什么?”等。而DSS系統回答“今年銷售總量比去年多多少?從而預測明年銷售總量”、“三月份中,在天津的銷售部門的情況如何?從而推測在北京的銷售部門情況”,所以,數據挖掘的出現使決策支持工具跨人了一個新階段。數據挖掘技術能夠幫助用戶從歷史性數據中挖掘知識,進而支持決策,極大地吸引用戶,而用戶造就的數十億美元的市場又極大地吸引了數據庫廠商,各大公司紛紛開始了自己的數據挖掘工具產品的研制工作。四、數據倉庫數據倉庫的用戶: 1數據倉庫的信息使用者 2數據倉庫的探索者——探索者要做的工作有:概括分析、抽取、建模和分類。數據倉庫的用戶有兩類:信息使用者和探索者信息使用者是使用數據倉庫的大量用戶。
信息使用者以一種可預測的、重發性的方式使用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 質量管理制度
- 校史館設計建設方案說明
- 市政工程中路燈工程的施工方案
- 企業訴訟案件管理辦法
- 環衛車輛車輛安全管理制度
- 粉塵爆炸應急預案
- 商品房預售合同范本
- 露天停車場管理方案
- 彩鉛藝術教學設計
- 中職《中餐烹飪與營養膳食》專業人才培養方案
- 2024版家庭資產配置與財富傳承規劃合同3篇
- 2025屆高考地理 二輪復習課件-專題35 生態脆弱區的綜合治理
- 幼兒園體育游戲對幼兒社交能力的影響
- 《STP營銷戰略概述》課件
- 英語語法點點通(新疆交通職業技術學院)知到智慧樹答案
- 2024年四川省綿陽市中考語文試卷(附真題答案)
- 女性的中醫養生保健
- 【論正當防衛的限度(論文)8400字】
- 《跨境直播運營》課件-跨境直播的內容組織
- 參加社會保險人員登記表
- (正式版)SH∕T 3541-2024 石油化工泵組施工及驗收規范
評論
0/150
提交評論