




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數據信息知識決策行動利潤MISBIDSS&專家系統 決策支持系統、商務智能以及專家系統在組織信息管理過程中發揮的作用BI&DSSMIS(ERP、CRM、SCM)EDPSDSS與BI在組織IS中的地位第一節 決策支持 1 第二節 商務智能2第五章 決策支持和商務智能第一節 決策支持決策1 決策支持系統2 群體決策支持系統3專家系統4決策及相關知識5.1.1管理的重點在于經營,經營的中心在于決策.決策貫穿管理活動的始終,管理的過程主要是決策及其實施的過程 .決策是企業最重要、意義最重大的活動之一.由于決策問題的范圍和規模越來越大,越來越復雜,變化越來越快,迫切要求引進科學決策方法,以提高決策水平。
2、決策是為了實現特定的目標,根據客觀的可能性,在占有一定信息和經驗的基礎上,借助一定的工具、技巧和方法,對影響目標實現的諸因素進行分析、計算和判斷、選擇后,對未來行動做出的決定。決策是人們在政治、經濟、技術、工作和日常生活中普遍存在的一種行為。決策的概念 1決策的過程四個階段 2情報階段:發現問題設計階段:找出可行性方案選擇階段:找出適合的方案實施階段:方案實施返回情報階段返回設計階段返回選擇階段結構化決策有時也稱為程序化決策,結構化決策問題相對比較簡單、直接,其決策過程和決策方法有固定的規律可以遵循,能用明確的語言和模型加以描述,并可依據一定的通用模型和決策規則實現其決策過程的基本自動化。企業
3、的訂貨和物資供應等,通常可用運籌學、計算機仿真和管理信息系統等來解決。 計算工資選擇商品(簡單的價格比較)決策問題的類型3結構化決策案例:選擇一種新的打包機所進行的結構化決策 非結構化決策問題是指那些決策過程復雜,其決策過程和決策方法沒有固定的規律可以遵循,沒有固定的決策規則和通用模型可依,決策者的主觀行為(學識、經驗、直覺、判斷力、洞察力、個人偏好和決策風格等)對各階段的決策效果有相當的影響。是否引進一條新的生產線是否發動一場廣告宣傳戰是否改變公司的形象決策問題的類型3非結構化決策案例:為產品的發展方向做出的決策 半結構化決策問題介于上述兩者之間,其決策過程和決策方法有一定規律可以遵循,但又
4、不能完全確定,即有所了解但不全面,有所分析但不確切,有所估計但不確定。這樣的決策問題一般可適當建立模型,但無法確定最優方案。股票市場的投資分析選擇合適的工作決策問題的類型3半結構化決策決策支持系統的目標是幫助人們分析信息找出商務智能,進而發現知識. 術語“決策支持系統”是指可以輔助人們決策的任何計算機化的系統.決策支持系統5.1.2從狹義上講,決策支持系統是一種高度靈活且具有良好交互性的,主要用于對半結構化和非結構化問題的決策提供輔助支持的信息系統。決策支持系統將決策者具有的經驗、直覺、判斷能力等和信息技術本身特定的功能聯系在一起,使二者都能發揮各自的優勢。決策支持系統的含義1決策者與決策支持
5、系統的結合決策者的優勢DSS的優勢IT的優勢經驗直覺判斷知識提高生產率增進理解加快速度提高靈活性減少問題的復雜性降低成本速度信息處理能力DSS的主要功能就是通過加強決策者的洞察力來對決策者提供幫助,改善決策者的決策效果。決策者的知識技能與IT的強大功能相結合,使決策者能更迅速地響應市場的變化以及更高效地管理資源早期的管理信息系統主要為管理者提供預定的報告,而DSS則是在人和計算機交互的過程中幫助決策者探索可能的方案,為管理者提供決策所需的信息。管理信息系統和決策支持系統各自代表了信息系統發展過程中的某一階段,但至今它們仍在不斷地發展,而且是相互交叉的關系。管理信息系統是面向管理的信息系統,決策
6、支持系統則是面向決策的信息系統。決策支持系統在組織中可能是一個獨立的系統,也可能作為管理信息系統的一個高層子系統而存在。DSS不同于傳統的管理信息系統一家國有保險公司在給有酒后駕車(DUI)歷史的司機保險時,利用DSS分析公司遭受風險的金額。系統揭示出:以前有一次(DUI)歷史的40歲以上的已婚有房男性很少再次犯規,通過降低這些人的保險費率,公司在不增加遭受風險損失的情況下,提高了市場占有率。CRM是許多成功的公司戰略的重要組成部分,而DSS是CRM的重要組成部分。華爾街的零售業經濟公司利用決策支持系統分析客戶行為和目標,從而展現機遇并警示經紀人注意最新出現的問題。決策支持系統的應用舉例面向組
7、織中上層管理人員經常面臨的半結構化問題;把模型和分析技術與傳統的數據存儲技術及檢索技術結合起來;易于為非計算機專業人員以交互會話的方式使用;強調對環境及用戶決策方法改變的靈活性及適應性;支持但不是代替高層決策者制定決策。充分利用先進信息技術快速傳遞和處理信息。決策支持系統的特征3三角式結構是由數據庫、模型庫、方法庫等子系統與對話子系統成三角形分布的結構,也是DSS最基本的結構。用戶數據庫管理子系統方法庫管理子系統模型庫管理子系統數據庫方法庫模型庫圖5-1 DSS的四庫邏輯結構圖對話管理子系統決策支持系統的構成4三角式結構對話管理子系統是DSS中用戶和計算機的接口,起著在操作者、模型庫、數據庫和
8、方法庫之間傳遞、轉換命令和數據的重要作用,其核心是人機界面。數據庫管理子系統是存儲、管理、提供與維護用于決策支持的數據的DSS基本部件,是支撐模型庫子系統及方法庫子系統的基礎。數據庫管理子系統由數據庫、數據庫析取模塊、數據字典、數據庫管理系統及數據查詢模塊等部件組成。三角式結構模型庫子系統是構建和管理模型的計算機軟件系統,它是DSS中最復雜與最難實現的部分。方法庫子系統是存儲、管理、調用及維護DSS各部件要用到的通用算法、標準函數等方法的部件。三角式結構串聯結構的特點是對話子系統不直接與數據庫子系統聯系,而是通過模型庫子系統轉達操作請求。因此模型庫子系統必須設有用戶操作數據庫的轉接功能。融合式
9、系統結構數據庫子系統與模型庫子系統互不獨立,既可以說是模型庫子系統建立在數據庫子系統的基礎上,也可以說是數據庫子系統被嵌入模型庫子系統之中,模型庫中的模型運行時直接調用數據庫中的數據。其他結構群體決策的含義群體決策是指多人在一起討論問題,提出解決問題的若干方案,并通過對這些方案進行評價,選擇可用的方案,最后做出決策。一般來說,群體決策問題都是非結構化問題,很難直接用結構化的方法提供支持。 群體決策支持系統5群體決策支持系統的概念所謂群體決策支持系統(Group DSS,GDSS)就是將計算機技術、通信技術和決策支持技術等結合在一起,支持群體決策問題的求解。GDSS是對個體決策支持系統的擴展,是
10、為群體決策活動提供支持的信息系統,它促進具有共同責任的群體求解半結構化和非結構化決策問題。GDSS使多個決策參與者共同進行思想和信息的交流,群策群力,尋找一個令人滿意和可行的方案,但在決策過程中只由某個特定的人做出最終決策,并對決策結果負責。 群體決策支持系統的組成主持人決策者決策者人機接口規則庫子系統公共顯示設備局部決策支持系統通信庫子系統公共數據庫管理系統公共模型庫管理系統公共方法庫管理系統圖5-2 一種典型的群體決策支持系統的構成框架圖群體決策支持系統的類型決策室決策者面對面地集于一室在同一時間進行群體決策局域決策網建立在計算機局域網基礎上的,用于多位決策者在近距離內的不同房間(例如:自
11、己的辦公室)里定時或不定時作群體決策的系統群體決策支持系統的類型虛擬會議利用計算機網絡通信技術,使分散在各地的決策者在某一時間內能以不見面的方式進行集中決策。遠程決策網充分利用廣域網等信息技術來支持群體決策,它綜合了局域決策網與虛擬會議的優點,可使決策參與者異時異地地共同對同一問題做出決策。在企業中,人是非常有價值的,因為要靠他們完成重要的經營任務。多數企業都需要專業知識,而企業的專業知識常常只能存在于某些人的大腦中。專家系統能夠獲取企業的專業知識,并將它們提供給那些非專業人員,以便用它來解決問題或學習如何解決問題。專家系統5.1.3專家系統的概念由于各個應用領域的特點不同,人們研究專家系統的
12、出發點不同,看待問題的觀點不同,追求的目標不同,導致對專家系統的定義存在不一致的看法。一般認為:它是一個智能程序系統;它具有相關領域內大量的專家知識;它能應用人工智能技術模擬人類專家求解問題的思維過程進行推理,解決相關領域內的困難問題,并且達到該領域專家的水平。1專家系統的概念概括的說,所謂專家系統是一種在相關領域中具有專家水平解題能力的智能程序系統,它能運用領域專家多年積累的經驗與專門知識,模擬人類專家的思維過程,求解需要專家才能解決的困難問題。1一個醫學專家系統就能夠像真正的專家一樣,診斷病人的疾病,判別出病情的嚴重性,并給出相應的處方和治療建議.地質專家可以根據地質資料和勘探數據,判斷什
13、么地方有礦藏,是否有開采價值。例子會計-用于審計、稅務計劃、管理咨詢和培訓方面醫藥-在兼顧多方面因素(如患者病史、感染源以及現有藥品的價格)情況下開出抗生素處方財務管理-辨別銀行貸款部門中有拖欠傾向的賬戶生產-知道各類產品的加工制造,如飛機零部件專家系統的應用領域一個非常簡單的專家系統規則現象或事實是否解釋1綠燈亮了嗎?通過十字路口轉到規則2綠燈亮時是安全的,否則需要更多的信息2紅燈亮了嗎?轉到規則4轉到規則3應停車,不可以通過3在你到達十字路口前,紅燈很可能要亮嗎?轉到規則4通過十字路口只有黃燈亮時才會出現這種情況,然后你將有兩種選擇4在進入十字路口前,你能停車嗎?停車轉到規則5應停車,否則
14、就可能出現問題5是否有輛車正從某側開過來準備應付撞車事件通過十字路口除非十字路口處沒有車路過,否則很可能相撞一個非常簡單的專家系統綠燈亮了嗎(是/否)?否紅燈亮了嗎(是/否)?否在你到達十字路口前,紅燈很可能要亮嗎(是/否)?為什么?只有黃燈亮時才會出現這種情況,然后你將有兩種選擇。在你到達十字路口前,紅燈很可能要亮嗎(是/否)?否結論:通過十字路口接上例 如果在接近十字路口時綠燈亮了,你可以直接通過;如果紅燈亮了,就應該停車;如果不停車并且某一側有車經過,你可能就會有麻煩了。同樣,若黃燈亮了,你可以在交通燈快要變成紅燈之前通過路口;否則,就有可能發生交通事故。專家系統的一般結構專家系統通常由
15、知識庫、知識庫管理系統、推理機、數據庫、知識獲取與學習系統、解釋系統和用戶接口等部分構成。 專家、開發人員知識獲取與學習系統解釋系統推理機知識庫管理系統用戶接口用戶工作區間知識庫圖5-3 專家系統的一般體系結構2各部分功能知識庫知識庫是經過分類組織的“知識的集合”,知識庫的概念是數據庫概念在知識處理領域的拓廣。知識庫以某種知識表示形式存放專家系統所需的各種知識。一般來說,專家系統中的知識庫與專家系統程序是相互獨立的,用戶可以通過改變、完善知識庫中的知識內容來提高專家系統的性能。在專家系統中運用得較為普遍的知識是產生式規則。例如,在“動物識別”專家系統中有這樣一條規則:IF 能做單腿跳嗎=否 A
16、ND 在蘇格蘭嗎=是 AND 高度=大THEN 動物=馬 各部分功能(續)知識庫管理系統知識庫管理系統用于建立原始的知識庫結構和初始數據,組織知識庫中的內容,并對知識庫進行例行維護。人類專家或專家系統管理員通過該子系統向知識庫增加新知識,修改有關的數據,刪除已過時的知識。推理機推理機是對專家系統推理過程進行控制的程序,它從用戶所給的初始條件出發,依據一定的控制策略,通過使用知識庫中的有關知識,反復匹配知識庫中的規則,得出推理結論,從本質上,可將推理機理解為對于以某種語言表示的推理規則的解釋程序。各部分功能(續)數據庫數據庫又叫工作空間,是一個動態的存儲區域。其中包含專家系統運行過程中的各種數據
17、,如初始條件、中間結果、推理結論等。一般來說,數據庫中存放著系統當前所處理對象的一些事實和系統當前的狀態數據。例如,醫療專家系統的數據庫存放當前患者的姓名、年齡、病情癥狀以及推理得到的初步診斷結果。知識獲取與學習系統知識獲取與學習系統是專家系統中用于維護更新知識庫的程序部分。專家系統自身通過推理過程或為完成推理在與用戶的交互過程中發現并學習新的知識,然后通過知識庫管理系統更新知識庫。同時,人類專家和系統開發人員也通過這個系統增加、刪除或修改知識庫的內容。各部分功能(續)解釋系統解釋系統的功能是回答用戶有關推理過程方面的問題,向用戶解釋說明專家系統的推理過程、推理中所使用的知識、所得結論的緣由、
18、條件和結論之間的因果關系等。解釋的內容通過用戶接口輸出。用戶接口用戶接口是專家系統與用戶交互的界面,是專家系統中完成系統與用戶對話的程序部分。它直接面向用戶,系統通過用戶界面接收所求解問題的初始數據,并將推理結果及相關的解釋輸出給用戶。 專家系統的特征具有專家水平的專門知識一般問題的求解能力具有解釋功能具有獲取知識的能力知識和推理機構相互獨立3ES利用IT來獲取并利用人類的專業知識。ES能夠很好地解決具有清晰規則和程序的問題且具有很高的效率,并給企業帶來巨大的收益。專家系統的應用范疇ES能做的事情處理大量的信息匯集來自各種渠道的信息提供決策的一致性減少完成任務的人員工作時間減少錯誤改善為顧客提
19、供的服務提供新的信息降低成本運用DSS時,用戶必須對所處理的問題具有相當的專業知識和專業技能。DSS是輔助用戶進行決策,意味著用戶必須知道如何對問題進行推理、應該提出哪些問題、如何得到答案以及如何進行下一步驟。專家系統自身就具有這些功能,用戶只須向ES提供需要解決問題的事實和癥候,用以實際解決問題的技術或專業知識是由某領域內的專家提供的。專家系統與DSS的區別第二節 商務智能企業資源計劃(ERP)、銷售終端(POS)、市場調查、供應商、客戶、網絡、政府部門等都在不斷地增加信息,據統計,平均每18個月信息量就翻一番,但據專家估計目前被利用的數據只有5%10%,并且我們能分析的數據僅限于數據庫中的
20、數據。那么怎樣才能把大量的數據轉換成可靠的、有價值的商務信息以增加利潤和市場份額,獲得更多的競爭優勢,這已成為商業IT界關注的問題。由此,商務智能技術應運而生。商務智能產生的背景企業的“數據監獄”(Data Jail)現象。對大部分企業來說數據處理的問題不是數據缺乏,而是大量的數據冗余和數據不一致。龐大的數據量和傳統數據管理方法的缺陷,使大部分企業出現了“數據擁擠”(數據監獄)現象,既不利于企業的管理也不利于信息的有效利用。 “數據資產”新企業觀念的建立。目前大部分大中規模的企業都是信息豐富的組織,而一個信息豐富的組織的績效不僅僅依賴于產品、服務或地點等因素,而更重要的是依賴知識。商務智能的本
21、質正是把數據轉化為知識,致力于知識發現和挖掘,使企業的數據資產能帶來明顯的經濟效益,減少不確定性因素的影響,使企業取得新的競爭優勢。 1商務智能產生的背景(續)企業運營模式的變化。電子商務正在改變著全球商務活動的方式,信息在經濟活動中越來越占據著重要的地位。建立在Internet之上的企業經營模式電子商務:電子郵件、電子數據交換、電子支付系統、電子營銷等技術的發展和應用為商務智能系統提供了市場和生存環境。 數據庫和人工智能技術的發展。商務智能的發展也得益于相關技術的發展,并行處理系統、廉價數據存儲、新數據挖掘算法、神經網絡技術、人工智能技術、決策支持技術、從大量數據中發現其后潛藏的商業機會等等
22、技術的發展,使企業能以更低的成本投資商務智能,并取得更高的投資回報率。1一類由數據倉庫(或數據集市)、查詢報表、數據分析、數據挖掘、數據備份和恢復等部分組成的,以幫助企業決策為目的的技術。商務智能(Business Intelligence,BI)是一種知識,它包含了企業的客戶、競爭對手、合作伙伴、競爭環境和企業內部運作的知識,使企業有能力制定有效的、重要的和經常性的商業戰略決策。創建商務智能需要數據和信息,人們首先必須收集并合理地組織信息,然后必須使用合理的IT工具(數據倉庫、聯機分析處理和數據挖掘)來定義和分析信息內部的各種關系。決策者利用IT工具從信息中提取商務智能。商務智能的定義2構建
23、商務智能的過程商務智能的典型應用 產品銷售管理包括產品的銷售策略、銷售量分析,影響產品銷售的因素分析,以及產品銷售的改進方案的預測。 客戶關系管理通過客戶關系管理子系統,使企業可以分析顧客購買習慣和購買傾向,調查顧客滿意度,進而采取相應對策增強顧客保持力,培養忠實顧客,維持良好的顧客關系。 產品創新和推廣異常處理25.2.2數據倉庫(Data Warehouse,DW)技術產生于20世紀90年代初,其目標是進行決策支持。數據倉庫的產生是多方面因素綜合作用的結果,數據庫技術和分布式處理技術的發展、企業對信息的需求和決策支持系統的不足促使數據倉庫的產生。 數據倉庫 5.2.2 數據倉庫是信息的邏輯
24、集合,這些信息來自于許多不同的業務數據庫,并用于創建商務智能,以便支持企業的分析活動和決策任務什么是數據倉庫數據倉庫的特征面向主題的集成的穩定的與時間相關的數據倉庫具有多維性在關系數據庫模型中,信息是用一系列二維表來表示數據倉庫中包含若干層的行和列大多數數據倉庫實際上是一個多維數據庫數據倉庫中的層根據不同的維度來表達信息這種多維度的信息圖表被稱為超立體結構在企業中,大多數數據庫是面向業務的,即大多數數據庫都支持聯機事務處理(OLTP)數據倉庫不是面向業務的,它們是用來支持企業中各種決策活動的,因此DW僅支持聯機分析處理(OLAP)數據倉庫支持決策而非事務處理MCI電話公司 以customer
25、marketing warehouse進行趨勢分析、估算促銷成本、客戶維持率分析,從而能得知采取便宜且更為有效的選擇性促銷方式。 Wal-Mart連鎖零售商店分析顧客每次采購的物品、時間及物品的擺置地點等,找出其中關聯性,并據此決定每一家店的進貨方式、促銷戰略與店面貨物的最有效排列方式。美國聯邦住宅局利用數據倉庫將10年來分散于70多個系統中的預算與會計資料整合起來,供預算預測、支出分析、趨勢分析、方案評比及政策分析之用。Visa會員銀行利用數據倉庫CRIS(cardholder risk information service)分析,幫助銀行發現欺詐的行為模式,減少了16%的偽造信用卡損失。
26、數據倉庫實用案例數據倉庫系統的結構分析工具關系數據庫數據文件其他數據數據倉庫管理工具抽取、轉換、裝載元數據庫數據建模工具綜合數據當前數據歷史數據用戶查詢工具C/S工具OLAP工具數據挖掘工具源數據倉庫管理數據倉庫概念模型是對事物的概括和抽象。概念模型獨立于機器,反映了事物和事物之間的聯系,具有簡明、易理解的特點。數據倉庫的數據概念模型是多維數據模型。在數據倉庫中,維是同類數據的集合,是組織數據的變量,也是重要的決策因素。數據倉庫的組織多維數據模型的示例 北京1牛奶面包啤酒可樂黃油商品(工業-類別-商品)城市(國家-省-市)日期(年-月-日)234567上海廣州天津星型模型大多數數據倉庫都采用星
27、型模型來表示多維數據模型。星型模型包括一個事實表和多個維表,其中的事實表和維表都是關系表。事實表包含數據倉庫中的測量數據和指向與測量數據相關的其他維表的外鍵指針,每個外鍵指針指向一個維表。維表記錄每一維的主鍵和相關因素的屬性,每個維表對應多維模型中的一維,它們形成了概念模型的多維層次聯系。 銷售表客房表訂單號銷售員號客戶號產品號日期標識地區標識數量總價訂單號訂貨日期客戶號客戶名稱客戶地址銷售員號銷售員姓名城市產品號產品名稱產品目錄單價日期標識日月年地區名稱省別訂貨表地區表產品表日期表事實表圖5-9 星型模型星型模型雪花模型雪花模型是對星型模型的擴展。它通過對星型模型維表進一步細化,使原有的一些
28、維表被擴展為更小的事實表,形成由一些局部星型模型所組成的多層次結構。維表細化的目的是通過減少數據存儲量和聯合較少的維表來改善查詢性能。 地區表目錄表客房表事實表年表月表銷售表訂單號銷售員號客戶號產品號日期標識地區標識數量總價訂單號訂貨日期客戶號客戶名稱客戶地址銷售員號銷售員姓名城市產品號產品名稱產品目錄單價日期標識日月年地區名稱省別訂貨表產品表日期表圖5-10 雪花模型產品目錄目錄描述月份年年省表省別雪花模型 數據集市(Data Marts)是一種更小、更集中的數據倉庫;數據集市面向特定應用,主要針對具體的、部門級的應用。數據集市數據集市的特征規模小,面向部門,有特定的應用由業務部門定義、設計
29、、開發、管理和維護能快速實現購買比較便宜,投資回收快工具集的緊密集成提供更詳細的、預先存在的、數據倉庫的摘要子集可升級到完整的數據倉庫。數據倉庫和數據庫的比較作業用數據處理特性(數據庫)分析用數據處理特性(數據倉庫)數據特性 無重復數據重復數據詳細、少量匯總(微觀)詳細、大量匯總(宏觀)數據處理量(數個月)數據處理量(510年)經常移動不常移動作業特性 提供作業階層數據處理服務提供管理階層信息服務支持每日交易的操作(增添、刪除、查詢、打?。┲С止芾頉Q策的需求(查詢、打?。┞摍C事務處理(OLTP)聯機分析處理(OLAP)要求操作有效率且快速回應對效率及快速回應不特別要求開發特性軟件開發生命周期動
30、態反復分析交易系統導向、適于大量交易決策分析導向、適于復雜查詢使用數據倉庫時需重點考慮的問題企業是否真正需要數據倉庫數據倉庫與數據挖掘工具時十分昂貴的,而且需要不斷地得到擴展的和昂貴的支持。有些企業并不需要數據倉庫,若能從業務數據庫中輕而易舉地獲取決策所必需的信息,就沒必要采用數據倉庫。企業員工需要整個數據倉庫嗎如果不是這樣,就應考慮建立數據集市。怎樣更新信息為創建數據庫,可以用“快照”(snapshot)方式從其他數據庫中提取信息,并導入數據倉庫,但如果關鍵的信息要做到即時更新,則往往是不可行的。案例:金融業數據倉庫解決方案數據倉庫是金融銀行機構實現客戶關系管理的核心技術,也是金融銀行業競爭
31、優勢的來源,主要的應用業務部門為信用卡部、信貸部、市場部和零售業務部等,應用領域是以客戶為中心的,分銷渠道管理、客戶利潤分析、客戶關系優化、風險評估和管理。采用數據倉庫作為個性化服務的手段,在發達國家和地區,金融銀行業的實踐已取得顯著的成效 。什么是個性化服務呢?客戶認為:隱含知道我(Who)在什么數據(When)、需要什么產品或服務(What)、以我可以接受的價格(How much)、經由我喜好的分銷渠道(Where),對我提供銷售。銀行認為:以有競爭性的產品或服務(What)、在適當的時間(When)、通過適當的分銷渠道(Where)、對信用好風險低的客戶(Who)、以合理的價格(How
32、Much)和利潤(Profitable)完成銷售。兩者都是在精打細算的前提下,以達成各自的需求和目標。金融業數據倉庫解決方案(續)以客戶為中心的數據倉庫決策支持系統可以快速的了解每一項交易、每一個賬號、每一個分銷渠道、每一位客戶的風險和利潤,讓銀行作出正確的業務決策,及時響應每一位客戶現在未來的需要,提高整體運作和管理水平。主要體現在以下幾個方面:(1)分銷渠道的分析和管理(Behavior Explorer)建立分銷渠道的分析和管理階段完成后,銀行就能知道客戶、渠道、產品或服務三者之間的關系,了解客戶的購買行為,客戶或渠道對業務收入的貢獻,哪些客戶比較喜好經由什么渠道在何時和銀行打交道,目前
33、的分銷渠道的服務能力如何,需要增加哪些分銷渠道才能達到預期的服務水平。金融業數據倉庫解決方案(續)(2)利潤評價模型(Profitable Measurement Foundation)建立所有客戶的每一個賬號的利潤評價模型,以便了解每一位客戶對銀行的總利潤貢獻度。銀行可以依照客戶的利潤貢獻度安排合適的分銷渠道提供服務和銷售,知道哪些有利潤的客戶需要留住,采用什么方法留住客戶,以交叉銷售改善客戶的利潤貢獻度,知道哪些客戶應該爭取。另外,銀行可以模擬和預測,新產品對銀行利潤的貢獻度,或是新政策對銀行會產生什么樣的財務影響,或是客戶流失或留住對銀行的整體利潤的影響。金融業數據倉庫解決方案(續)(3
34、)客戶關系優化(Relationship Optimizer)客戶在每一筆交易中都能主動的告訴銀行需要什么產品或服務,例如,定期存款是希望退休養老使用、申請信用卡是需要現金消費、詢問放貸利息是需要住房貸款等,這些都是銀行提供產品或服務最好的時機。銀行需要將賬號每天發生的交易明細,以實時或定時的方式加載到中央數據倉庫系統,核對客戶行為的變化。當有上述變化時,馬上生成事件,然后銀行業務部門利用客戶購買傾向模型、渠道喜好模型、利潤貢獻度模型、信用和風險評分模型等,主動地和客戶溝通并進行交叉銷售,達成留住客戶和增加利潤的目標。金融業數據倉庫解決方案(續)(4)風險評估和管理風險評估和管理是實施數據倉庫
35、最困難的工作,本階段因為牽涉很多管理制度,所以需要較長的時間。風險評估和管理主要利用各種數學模型進行分析,模擬風險和利潤間的關系。當本階段完成后,銀行就完全實現了以客戶為中心的個性化服務數據倉庫決策支持系統,可以在滿足高利潤低風險客戶需求的前提下,達成銀行收益的極大化。 學習內容聯機分析處理的概念OLAP的基本分析操作聯機分析處理OLAP 5.2.3 聯機分析處理(OLAP) 的概念聯機分析處理 (On-Line Analytical Processing,OLAP)OLAP是在傳統的聯機事務處理(on-line transaction processing,OLTP)的基礎上發展起來的一種數
36、據分析技術,又稱多維分析或共享多維信息的快速分析。它用于完成基于某種數據存儲的數據分析功能。隨著用戶對數據分析要求的增加,OLTP已不能完全滿足用戶的需求。關系數據庫雖然具有一定的數據視圖選取、比較和綜合的能力,但受到數據分析能力的制約,例如,SQL等數據庫查詢語言對大型數據庫的簡單查詢不能滿足決策者提出的信息需求,用戶的決策分析需要對關系數據庫進行大量計算才能得出結果。1OLTP和OLAP 的比較OLTP是傳統的關系型數據庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。OLAP是數據倉庫系統的主要應用,支持復雜的分析操作,側重決策支持,并且提供直觀易懂的查詢結果,可以以多維的形式從
37、多方面和多角度來觀察組織的狀態、了解組織的變化。 OLTP和OLAP 的比較(續)OLTPOLAP用戶操作人員,低層管理人員決策人員,高級管理人員功能日常操作處理分析決策DB 設計面向應用面向主題數據當前的,最新的細節的,二維的分立的歷史的,聚集的,多維的集成的,統一的存取讀/寫數十條記錄讀上百萬條記錄工作單位簡單的事務復雜的查詢用戶數上千個上百個DB 大小100MB-GB100GB-TB OLAP的一些基本概念變量變量是數據的實際意義,即描述數據“是什么” 一般情況下,變量總是一個數值度量指標,例如人數、單價、銷售量等都是變量, 維維是人們觀察數據的特定角度。例如,企業常常關心產品銷售數據隨
38、著時間推移而產生的變化情況,這時是從時間角度來觀察產品的銷售,所以時間是一個維(時間維)。 2OLAP的一些基本概念(續)維的層次人們觀察數據的某個特定角度(即某個維)還可以存在細節程度不同的多個描述方面,我們稱這個描述方面為維的層次。維成員維的一個取值稱為該維的一個維成員。如果一個維是多層次的,那么該維的維成員是由各個不同維層次的取值組合而成的。例如,時間維的一個維成員,即“某年某月某日”。一個維成員并不一定在每個維層次上都要取值,例如“某年某月”、“某月某日”、“某年”等都是時間維的維成員。對應一個數據項來說,維成員是該數據項在某維中位置的描述。例如對一個銷售數據來說,時間維是維成員“某年
39、某月某日”就表示該銷售數據是“某年某月某日”的銷售數據,“某年某月某日”是該銷售數據在時間維上位置的描述。OLAP的一些基本概念(續)多維數組一個多維數組可以表示為:(維1,維2,維n,變量)。例如,若日用品銷售量數據是按時間、地區和銷售渠道組織起來的三維立方體,加上變量銷售額,就組成了一個多維數組(地區、時間、銷售渠道、銷售額)。數據單元(單元格)多維數組的取值成為一個數據單元。當多維數組的各個維都選中一個維成員,這些維成員的組合就唯一確定了一個變量的值。那么數據單元就可以表示為(維1維成員,維2維成員,維n維成員,變量的值)。例如,我們在產品、地區、時間和銷售渠道上各取維成員“牙膏”、“上
40、?!薄ⅰ?998年12月”和“批發”,就唯一確定了變量“銷售額”的一個值(假設為100000),則該數據單元可表示為(牙膏、上海、1998年12月、批發,100000)。 OLAP的基本分析操作切片(Slice)定義1:在多維數組的某一維上選定一維成員的動作成為切片,即在多維數組(維1,維2,維n,變量)中選一維,如維i,并取其一維成員(設為“維成員Vi”),所得的多維數組的子集(維1,維成員Vi,維n,變量)稱為在維i上的一個切片。定義2:選定多維數組的一個二維子集的動作叫做切片,即選定多維數組(維1,維2,維n,變量)中的兩個維,如維i和維j,在這兩個維上取某一區間或任意維成員,而將其余的
41、維都取定一個維成員,則得到的就是多維數組在維i和維j上的一個二維子集,稱這個二維子集為多維數組在維i和維j上的一個切片,表示為:(維i,維j,變量)。3切片示例上海時間維地區維產品維廣州電視機 電冰箱9899上海電視機切塊(Dice)定義1:在多維數組的某一維上選定某一區間的維成員的動作稱為切塊,即限制多維數組的某一維的取值區間。顯然,當這一區間只取一個維成員時,即得到一個切片。定義2:選定多維數組的一個三維子集的動作稱為切塊。即選定多維數組(維1,維2,。,維n,變量)中的三個維:維i,維j和維r,在這三個維上取某一區間或任意的維成員,而將其余的維都取定一個維成員,則得到的就是多維數組在維i
42、、維j和維r上的一個三維子集,我們稱這個三維子集為多維數組在維i、維j和維r上的一個切塊,表示為:(維i,維j,維r,變量)。 OLAP的基本分析操作3旋轉(Rotate)旋轉即改變一個報告或頁面顯示的維方向。例如,旋轉可能包含交換行和列,或是把某一個行維移到列維中去,或是把頁面顯示中的一個維和頁面外的維進行交換(令其成為新的行或列中的一個)。 OLAP的基本分析操作3旋轉示例(a)是把一個橫向為時間、縱向為產品的報表旋轉成為橫向為產品、縱向為時間的報表。(b)是把一個橫向為時間、縱向為產品的報表,變成一個橫向仍為時間,而縱向旋轉為地區的報表。 時間維產品維產品維時間維行列交換(a)時間維產品
43、維時間維地區維旋轉以改變頁面顯示(b)圖5-12 旋轉下鉆/上探(drill down/roll up)鉆探處理是使用戶在數據倉庫的多層數據中能通過導航信息而獲得更多的細節性數據。鉆探一般是指向下鉆探。 還包括上探:即讓用戶查看一個數據集的粗集視圖,例如上例中相反的操作為上探交叉鉆探:即可讓用戶在同一層次從一個數據集橫向地移到另一個數據集進行查看和分析 OLAP的基本分析操作3下鉆示例地區銷售額(萬元)上海900長沙650廣州8001999年某產品銷售數據 1999年地區1季度2季度3季度4季度上海200200350150長沙250100150150廣州2001501802701999年各季度
44、某產品銷售數據人們在日常生活中經常會遇到這樣的情況:超市的經營者希望將經常被同時購買的商品放在一起,以增加銷售;保險公司想知道購買保險的客戶一般具有哪些特征;醫學研 究人員希望從已有的成千上萬份病歷中找出患某種疾病的病人的共同特征,從而為治愈這種疾病提供一些幫助。對于以上問題,現有MIS中的數據分析工具無法給出答案。因為無論是查詢、統計還是報表,其處理方式都是對指定的數據進行簡單的數字處理,而不能對這些數據所包含的內在信息進行提取。隨著MIS的廣泛應用和數據量激增,人們希望能夠提供更高層次的數據分析功能,從而更好地對決策或科研工作提供支持。正是為了滿足這種要求,從大量數據中提取出隱藏在其中的有
45、用信息,將機器學習應用于大型數據庫的數據挖掘(Data Mining)技術得到了長足的發展。 數據挖掘5.2.41數據挖掘的概念數據挖掘(Data Mining)是從大量數據中抽取有意義的、隱含的、以前未知的并有潛在使用價值的知識的過程。 數據挖掘的基本理念:“顧客過去的消費行為可以作為未來采購意愿的指標?!?,從不同的數據來源收集大量的顧客信息,以便分析并確認特定的顧客需求,掌握特定目標市場。例如:顧客在何時、何處采購,購買什么產品,什么價格,在哪一種商店,在何時到何處旅游等。2數據挖掘的過程采集選擇的目的是辨別出需要分析的數據集合,縮小處理范圍,然而實際相系統中收集到的原始數據通常是“臟”的
46、,即數據存在雜亂性、重復性及不完整性。數據預處理可以處理數據中的遺漏及清洗臟數據,從而提高數據挖掘的質量,數據預處理包括數據集成、數據清理、數據變換和數據簡化等幾方面的功能。采集選擇數據預處理采集開采原始數據源數據目標數據模式知識解釋評價數據挖掘的過程數據挖掘的過程(續)數據挖掘階段進行實際的挖掘操作,它要先決定是進行發現型的數據挖掘,還是驗證型的數據挖掘,然后選擇合適的工具,進行發現知識的操作及證實發現的知識。解釋評價的任務不僅是把結果表達出來(例如采用信息可視化方法),還要對信息進行過濾處理,如果不能令決策者滿意,需要重復以上數據挖掘的過程。3數據挖掘與數據倉庫的關系首先,由于大多數數據挖
47、掘工具要在集成的、一致的、經過清理的數據上進行挖掘。而已經完成數據清理、數據變換和數據集成的數據倉庫,完全能為數據挖掘提供它所需要的挖掘數據,使數據挖掘免除了數據準備的繁雜過程。3數據挖掘與數據倉庫的關系其次,在數據挖掘過程中,常常需要進行探測式的數據分析,從各種數據庫中選擇相關數據,對各種數據選擇不同的粒度,以不同的形式提供知識或結果。而數據倉庫中的OLAP完全可以為數據挖掘提供有關的數據操作支持,例如,對數據立方體或數據挖掘中間結果進行下鉆、上探、旋轉、切塊、切片等操作,且以OLAP的可視化功能為數據挖掘過程或挖掘結果提供良好的操作平臺,這些都將極大地增強數據挖掘的功能和靈活性。此外,在數
48、據挖掘過程中,如果將數據挖掘與數據倉庫進行有效的連接,將增加數據挖掘的聯機挖掘功能。用戶在數據挖掘的過程中,可以利用數據倉庫中的OLAP與各種數據挖掘工具的連接,使用戶可以為數據挖掘選擇合適的數據挖掘工具,能夠在數據挖掘過程中靈活地組織挖掘工具以增強數據挖掘能力,同時還為用戶靈活地改變數據挖掘的模式與任務提供便利。數據挖掘工具是用戶對數據倉庫進行信息查詢的軟件工具。數據挖掘工具支持OLAP的概念,即通過對數據的處理來支持決策任務。數據挖掘工具數據挖掘工具集查詢與報表工具查詢與報表工具與QBE工具、SQL和典型數據庫環境中的報表生成器類似。大多數數據倉庫環境都支持諸如QBE、SQL和報表生成器之
49、類的簡單易用的數據操作子系統工具。智能代理智能代理運用各種人工智能工具(如:神經網絡、模糊邏輯)形成OLAP中的“信息發現”基礎,并創建商務智能。智能代理是一種軟件,它可以輔助人或充當人的代表來執行重復的與計算機相關的任務。數據挖掘代理在數據倉庫上運行以發現信息(知識)。智能代理不僅僅應用于數據倉庫環境的OLAP,而且還能應用于Web上查詢信息。多維分析工具切片/切塊技術旋轉魔方統計工具統計工具幫助人們利用各種數學模型將信息存儲到數據倉庫中,進而去挖掘出新的信息。時間序列分析-計劃未來趨勢回歸分析-確定一個變量對另一個變量的影響4數據挖掘的主要應用領域以產品營銷領域為例 顧客特性分析(customer profile analysis)目標市場分析(targeted market analysis)市場購物籃分析(marketbasket analysis)5數據挖掘分類分類(Classification)其旨在生成一個分類函數或分類模型,該模型能把數據庫中的數據項映射到給定類別中的某一個。既可以用此模型分析已有的數據,也可以用它來預測未來的數據。聚集(Clustering)聚集是對記錄分組,把相似的記錄在一個聚集里。聚集和分類的區別是聚集不依賴于預先定義好的類,不需要訓練集。數據可視化(Description and Visualization)數據可視化嚴格
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年“口袋書”題庫-機電
- 9清明教學設計-2023-2024學年三年級下冊語文統編版
- 2025年統計學專業期末考試:抽樣調查方法在軍事科學研究中的試題
- 2025年消防執業資格考試題庫:消防應急通信保障通信設備操作培訓試題
- 2025年征信考試題庫:征信產品創新與信用數據挖掘試題
- 2025年聲樂演唱職業能力測試卷:聲樂作品演唱技巧與情感表達試題
- 2025年小學語文畢業升學考試全真模擬卷-語文口語表達訓練能力測試試題
- 2025年初中地理環境與可持續發展模擬試卷及答案(自然地理知識篇)
- 2025年注冊稅務師稅法二實務操作測試試卷
- 2025年醫保知識考試題庫及答案:醫保政策調整與影響醫療保險基金管理試題
- 第十四屆全國海洋知識競賽活動參考題庫(含答案)
- 北師大版四年級下冊應用題專項練習【含答案】
- 物品接收單模板(接受聯、存根聯)
- 抗滑樁施工危險源辨識與評價及應對措施
- 語文園地五(識字加油站、我的發現)
- 身體紅綠燈課件
- 建設單位業主方工程項目管理流程圖
- 發展心理學第四節-智力發展
- 壓力管道檢驗計算案例
- 碎石擠密樁復合地基施工工法解讀
- 初中花城版八年級下冊音樂4.狂歡之歌(15張)ppt課件
評論
0/150
提交評論