




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
題型:選擇10*1分,單項選擇10*1分,填空8*1分,計算4*9分,問答4*9分。商務智能概述1.數據數據是可以記錄、通信和能識別的符號,它通過有意義的組合來表達現實世界中的某種實體〔具體對象、事件、狀態或活動〕的特征。商務智能技術可以分析結構化數據、半結構化數據以及非結構化數據、靜態的歷史數據和動態數據流等各種類型的數據。2.3.BI定義定義一:BusinessIntelligenceisaprocessofturningdataintoknowledgeandknowledgeintoactionforbusinessgain.(DataWarehouseInstitute)標準定義:商務智能是企業利用現代信息技術收集、管理和分析結構化和非結構化的商務數據和信息,創造和累計商務知識和見解,改善商務決策水平,采取有效的商務行動,完善各種商務流程,提升各方面商務績效,增強綜合競爭力的智慧和能力。4.商務智能的結構〔1〕商務智能的結構主要由兩局部組成:數據倉庫環境分析環境〔2〕商務智能主要由三種技術構成:數據倉庫〔DataWarehouse〕聯機分析處理〔On-lineAnalysis,OLAP〕數據挖掘〔DataMining〕在三大技術支柱中,數據倉庫是商務智能的根底。聯機分析處理〔OLAP〕是以海量數據為根底的復雜分析技術。數據挖掘(DataMining)是從海量數據中,提取隱含在其中的、人們事先不知道的但又可能有用的信息和知識的過程。決策支持系統結構化:數據結構字段含義確定、清晰。典型的如數據庫中的表結構半結構化:具有一定結構,但語義不夠確定典型的如HTML網頁,有些字段是確定的(title),有些不確定(table)非結構化:雜亂無章的數據,很難按照一個概念去進行抽取,無規律性DSS的產生背景電子數據處理——EDP〔ElectronicData Processing〕管理信息系統——MIS〔ManagementInformationSystems〕決策支持系統——DSS〔DecisionSupportSystems〕〔70年代中期提出〕3.DSS的定義決策支持系統(DSS)是以管理科學,運籌學,控制論和行為科學為根底,以計算機技術,仿真技術和信息技術為手段,針對半結構化和非結構化的決策問題,支持決策活動的具有智能作用的人機系統.DSS的構造DSS的構造研究主要解決DSS的組成問題,即組成DSS的部件。現在,經典提法是:DSS=四庫系統+對話系統〔人機界面〕四庫系統:數據庫系統、模型庫系統、方法庫系統、知識庫系統。4.模型庫〔ModelBase〕提供模型的存儲和表示模式。模型庫管理系統提供模型的提取、訪問、更新和合成等操作。數據倉庫數據倉庫〔DataWarehouse,DW〕的概念是92年提出來的。2.數據處理被分為兩大類:操作型處理〔OLTP〕和分析型處理〔OLAP〕(1)區別:操作型處理以傳統的數據庫為中心進行企業的日常業務處理。如電信部門部門的計費數據庫用于記錄客戶的通信消費情況;銀行的數據庫用于記錄客戶的帳號、密碼、存入和支出等一系列業務行為。分析型處理以數據倉庫為中心分析數據背后的關聯和規律,為企業決策提供可靠有效的依據。如對超市近期數據進行分析可以發現近期暢銷的產品,從而為公司采購部門提供指導信息。(2)操作型處理&分析型處理的比擬1〕使用的人員和處理的數據操作型系統的使用人員通常是企業的具體操作人員,處理的數據通常是企業業務的細節信息,其目標是實現企業的業務運營。分析型系統的使用人員通常是企業的中高層管理者,或者是從事數據分析的工程師,分析型系統包含的信息往往是企業的宏觀信息而非具體細節,其目的是為企業的決策者提供支持信息。2〕環境操作型處理和分析型處理的別離,劃清了數據處理的分析型環境與操作型環境之間的界限,從而由原來以單一數據庫為中心的數據環境開展為以數據庫為中心的業務處理系統和以數據倉庫為根底的分析系統。3.商業智能系統由3個層次的內容組成:數據倉庫、聯機分析處理〔OLAP〕和數據挖掘。商業智能系統的數據處理循環:數據倉庫的體系結構由于數據庫和數據倉庫應用的出發點不同,數據倉庫將獨立于業務數據庫系統,但是數據倉庫又同業務數據庫系統息息相關。也就是說,數據倉庫不是簡單地對數據進行存儲,而是對數據進行“再組織〞。數據清洗——數據不一致和不同步1〕數據不一致企業常常為不同的應用對象建立不同的業務數據庫,這些業務系統中可能包含重復的信息;不同的數據庫可能使用不同數據庫公司的產品;不同的業務系統可能由不同的軟件開發商提供。這使得各個業務數據庫中的數據存在不一致的現象。數據庫使用人員的操作失誤也會造成數據的不一致。2〕數據不同步由于冗余的數據存放在不同的數據庫中,如果不同數據庫間的數據更新不是實時的,那么可能出現數據不同步的情況。6.數據轉化由于業務系統可能使用不同的數據庫廠商的產品,各種數據庫產品提供的數據類型可能不同,因此需要將不同格式的數據轉化成統一的數據格式。7.元數據〔數據的數據〕數據倉庫的元數據主要包括兩類:〔1〕第一種是為了從操作型環境向數據倉庫環境轉換而建立的元數據,它包括所有源數據項的名稱、屬性及其在提取倉庫中的轉化;〔2〕第二種元數據在數據倉庫中是用來與最終用戶的多維商業模型和前端工具之間建立映射的,這種數據成為BI元數據,它包括:1〕數據倉庫中信息的種類、存儲位置、存儲格式;2〕信息之間的關系、信息和業務的關系,數據使用的業務規那么;〔如:何時數據倉庫中的所有數據才能用于生成報表〕3〕數據模型;4〕數據模型和數據倉庫的關系。8.數據集市數據倉庫面向整個企業,而數據集市那么是面向企業中的某個部門。面向企業中的某個部門〔主題〕而在邏輯上或物理上劃分出來的數據倉庫中的數據子集稱為數據集市。當部門人員使用數據時,不需要到數據倉庫的巨量數據中檢索,而只需在這些數據上進行分析,因此從效率和處理速度的角度出發,這種劃分是合理的。獨立和依賴的數據集市。9.數據倉庫的功能和特征傳統的數據庫系統由于主要用于企業的日常事務處理工作,存放在數據庫中的數據根本符合操作型數據的特點。而為了適應數據分析處理的要求而產生的數據倉庫中存放的數據,根本符合分析型數據的特點。10.區別:11.數據轉化數據轉化通常可能包含如下問題:〔1〕數據格式〔2〕測量單位〔3〕數據代碼含義混亂〔4〕數據名稱混亂12.BI需要的不是靜態的集成,而是動態的集成。13.數據庫系統中數據是不穩定的,數據倉庫中的數據相對穩定。數據倉庫的數據只增不刪,這使得數據倉庫的數據總是擁有時間維度。14.硬件的利用模式在數據庫環境下,硬件資源的利用率總保持在一個相對穩定的狀態,這是由于不斷地有事務需要處理。而在數據倉庫環境下,硬件資源的利用率常常在高利用率和低利用率之間切換。當系統進行數據分析應用時,硬件資源的利用率將很高;而系統空閑時,系統的硬件利用率很低。15.數據倉庫的數據組織結構在數據倉庫中,數據被分成4種級別,分別是:高度綜合級輕度綜合級當前細節級早期細節級16.OLAP中的數據顆粒度粒度就是對數據倉庫中數據綜合程度的一個度量。數據粒度與數據量數據的綜合程度不同,其數據量將相差很大。數據粒度越小,信息越細節,數據量越大。數據粒度越大,忽略了眾多的細節,數據量越小。17.數據的分割所謂數據分割是指將數據分散到各自的物理單元中以便能夠獨立處理,提高數據處理的效率。數據分割后的數據單元稱為分片。數據分割沒有固定的標準,分割的方法和粒度應當根據實際情況來確定。分割方法常常可以選擇時間、地點、業務領域來劃分。18.數據倉庫的數據追加技術〔1〕時標法〔2〕前后映像比擬法〔3〕DELTA文件法〔4〕日志文件法19.清理數據倉庫的數據數據倉庫的清理與普通系統中數據清理的含義有區別。在普通的系統中,數據清理意味著將數據刪除。而數據倉庫系統中清理并不是簡單地刪除,而是從細化級別的數據逐漸上升為高級綜合度的數據,直到數據已經不再具備任何意義時被去除的過程。數據倉庫中清理的過程如下:數據從操作型環境進入分析型環境;數據從細節數據逐漸轉換為綜合數據;數據從高速磁盤中轉移到低速存儲介質上;數據失去實際意義,最終被去除。這個過程實際上也是數據在數據倉庫中的生命周期。20.操作數據存儲〔ODS〕ODS是用于支持企業日常的全局應用的數據集合。ODS解決的是“日常〞性問題,因而具有引入數據是可變的、數據是當前或者近期的特點,這個特點類似于傳統的數據庫。ODS是面向全局應用的〔數據涉及多個部門〕,這使得ODS中的數據需要面向主題來組織,并且應當是實時集成的。所謂面向主題的,是指數據倉庫圍繞一些主題,并且更關注決策者的數據建模與分析,而不是集中于組織機構的日常操作和事務處理21.記錄系統和參考表建立ODS實際上是建立了一個全局數據庫,它通過在ODS中的記錄系統定義和參考表來建立一系列DB和ODS記錄間的雙向聯系,以實現數據在企業級上的同步。ODS的記錄系統就是說明如何從DB中向ODS進行數據抽取。有了ODS記錄系統后,DB中對應的數據項發生的變化,都將反映到相應的ODS記錄中。參考表建立的是從ODS數據項到DB數據項的反向映射。當ODS中的記錄發生變化時,將通過參考表去修改與之相關的DB中所有數據項。其過程如下圖。數據庫A、B、C都存在相同含義的數據。數據庫A中的數據項發生變化后,通過ODS記錄系統定義,反映到ODS中對應的數據項;再通過參考表去更新數據庫B和C。通過記錄系統定義和參考表,使得原先分散的數據庫系統被緊密的結合起來,一點動,全局變。21.在DB—ODS—DW三層結構中數據是如何流動的在三層結構中,數據的傳輸控制是通過兩級記錄系統的定義來實現的。ODS系統和DW系統都有各自的記錄系統和記錄系統的定義。ODS的記錄系統是定義在原有的數據庫系統中,DW的記錄系統是定義在ODS一致性數據環境中。ODS記錄系統的定義作為ODS元數據的一局部保存放在ODS區中,它指明需要如何從數據庫系統中提取數據。DW記錄系統的定義作為DW元數據的一局部存放在DW中,它指明需要如何從ODS環境中提取數據,如圖2-45所示。聯機分析處理——OLAP1.OLAP系統按照其存儲器的數據存儲格式可以分為關系OLAP〔RelationalOLAP,簡稱ROLAP〕、多維OLAP〔MultidimensionalOLAP,簡稱MOLAP〕和混合型OLAP〔HybridOLAP,簡稱HOLAP〕三種類型。鉆取〔Dillup/Drilldown〕〔上鉆、下鉆〕電子商務與數據挖掘電子商務與數據挖掘結合的原因〔1〕電子商務提供海量的數據如果一個電子商務網站平均每個小時賣出五件物品,那么它一個月的平均點擊量是160萬次。〔2〕豐富的記錄信息良好的WEB站點設計將有助于獲得豐富的信息〔3〕干凈的數據從電子商務站點收集的都是電子數據,無需人工輸入或者是從歷史系統進行整合〔4〕研究成果容易轉化在電子商務中,很多知識發現都可以進行直接應用投資收益容易衡量2.可以在一個電子商務網站挖掘些什么東西?內容挖掘(WebConten
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CNCA 058-2023煤炭行業健康企業評價規范
- T/CIQA 47-2022紅花質量分級
- T/CIIA 028-2022生態系統長期觀測數據產品規范
- T/CGCC 62-2022自動售貨設備運營管理規范
- T/CGAS 027-2023城鎮燃氣智能調壓箱技術規范
- T/CECS 10129-2021塑料扁絲土石籠袋
- T/CCS 068-2023井工煤礦智能化數據中心運維管理規范
- T/CCS 056-2023燃煤電廠摻燒生物質加裝碳捕集與封存技術工程項目溫室氣體排放評估指南
- T/CCOA 80-2023油茶籽油生產技術規范
- T/CCMA 0063-2018盾構機操作、使用規范
- 醫療糾紛防范及法律責任課件
- 電動自行車車棚設計施工規劃方案
- 資金流,合同流,發票流,三流一致報告模板
- 《心理健康教育主題班會》主題
- GB 30254-2024高壓三相籠型異步電動機能效限定值及能效等級
- SL+290-2009水利水電工程建設征地移民安置規劃設計規范
- 2024年江蘇中考地理試卷(帶有答案)
- 江蘇省江陰市普通高中2023-2024學年物理高一第二學期期末統考試題含解析
- 唐詩宋詞人文解讀智慧樹知到期末考試答案章節答案2024年上海交通大學
- 小學四年級奧數-還原問題
- 江蘇省2024年中職職教高考文化統考財會專業綜合理論試卷
評論
0/150
提交評論