




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 數(shù)據(jù)庫技術(shù)一、引入問題的原因二十一世紀(jì)以來,隨照以計(jì)算機(jī)為核心的信息技術(shù)的發(fā)展,社會(huì)各個(gè)領(lǐng)域的管理都逐步走向了計(jì)算機(jī)化和網(wǎng)絡(luò)化,管理的核心內(nèi)容是數(shù)據(jù)的收集、整理、分析,關(guān)鍵是數(shù)據(jù)的后期分析,數(shù)據(jù)只有通過合理的分析才能發(fā)揮信息對(duì)各個(gè)領(lǐng)域管理的支持作用,是管理者決策的支持。所以數(shù)據(jù)庫技術(shù)作為社會(huì)各個(gè)領(lǐng)域管理過程中的底層技術(shù)支持是至關(guān)重要的和必不可少的。只有充分的掌握數(shù)據(jù)庫技術(shù)的有關(guān)理論,才能建立有效的數(shù)據(jù)庫及數(shù)據(jù)庫管理系統(tǒng),發(fā)揮數(shù)據(jù)庫技術(shù)在社會(huì)各領(lǐng)域管理中的核心作用。避免數(shù)據(jù)庫技術(shù)在管理應(yīng)用中問題的出現(xiàn)、走出數(shù)據(jù)庫在實(shí)際管理中的誤區(qū)。由于數(shù)據(jù)庫技術(shù)在社會(huì)各個(gè)領(lǐng)域管理中所發(fā)揮的實(shí)際作用,才使得數(shù)據(jù)
2、庫技術(shù)受到世界的關(guān)注,成為研究和使用的對(duì)象,得到了不斷的發(fā)展和優(yōu)化。從最初的手工處理演變成完整復(fù)雜的系統(tǒng)。二、數(shù)據(jù)庫技術(shù)的發(fā)展數(shù)據(jù)庫技術(shù)是數(shù)據(jù)管理發(fā)展到一定階段的產(chǎn)物,整個(gè)發(fā)過程和數(shù)據(jù)處理相關(guān)技術(shù)的發(fā)展息息相關(guān),并且受到社會(huì)各個(gè)領(lǐng)域管理對(duì)數(shù)據(jù)處理所提出的新要求的影響。在數(shù)據(jù)處理技術(shù)支持和管理新需求的雙重作用下,使得數(shù)據(jù)庫技術(shù)的整個(gè)發(fā)展過程經(jīng)歷了如下幾個(gè)階段:1、手工階段,數(shù)據(jù)的組織與管理靠程序員手工完成計(jì)算機(jī)用于計(jì)算2、文件系統(tǒng)階段:出現(xiàn)OS和文件管理系統(tǒng),一一計(jì)算機(jī)不僅用科學(xué)計(jì)算,還用于管理a、專門用于數(shù)據(jù)管理,可以增、刪、改(文本或數(shù)據(jù)編輯使數(shù)據(jù)可以反復(fù)使用,b、數(shù)據(jù)余度大c、數(shù)據(jù)程序缺乏
3、獨(dú)立性。3、數(shù)據(jù)系統(tǒng)階段,數(shù)據(jù)量加大,共享要求增加,產(chǎn)生數(shù)據(jù)庫技術(shù),對(duì)數(shù)據(jù)庫的使用有專門軟件即數(shù)據(jù)庫管理系統(tǒng)DBMS)包括建立、使用、維護(hù)、數(shù)據(jù)庫(數(shù)據(jù)和程序獨(dú)立)一一實(shí)現(xiàn)數(shù)據(jù)庫系統(tǒng)的業(yè)務(wù)數(shù)據(jù)與EDI單證間的自動(dòng)轉(zhuǎn)換一一計(jì)算機(jī)越來越多的運(yùn)用于管理領(lǐng)域一一“管理信息”一一管理信息系統(tǒng)數(shù)據(jù)庫特點(diǎn):(1)面向全組織的復(fù)雜的數(shù)據(jù)結(jié)構(gòu)(2)數(shù)據(jù)的最小存取單位是數(shù)據(jù)項(xiàng)(3)數(shù)據(jù)的冗余度小,易擴(kuò)充(4)具有較高的數(shù)據(jù)獨(dú)立性(5)統(tǒng)一的數(shù)據(jù)控制功能(安全性控制、完整性控制、并發(fā)性控制)4、數(shù)據(jù)倉庫階段(背景:數(shù)據(jù)技術(shù)的成熟及廣泛應(yīng)用,企業(yè)管理的需求,導(dǎo)致了數(shù)據(jù)倉庫的產(chǎn)生,包含三個(gè)方面的內(nèi)容:數(shù)據(jù)倉庫技術(shù)聯(lián)機(jī)分
4、析處理技術(shù)、數(shù)據(jù)挖掘技術(shù),原因:競(jìng))爭(zhēng)。(1)原因:A、數(shù)據(jù)庫技術(shù)的發(fā)展為解決決策支持問題提供了可能B、激烈的市場(chǎng)競(jìng)爭(zhēng)產(chǎn)生了對(duì)決策支持的巨大需求由此人們找到了以數(shù)據(jù)倉庫為基礎(chǔ),以O(shè)LAP和DM工具為手段的一整套可操作、可實(shí)施的解決方案。(2)包含三個(gè)方面的內(nèi)容:數(shù)據(jù)倉庫技術(shù)DW)聯(lián)機(jī)分析處理技術(shù)OLAP)數(shù)據(jù)挖掘技術(shù)DM)三、數(shù)據(jù)庫的建立過程及建立中問題的解決數(shù)據(jù)庫的建立是數(shù)據(jù)庫技術(shù)能否發(fā)揮作用的關(guān)鍵所在,而數(shù)據(jù)庫建立過程中問題的解決是數(shù)據(jù)庫建立是否合理的關(guān)鍵。只有建立規(guī)范化的數(shù)據(jù)庫,才能保障數(shù)據(jù)庫建立的合理化,發(fā)揮數(shù)據(jù)庫技術(shù)的作用。數(shù)據(jù)庫的建立過程經(jīng)歷了用戶需求分析、數(shù)據(jù)分析、概念模型設(shè)計(jì)、
5、數(shù)據(jù)庫設(shè)計(jì)、建立數(shù)據(jù)庫幾個(gè)關(guān)鍵階段。用戶需求分析Mrt八Jr*數(shù)據(jù)分析數(shù)據(jù)庫設(shè)計(jì)建立數(shù)據(jù)庫數(shù)據(jù)庫是否規(guī)范化,直接取決于數(shù)據(jù)庫概念模型設(shè)計(jì)的是否規(guī)范,所以說概念模型設(shè)計(jì),數(shù)據(jù)庫建立中問題的關(guān)鍵所在,如何使數(shù)據(jù)庫概念模型設(shè)計(jì)規(guī)范化呢?引入數(shù)據(jù)庫規(guī)范化理論,舉例說明。1、數(shù)據(jù)庫建立的過程一個(gè)管理信息系統(tǒng)的各部分是否能緊密的結(jié)合在一起以,及如何結(jié)合關(guān)鍵在數(shù)據(jù)庫,因些只有對(duì)數(shù)據(jù)庫進(jìn)行合理的邏輯設(shè)計(jì)和有效的物理設(shè)計(jì)才能開發(fā)出高效的管理信息系統(tǒng)。過程分兩步:A、設(shè)計(jì)和建立高效的數(shù)據(jù)庫DB)B、設(shè)計(jì)和建設(shè)數(shù)據(jù)庫管理系統(tǒng)DBMS)數(shù)據(jù)庫管理信息系統(tǒng)的建設(shè)過程:數(shù)據(jù)庫設(shè)計(jì)與實(shí)現(xiàn)階段用戶需求分析一一數(shù)據(jù)分析一概念模
6、型設(shè)計(jì)一一數(shù)據(jù)庫設(shè)計(jì)一建立數(shù)據(jù)庫一DBMS設(shè)計(jì)DBMS的實(shí)現(xiàn)一系統(tǒng)使用與維護(hù)數(shù)據(jù)庫管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)階段四、數(shù)據(jù)庫技術(shù)在社會(huì)各領(lǐng)域管理中發(fā)揮的主要作用(一)數(shù)據(jù)庫的作用:對(duì)電子商務(wù)來講:A、存儲(chǔ)和管理商務(wù)數(shù)據(jù)(數(shù)據(jù)庫技術(shù)的基本功能)B、決策支持一企業(yè)可以利用數(shù)據(jù)管理技術(shù)中的新技術(shù)對(duì)數(shù)據(jù)庫中海量的商務(wù)數(shù)據(jù)進(jìn)行科學(xué)的組織、分析和統(tǒng)計(jì),從而更好的服務(wù)于企業(yè)的決策支持。五、數(shù)據(jù)庫技術(shù):(一)數(shù)據(jù)庫的作用:對(duì)電子商務(wù)來講:A、存儲(chǔ)和管理商務(wù)數(shù)據(jù)(數(shù)據(jù)庫技術(shù)的基本功能)B、決策支持一企業(yè)可以利用數(shù)據(jù)管理技術(shù)中的新技術(shù)對(duì)數(shù)據(jù)庫中海量的商務(wù)數(shù)據(jù)進(jìn)行科學(xué)的組織、分析和統(tǒng)計(jì),從而更好的服務(wù)于企業(yè)的決策支持。(二
7、)數(shù)據(jù)庫技術(shù)發(fā)展(三)數(shù)據(jù)庫技術(shù)基本理論敘述:電子商務(wù)應(yīng)用的前提是企業(yè)管理信息系統(tǒng)MIS)的廣泛應(yīng)用,數(shù)據(jù)庫技術(shù)是企業(yè)管理信息系統(tǒng)的核心技術(shù)之一,所以想深入理解電子商務(wù)就應(yīng)該先了解數(shù)據(jù)庫的一些基本理論2、數(shù)據(jù)模型(數(shù)據(jù)庫系統(tǒng)中用于提供信息表示和操作手段的形式架構(gòu),由三個(gè)部分組成)1)構(gòu)成:數(shù)據(jù)結(jié)構(gòu):數(shù)據(jù)對(duì)象及相互聯(lián)系數(shù)據(jù)操作:數(shù)據(jù)的檢索和更新數(shù)據(jù)的約束條件:完整性規(guī)則的集合(說明:完整性規(guī)則是指在給定數(shù)據(jù)模型中數(shù)據(jù)及其聯(lián)系所具有的制約和依存規(guī)則)2)分類:A、層次模型:a、米用層次或樹型結(jié)構(gòu)來表示實(shí)體之間的聯(lián)系模型b、節(jié)點(diǎn)表示數(shù)字、連線表示關(guān)系(關(guān)系是:n的關(guān)系)c、根結(jié)點(diǎn)除外,每個(gè)結(jié)點(diǎn)都與上
8、一層父結(jié)點(diǎn)相連d、層次模型只能描述數(shù)據(jù)之間的一對(duì)一或一對(duì)多的關(guān)系e、層次模型完整性約束:除根外每個(gè)記錄必須有父記錄插入時(shí)沒有父記錄子記錄不能插入刪除父記錄子記錄也被刪除掉B、網(wǎng)狀模型:(比層次具有普遍性,可以有父節(jié)點(diǎn)也可以沒有或多個(gè)父節(jié)點(diǎn)。它描述了數(shù)據(jù)間的多對(duì)多關(guān)系)C、關(guān)系模型:(是三種應(yīng)用最廣的、簡(jiǎn)單,但定義復(fù)雜、理解為一個(gè)二維表,每行代表一個(gè)實(shí)體記錄,每一列代表一個(gè)實(shí)體的屬性的數(shù)據(jù)項(xiàng)或字段)。關(guān)系具有特點(diǎn):a)數(shù)據(jù)項(xiàng)不可再分(表中套表不可以)b)列是同性質(zhì)的為屬性,不能重復(fù)。c)不能重復(fù)記錄,記錄無順序。d)每個(gè)表都有一個(gè)主鍵,唯一標(biāo)識(shí)關(guān)系中的一個(gè)記錄。e)表格列順序不重要以上三種模型中
9、關(guān)系模型概念簡(jiǎn)單、清晰,逐漸成為數(shù)據(jù)庫的基礎(chǔ)、流行的數(shù)據(jù)庫系統(tǒng)模型。均為關(guān)系數(shù)據(jù)庫。口:oracle、sqlserver等。3、關(guān)系數(shù)據(jù)庫以關(guān)系模型為基礎(chǔ)的數(shù)據(jù)庫,關(guān)系模型由但部分構(gòu)成:數(shù)據(jù)結(jié)構(gòu),關(guān)系操作,關(guān)系完整性。1)基本概念1)數(shù)據(jù)結(jié)構(gòu):關(guān)系表,結(jié)構(gòu)單一2)關(guān)系操作:操作方式是集合操作,即操作的對(duì)象和操作的結(jié)果是集合,稱為一次一集合的方式,而不是一次一記錄的方式。包括:關(guān)系的并、差、交、選擇、投影、連接等操作。3)關(guān)系的完整性:包括實(shí)體、參照、用戶自定義三個(gè)部分的完整性。實(shí)體完整性:保證數(shù)據(jù)庫中的記錄的唯一性即關(guān)系中主碼的值既不能為空也不能重復(fù)。參照完整性:保證表與表之間語意上的完整性,
10、如果關(guān)R2的外碼X與關(guān)系R1的主碼相對(duì)應(yīng),則外碼X的每個(gè)值必須在關(guān)系R1中主碼的值中找到或者為空。用戶自定義完整性:反映了用戶的要求,指用戶對(duì)某一具體數(shù)據(jù)指定的約束條件。(2)結(jié)構(gòu)化查詢語言SQLStructureQueryLanguage關(guān)系數(shù)據(jù)庫的標(biāo)準(zhǔn)語言,通過SQL對(duì)數(shù)據(jù)庫進(jìn)行操作,以減輕用戶的負(fù)擔(dān),各類關(guān)系數(shù)據(jù)庫系統(tǒng)都支持標(biāo)準(zhǔn)SQLSQL的特點(diǎn):一體化:SQL可以完成對(duì)數(shù)據(jù)庫的所有操作(數(shù)據(jù)定義語-DDL.數(shù)據(jù)操作語言-DML、數(shù)據(jù)控制語言-DCL)。靈活:一種聯(lián)機(jī)交互式,一種嵌入程序式(嵌入到某種高級(jí)語言的程序中,兩種方式的語法結(jié)構(gòu)統(tǒng)一,給用戶帶來靈活性選擇的余地,又不會(huì)擔(dān)心不一致。
11、)高度非過程化:SQL用戶只需提出“做什么”不用了解實(shí)現(xiàn)細(xì)節(jié),復(fù)雜的過程由系統(tǒng)自動(dòng)完成。(高級(jí)編程語言必須通過程序解決“怎樣作”的問題)語言簡(jiǎn)潔,易學(xué)易用(3)關(guān)系數(shù)據(jù)庫的規(guī)范化理論使數(shù)據(jù)庫設(shè)計(jì)的方法走向完備為了使數(shù)據(jù)庫設(shè)計(jì)的方法走向完備人們研究了規(guī)范化理論。從1971年起E.F.Codd就提出了這一理論,規(guī)范化理論的研究已經(jīng)取得了很多成果。規(guī)范化可使關(guān)系結(jié)構(gòu)簡(jiǎn)化,更加有規(guī)律存儲(chǔ)盡量減少冗余,使數(shù)據(jù)庫設(shè)計(jì)更為合理1)目的:保證庫中每個(gè)分量都不可再分消除冗余存儲(chǔ),簡(jiǎn)化檢索操作消除扦入異常和刪除異常說明:扦入異常:刪除異常(刪除多余要求的屬性)2)理論內(nèi)容A、數(shù)據(jù)依賴a、函數(shù)依賴定義設(shè)R(U)是屬
12、性集U上的關(guān)系模式。X,Y是U的子集。若對(duì)于R(U)的任意一個(gè)可能的關(guān)系r,r中不可能存在兩個(gè)元組在X上的屬性值相等,而在Y的屬性值上不等,則稱X函數(shù)確定Y或Y函數(shù)依賴X,記作XY。例:“學(xué)號(hào)”唯一確定“姓名”學(xué)號(hào)姓名XY,但Y不包含于X,則稱XY是非平凡的函數(shù)依賴。XY,但Y包含于X,則稱XY是平凡的函數(shù)依賴。若XY,則X叫做決定因素。若XY,YX,則記作X在R(U)中,如果XY,(Y不包含于X),Y不決定X,YZ,則稱Z對(duì)X傳遞函數(shù)依賴2。例:學(xué)號(hào)系別系別學(xué)號(hào)系別系主任“系主任”傳遞函數(shù)依賴“學(xué)號(hào)”例:學(xué)號(hào)姓名姓名學(xué)號(hào)姓名班級(jí)學(xué)號(hào)直接班級(jí)b、多值依賴:例:一個(gè)學(xué)生能選擇多門課程“,課程”多
13、值依賴于“學(xué)號(hào)”敘述:設(shè)計(jì)數(shù)據(jù)庫時(shí),先根據(jù)關(guān)系的各屬性的關(guān)系換為更合適形式將屬性歸入合適的關(guān)系中B、碼侯選碼:如果一個(gè)屬性集合能唯一的標(biāo)識(shí)元組且不包含多余的屬性,則該屬性集合被稱為侯選碼。碼:當(dāng)前正在使用的候選碼,被稱為主碼。外碼:如果一個(gè)關(guān)系中的屬性或?qū)傩约喜皇窃撽P(guān)系的碼但它是另一個(gè)關(guān)系的碼,則稱其為該關(guān)系的外碼。主碼與外碼提供了一個(gè)表示關(guān)系間聯(lián)系的手段。主屬性:包含在任何一個(gè)候選碼中的屬性。非主屬性:不包含在任何一個(gè)候選碼中的屬性。C、范式一按屬性間依賴情況區(qū)分關(guān)系規(guī)范化的程序關(guān)系數(shù)據(jù)庫的關(guān)系是要滿足一定要求的,滿足不同程度要求的為不同的范式。滿足最低要求的叫第一范式,簡(jiǎn)稱1NF。在第一
14、范式中滿足進(jìn)一步要求的為第二范式,其余的以此類推。從范式來講,主要是E.F.Codd做的工作,1971年1972年間E.F.Codd系統(tǒng)的提出了一范式,二范式,三范式的概念來討論規(guī)范化問題1974年,Codd和Boyee又共同提出了一個(gè)新的范式,即BCNF。1976年Fagin又提出了4NF。后來又有人提出了5NF。第一范式(1NF),設(shè)R是一個(gè)關(guān)系模式,R屬于第一范式當(dāng)且僅當(dāng)R中的每個(gè)屬性的值域只包含原子項(xiàng),即不可分割的數(shù)據(jù)項(xiàng)。第二范式(2NF),設(shè)R是一個(gè)關(guān)系模式,R屬于第二范式當(dāng)且僅當(dāng)R是第一范式,且每個(gè)非主屬性完全依賴于碼。非2NF學(xué)生_住宿一課程學(xué)號(hào)系名年齡學(xué)號(hào)課程號(hào)成績(jī)29計(jì)20-
15、|30庫901匚數(shù)(2)8030外212930語(3)70語(3)8529說明:每個(gè)程序號(hào)對(duì)應(yīng)一個(gè)系名沒意義造成數(shù)據(jù)冗余例:關(guān)系模式SLC(學(xué)號(hào),系名,住址,課程號(hào),成績(jī))(學(xué)號(hào),課程號(hào))F成績(jī)(學(xué)號(hào),課程號(hào))P系名(學(xué)號(hào),課程號(hào))P住址改進(jìn):SLC改為兩個(gè)關(guān)系模式SC(學(xué)號(hào),課程號(hào),成績(jī))(學(xué)號(hào),課程號(hào))十成績(jī)S2(學(xué)號(hào),系別,住址)學(xué)號(hào)F系別學(xué)號(hào)F住址例:R(S#,C#,GRADE,TNAME,TADDR)(S#,C#)TNAMEC#TNAME所以不屬于2范式改進(jìn):R1(S#,C#,GRADE)R2(C#,TNAME,TADDR)改進(jìn)前每個(gè)學(xué)生每選一門課將對(duì)應(yīng)一個(gè)老師名稱和地址造成數(shù)據(jù)冗余
16、第三范式(3NF),設(shè)R是一個(gè)關(guān)系模式,R屬于第三范式當(dāng)且僅沬是第二范式,且每個(gè)非主屬性都不傳遞依賴于碼。BCNF,當(dāng)且僅當(dāng)所有的決定因素都是候選碼。例:R2(C#,TNAME,TADDR)C#TNAME;(TNAMEC#),TNAMEC#TNAMETADDRC#TADDR所以,不屬于3范式改進(jìn):R2分成兩個(gè)關(guān)系模式R21(C#,TNAMER22(TNAME,TADDR)第四范式(4NF),當(dāng)且僅當(dāng)滿足BCNF,且沒有多值依賴。例:C(課程號(hào),課程名,先行課程)課程號(hào)課程名課程號(hào)先行課程一個(gè)低一級(jí)范式的關(guān)系模式,通過模式分解可以轉(zhuǎn)換為若干個(gè)滿足高一級(jí)的范式的關(guān)系模式的集合,這種轉(zhuǎn)換過程叫做規(guī)范
17、化2。1NF2F3NF-BCNF4NF消除非消除非消除主屬消除非主屬性主屬性性對(duì)鍵的凡且非對(duì)鍵的對(duì)鍵的部分和函函數(shù)依部分函傳遞函數(shù)傳遞依賴的多數(shù)依賴數(shù)依賴賴值依賴說明:敘述:積極參與電子商務(wù)建設(shè)的企業(yè),一方面須選擇適合自身的數(shù)據(jù)庫系統(tǒng)開發(fā)工具,另一方面須考慮如何同合作伙伴達(dá)成一致,保證統(tǒng)一性4、數(shù)據(jù)倉庫第一幫助企業(yè)作決策的體系化解決方案形成決策支持系統(tǒng)框架:DW+OLAQ+DM由三個(gè)獨(dú)立的信息處理技術(shù)組成,三者沒有內(nèi)在的依賴關(guān)系,但存在著一定聯(lián)系和互補(bǔ)性,結(jié)合起來發(fā)揮更大的作用1)數(shù)據(jù)倉庫:是一種只讀的用于分析的數(shù)據(jù)庫,是決策支持系統(tǒng)的底層,從大量的事務(wù)型數(shù)據(jù)庫中抽取數(shù)據(jù),轉(zhuǎn)換為新的存儲(chǔ)格式,
18、用于支持決策的目標(biāo)A、數(shù)據(jù)倉庫:支持管理決策過程的、面向主題的、集成的、隨時(shí)間變化的、信息本身相對(duì)而言穩(wěn)定的數(shù)據(jù)集合B、說明:a、“主題”一一使用數(shù)據(jù)倉庫輔助決策時(shí)所關(guān)心的重點(diǎn)項(xiàng)目問題b、面向主題一一數(shù)據(jù)倉庫中的信息按主題組織提供c、集成:數(shù)據(jù)經(jīng)過系統(tǒng)的加工整理,是相互一致的,具有代表性d、隨時(shí)間變化:一個(gè)時(shí)間段內(nèi)的數(shù)據(jù),是一種趨勢(shì)分析,而不是時(shí)間點(diǎn)上的數(shù)據(jù)(一般時(shí)限510年,數(shù)據(jù)量10GB左右)e、相對(duì)穩(wěn)定:數(shù)據(jù)一旦進(jìn)入倉庫,被長(zhǎng)期保存很少變更C、與數(shù)據(jù)庫區(qū)別:a、依據(jù)決策的要求(從數(shù)據(jù)庫中抽取有需要的數(shù)據(jù),并重新組織)b、多維的組織方式,有多層的行和列(從多個(gè)角度組織數(shù)據(jù),便于從多個(gè)角度進(jìn)
19、行分析)c、支持決策處理,不同于普通的事物處理D、技術(shù)保證:a、并行/分布式數(shù)據(jù)庫技術(shù)一一數(shù)據(jù)量大,提高工作效率b、高性能的數(shù)據(jù)庫服務(wù)器一一分析數(shù)據(jù),需要高性能的數(shù)據(jù)庫服務(wù)器配合工作c、數(shù)據(jù)庫互操作技術(shù)一一異構(gòu)數(shù)據(jù)源間的互操作(數(shù)據(jù)來源不同)2)聯(lián)機(jī)分析處理技術(shù)根據(jù)用戶的問題,提取信息,并能直觀的呈現(xiàn)給用戶A、概念:是針對(duì)特寫的問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析,對(duì)信息進(jìn)行快速穩(wěn)定一臻和交互式存取B對(duì)數(shù)據(jù)進(jìn)行多層次、多階段的分析處理,以獲得高度歸納的分析結(jié)果。是一種自上而下不斷深入的分析工具。C分類:一是基于多維數(shù)據(jù)庫的(形成多維數(shù)據(jù)庫,)一類是基于關(guān)系數(shù)據(jù)庫的(不形成多維數(shù)據(jù)庫只是模擬多維數(shù)據(jù))3)數(shù)
20、據(jù)挖掘技術(shù):A、基本思想:從數(shù)據(jù)中抽取有價(jià)值的信息,幫助決策者尋找數(shù)據(jù)間的潛在關(guān)聯(lián),發(fā)現(xiàn)被忽略的因素。支持預(yù)測(cè)趨勢(shì)和決策行為B、概念:從數(shù)據(jù)庫角度:數(shù)據(jù)挖掘是一個(gè)非平凡的過程,即數(shù)據(jù)挖掘既不是把數(shù)據(jù)全部抽取,也不是一點(diǎn)兒也不抽取,而是抽取出數(shù)據(jù)間隱含的、未知的、可能有用的信息。C、數(shù)據(jù)挖掘與聯(lián)機(jī)分析的區(qū)別:驅(qū)動(dòng)方式不同:聯(lián)機(jī)分析使用戶驅(qū)動(dòng)(,是一種驗(yàn)證性的分析),數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)驅(qū)動(dòng),是一種真正的知識(shí)發(fā)現(xiàn)方法(用戶不必提出確切要求,系統(tǒng)能根據(jù)數(shù)據(jù)本身的規(guī)律,自動(dòng)的挖掘出潛在的模式,幫助決策者調(diào)整市場(chǎng)策略,有利于發(fā)現(xiàn)未知的事實(shí)數(shù)據(jù)分析深度不同:聯(lián)機(jī)分析位于數(shù)據(jù)淺層次的,而挖掘技術(shù)是較深層次的。兩者主要差別在于能否自動(dòng)的進(jìn)行數(shù)據(jù)分析。聯(lián)機(jī)分析處理產(chǎn)品漸漸融入了數(shù)據(jù)挖掘方法它們之間的界限正逐漸模糊說明:A、數(shù)據(jù)倉庫解決了數(shù)據(jù)不統(tǒng)一的問題(從底層數(shù)據(jù)庫收集大量事務(wù)級(jí)數(shù)據(jù)同時(shí),對(duì)數(shù)據(jù)進(jìn)行集成、轉(zhuǎn)換和綜合,形成整個(gè)系統(tǒng)的數(shù)據(jù)基礎(chǔ))B、聯(lián)機(jī)分析處理從數(shù)據(jù)倉庫中的集成數(shù)據(jù)出發(fā),構(gòu)建面向分析的多給數(shù)據(jù)模型。用戶可以使用不同的方法從不同的角度對(duì)數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)分析方法和數(shù)據(jù)結(jié)構(gòu)的分離C、數(shù)據(jù)挖掘以數(shù)據(jù)倉庫和多維數(shù)據(jù)庫中的大量數(shù)據(jù)為基礎(chǔ),自動(dòng)發(fā)現(xiàn)數(shù)據(jù)中的潛在模式,以其為基礎(chǔ)自動(dòng)作出預(yù)測(cè)(四)、電子商務(wù)與數(shù)據(jù)庫技術(shù):數(shù)據(jù)庫技術(shù)對(duì)電子商務(wù)的支持是多方位的)1、電子
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年公共衛(wèi)生管理考核試題及答案
- 國際貿(mào)易實(shí)務(wù)與技巧2025年試題及答案
- 2025房屋買賣合同格式
- 2025商城合作合同模板
- 2025建筑設(shè)備租賃合同協(xié)議樣本
- 電子商務(wù)課程設(shè)計(jì)
- 機(jī)場(chǎng)頂棚施工方案
- 跨學(xué)科課程的開發(fā)與實(shí)踐計(jì)劃
- 模具維修保養(yǎng)協(xié)議書
- 關(guān)注社會(huì)責(zé)任的年度活動(dòng)計(jì)劃
- GB/T 23443-2024建筑裝飾用鋁單板
- 認(rèn)知重構(gòu)的應(yīng)用研究
- GB/Z 44789-2024微電網(wǎng)動(dòng)態(tài)控制要求
- 2025云南省高中學(xué)考會(huì)考英語詞匯單詞表(復(fù)習(xí)必背)
- 企業(yè)資產(chǎn)管理
- 配電網(wǎng)自動(dòng)化技術(shù)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 套管修復(fù)(2010大賽)
- 酒店工作安全培訓(xùn)(共60張課件)
- 初中七年級(jí)主題班會(huì):團(tuán)結(jié)合作團(tuán)結(jié)就是力量(課件)
- 新課標(biāo)背景下“教學(xué)評(píng)一體化”評(píng)的策略
- 浙江省杭州市2023年中考英語真題(含答案)
評(píng)論
0/150
提交評(píng)論