數據管理技術_第1頁
數據管理技術_第2頁
數據管理技術_第3頁
數據管理技術_第4頁
數據管理技術_第5頁
已閱讀5頁,還剩57頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、問題一:在一個系,有一張學生選課表(學號,課程號,選修課程,成績),記載著該系學生的選課情況。該系的教學秘書需要查詢和統計某些學生的修課情況、各門課程的成績、平均成績;需要查詢和統計選修了某門課程的學生、課程的平均成績、成績的分布情況問題二:在一個大學,有一張學生選課表(學號,課程號,選修課程,成績),記載著該校學生的選課情況,學生基本信息表(學號,姓名,性別,所屬系,電話號碼),記載該校學生的信息,開設課程表(課程號,課程名,課程類別,學分),記載該校開設的課程信息。學生工作處需要查詢和統計各系、各性別學生人數的分布情況、平均成績的分布情況,以及重修學生的人數和比例;學校教務處需要查詢和統計

2、各系開設的課程總門數,不同類別的課程門數、總學分數,各課程選修的學生總數和平均成績。問題三:一個大學有多個管理部門:學生工作處、人事處、財務處、教務處、房管處、設備處、校長辦公室,負責對全校的學生、職工、財務、教學、房產、設備、校日常事務進行管理;有多個學院:計算機學院、數學學院、生命科學學院、法學院、商學院,分別負責對本院學生、教學、教師、設備等進行管理.這三個問題為什么感覺越來越困難?從問題一至問題三,為什么感覺越來越困難?用戶越來越多數據量和范圍越來越大需求越來越復雜數據管理對數據進行分類、組織、編碼、存儲、檢索和維護,是數據處理的中心問題。數據管理技術的目標就是合理地組織數據、有效地存

3、取數據,為此必須解決下列問題: 存儲介質 數據的表示 數據的操作 數據的管理NumberNameCourseDateGrade9525012ZhangYanMIS1998.9A9525018Jeff YuMIS1998.9A9525027He HuiMIS1998.9B數據庫是目前最有效的數據管理工具,成為現代管理信息系統的核心和基礎數據庫是目前最有效的數據管理工具,成為現代管理信息系統的核心和基礎數據的組織數據的組織1數據庫與數據管理數據庫與數據管理2數據倉庫與分析處理數據倉庫與分析處理3數據組織的層次性文件文件(File)記錄記錄(Record)RecordFieldFiled域域(Fie

4、ld)FieldByte字節字節(Byte)ByteByteBitBit位位(Bit)Bit物理組織物理組織位位字節字節字符字符技技術術界界面面字符字符域域(數據數據項項)記錄記錄文件文件邏輯組織邏輯組織員工員工對數據的有效組織和管理,關鍵在于在各個層次上建立數據世界與現實世界的準確、完善的對應關系,并以恰當、高效的手段來安排數據世界的各個層次數據的組織數據的組織1數據庫與數據管理數據庫與數據管理2數據倉庫與分析處理數據倉庫與分析處理3 在應用需求的推動下,在計算機硬件、軟件發展的基礎上,數據管理技術經歷了人工管理、文件系統、數據庫系統三個階段。在50年代中期以前,計算機主要用于科學計算。 硬

5、件狀況是,外存只有紙帶、卡片、磁帶,沒有磁盤等直接存取的存儲設備; 軟件狀況是,沒有操作系統,沒有管理數據的軟件;人工管理數據具有如下特點: 數據不保存 數據不共享 應用程序管理數據(1) 人工管理階段(自由管理階段)50年代后期到60年代中期 硬件方面已有了磁盤、磁鼓等直接存儲設備; 軟件方面,操作系統中已經有了專門的數據管理軟件,一般稱為文件系統用文件系統管理數據具有如下特點: 數據可以長期保存 由文件系統管理數據(2) 文件系統階段注冊系統注冊系統會計系統會計系統勤工儉學系統勤工儉學系統注冊程序注冊程序學生文件學生文件會計程序會計程序學生文件學生文件學生文件學生文件勤工儉學程序勤工儉學程

6、序缺點:數據冗余缺點:數據冗余數據不一致數據不一致數據獨立性差數據獨立性差60年代后期以來,計算機用于管理的規模越來越大,應用越來越廣泛,數據量急劇增長,同時多種應用、多種語言互相覆蓋地共享數據集合的要求越來越強烈。數據由數據庫管理系統DBMS統一管理和控制數據庫系統管理具有如下特點: 數據的共享性高 冗余度低(3) 數據庫系統階段注冊系統注冊系統會計系統會計系統勤工儉勤工儉學系統學系統注冊程序注冊程序會計程序會計程序 勤工儉學程序勤工儉學程序DBMS數據庫數據庫1.數據庫所謂數據庫是長期儲存在計算機內、有組織的、可共享的數據集合 長期是指數據永久保存,不是轉瞬即逝的 有組織是指按照某種數據模

7、型如關系模型進行存儲 可共享是數據庫中的數據可以被不同的用戶共享。每個用戶可以因不同的目的而訪問相同的數據,甚至可以同時訪問同一數據 例如:產品數據庫,銀行數據庫,。數據庫兩個主要目標是減少冗余和獲得數據獨立性減少數據冗余 冗余就是數據的重復; 冗余數據意味著對某些事實的修改必須在多處進行,否則它們的值不相等,很難確定哪一個值是正確的。 獲得數據獨立性 在對數據結構進行修改時,不必修改處理該數據的應用程序2.數據庫管理系統數據庫管理系統(DataBase Management System, DBMS)是用于在數據庫中創建、存儲、組織和讀取數據的一類特殊軟件 Access是個人電腦使用的DBM

8、S Oracle和SQL Server是在大中型主機上使用的DBMS MySQL是一種流行的開源DBMS數據庫管理系統的功能(1)數據定義 定義數據庫中數據的結構,主要用于建立數據庫表和定義表中字段的屬性【例】CREATE TABLE student(name CHAR(10),) 建立一個名為student的學生表,其屬性包括學生姓名等各項信息(2)數據字典 存儲關于數據庫結構的元數據,即數據的數據 如某一個字段的名稱、描述、大小、類型以及格式等信息(3)數據操縱 實現數據庫中有關數據的各種操作,包括數據插入、修改、刪除以及查詢 現在最常用的數據操縱語言是結構化查詢語言SQL【例】 SELE

9、CT name FROM student WHERE age203.關系數據庫 (1) 數據模型現實世界信息世界數據世界人們頭腦之外的客觀世界,它包含客觀人們頭腦之外的客觀世界,它包含客觀事物及其相互聯系。事物及其相互聯系。信息世界,是現實世界在人們頭腦中信息世界,是現實世界在人們頭腦中的反映。的反映。現實世界中的事物及其聯系,在數據世界現實世界中的事物及其聯系,在數據世界中用數據模型描述。中用數據模型描述。信息的轉換過程客觀客觀 事物類:事物類:事物事物 相關性質集合相關性質集合人人實體實體 實體集合實體集合及及 實體實體聯系聯系 相關屬性集合相關屬性集合 加工、轉換加工、轉換數數 文件文件

10、據據 記錄記錄庫庫 相關數據項集合相關數據項集合加工加工轉換轉換存儲存儲 二進制數據集合二進制數據集合結構結構計算機世界計算機世界DBMS數據世界數據世界DBMS的數的數據模型據模型信息世界信息世界認識選擇描述認識選擇描述現實世界現實世界E-R模型模型DBMS的數據模型 在數據庫系統中,對現實世界中數據的抽象、描述以及處理等都是通過數據模型來實現的。 層次模型,網狀模型,關系模型ABCDEF 關系模型(Relational Model)美國IBM公司的E.F.Codd,從1970年起連續發表了多篇論文,提出關系模型,奠定了關系數據庫的理論基礎關系模型用二維表表示實體與實體之間聯系的模型在關系模

11、型下,數據的邏輯結構是二維表學號學號 姓名姓名 班級班級 性別性別 981233 張三 MBA981 男 981236 李四 MBA981 女 981237 王五 MBA982 男 981240 趙六 MBA982 男 關系模型中的主要術語包括: 關系關系(relationrelation):對應于實體集合的二維表;):對應于實體集合的二維表; 元組元組(tupletuple):也稱為記錄():也稱為記錄(recordrecord),即二維表中的),即二維表中的一行,對應于一個實體;一行,對應于一個實體; 屬性屬性(attributeattribute):即二維表中的一列,代表實體的一):即二

12、維表中的一列,代表實體的一個數據側面,屬性在元組上的取值就是數據項;個數據側面,屬性在元組上的取值就是數據項; 關系模式關系模式:即對關系的描述,用關系名(屬性:即對關系的描述,用關系名(屬性1 1,屬性,屬性2 2,屬性,屬性n n)的形式表達。)的形式表達。 主碼主碼/ /主關鍵字主關鍵字(key)(key):唯一標識每條記錄的屬性:唯一標識每條記錄的屬性完整性約束是為保證數據庫中數據的正確性.(1) 完整性約束實體完整性 每一條數據記錄都應該具有身份標識 在數據庫中,每個數據庫表都應當含有一個不能為空且無重復的主碼學號學號 姓名姓名 班級班級 性別性別 981233 王五MBA981 女

13、 981236 李四 MBA981 女 981233 王五 MBA982 男 趙六 MBA982 男 參照完整性 反映數據屬性值之間的某種“存在性”關系 子表中的值存在時,其所參照的父表中的值應當已經存在,否則,參照完整性遭到破壞用戶自定義完整性(屬性的值類型和值域):決定該屬性的基本數據特征 屬性為“月份”,則該屬性的類型為整型數字,并且取值范圍在1, 2, 3, ,12之中 屬性為“性別”,則取值應在“男”,“女”之中 數據依賴關系反映數據屬性值之間的“對應”關系。以函數依賴為例,屬性組B依賴于屬性組A(記為AB)是指:如果任兩條記錄的A值相等,則必有相等的B值與之相對應。換句話說,AB反

14、映了“相等的B值對應相等的A值”這樣的語義。(2) 數據依賴關系插入異常:在沒有采購這個產品時,它的價格無法輸入刪除異常:在刪除了有關某產品的最后一條訂單時,其價格信息也被刪除冗余度大:如果某項產品有多條訂單,價格被存儲多次Orders字段例子訂單編號產品編號訂購日期價 格001A0012000-2-3$29.00 Orders字段例子訂單編號訂購日期0012000-2-3產品編號 A001Products字段例子產品編號價 格A001$29.00實體聯系模型反映的是信息世界中的實體及其相互聯系。圖書作者寫作出版社類別頁數ISBN*書名姓名出生地身份證號*定稿時間價格實體(Entity) 現實

15、世界中存在的對象和事物。屬性(Attribute) 屬性指實體具有的某種特性。(1) 基本概念實體名稱實體名稱表示方法:表示方法:表示方法:表示方法:屬性屬性實體名稱實體名稱屬性屬性2屬性屬性n屬性屬性1聯系 現實世界的事物總是存在著這樣或那樣的聯系。表示方法:表示方法:一對一聯系 如果對于A中的一個實體,B中至多有一個實體與其發生聯系,反之,B中的每一實體至多對應A中一個實體,則稱A與B是一對一聯系。 (2) 聯系類型系系系主任系主任任職任職11病區病區科室主任科室主任任職任職11一對多聯系 如果對于A中的每一實體,實體B中有一個以上實體與之發生聯系,反之,B中的每一實體至多只能對應于A中的

16、一個實體,則稱A與B是一對多聯系。 (2) 聯系類型AB聯系聯系1n聯系聯系教研室教研室教師教師1n多對多聯系 如果A中至少有一實體對應于B中一個以上實體,反之,B中也至少有一個實體對應于A中一個以上實體,則稱A與B為多對多聯系AB聯系聯系mn教師教師學生學生教學教學mn出版社出版社類別類別頁數頁數ISBN*書名書名姓名姓名出生地出生地身份證號身份證號*定稿時間定稿時間價格價格1、利用分類、聚集、概括等方法抽象出實體,并一一、利用分類、聚集、概括等方法抽象出實體,并一一命名。命名。2、描述實體之間的聯系、描述實體之間的聯系3、實體屬性和聯系屬性的說明、實體屬性和聯系屬性的說明mn 支持ER模型

17、-關系數據庫之間轉換的開發工具:ERWin Oracle DeveloperSybase PowerDesigner 圖 5 9 ER模型與關系數據庫結構數據庫也是一種軟件,所以數據庫的發展趨勢在總體上與軟件的發展趨勢是一樣的 越來越自然,人使用起來越來越方便發展方向從三方面來看數據的組織數據的組織1數據庫與數據管理數據庫與數據管理2數據倉庫與分析處理數據倉庫與分析處理3信息處理的任務信息獲取信息獲取從企業內從企業內部和外部部和外部獲得最為獲得最為基本的信基本的信息息將企業中將企業中的信息以的信息以最有效的最有效的方式提交方式提交給其他實給其他實體體對已有的對已有的信息進行信息進行處理以獲處理

18、以獲得新的信得新的信息息將有用的將有用的信息存儲信息存儲起來起來信息傳遞信息傳遞信息創造信息創造信息存儲信息存儲信息通信信息通信通過媒體通過媒體將信息傳將信息傳遞給他人遞給他人或另一地或另一地點點企業業務和管理企業業務和管理決策的核心內容決策的核心內容OLTP (Online Transaction Processing) 主要用于快速有效的處理日常的、重復性的數據,產生的結果主要是業務報告OLAP (Online Analytical Processing) 加入了對累積數據的分析,由最終用戶分析,將戰略信息放在決策者手上一個好的系統能夠支持用戶方便的查詢數據,也能快捷、準確、有效地支持決策

19、即把一個組織中的歷史數據收集到一個中央倉庫中以便于處理;是支持決策過程的、面向主題的、集成的、隨時間而變的、持久的數據集合;是OLAP應用的環境和基礎;是當今信息管理中的主流趨勢之一。 (1) 數據倉庫(data warehouse, DW)35數據倉庫體系結構其它數據源元數據存儲監控和管理OLAP服務器分析操作數據庫提取轉換數據倉庫服務查詢/報告裝入刷新數據集市數據挖掘數據源數據存儲OLAP引擎前端工具數據倉庫和數據庫系統 對 比 內 容 數 據 庫 數 據 倉 庫數據內容當前值歷史的、存檔的、歸納的、計算的數據數據目標面向業務操作程序,重復處理面向主題域,分析應用數據特性動態變化,按字段更

20、新靜態、不能直接更新,只能定時添加、刷新使用頻率訪問量高,少量記錄低,海量記錄對響應時間的要求以秒為單位時間長主要用戶基層業務人員和管理人員高層決策人員【例】假設你的公司在東部、西部和中部地區銷售四種不同的產品螺母、螺釘、墊圈和螺絲釘。如果你提問: 東部地區上一個季度墊圈的銷售量通過查詢銷售數據庫可以容易地找到答案 每個地區的每種產品銷售量以及實際銷售量與預計銷售量的比較結果多維數據立方體(Cube)如果在各個維度的取值范圍內逐點進行標注,則可以得到“數據立方體”預期銷量預期銷量實際銷量實際銷量螺母螺母螺釘螺釘螺圈螺圈螺絲釘螺絲釘東部東部西部西部中部中部不同的管理者可以從不同的維度(即視角)去考查這些數據銷售數據區域經理區域經理財務經理財務經理產品經理產品經理其他視角其他視角數據倉庫的多維查詢方式數據倉庫的多維查詢方式切片切片旋轉旋轉切塊切塊下鉆下鉆上卷上卷【例例】AllElectronics匯總匯總數據立方體數據立方體三維:三維:Address(溫哥華溫哥華,多倫多多倫多,紐約紐約,芝加哥)芝加哥)Time(Q1,Q2,Q3,Q4),),Item(家庭娛樂,計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論