數據庫原理與應用:第1章 數據庫系統概述_第1頁
數據庫原理與應用:第1章 數據庫系統概述_第2頁
數據庫原理與應用:第1章 數據庫系統概述_第3頁
數據庫原理與應用:第1章 數據庫系統概述_第4頁
數據庫原理與應用:第1章 數據庫系統概述_第5頁
已閱讀5頁,還剩85頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數據庫系統原理與應用 第一講 第1章 數據庫系統概述一、信息與數據1.“信息”是對現實世界事物存在方式或運動狀態的反映。信息具有可感知性、可表述性、可存儲性、可加工性和可轉換性、可傳遞性、可共享性、以及與其符號的不可分離性。第1章 數據庫系統概述2.“數據”是用符號表示的,用于反映客觀世界中客體屬性的記錄。數據是用于載荷信息的物理符號。數據的4個特征:1)數據有“型”和“值”之分。2)數據受數據類型和取值范圍的約束。3)數據有定性表示和定量表示之分。4)數據應具有載體和多種表現形式。第1章 數據庫系統概述3.信息與數據聯系數據是信息的符號表示,信息是經過加工之后并對客觀世界和生產活動產生影響的

2、數據,是數據的內涵,是數據的語義解釋。數據是符號化的信息,信息是語義化的數據 數據和信息許多情況下可以混用,比如信息處理和數據處理有時并沒有嚴格的語義區別;但有時卻必須加以區分,比如數據文件不能說成信息文件。 4、數據管理與數據處理 數據管理(Data Management) 包括組織和保存數據、進行數據維護、提供數據查詢和統計功能這三方面。 數據處理(Data Processing) 包括數據管理、數據加工、數據傳播等工作。第1章 數據庫系統概述第1章 數據庫系統概述數據管理技術經歷了人工管理、文件系統和數據庫系統三個階段。 二、數據管理技術的發展第1章 數據庫系統概述1.人工管理階段(20

3、世紀50年代中期以前)特點:1)數據不保存2)程序與數據合在一起,數據沒有獨立性3)編寫程序時要安排數據的物理存儲4)數據面向應用第1章 數據庫系統概述1 9 5 1 年雷明頓蘭德公司(Remington Rand Inc.)的一種叫做Univac I 的計算機推出了一種一秒鐘可以輸入數百條記錄的磁帶驅動器,從而引發了數據管理的革命。1956 年IBM生產出第一個磁盤驅動器 the Model 305 RAMAC。此驅動器有50 個盤片,每個盤片直徑是2 英尺,可以儲存5MB的數據。使用磁盤最大的好處是可以隨機地存取數據,而穿孔卡片和磁帶只能順序存取數據。 第1章 數據庫系統概述2. 文件系統

4、階段(20 世紀50年代后期至60年代中期)特點: 1)數據以文件形式長期保存 2)數據的物理結構與邏輯結構有了區別 3)文件形式多樣化 4)程序與數據間有一定的獨立性缺點:不能表示復雜的數據結構,存在數據重復存儲、冗余度大、一致性差等問題。第1章 數據庫系統概述數據庫系統的萌芽出現于60 年代。當時計算機開始廣泛地應用于數據管理,對數據的共享提出了越來越高的要求。傳統的文件系統已經不能滿足人們的需要。能夠統一管理和共享數據的數據庫管理系統(DBMS)應運而生。數據模型是數據庫系統的核心和基礎,各種DBMS 軟件都是基于某種數據模型的。 第1章 數據庫系統概述3.數據庫系統階段(20 世紀60

5、年代后期以后)特點: 1)數據結構化 2)數據共享 3)減少了數據冗余 4)有較高的數據獨立性 5)用數據庫管理系統作為用戶與數據庫的接口數據庫DBMS邏輯文件1邏輯文件2邏輯文件3程序1程序2程序3第1章 數據庫系統概述三、數據庫系統的組成與結構數據庫管理系統DBMS數據庫應用系統操作系統應用開發工具用戶用戶用戶.數據庫管理員第1章 數據庫系統概述1.數據庫(Database) 數據庫簡稱DB,是在計算機存儲設備上按一定的組織方式存儲在一起的,相關的數據集合。數據庫中的存儲數據是“集成的”和“共享的” 1) 數據庫系統具有整體數據結構化和數據冗余小的特點。 2) 數據庫中的數據可為多個不同的

6、用戶共享。 數據庫概念的含義: (1)數據庫是存儲在計算機存儲設備上的: 數據庫是存在于計算機存儲設備上的一個或多個(數據庫)文件組成的統一體,是可感知的數據庫形體。 (2)數據庫是按一定的組織方式存儲在一起的: 數據庫中的數據是以結構化的形式存儲的,這種結構化形式實質上就是數據庫的數據模型,是不可感知的數據庫形體。第1章 數據庫系統概述(3)數據庫是相關的數據集合: 數據庫中的數據既有某特定應用領域涉及的各種基本數據,也有反映這些數據之間聯系的數據,也是不可感知的數據庫形體之一。 第1章 數據庫系統概述第1章 數據庫系統概述2. 數據庫管理系統(DBMS) 是建立、管理和維護數據庫的軟件系統

7、,是一種位于應用軟件和操作系統之間,實現數據庫管理功能的系統軟件。 第1章 數據庫系統概述四、數據庫系統的體系結構應用程序應用軟件包(用戶接口)DBMS操作系統(OS)硬件(DB)存儲記錄接口第1章 數據庫系統概述1. 數據庫的三級模式結構 美國國家標準學會所屬標準計劃和要求委員會在1975年公布了一個關于數據庫標準的報告,提出了數據庫三級模式結構。 1)概念模式(Logical Schema) 是對DB中全部數據的整體邏輯結構和特征的描述,體現了全局、整體的數據觀點。 概念模式的主體是數據庫的數據模型; 一個DB只有一個與數據模型對應的概念模式; 概念模式僅涉及“型”的描述,不涉及具體的值。

8、第1章 數據庫系統概述 2)外模式(External Schema) 是對DB用戶能看見和使用的局部數據邏輯結構的描述,體現了應用程序員對數據庫的數據觀點。 外模式是用戶和DB的接口; 一個DB可有多個外模式; 外模式是保證DB安全性的措施之一。第1章 數據庫系統概述 3)內模式(Internal Schema) 是對數據庫物理存儲結構的描述,體現了對數據庫的存儲觀。 一個DB只有一個與概念模式對應的內模式。內模式是數據在數據庫內部的表示,它定義了數據的內部記錄類型、記錄尋址技術、索引和文件的組織方式及數據控制方面的內容。第1章 數據庫系統概述模式結構內模式概念模式外模式DB數據抽象物理層邏輯

9、層視圖層低復雜性強易用性簡單結構抽象地訪問數據高效地存儲數據邏輯地組織數據第1章 數據庫系統概述第1章 數據庫系統概述2. 三個模式間的映像 1) 外模式/模式的映象:定義并保證了外模式與數據模式之間的對應關系。 保證了數據的邏輯獨立性 當數據庫的概念模式結構因某種原因修改時,只要沒有改變概念模式中與外模式定義有關的屬性及與其關系模式名的隸屬關系,就可使外模式保持不變,從而不需修改應用程序。第1章 數據庫系統概述 2) 模式/內模式的映象及作用:定義并保證了數據的邏輯模式與內模式之間的對應關系。 保證了數據的物理獨立性 當數據庫的內模式由于某種原因要修改時,可通過對概念模式與內模式之間的映象的

10、修改,使概念模式盡可能地保持不變,實現內模式的改變盡可能地不修改應用程序。應用程序A1應用程序A2應用程序B1應用程序B2用戶A1用戶A1外模式A外模式B外模式到模式的映象A外模式到模式的映象B概念模式模式到內模式的映象內模式數據庫局部邏輯結構概念級DB全局邏輯結構存儲級DB存儲組織結構DBMSOS用戶級DB用戶A1用戶A1需要強調的是: 數據庫三級模式之間的轉換是在數據庫管理系統(DBMS)的統一控制下實現的。第1章 數據庫系統概述第1章 數據庫系統概述三級模式間的比較外模式概念模式內模式其他名字子模式、用戶模式、外視圖模式、概念視圖、DBA視圖存儲模式、內視圖描述數據庫用戶能看見和使用的局

11、部數據的邏輯結構數據庫中全體數據的邏輯結構數據物理結構和存儲方式的描述特點用戶與數據庫的接口所有用戶的公共數據視圖數據在數據庫內部的表示方式可以有多個外模式只有一個概念模式只有一個內模式面向應用程序或最終用戶由DBA定義基本由DBMS定義第1章 數據庫系統概述五、數據庫管理系統(DataBase Management System) 數據庫管理系統是專門用于管理數據庫的計算機系統軟件。能夠為數據庫提供數據的定義、建立、維護、查詢和統計等操作功能,并完成對數據完整性、安全性進行控制的功能。第1章 數據庫系統概述數據定義功能 提供數據定義語言(DDL)2. 數據操縱功能提供數據操縱語言(DML),

12、實現檢索、插入、修改和刪除等基本存取操作數據庫的建立和維護功能 包括初試數據的裝入,數據庫的存儲、恢復,系統性能的監視和分析等4. 數據庫的運行管理功能數據的安全性、完整性和并發控制第1章 數據庫系統概述六、常見數據庫1.IBM的DB2IBM在1977年完成了System R系統的原型 2. Oracle 1979 年引入了第一個商用SQL 關系數據庫管理系統3. Sybase 1987年5月推出1.0。首先提出Client/Server 數據庫體系結構的思想,并率先在Sybase SQLServer 中實現第1章 數據庫系統概述4.SQL Server 1989年,微軟發布了SQL Serv

13、er 1.0 版5. mySQL 小型關系型數據庫管理系統,開發者為瑞典MySQL AB公司。在Internet上的中小型網站中應用廣泛6.Access 1994年推出的微機數據庫管理系統。具有界面友好、開發簡單等特點,是典型的桌面數據庫管理系統 7.Foxpro 最初由美國Fox公司1988年推出,1992年被Microsoft公司收購第2章 數據模型 2.1 數據模型 2.2 概念模型 2.3 數據庫類型現實世界信息 現實世界是存在于人們頭腦之外的客觀世界。 現實世界既包括象宇宙、地球、山脈、河流等一切自然存在的實體和現象,也包括人類社會進步與發展的演變過程和各種生產活動。 所以可狹義地將

14、現實世界看作為各個事物、各個現象、各個單位的實際情況,例如一個大學、一個企業、一個工廠的倉庫等。2.1數據模型 計算機現實世界信息對數據和信息的處理是在計算機世界數據世界完成的。2.1數據模型 計算機現實世界信息?信息世界 信息世界是現實世界在人們頭腦中的反映和解釋,是現實世界的概念化。2.1數據模型 計算機現實世界信息信息世界概念模型概念化抽象 通過對現實世界中人們關心的“事物”及其之間聯系的概念化抽象,形成了信息世界中的概念模型。2.1數據模型 計算機現實世界信息信息世界概念模型概念化抽象DBMS支持的數據模型形式化轉換2.1數據模型2.1數據模型 計算機現實世界信息信息世界概念模型概念化

15、抽象DBMS支持的數據模型形式化轉換 進一步講,概念模型向DBMS支持的數據模型的轉換,本質上是對信息世界的進一步抽象,是信息世界的形式化和數據化,反映了數據之間的聯系和數據的共性特征,由此形成了由數據模型描述的數據世界,也即計算機世界。 數據模型是現實世界中的各種事物及各事物之間的聯系用數據及數據間的聯系來表示的一種方法。 一個數據庫的數據模型實際上給出了在計算機系統上進行描述和動態模擬現實世界信息結構及其變化的方法。2.1數據模型 數據模型定義為一組面向計算機的概念集合,由數據結構、數據操作、數據約束三部分組成:數據結構:包括應用所涉及的對象、對象具有的特征和對象間的聯系。是對數據庫靜態特

16、征的描述。數據操作:是一組對數據結構的任何實例執行的操作集合,如查詢、插入、刪除、修改,反映了數據的動態特性。數據約束:是對數據靜態特征和動態特性的限定,定義了相容的數據庫狀態的集合及可允許的狀態變化,保證了數據庫中數據的正確、有效和安全。 2.1數據模型先自學,以后重點講。2.2概念模型2.3數據庫類型數據庫技術的三個發展階段: 層次模型、網狀模型、關系模型從60 年代末到70年代初的三個事件為代表, 標志了數據庫技術日趨成熟第一個事件:1969年, IBM公司研制開發了Information Management System(IBS)數據庫管理系統。IBS是層次結構的數據庫模型。層次模型

17、的特征 1) 有且僅有一個結點沒有雙親結點,這個結點稱為根結點。 2) 除根結點之外的其他結點有且只有一個雙親結點。2.3數據庫類型系教務管理層次模型實體聯系2.3數據庫類型系教務管理層次實例2.3數據庫類型層次模型的優點:(1)結構清晰,容易理解;(2)結點間聯系簡單,記錄之間的聯系通過指針來實現,查詢效率較高。 現實世界中的家族和組織機構關系, 都是自然的層次結構, 用層次模型來組織數據, 查詢數據的算法很簡便, 因為查詢的路徑是唯一的。但它不能描述事物間復雜的聯系。 層次模型只能表示一對多(包括一對一)的聯系,對于多對多聯系,需要分解成一對多的聯系。2.3數據庫類型第二個事件:60年代末

18、、70年代初, 美國數據系統語言協商會下屬的數據庫任務組(DBTG), 對數據庫方法進行了系統的研討后提出報告, 稱為DBTG報告。DBTG報告確定并建立了數據庫系統的許多概念、方法和技術, 標志了網狀結構的數據庫模型的誕生。2.3數據庫類型網狀模型結構的特征 1) 有一個以上的結點沒有雙親。 2) 結點可以有多于一個的雙親。 在現實世界中, 比如存款戶與銀行的聯系, 一個用戶可在多個銀行開戶, 而一個銀行可為多個用戶開戶, 網狀模型可用于描述這類較為復雜的結構, 但由于到達一個結點的路徑有多條, 開發者必須選擇較優的數據存取路徑, 因此開發者必須了解系統結構的細節, 加重了其編寫應用程序的負

19、擔。2.3數據庫類型 學生選修課網狀模型2.3數據庫類型 學生選修課網狀模型實例2.3數據庫類型網狀模型的優點: 在網狀模型中,結點間的聯系更具有任意性,更能表示事物之間的復雜聯系,更適合于描述客觀世界。數據結構復雜,數據獨立性差。2.3數據庫類型層次模型和網狀模型是數據庫發展過程中最先使用的兩種模型,但由于他們都有非常明顯的不足,已經被關系模型所取代。2.3數據庫類型第三個事件:1970年, IBM公司San Jose研究實驗室的研究員E.F.Codd發表了一篇里程碑性的文章“A Relational Model of Data for Large Shared Data Banks” ,大

20、型共享數據庫的關系模型。在該文中, 他把數學中的一個稱為關系代數的分支, 應用到存儲大量數據的問題中。他連續發表了多篇論文, 系統而嚴格地提出了關系模型的理論, 最終奠定了現代關系型數據庫管理系統的(RDBMS)的理論基礎。2.3數據庫類型Edgar F.Codd 博士關系數據庫之父美國工程院院士 原是英國人,1923生于英格蘭中部波特蘭 第二次世界大戰時應征入伍,在皇家空軍服役。1942-1945年間任機長,參與了許多驚心動魄的空戰。 英國牛津大學數學專業理學士及碩士學位,畢業后到IBM公司工作從事操作系統和自動機理論研究 年近40重返密歇根大學進修計算機與通信專業,1963年獲得碩士學位,

21、1965年又獲得博士學位。 60年代后期開始數據庫研究, 1970年E.F.Codd 博士提出關系模型概念(CACM,Vol.13, Vol.6, 1970 ) 1981年獲圖靈獎,84年從IBM公司退休 還創辦了一個研究所:關系研究所(The Relational Institute)和一個公司:Codd & Associations,進行關系數據庫產品的研發、銷售、咨詢等業務關系模型是一種用二維表格結構表示數據及數據之間聯系的數據模型。其關系模式是: 學生(學號,姓名,年齡,性別,系,年級)2.3數據庫類型關系數據模型的特點:1)關系數據模型具有嚴格的數學理論基礎2)關系數據模型概念單一,

22、容易理解3)關系數據模型的存取路徑對用戶隱蔽4)關系模型中的數據是靠數據冗余實現的其關系模式是: R(A1,A2,An) R是關系名,Ai(i=1,2,n)是關系的屬性2.3數據庫類型 關系模型的優點: (1)模型結構簡單清晰,容易為初學者接受。 (2)用戶只需用簡單的查詢語句就可以對數據庫進行操作,不涉及存儲結構、訪問技術等細節。 (3)關系模型使數據庫的研究建立在比較堅實的數學基礎上,為數據庫技術的成熟奠定了基礎。2.3數據庫類型 關系模型的缺點: (1)查詢效率可能不如非關系模型,要對用戶的查詢進行優化。 (2)關系必須是規范化的,不允許表中有表。2.3數據庫類型第章 關系數據庫 3.1

23、 關系模型的基本概念 3.2 關系的數學定義 3.3 關系代數 3.1 關系模型的基本概念關系 元組 屬性域關系模式候選碼(候選關鍵字)主碼(主關鍵字)主屬性外碼(外關鍵字)全碼舉例:關系:一個關系就是一張二維表 每個關系有一個關系名,比如學生登記表元組:表中的每一行即為一個元組,即一條記錄屬性:表中的列稱為屬性,每一列有一個屬性名,即字段、字段名。3.1 關系模型的基本概念元組屬性注:元組、屬性,是關系模型的術語, 對應于存儲文件的名詞為記錄、字段。舉例:1,2,3,4,5域域:屬性的取值范圍。 即不同元組對同一個屬性的值所限定的范圍。關系模式:對關系的描述稱為關系模式 關系名(屬性1, 屬

24、性2, ., 屬性n)一個關系模式對應一個關系文件結構 學生登記表(學號# , 姓名, 年令,性別,系名,年級)候選碼(或候選關鍵字、碼):屬性或屬性的組合,其值能夠唯一地標識一個關系中的一個元組。 本例候選碼是:學號(由于姓名可能重碼) 本例有二個候選碼:學號、身份證號舉例:候選碼也可以是屬性的組合,如關系:郵寄地址(城市名,街道名,郵政編碼) 其候選碼: 城市名,街道名 和 街道名,郵政編碼3.1 關系模型的基本概念主碼(或主關鍵字):一個關系中若有多個候選碼,從中選擇一個為主碼 本例候選碼有二個:學號、身份證號,可選學號為主碼 唯一性 非冗余 有效性主屬性:包含在主碼中的諸屬性稱為主屬性

25、 本例主碼是學號,學號是主屬性 不屬于任何候選碼中的屬性稱為非主屬性。外碼(或外關鍵字): 如關系R2中的屬性或屬性組X,是另一個關系R1的主碼,則X稱為R2的外碼,關系R2為參照關系,關系R1為被參照關系。 2(商品編號# , 商品名稱, 大類編號) 1(大類編號# , 大類名)主碼外碼外碼是用來表示多個關系聯系的方法 全碼:當所有屬性都是一關系模式的候選碼,稱為全碼 本例候選碼有二個:學號、身份證號,可選學號為主碼討論:主碼由多個屬性組合(學號 , 姓名 , 性別 , 課程編號 , 課程名 , 成績 ,績點 )#屬性組學號與課號是關系的主碼 關系 R11的主碼是電影編號 關系 R2不同場次

26、不同價2的主碼是電影編號+場次 關系 R33的主碼: 電影編號+場次+場所不同場次、不同場所不同價3.2 關系的數學定義域 域是一組具有相同數據類型的值的集合笛卡爾積 設定一組域D1,D2,Dn,定義D1,D2,Dn的笛卡爾積為:D1D2Dn= (d1,d2,dn)|diDi,i=1,n其中每個元素(d1,d2,dn)叫做一個n元組,元素中的每個值di叫做一個分量例:設D1=李兵,王芳,D2=男,女, D3=北京,上海。D1D2D3=(李兵,男,北京),(李兵,男,上海),(李兵,女,北京),(李兵,女,上海),(王芳,男,北京),(王芳,男,上海),(王芳,女,北京),(王芳,女,上海)基數為222=8。3.2 關系的數學定義可見,笛卡兒積實際上是一個二維表,結果共有8個元組。 姓名(D1)性別(D2)籍貫(D3)李兵男北京李兵男上海李兵女北京李兵女上海王芳男北京王芳男上海王芳女北京王芳女上海3.2 關系的數學定義3.2 關系的數學定義關系關系是笛卡爾積的有限子集,關系中的每個元素是關系中的元組。笛卡兒積D1D2Dn的任一子集稱為在域D1,D2,Dn上的關系。值域集合D1,D2,Dn是關系中元組的取值范圍,稱為關系的域(Domain),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論