數據庫第一講數據庫基礎知識_第1頁
數據庫第一講數據庫基礎知識_第2頁
數據庫第一講數據庫基礎知識_第3頁
數據庫第一講數據庫基礎知識_第4頁
數據庫第一講數據庫基礎知識_第5頁
已閱讀5頁,還剩51頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一講

數據庫基礎知識賀金平教學內容1.1數據庫基礎1.1.1數據和信息1.1.2數據處理與數據管理1.2數據庫技術的發展1.2.1人工管理階段1.2.2文件系統階段1.2.3數據庫系統階段1.3數據模型1.3.1數據模型概念1.3.2實體聯系模型1.3.3三種常見的數據模型1.4數據庫系統1.5關系模型1.5.1關系模型術語1.5.2關系運算目標與重點學習目標掌握數據庫、數據庫管理系統、數據庫系統概念掌握理解關系模型相關概念(關系、實體、屬性、主鍵、外鍵等)掌握ER圖的繪制方法掌握關系運算(并、交、差,選擇、投影、聯接)重點與難點關系模型相關概念的理解關系運算E-R圖的繪制1.1數據庫概述1963年,美國Honeywell公司的IDS(IntegratedDataStore)系統投入運行,揭開了數據庫技術的序幕。20世紀70年代是數據庫蓬勃發展的年代,網狀系統和層次系統占據了整個數據庫商用市場,而關系系統僅處于實驗階段。20世紀80年代,關系系統由于使用簡便以及硬件性能的改善,逐步代替網狀系統和層次系統占領了市場。20世紀90年代,關系數據庫已成為數據庫技術的主流。1.1.1數據和信息1.信息信息(Information)是人們頭腦中對現實世界中客觀事物以及事物之間聯系的抽象反映,它向我們提供了關于現實世界實際存在的事物和聯系的有用知識。2.數據數據是人們用各種物理符號,把信息按一定格式記載下來的有意義符號組合。數據包括數據內容和數據形式.3.數據與信息的關系數據是信息的具體的表示形式,信息是各種數據所包括的意義。信息可用不同的數據形式來表現,信息不隨數據的表現形式而改變。如:1980年10月1日與1980-10-1信息和數據的關系是:數據是信息的載體,它是信息的具體表現形式。1.1.2數據處理與數據管理1.數據處理信息處理(InformationProcess)也稱為數據處理,它是利用計算機對各種類型的數據進行處理,從而得到有用信息的過程。信息是數據處理的結果。數據的處理過程包括:數據收集、轉換、組織,數據的輸入、存儲、合并、計算、更新,數據的檢索、輸出等一系列活動。2.數據管理計算機數據管理是指計算機對數據的管理方法和手段。數據管理是指對數據的組織、分類、編碼、存儲、檢索和維護,是數據處理的中心問題。1.2數據庫技術的發展數據管理經歷了四個階段人工管理文件系統數據庫系統高級數據庫系統1.2.1人工管理階段在20世紀50年代中期以前計算機主要用于科學計算。硬件狀況沒有磁盤等直接存取的存儲設備;軟件狀況是,沒有操作系統,沒有管理數據的軟件;數據處理方式是批處理。人工管理階段的數據管理有下列特點:數據不保存在計算機內。沒有專用的軟件對數據進行管理。只有程序(program)的概念,沒有文件(file)的概念。數據的組織方式必須由程序員自行設計與安排。數據面向程序。即一組數據對應一個程序。1.2.2文件系統階段20世紀50年代后期到60年代中期計算機不僅用于科學計算,而且還大量用于管理。硬件上已有了磁盤、磁鼓等直接存取的存儲設備;軟件方面,操作系統中已經有了專門的數據管理軟件,一般稱為文件系統;處理方式上不僅有了文件批處理,而且能夠聯機實時處理。傳統的文件管理階段問題1.數據冗余性(Dataredundancy)2.數據不一致性(Datainconsistency)3.數據聯系弱(Datapoorrelationship)4.數據安全性差(Datapoorsecurity)5.缺乏靈活性(Lackofflexibility)1.2.3數據庫系統階段20世紀60年代后期以來,計算機用于管理的規模更為龐大,以文件系統作為數據管理手段已經不能滿足應用的需求為解決多用戶、多應用共享數據的需求,使數據為盡可能多的應用服務,出現了數據庫技術和統一管理數據的專門軟件系統——數據庫管理系統。(1)標志文件管理數據階段向現代數據庫管理系統階段轉變的三件大事1.1968年,IBM(InternationalBusinessMachine,國際商用機器)公司推出了商品化的基于層次模型的IMS系統2.1969年,美國CODASYL(ConferenceOnDataSystemLanguage,數據系統語言協商會)組織下屬的DBTG(DataBaseTaskGroup,數據庫任務組)發布了一系列研究數據庫方法的DBTG報告,奠定了網狀數據模型基礎3.1970年,IBM公司研究人員E.F.Codd提出了關系模型,奠定了關系型數據庫管理系統基礎(2)現代的數據庫管理系統階段特點1.使用復雜的數據模型表示結構2.具有很高的數據獨立性3.為用戶提供了方便的接口(SQL)4.提供了完整的數據控制功能5.提高了系統的靈活性1.2.4高級數據庫技術階段(1)分布式數據庫系統(2)對象數據庫系統1.3數據模型(DataModel)1.3.1數據模型概念數據模型:能表示實體類型及實體間聯系的模型稱為“數據模型”。用來表示信息世界中的實體及其聯系在數據世界中的抽象描述,它描述的是數據的邏輯結構。邏輯數據模型包含三個部分:數據結構是指對實體類型和實體間聯系的表達和實現;數據操作是指對數據庫的檢索和更新(包括插入、刪除和修改)兩類操作;數據完整性約束給出數據及其聯系應具有的制約和依賴規則。1.3.2實體聯系模型(ER模型)1.實體聯系模型實體-聯系模型為數據庫建模提供了3個基本的語義概念:實體(Entity)、聯系(Relationship)、屬性(Attributes)。2.實體:具有相同屬性或特征的客觀現實和抽象事物的集合。該集合中的一個元組就是該實體的一個實例(instance)3.屬性:表示一類客觀現實或抽象事物的一種特征或性質。E-R模型4.實體型屬性值的集合表示一個實體,而屬性的集合表示一種實體的類型,稱為實體型。5.實體聯系實體聯系是指實體類型之間的聯系,它反映了實體類型之間的某種關聯。6.二元實體(型)間聯系的種類:一對一聯系(1:1)一對多聯系(1:n)多對多聯系(m:n)二元聯系中的聯系類型二元聯系中的多對多聯系實體聯系模型E-R方法:“實體-聯系方法”(Entity-RelationshipApproach),它是描述現實世界概念結構模型的有效方法,是一種用來在數據庫設計過程中表示數據庫系統結構的方法。用E-R方法建立的概念結構模型稱為E-R模型,或稱為E-R圖。ER圖:(EntityRelationship)實體聯系圖,是一種可視化的圖形方法,它基于對現實世界的一種認識,即客觀現實世界由一組稱為實體的基本對象和這些對象之間的聯系組成,是一種語義模型,使用圖型模型盡力地表達數據的意義E-R圖基本成分包含實體、屬性和聯系。E-R圖的基本思想就是分別用矩形框、橢圓形框和菱形框表示實體、屬性和聯系,使用無向邊將屬性與其相應的實體連接起來,并將聯系分別和有關實體相連接,注明聯系類型。E-R圖的三種元素E-R圖的三種基本元素及其圖形的表示方法實體屬性聯系集線段E-R圖的繪制步驟首先確定實體類型確定聯系類型(1:1,1:N,M:N)把實體類型和聯系類型組合成E-R圖。確定實體類型和聯系類型的屬性。確定實體類型的鍵,在E-R圖中屬于鍵的屬性名下畫一條橫線。二元實體聯系種類兩個實體之間的聯系學生選修成績課程系主任領導系學生屬于系11n1mn學生與課程聯系的E-R圖學生與課程聯系的完整E-R圖課程名學生學號姓名性別出生日期系別課程課程號學分n成績m選修圖書借閱E-R圖圖書管理實體聯系圖圖書信息書號書名出版社作者借書證號單價讀者信息姓名地址性別借書NM借書日期歸還日期E-R圖設計原則真實性原則避免冗余原則簡單性原則合適性原則:用實體集還是屬性合適性原則:用實體集還是聯系集。原則:當描述發生在實體集之間的行為時,最好采用聯系集。1.3.3三種常見的數據模型(1)結構型(層次型—HierarchicalDatabase):樹狀結構用樹形結構表示各類實體以及實體間的聯系。層次模型數據庫系統的典型代表是IBM公司的IMS(InformationManagementSystems)數據庫管理系統。在數據庫中,對滿足以下兩個條件的數據模型稱為層次模型。(1)有且僅有一個節點無雙親,這個節點稱為“根節點”。(2)其他節點有且僅有一個雙親。①優點:數據結構類似于金字塔,不同層次間的關聯性直接簡單②缺點:數據縱向發展,橫向關系難以建立結構型(層次型—HierarchicalDatabase):樹狀結構施施研究室施先生孫小小盧拉拉F174SQLServer$500孫小小盧拉拉專長操作系統硬件技術網絡技術專長網頁設計操作系統數據庫作者出版物(2)網絡型(網狀型—NetworkDatabase)將每條記錄當成一個節點,節點與節點之間可以建立關聯,形成一個復雜的網狀結構。網狀數據模型的典型代表是DBTG系統,也稱CODASYL系統。在數據庫中,對滿足以下兩個條件的數據模型稱為網狀模型:(1)允許一個以上的節點無雙親。(2)一個節點可以有多于一個的雙親。①優點:避免數據重復性②缺點:關聯性復雜(2)網絡型(網狀型—NetworkDatabase)孫小小F480Linux應用620F174Windows98系統秘笈490F339HomePage制作高手480標標出版公司旗旗出版公司(3)關系型(RelationalDatabase)關系模型中基本數據邏輯結構是一張二維表用二維表結構來表示實體以及實體之間聯系的模型稱為關系模型。在關系模型中:通常把二維表稱為關系一個表的結構稱為關系模式表中的每一行稱為一個元組,相當于通常的一個記錄(值)每一列稱為一個屬性,相當于記錄中的一個數據項由若干個關系模式(相當于記錄型)組成的集合,就是一個關系模型。關系數據庫學生信息表學號姓名性別出生年月99070470JimMale1980.1099070471MikeMale1981.199070468MarryFemale1979.2學生成績表學號課程編號成績99070470A01019099070471B01028099070468A01017099070468C00018699070470B0102751.3.4數據庫系統的網絡架構(1)單機架構同一臺計算機包辦所有數據庫系統的工作,包括保存、處理、管理及使用數據庫系統。如:Access、FoxPro(2)大型主機/終端架構同一臺大型主機負責存儲及處理龐大的數據,用戶通過終端與大型主機聯機,以存取數據庫的內容(3)主從式架構(C/S)客戶端計算機處理部分工作,分散數據庫服務器負荷(4)分布式架構數據存儲在數臺數據庫服務器上,存取效率高1.4數據庫系統1.4.1數據庫系統三級模式結構(1)數據庫的三級抽象術語數據模型用數據定義語言描述的稱呼DBTG報告中的稱呼外部級外模型外模式子模式概念級概念模型概念模式模式內部級內模型內模式物理模式(2)三級體系結構(3)體系結構中的五個要素概念模式(conceptnalschema)是數據庫中全部數據的整體邏輯結構的描述。外模式(externalschema)是用戶與數據庫系統的接口,是用戶用到的那部分數據的描述。內模式(internalschema)是數據庫在物理存儲方面的描述,定義所有內部記錄類型、索引和文件的組織方式,以及數據控制方面的細節。模式/內模式映象存在于概念級和內部級之間,用于定義概念模式和內模式之間的對應性。外模式/模式映象存在于外部級和概念級之間,用于定義外模式和概念模式之間的對應性。(4)兩級數據獨立性數據獨立性(dataindependence)是指應用程序和數據庫的數據結構之間相互獨立,不受影響。數據獨立性分成物理數據獨立性和邏輯數據獨立性兩個級別。1.4.2數據庫系統組成數據庫系統(DatabaseSystem,簡記為DBS):DBS是實現有組織地、動態地存儲大量關聯數據、方便多用戶訪問的計算機硬件、軟件和數據資源組成的系統,即它是采用數據庫技術的計算機系統。數據庫系統指在計算機系統中引入數據庫后構成的系統,一般由數據庫、數據庫管理系統(及其開發工具)、應用系統、數據庫管理員和用戶構成。狹義的數據庫系統由數據庫、數據庫管理系統組成一、數據庫系統的組成1.數據庫數據庫是與應用彼此獨立的、以一定的組織方式存儲在一起的、彼此相互關聯的、具有較少冗余的、能被多個用戶共享的數據集合。2.數據庫管理系統(DBMS)數據庫管理系統(DatabaseManagementSystem),是一種負責數據庫的定義、建立、操作、管理和維護的系統管理軟件。DBMS位于用戶和操作系統之間,負責處理用戶和應用程序存取、操縱數據庫的各種請求。數據庫管理系統的功能數據定義:定義并管理各種類型的數據項數據處理:數據庫存取能力(增加、刪除、修改和查詢)數據安全:創建用戶賬號、相應的口令及設置權限數據備份:提供準確、方便的備份功能常用的大型DBMS:SQLServer、Oracle、Sybase、Informix、DB2DBMS是位于用戶與操作系統(OS)之間的一層數據管理軟件,它為用戶或應用程序提供訪問DB的方法,包括DB的建立、查詢、更新及各種數據控制。DBMS總是基于某種數據模型,可以分為層次型、網狀型、關系型和面向對象型等。DBMS的工作模式數據庫系統的組成3.數據庫管理員(DatabaseAdministrator,DBA)數據庫管理員是大型數據庫系統的一個工作小組。主要負責數據庫設計、建立、管理和維護數據庫,協調各用戶對數據庫的要求等。4.用戶用戶是數據庫系統的服務對象,是使用數據庫系統者數據庫系統的用戶可以有兩類:終端用戶、應用程序員。5.數據庫應用系統應用系統是指在數據庫管理系統提供的軟件平臺上,結合各領域的應用需求開發的軟件產品。二、數據庫系統的特點1.數據的共享性好,冗余度低,易擴充。數據庫中的整體數據可以被多個用戶,多種應用共享使用;數據共享。2.采用特定的數據模型數據庫中的數據是有結構的。數據庫系統不僅可以表示事物內部各數據項之間的聯系,而且可以表示事物與事物之間的聯系。3.具有較高的數據獨立性數據和程序的獨立,把數據的定義從程序中分離出來,簡化了應用程序的編制,大大減少程序維護的工作量。4.有統一的數據控制功能有效地提供了數據的安全性保護、數據的完整性檢查、并發控制和數據庫恢復等功能。三、數據庫系統的結構1.5關系模型1.5.1關系術語(1)關系模式(RelationalScheme):它由一個關系名以及它所有的屬性名構成。它對應二維表的表頭,是二維表的構成框架(邏輯結構)。其格式為:關系名(屬性名1,屬性名2,…,屬性名n)在SQLServer中對應的表結構為:表名(字段名1,字段名2,…,字段名n)(2)關系(Relation):表示多個實體之間的相互關聯,每一張表稱為該關系模式的一個具體關系。它包括:關系名,表的結構和表的數據(元組)。(3)聯系集:實體集之間的聯系二元聯系集:兩個實體集之間的聯系集關系術語(4)實體集(entityset):性質相同的同類實體的集合,稱為實體集。(5)元組(Tuple):二維表的一行稱為關系的一個元組,對應一個實體的數據。(6)屬性(Attributes):二維表中的每一列稱為關系的一個屬性。(7)域(Domain):屬性所對應的取值變化范圍叫屬性的域

關系術語(8)實體標識符(identifier):能惟一標識實體的屬性或屬性集,稱為實體標識符。有時也稱為關鍵碼(key),或簡稱為鍵。(9)主關鍵字(PrimaryKey):能唯一標識關系中不同元組的屬性或屬性組稱為該關系的候選關鍵字。被選用的候選關鍵字稱為主關鍵字。(10)外部關鍵字(ForeignKey):如果關系R的某一(些)屬性A不是R的候選關鍵字,而是另一關系S的候選關鍵字,則稱A為R的外來關鍵字。二、關系的特點1.關系必須規范化,分量必須取原子值2.不同的列允許出自同一個域3.列的順序無所謂4.任意兩個元組不能完全相同5.行的順序無所謂實際關系模型關系StudInfo(StudNo,StudName,StudSex,StudBirthDay,ClassID)ClassInfo(ClassID,ClassName,ClassDesc)字段一對多的聯系(1:M)通過外鍵實現元組字段值域為男、女關鍵字關鍵字外鍵StudInfoClassInfo1.5.2關系運算關系的基本運算有兩類:傳統的集合運算有:并、差、交專門的關系運算有:選擇、投影、聯接傳統的集合運算舉例ABC

ABCa1b1c1

a1b1c1a1b1c2

a2b2c1a2b2c1

a2b3c2(a)(b)RSABCa1b1c1a2b2c1R∩S(e)R×SABCABCa1b1c1a1b1c1a1b1c1a

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論