數據庫系統與原理_第1頁
數據庫系統與原理_第2頁
數據庫系統與原理_第3頁
數據庫系統與原理_第4頁
數據庫系統與原理_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數據管理技術的產生和發展數據庫技術是應數據管理任務的需要而產 生的。數據的處理是指對各種數據進行收集、存 儲、加工和傳播的一系列活動的總和。 數據管理則是指對數據進行分類、組織、 編碼、存儲、檢索和維護,它是數據處理 的中心問題。數據管理技術經歷了人工管理、文件系統、 數據庫系統三個階段。人工管理階段(20世紀50年代中期以前) 特點:(1)數據不保存(2)應用程序管理 數據,數據需要由應用程序自己管理,沒 有相應的軟件系統負責數據的管理工作。(3)數據不共享。(4)數據不具有獨立性文件系統階段(50年代后期一60年代中期) 特點:(1)數據可長期保存(2)由文件系統管理數據(3)數據共享性差

2、,冗余度大(4)數據獨立性差 不容易擴充; 數據與程序之間仍缺乏獨立性;是一個無 彈性的無結構的數據集合。數據庫系統階段(60年代一 )特點:(1) 數據結構化(2)數據的共享性高,冗余度 低,易擴充(3)數據獨立性高物理獨立性是指用戶的應用程序與 存儲在磁盤上的數據庫中數據是相互獨立 的。邏輯獨立性是指用戶的應用程序與 數據庫的邏輯結構是相互獨立的,數據獨立性是由DBMS的二級映象功能 來保證的。(4)數據由DBMS統一管理和控制數據庫的共享是并發的 (Concurrency)。DBMS還必須提供的數據控制功能:(1)數據的安全性(2)數據的完整性、正確性、有效性和 相容性(3)并發控制(4

3、)數據庫恢復數據庫技術的發展是沿著數據模型的主線 展開的。數據模型是現實世界數據特征的抽象。數據庫中用數據模型這個工具來抽象、 表示和處理現實世界中的數據和信息。通 俗地講數據模型就是現實世界的模擬。數據模型應滿足三方面要求:一是能比較真實地模擬現實世界;二 是容易為人所理解;三是便于在計算機上 實現。根據應用的不同目的,數據模型劃分為兩 類:概念模型(信息模型) 按用戶的觀 點來對數據和信息建模;主要用于數據庫 設計。數據模型按計算機系統的觀點對數據建模; 主要包括網狀模型、層次模型、關系模型 等,主要用于DBMS的實現。數據模型的三個要素數據結構是所研究的對象類型的 集合。數據操作 是指對

4、數據庫中各種 對象(型)的實例(值)允許執行的操作的集 合,包括操作及有關的操作規則。數據庫 主要有檢索和更新(包括插入、刪除、修改) 兩大類操作。數據操作是對系統動態特性 的描述數據的約束條件是一組完整性規則 的集合。完整性規則是給定的數據模型中數 據及其聯系所具有的制約和依存規則,用 以限定符合數據模型的數據庫狀態以及狀 態的變化,以保證數據的正確、有效、相 容。(1)實體客觀存在并可相互區別的事物稱為實 體。(2)屬性 實體所具有的某一特性稱 為屬性。一個實體可以由若干個屬性來刻 畫。(3)碼 唯一標識實體的屬性集稱 為碼。(4)域屬性的取值范圍稱為該屬性的域。(5)實體型用實體名及其屬

5、性集合來抽象和刻畫同類實體,稱為實體型。(6)實體集同型實體的集合稱為實體集。(7)聯系 在現實世界中,事物內部以及事物之間是有聯系的,這些聯系在信息 世界中反映為實體(型)內部的聯系和實體 (型)之間的聯系。實體內部的聯系通常是 指組成實體的各屬性之間的聯系。實體之 間的聯系通常是指不同實體集之間的聯 系。兩個實體型之間的聯系可以分為三類:一對一聯系(1:1),一對多聯系(1:n), 多對多聯系(m:n),數據模型數據庫領域中最常用的數據模型有四種 層次模型, 網狀模型 關系模型 面向對象模型DBMS提供內模式描述語言(內模式DDL,或者存儲模式DDL)來嚴格地定義 內模式。優點:數據庫的二

6、級映象保證了數據庫外模 式的穩定性,從而從底層保證了應用程序 的穩定性。數據和程序之間的獨立性使得數據的 定義和描述可以從應用程序中分離出去。 另外,由于數據的存取由DBMS管理,用戶 不必考慮存取路徑等細節,從而簡化了應 用程序的編制,大大減少了應用程序的維 護和修改。層次數據模型的優缺點優點:優點:很少幾條命令就能操縱數據庫,使 用簡單;對于實體間聯系是固定的,且預先 定義好的應用系統,采用層次模型性能優 于關系模型;良好的完整性支持;缺點:對于多對多聯系,通過引入冗余數 據解決;對插入和刪除操作限制多;查詢子女結點必須通過雙親結點; 網狀數據模型的優缺點優點: 能夠更為直接地描述現實世界

7、; 具有良好的性能,存取效率較高;其DDL (數據定義語言)語言極其復 雜;數據獨立性差;關系數據庫的優缺點優點:建立在嚴格的數學概念的基礎上的; 關系模型的概念單一;關系模型的存取路徑對用戶透明, 數據獨立性高,安全保密性好; 缺點:查詢效率不如非關系數據模型;數據庫管理系統它是數據庫系統的核心,是為數據 庫建立、使用和維護而配置的軟件; 建立在操作系統的基礎上于操作系 統與用戶之間的一層數據管理軟 件;負責對數據進行同一的管理和 控制;DBMS的功能數據定義;數據操縱;數據庫運行 管理;數據組織、存儲和管理;數據庫的建立和維護;數據通道接 口;DBMS的組成:數據定義語言及其翻譯 處理程序

8、;數據操縱語言及其編譯(或解釋) 程序;數據庫運行控制程序;實用程序1:實體:客觀存在并可相互區別的 事物。2:模式:數據庫中全體數據的邏輯結 構和特征的描述,是所有用戶的公共數據 視圖。3:候選碼:關系中能唯一地標識一個 元組的屬性或屬性組。4:函數依賴:設R (U)是屬性集U 上的關系模式,X,Y是U的子集,若對于 R (U)的任意一個可能的關系r,r中不可 能存在兩個元組在X上的屬性值相等,而 在Y上的屬性值不等,則稱X函數決定Y 或Y函數依賴于X,記為X Y。5:事務:用戶定義的一個數據庫操作 序列,這些操作要么全做,要么全不做, 是一個不可分割的工作單位。數據庫系統的特點:數據結構化

9、,數據共享性高、冗余度低、 易擴充,數據獨立性高,數據由DBMS統一 管理和控制。查詢優化的一般準則:選擇運算應盡可能先做。在執行連接前對關系適當地預處理。把投影運算和選擇運算同時進行把投影同其前或其后的雙目運算結合起來。把某些選擇同在它前面要執行的笛 卡爾積結合起來成為一個連接運算。找出公共子表達式。:數據庫設計的特點:數據庫建設是 硬件、軟件、干件的結合,把結構設計和 行為設計密切結合起來。事務的四個特性:原子性、一致性、 隔離性和持續性。數據庫數據具有永久存儲有組 織和可共享三個基本特點。試述數據、數據庫、數據庫系統、數 據庫管理系統的概念。數據:描述事物的符號記錄稱為數據。數 據庫:數

10、據庫是長期儲存在計算機內、有 組織的、可共享的數據集合。數據庫中的 數據按一定的數據模型組織、描述和儲存, 具有較小的冗余度、較高的數據獨立性和 易擴展性,并可為各種用戶共享。數據庫 系統:數據庫系統(DBS)是指在計算機 系統中引入數據庫后的系統構成。數據庫 系統由數據庫、數據庫管理系統(及其開 發工具)、應用系統、數據庫管理員構成。 數據庫管理系統:數據庫管理系統(DBMS) 是位于用戶與操作系統之間的一層數據管 理軟件。DBMS主要功能包括數據定義功 能、數據操縱功能、數據庫的運行管理功 能、數據庫的建立和維護功能。使用數據庫系統有什么好處?使用數據庫系統的好處很多,例如可以 大大提高應

11、用開發的效率,方便用戶的使 用,減輕數據庫系統管理人員維護的負擔 等。總之,使用數據庫系統的優點是很多 的,既便于數據的集中管理,控制數據冗 余,可以提高數據的利用率和一致性,又 有利于應用程序的開發和維護。.試述文件系統與數據庫系統的區別 和聯系。區別:文件系統面向某一應用程序,共 享性差、冗余度大,獨立性差,紀錄內有 結構、整體無結構,應用程序自己控制。 數據庫系統面向現實世界,共享性高、冗 余度小,具有高度的物理獨立性和一定的 邏輯獨立性,整體結構化,用數據模型描 述,由數據庫管理系統提供數據安全性、 完整性、并發控制和恢復能力.試述數據模型的概念、數據模型的作 用和數據模型的三個要素。

12、數據模型是數據庫中用來對現實世界 進行抽象的工具,是數據庫中用于提供信 息表示和操作手段的形式構架。一般地講, 數據模型是嚴格定義的概念的集合。這些 概念精確地描述系統的靜態特性、動態特 性和完整性約束條件。因此數據模型通常 由數據結構、數據操作和完整性約束三部 分組成。數據結構:是所研究的對象 類型的集合,是對系統的靜態特性的描述。 數據操作:是指對數據庫中各種對象 (型)的實例(值)允許進行的操作的集 合,包括操作及有關的操作規則,是對系 統動態特性的描述。數據的約束條件: 是完整性規則的集合,完整性規則是給定 的數據模型中數據及其聯系所具有的制約 和依存規則,用以限定符合數據模型的數 據

13、庫狀態以及狀態的變化,以保證數據的 正確、有效、相容。.試述概念模型的作用。概念模型實際上是現實世界到機器世 界的一個中間層次。概念模型用于信息世 界的建模,是現實世界到信息世界的第一 層抽象,是數據庫設計人員進行數據庫設 計的有力工具,也是數據庫設計人員和用 戶之間進行交流的語言。.定義并解釋概念模型中以下術語: 實體,實體型,實體集,屬性,碼,實體 聯系圖(E-R圖)實體:客觀存在并可以相互區分的事物 叫實體。實體型:具有相同屬性的實體具 有相同的特征和性質,用實體名及其屬性 名集合來抽象和刻畫同類實體稱為實體 型。實體集:同型實體的集合稱為實體集。 屬性:實體所具有的某一特性,一個實體

14、可由若干個屬性來刻畫。碼:唯一標識實 體的屬性集稱為碼。實體聯系圖:E-R圖 提供了表示實體型、屬性和聯系的方法: 實體型:用矩形表示,矩形框內寫明實體 名。屬性:用橢圓形表示,并用無向邊 將其與相應的實體連接起來。聯系:用菱 形表示,菱形框內寫明聯系名,并用無向 邊分別與有關實體連接起來,同時在無向 邊旁標上聯系的類型(1:1,1 : n或 m : n)。.試述網狀、層次數據庫的優缺點。 層次模型的優點主要有:1)模型簡單, 對具有一對多的層次關系的部門描述非常 自然、直觀,容易理解,2)用層次模 型的應用系統性能好,特別是對于那些實 體間聯系是固定的預先定義好的應用,采 用層次模型來實現,

15、其性能優于關系模型; 3)次數據模型提供了良好的完整性支 持。層次模型的缺點主要有:1)現實 世界中很多聯系是非層次性的,如多對多 聯系、一個結點具有多個雙親等,層次模 型不能自然地表示這類聯系。只能通過引 入冗余數據或引入虛擬結點來解決。2) 對插入和刪除操作的限制比較多。3)查 詢子女結點必須通過雙親結點。網狀模型:網狀數據模型的優點主要有:1)能夠更為直接地描述現實世界,如一 個結點可以有多個雙親。2)具有良好的 性能,存取效率較高。網狀數據模型的缺 點主要有:1)結構比較復雜,而且隨 著應用環境的擴大,數據庫的結構就變得 越來越復雜,不利于最終用戶掌握。2) 其DDL,DML語言復雜,

16、用戶不容易使 用。由于記錄之間聯系是通過存取路徑實 現的,應用程序在訪問數據時必須選擇適 當的存取路徑。因此,用戶必須了解系統 結構的細節,加重了編寫應用程序的負擔。.試述關系模型的概念,定義并解釋 以下術語:(1)關系(2)屬性(3) 域(4)元組(5)主碼(6)分 量(7)關系模式關系模型由關系數據結構、關系操作集 合和關系完整性約束三部分組成。在用戶 觀點下,關系模型中數據的邏輯結構是一 張二維表,它由行和列組成。(1)關系: 一個關系對應通常說的一張表。(2)屬 性:表中的一列即為一個屬性;(3)域: 屬性的取值范圍;(4)元組:表中的一 行即為一個元組;(5)碼:表中的某個 屬性組,

17、它可以唯一確定一個元組;(6) 分量:元組中的一個屬性值;(7)關系 模式:對關系的描述,一般表示為關系名 (屬性1,屬性2,、,屬性n九.試述關系數據庫的特點。 關系數據模型具有下列優點: 1 關系模型 與非關系模型不同,它是建立在嚴格的數 學概念的基礎上的。2關系模型的概念單 一。無論實體還是實體之間的聯系都用關 系表示。操作的對象和操作的結果都是關 系。所以其數據結構簡單、清晰,用戶易 懂易用。3關系模型的存取路徑對用戶透 明,從而具有更高的數據獨立性、更好的 安全保密性,也簡化了程序員的工作和數 據庫開發建立的工作。缺點:由于存取路 徑對用戶透明,查詢效率往往不如非關系 數據模型。因此

18、為了提高性能,必須對用 戶的查詢請求進行優化,增加了開發數據 庫管理系統軟件的難度。.試述數據庫系統三級模式結構,這 種結構的優點是什么?數據庫系統的三級模式結構由外模式、 模式和內模式組成。外模式,亦稱子模式 或用戶模式,是數據庫用戶(包括應用程 序員和最終用戶)能夠看見和使用的局部 數據的邏輯結構和特征的描述,是數據庫 用戶的數據視圖,是與某一應用有關的數 據的邏輯表示。模式,亦稱邏輯模式,是 數據庫中全體數據的邏輯結構和特性的描 述,是所有用戶的公共數據視圖。模式描 述的是數據的全局邏輯結構。外模式涉及 的是數據的局部的邏輯結構,通常是模式 的子集。內模式,亦稱存儲模式,是數據 在數據庫

19、系統內部的表示,即對數據的物 理結構和存儲方式的描述。數據庫系統的 三級模式是對數據的三個抽象級別,它把 數據的具體組織留給DBMS管理,使用戶 能邏輯抽象地處理數據,而不必關心數據 在計算機中的表示和存儲。為了能夠在內 部實現這三個抽象層次的聯系和轉換,數 據庫系統在這三級模式之間提供了兩層映 象:外模式/模式映象和模式/內模式映 象。正是這兩層映象保證了數據庫系統中 的數據能夠具有較高的邏輯獨立性和物理 獨立性。.定義并解釋以下術語:DDL、DMLDDL :數據定義語言。用來定義數據 庫模式、外模式、內模式的語言。DML : 數據操縱語言。用來對數據庫中的數據進 行查詢、插入、刪除和修改的

20、語句。.什么叫數據與程序的物理獨立性?什 么叫數據與程序的邏輯獨立性? 為什么 數據庫系統具有數據與程序的獨立性?數據與程序的邏輯獨立性:當模式改 變時、由數據庫管理員對各個外模式/模 式的映象作相應改變,可以使外模式保持 不變。應用程序是依據數據的外模式編寫 的,從而應用程序不必修改,保證了數據 與程序的邏輯獨立性,簡稱數據的邏輯獨 立性。數據與程序的物理獨立性:當數據 庫的存儲結構改變了,由數據庫管理員對 模式/內模式映象作相應改變,可以使模 式保持不變,從而應用程序也不必改變。 保證了數據與程序的物理獨立性,簡稱數 據的物理獨立性。數據庫管理系統在三級 模式之間提供的兩層映象保證了數據庫

21、系 統中的數據能夠具有較高的邏輯獨立性和 物理獨立性。.試述數據庫系統的組成。數據庫系統一般由數據庫、數據庫管理 系統(及其開發工具)、應用系統、數據庫 管理員和用戶構成。.DBA的職責是什么?負責全面地管理和控制數據庫系統。 具體職責包括:決定數據庫的信息內 容和結構; 決定數據庫的存儲結構和 存取策略;定義數據的安全性要求和 完整性約束條件;監督和控制數據庫 的試用和運行;數據庫系統的改進和 重組。.系統分析員、數據庫設計人員、應 用程序員的職責是什么?系統分析員負責應用系統的需求分 析和規范說明,系統分析員要和用戶及 DBA相結合,確定系統的硬件軟件配置, 并參與數據庫系統的概要設計。數

22、據庫設 計人員負責數據庫中數據的確定、數據庫 各級模式的設計。數據庫設計人員必須參 加用戶需求調查和系統分析,然后進行數 據庫設計。在很多情況下,數據庫設計人 員就由數據庫管理員擔任。應用程序員負 責設計和編寫應用系統的程序模塊,并進 行調試和安裝。.試述關系模型的三個組成部分。關系模型由關系數據結構、關系操作集 合和關系完整性約束三部分組成。.試述關系數據語言的特點和分類。關系數據語言可以分為三類:關系代 數語言,域關系演算語言包括:元組關 系演算語言,具有關系代數和關系演算雙 重特點的語言特點是,具有完備的表達 能力,是非過程化的集合操作語言,功能 強,能夠嵌入高級語言中使用.定義并理解下

23、列術語,說明它們之間 的聯系與區別:(1)域,笛卡爾積, 關系,元組,屬性(2)主碼,候選碼, 外部碼(3)關系模式,關系,關系數據庫域:域是一組具有相同數據類型的值的 集合。笛卡爾積:給定一組域D1, D2,Dn,這些域中可以有相同的。 這組域的笛卡爾積為:D1XD2XXDn = ( dl,d2,dn ) I di?Di, i = 1 , 2,n 其中每一個元素 (dl,d2,dn )叫作一個n元 組(n-tuple )或簡稱元組(Tuple )。 元素中的每一個值di叫作一個分量 (Component )。關系:在域 D1, D2,Dn上笛卡爾積D1 X D2 XX Dn的子集稱為關系,表

24、示為R ( D1, D2,Dn )元組:關系中的每個元素 是關系中的元組。屬性:關系也是一個二 維表,表的每行對應一個元組,表的每列 對應一個域。由于域可以相同,為了加以 區分,必須對每列起一個名字,稱為屬性。 候選碼:若關系中的某一屬性組的值能唯 一地標識一個元組,則稱該屬性組為候選 碼。主碼:若一個關系有多個候選碼,則 選定其中一個為主碼。外部碼:設F是基 本關系R的一個或一組屬性,但不是關系 R的碼,如果F與基本關系S的主碼Ks 相對應,則稱F是基本關系R的外部碼, 簡稱外碼。基本關系R稱為參照關系,基 本關系S稱為被參照關系或目標關系。關 系R和S可以是相同的關系。關系模式: 關系的描

25、述稱為關系模式。它可以形式化 地表示為:R ( U,D,dom,F ) 其中R為關系名,U為組成該關系的屬 性名集合,D為屬性組U中屬性所來自 的域,dom為屬性向域的映象集合,F為 屬性間數據的依賴關系集合。關系:在域 D1,D2,Dn上笛卡爾積D1 X D2 XX Dn的子集稱為關系,表示為R(D1 , D2,Dn )關系是關系模 式在某一時刻的狀態或內容。關系模式是 靜態的、穩定的,而關系是動態的、隨時 間不斷變化的,因為關系操作在不斷地更 新著數據庫中的數據。關系數據庫:關系 數據庫也有型和值之分。關系數據庫的型 也稱為關系數據庫模式,是對關系數據庫 的描述,它包括若干域的定義以及在這

26、些 域上定義的若干關系模式。關系數據庫的 值是這些關系模式在某一時刻對應的關系 的集合,通常就稱為關系數據庫。.試述關系模型的完整性規則。在參 照完整性中,為什么外部碼屬性的值也可 以為空?什么情況下才可以為空?關系模型的完整性規則是對關系的某種 約束條件。關系模型中可以有三類完整性 約束:實體完整性、參照完整性和用戶定 義的完整性。其中實體完整性和參照完整 性是關系模型必須滿足的完整性約束條 件,被稱作是關系的兩個不變性,應該由 關系系統自動支持。1)實體完整性規則:2)參照完整性規則:3)用戶定義的完整 性是針對某一具體關系數據庫的約束條 件。它反映某一具體應用所涉及的數據必 須滿足的語義

27、要求。在參照完整性中,外部碼屬性的值可以為空,它表示該屬性 的值尚未確定。但前提條件是該外部碼屬 性不是其所在關系的主屬性。.等值連接與自然連接的區別是什 么?連接運算中有兩種最為重要也最為常 用的連接,一種是等值連接,另一種是自 然連接。0為“=”的連接運算稱為等值 連接。它是從關系R與S的笛卡爾積中 選取A、B屬性值相等的那些元組。即 等值連接為:R A=B S = t r t s | t rE R A t sG S A t r A = t s :B 自然連接是一種特殊的等值連接,它要求兩個關系中進行比較的分量必 須是相同的屬性組,并且要在結果中把重 復的屬性去掉。即若R和S具有相同的 屬

28、性組B,則自然連接可記作:RS=t r t s | t rE R A t sG S A t r B = t s B .代數的基本運算有哪些?如何用這 些基本運算來表示其他的關系基本運算?在八種關系代數運算中,并、差、笛 卡爾積、投影和選擇五種運算為基本的運 算。其他三種運算,即交、連接和除,均 可以用五種基本運算來表達。交運算:R? S = R-(R-S)連接運算 R S = ?A?B(R?S) A?B 除運算:R ( X,Y ) ?S ( Y, Z ) = ?X? - ?X ( ?X? ? ?Y(S) ?R ) X、 Y、Z為屬性組,R中的Y和S中的Y 可以有不同的屬性名,但必須出自相同的

29、域集。1 .試述SQL語言的特點。(1 )綜合統一。SQL語言集數據定義 語言DDL、數據操縱語言DML、數據控 制語言DCL的功能于一體。(2 )高度非 過程化。用SQL語言進行數據操作,只要 提出“做什么”,而無須指明“怎么做”, 因此無需了解存取路徑,存取路徑的選擇 以及SQL語句的操作過程由系統自動完 成。(3 )面向集合的操作方式。(4 ) 以同一種語法結構提供兩種使用方式。SQL語言既是自含式語言,又是嵌入式語 言。(5 )語言簡捷,易學易用。.試述SQL的定義功能。SQL 的數據定義功能包括定義表、定義 視圖和定義索引。SQL語言使用CREATE TABLE語句建立基本表,ALT

30、ER TABLE語 句修改基本表定義,DROP TABLE語句刪 除基本表;使用CREATE INDEX語句建立 索引,DROP INDEX語句刪除索引;使用 CREATE VIEW 命令建立視圖, DROP VIEW 語句刪除視圖。.什么是基本表?什么是視圖?兩者 的區別和聯系是什么?.試述視圖的優點。.所有的視圖是否都可以更新?為什 么?. 哪類視圖是可以更新的,哪類視圖 是不可更新的?各舉一例說明。.在嵌入式SQL中是如何區分SQL 語句和主語言語句的?在SQL語句前加上前綴 EXEC SQL。 SQL語句的結束標志則隨主語言的不同而 不同。.在嵌入式SQL中是如何解決數據 庫工作單元與

31、源程序工作單元之間通信 的?數據庫工作單元與源程序工作單元 之間的通信主要包括:(1 ) SQL通信 區SQLCA,用來向主語言傳遞SQL語句 的執行狀態信息,使主語言能夠根據此信 息控制程序流程。(2 )主變量,1 )用 來實現主語言向SQL語句提供參數。2 ) 將SQL語句查詢數據庫的結果交主語言 進一步處理(3 )游標,解決集合性操作 語言與過程性操作語言的不匹配通過游標 逐一獲取記錄,并賦給主變量,交由主語 言進一步處理。.在嵌入式SQL中是如何協調SQL 語言的集合處理方式和主語言的單記錄處 理方式的?用游標來協調這兩種不同的處理方 式。游標區是系統為用戶開設的一個數據 緩沖區,存放

32、SQL語句的執行結果,每個 游標區都有一個名字。用戶可以通過游標 逐一獲取記錄,并賦給主變量,交由主語 言進一步處理。.試給出各類關系系統的定義:最小 關系系統;關系上完備的系統;全關系型 的關系系統。最小關系系統:一個系統可定義為最 小關系系統,當且僅當它:(1 )支持關 系數據庫。從用戶觀點看,關系數據庫由 表構成,并且只有表這一種結構。(2) 支持選擇、投影和(自然)連接運算,對 這些運算不必要求定義任何物理存取路 徑。關系上完備的系統:這類系統支持關 系數據結構和所有的關系代數操作。全關 系型的關系系統:這類系統支持關系模型 的所有特征。即不僅是關系上完備的而且 支持數據結構中域的概念

33、,支持實體完整 性和參照完整性。.試述全關系型系統應滿足的十二條 準則,以及十二條基本準則的實際意義和 理論意義。關系模型的奠基人E.F.Codd具體地 給出了全關系型的關系系統應遵循的十二 條基本準則。從實際意義上看,這十二條 準則可以作為評價或購買關系型產品的標 準。從理論意義上看,它是對關系數據模 型的具體而又深入的論述,是從理論和實 際緊密結合的高度對關系型 DBMS的評 述。準則0 一個關系型的DBMS必須能 完全通過它的關系能力來管理數據庫。準 則1信息準則。關系型DBMS的所有信息 都應在邏輯一級上用一種方法即表中的值 顯式地表示。準則2保證訪問準則。依 靠表名、主碼和列名的組合

34、,保證能以邏 輯方式訪問關系數據庫中的每個數據項 (分量值)。準則3空值的系統化處 理。全關系型的DBMS應支持空值的概念, 并用系統化的方式處理空值。準則4基 于關系模型的動態的聯機數據字典。數據 庫的描述在邏輯級上應該和普通數據采用 同樣的表示方式,使得授權用戶可以使用 查詢一般數據所用的關系語言來查詢數據 庫的描述信息。準則5統一的數據子語 言準則。準則6視圖更新準則。所有理 論上可更新的視圖也應該允許由系統更 新。準則7高級的插入、修改和刪除操 作。準則8數據物理獨立性。無論數據 庫的數據在存儲表示或存取方法上作任何 變化,應用程序和終端活動都保持邏輯上 的不變性。準則9數據邏輯獨立性

35、。當 對基本關系進行理論上信息不受損害的任 何改變時,應用程序和終端活動都保持邏 輯上的不變性。準則10數據完整性的獨 立性。關系數據庫的完整性約束條件必須 是用數據庫語言定義并存儲在數據字典中 的,而不是在應用程序中加以定義的。準 則11分布獨立性。關系型DBMS具有分 布獨立性。準則12無破壞準則。如果一 個關系系統具有一個低級(指一次一個 記錄)語言,則這個低級語言不能違背或 繞過完整性準則。.試述查詢優化在關系數據庫系統中 的重要性和可能性。重要性:關系系統的查詢優化既是 RDBMS實現的關鍵技術又是關系系統的優 點所在。它減輕了用戶選擇存取路徑的負 擔。用戶只要提出“干什么”,不必指

36、出 “怎么干”。查詢優化的優點不僅在于用 戶不必考慮如何最好地表達查詢以獲得較 好的效率,而且在于系統可以比用戶程序 的“優化”做得更好。可能性:這是因 為:(1)優化器可以從數據字典中獲 取許多統計信息,(2)如果數據庫的 物理統計信息改變了,系統可以自動對查 詢進行重新優化以選擇相適應的執行計 劃。在非關系系統中必須重寫程序,而重 寫程序在實際應用中往往是不太可能的。(3)優化器可以考慮數十甚至數百種不 同的執行計劃,從中選出較優的一個,而 程序員一般只能考慮有限的幾種可能性。(4)優化器中包括了很多復雜的優化技 術,這些優化技術往往只有最好的程序員 才能掌握。系統的自動優化相當于使得所

37、有人都擁有這些優化技術。.試述查詢優化的一般準則。下面的優化策略一般能提高查詢效 率:(1)選擇運算應盡可能先做。(2) 把投影運算和選擇運算同時進行。(3) 把投影同其前或其后的雙目運算結合起來 執行。(4)把某些選擇同在它前面要 執行的笛卡爾積結合起來成為一個連接運 算。(5)找出公共子表達式。(6 ) 選取合適的連接算法.試述查詢優化的一般步驟。各個關系系統的優化方法不盡相同, 大致的步驟可以歸納如下:(1)把查 詢轉換成某種內部表示,通常用的內部表 示是語法樹。(2)把語法樹轉換成標 準(優化)形式。即利用優化算法,把 原始的語法樹轉換成優化的形式。(3) 選擇低層的存取路徑。(4)生

38、成查詢 計劃,選擇代價最小的。.理解并給出下列術語的定義:函數依 賴、部分函數依賴、完全函數依賴、傳遞 依賴、候選碼、主碼、外碼、全碼 (All-key) 、 1NF 、 2NF 、 3NF 、 BCNF 、 多值依賴、4NF。.試述數據庫設計過程。這里只概要列出數據庫設計過程的六 個階段:1)需求分析2)概念結構設計3)邏輯結構設計4)數據庫物理設計5) 數據庫實施6)數據庫運行和維護這是一 個完整的實際數據庫及其應用系統的設計 過程。不僅包括設計數據庫本身,還包括 數據庫的實施、數據庫運行和維護。設計 一個完善的數據庫應用系統往往是上述六 個階段的不斷反復。54.試述數據庫設計過程的各個階

39、段上的 設計描述。各階段的設計要點如下: 1) 需求分 析:準確了解與分析用戶需求。2)概念 結構設計:通過對用戶需求進行綜合、歸 納與抽象,形成一個獨立于具體DBMS的 概念模型。3)邏輯結構設計:將概念結 構轉換為某個 DBMS 所支持的數據模型, 并對其進行優化。4)數據庫物理設計: 為邏輯數據模型選取一個最適合應用環境 的物理結構。5)數據庫實施:設計人員 運用DBMS提供的數據語言、工具及宿主 語言,根據邏輯設計和物理設計的結果建 立數據庫,編制與調試應用程序,組織數 據入庫,并進行試運行。6)數據庫運行 和維護:在數據庫系統運行過程中對其進 行評價、調整與修改。.試述數據庫設計過程

40、中結構設計部分 形成的數據庫模式。數據庫結構設計的不同階段形成數據 庫的各級模式,即:在概念設計階段形成 獨立于機器特點,獨立于各個DBMS產品 的概念模式,在本篇中就是E-R圖;?在 邏輯設計階段將 E-R 圖轉換成具體的數 據庫產品支持的數據模型,如關系模型, 形成數據庫邏輯模式;然后在基本表的基 礎上再建立必要的視圖(View),形成數 據的外模式; ? 在物理設計階段,根據 DBMS特點和處理的需要,進行物理存儲安 排,建立索引,形成數據庫內模式。.試述數據庫設計的特點。特點有:1)數據庫建設是硬件、軟件 和干件(技術與管理的界面)的結合。2) 從軟件設計的技術角度看,數據庫設計應 該

41、和應用系統設計相結合,也就是說,整 個設計過程中要把結構(數據)設計和行 為(處理)設計密切結合起來。57.需求分析階段的設計目標是什么?調 查的內容是什么?需求分析階段的設計目標是通過詳細 調查現實世界要處理的對象,充分了解原 系統工作概況,明確用戶的各種需求,然 后在此基礎上確定新系統的功能。調查的 內容是“數據”和“處理”,即獲得用戶 對數據庫的如下要求:(1)信息要求。 指用戶需要從數據庫中獲得信息的內容與 性質。由信息要求可以導出數據要求,即 在數據庫中需要存儲哪些數據。(2)處 理要求。指用戶要完成什么處理功能,對 處理的響應時間有什么要求,處理方式是 批處理還是聯機處理。(3)安

42、全性與完 整性要求。. 數據字典的內容和作用是什么?數據字典是系統中各類數據描述的集 合。數據字典的內容通常包括:數據項、 數據結構、數據流、數據存儲、處理過程 五個部分其中數據項是數據的最小組成單 位,若干個數據項可以組成一個數據結構。 數據字典通過對數據項和數據結構的定義 來描述數據流、數據存儲的邏輯內容。數 據字典的作用:數據字典是關于數據庫中 數據的描述,在需求分析階段建立,是下 一步進行概念設計的基礎,并在數據庫設 計過程中不斷修改、充實、完善。.什么是數據庫的概念結構?試述其特 點和設計策略。概念結構是信息世界的結構,即概念 模型,其主要特點是:(1)能真實、充 分地反映現實世界,

43、包括事物和事物之間 的聯系,能滿足用戶對數據的處理要求。 是對現實世界的一個真實模型。(2)易 于理解,從而可以用它和不熟悉計算機的 用戶交換意見,用戶的積極參與是數據庫 的設計成功的關鍵。(3)易于更改,當 應用環境和應用要求改變時,容易對概念 模型修改和擴充。(4)易于向關系、網 狀、層次等各種數據模型轉換。概念結構 的設計策略通常有四種:1自頂向下。即 首先定義全局概念結構的框架,然后逐步 細化;2自底向上。即首先定義各局部應 用的概念結構,然后將它們集成起來,得 到全局概念結構;3逐步擴張。首先定義 最重要的核心概念結構,然后向外擴充, 以滾雪球的方式逐步生成其他概念結構, 直至總體概

44、念結構;4混合策略。即將自 頂向下和自底向上相結合,用自頂向下策 略設計一個全局概念結構的框架,以它為 骨架集成由自底向上策略中設計的各局部 概念結構。.什么叫數據抽象?試舉例說明。數據抽象是對實際的人、物、事和概 念進行人為處理,抽取所關心的共同特性, 忽略非本質的細節,并把這些特性用各種 概念精確地加以描述,這些概念組成了某 種模型。如分類這種抽象是:定義某一類 概念作為現實世界中一組對象的類型。這 些對象具有某些共同的特性和行為。它抽 象了對象值和型之間的“ is member of ” 的語義。在E-R模型中,實體型就是這種 抽象。例如在學校環境中,李英是老師, 表示李英是教師類型中的

45、一員,則教師是 實體型,李英是教師實體型中的一個實體 值,具有教師共同的特性和行為:在某個 系某個專業教學,講授某些課程,從事某 個方向的科研。.試述數據庫概念結構設計的重要性和 設計步驟。重要性:數據庫概念設計是整個數據 庫設計的關鍵,將在需求分析階段所得到 的應用需求首先抽象為概念結構,以此作 為各種數據模型的共同基礎,從而能更好 地、更準確地用某一 DBMS實現這些需求。設計步驟:概念結構的設計方法有多 種,其中最經常采用的策略是自底向上方 法,該方法的設計步驟通常分為兩步:第1 步是抽象數據并設計局部視圖,第2步是 集成局部視圖,得到全局的概念結構.什么是E-R圖?構成E-R圖的基本

46、要素是什么?E-R圖為實體-聯系圖,提供了表示 實體型、屬性和聯系的方法,用來描述現 實世界的概念模型。構成E-R圖的基本要 素是實體型、屬性和聯系,其表示方法為: 實體型:用矩形表示,矩形框內寫明實體 名;屬性:用橢圓形表示,并用無向邊 將其與相應的實體連接起來;聯系:用 菱形表示,菱形框內寫明聯系名,并用無 向邊分別與有關實體連接起來,同時在無 向邊旁標上聯系的類型(1 :1, 1 : n 或 m : n)。.為什么要視圖集成?視圖集成的方法 是什么?在對數據庫系統進行概念結構設計時 一般采用自底向上的設計方法,把繁雜的 大系統分解子系統。首先設計各個子系統 的局部視圖,然后通過視圖集成的

47、方式將 各子系統有機的融合起來,綜合成一個系 統的總視圖。這樣設計清晰,由簡到繁。 由于數據庫系統是從整體角度看待和描述 數據的,因此數據不再面向某個應用而是 整個系統。因此必須進行視圖集成,使得 數據庫能被全系統的多個用戶、多個應用 共享使用。一般說來,視圖集成可以有兩 種方式:多個分E-R圖一次集成;逐 步集成,用累加的方式一次集成兩個分 E-R圖。無論采用哪種方式,每次集成局 部E-R圖時都需要分兩步走:(1)合并。 解決各分E-R圖之間的沖突,將各分E-R 圖合并起來生成初步E-R圖。(2)修改 和重構。消除不必要的冗余,生成基本E-R 圖。.什么是數據庫的邏輯結構設計?試述 其設計步

48、驟。數據庫的邏輯結構設計就是把概念結 構設計階段設計好的基本E-R圖轉換為 與選用的DBMS產品所支持的數據模型相 符合的邏輯結構。:(1)將概念結構轉 換為一般的關系、網狀、層次模型;(2) 將轉換來的關系、網狀、層次模型向特定 DBMS支持下的數據模型轉換;(3)對數 據模型進行優化。.試述把E-R圖轉換為DBTG模型和 關系模型的轉換規則。E-R圖向DBTG模型的轉換規則:1) 每個實體型轉換為記錄型,實體的屬性轉 換為記錄的數據項;2)實體型之間1 : n ( n N 1 )的聯系轉換為一個系,沒 有任何聯系的實體型轉換為奇異系;3) K (K N 2)個實體型之間多對多的聯系, 引入

49、一個連結記錄,形成K個實體型和連 結記錄之間的K個系。連結記錄的屬性由 諸首記錄的碼及聯系屬性所組成;4)同 一實體型內的 1 : n , n : m 聯系, 引入連結記錄,轉換為兩個系。66.你能給出由E-R圖轉換為IMS模型 的轉換規則嗎?E-R圖向IMS模型的轉換規則:1) 每個實體型轉換為記錄型,實體的屬性轉 換為記錄的數據項; 2) 實體型之間 1 : n ( n N 1 )的聯系轉換記錄型之間的 有向邊;3)實體型之間m : n ( m1, n1 )的聯系則分解成一對多聯系,再根 據2)轉換;4) K ( K N 2 )個實體 型之間多對多的聯系,可先轉換成多對兩 個實體型之間的聯

50、系,再根據3)轉換。.規范化理論對數據庫設計有什么指導 意義?規范化理論為數據庫設計人員判斷關 系模式優劣提供了理論標準,可用以指導 關系數據模型的優化,用來預測模式可能 出現的問題,為設計人員提供了自動產生 各種模式的算法工具,使數據庫設計工作 有了嚴格的理論基礎。.試述數據庫物理設計的內容和步驟。數據庫在物理設備上的存儲結構與存 取方法稱為數據庫的物理結構,它依賴于 給定的DBMS。為一個給定的邏輯數據模 型選取一個最適合應用要求的物理結構, 就是數據庫的物理設計的主要內容。數據 庫的物理設計步驟通常分為兩步:( 1 ) 確定數據庫的物理結構,在關系數據庫中 主要指存取方法和存儲結構;(

51、2 )對物 理結構進行評價,評價的重點是時間和空 間效率。69.你能給出關系數據庫物理設計的主要 內容嗎?例如ORACLE數據庫物理設計的 內容。對于關系數據庫物理設計的內容主要 包括:?為關系模式選擇存取方法;? 設計關系、索引等數據庫文件的物理存儲 結構。有關ORACLE數據庫物理設計的內 容請參考其技術資料,根據上述內容進行 總結。.數據輸入在實施階段的重要性是什 么?如何保證輸入數據的正確性?數據庫是用來對數據進行存儲、管理 與應用的,因此在實施階段必須將原有系 統中的歷史數據輸入到數據庫。數據量一 般都很大,而且數據來源于部門中的各個 不同的單位。數據的組織方式、結構和格 式都與新設

52、計的數據庫系統有相當的差 距,組織數據錄入就要將各類源數據從各 個局部應用中抽取出來,分類轉換,最后 綜合成符合新設計的數據庫結構的形式, 輸入數據庫。因此這樣的數據轉換、組織 入庫的工作是相當費力費時的工作。特別 是原系統是手工數據處理系統時,各類數 據分散在各種不同的原始表格、憑證、單 據之中。數據輸入工作量更大。保證輸入 數據正確性的方法:為提高數據輸入工作 的效率和質量,應該針對具體的應用環境 設計一個數據錄入子系統,由計算機來完 成數據入庫的任務。在源數據入庫之前要 采用多種方法對它們進行檢驗,以防止不 正確的數據入庫。.什么是數據庫的再組織和重構造?為 什么要進行數據庫的再組織和重

53、構造?數據庫的再組織是指:按原設計要求 重新安排存儲位置、回收垃圾、減少指針 鏈等,以提高系統性能。數據庫的重構造 則是指部分修改數據庫的模式和內模式, 即修改原設計的邏輯和物理結構。數據庫 的再組織是不修改數據庫的模式和內模式 的。進行數據庫的再組織和重構造的原因: 數據庫運行一段時間后,由于記錄不斷增、 刪、改,會使數據庫的物理存儲情況變壞, 降低了數據的存取效率,數據庫性能下降, 這時DBA就要對數據庫進行重組織。 DBMS 一般都提供數據重組織用的實用程 序。數據庫應用環境常常發生變化,如增 加新的應用或新的實體,取消了某些應用, 有的實體與實體間的聯系也發生了變化 等,使原有的數據庫

54、設計不能滿足新的需 求,需要調整數據庫的模式和內模式。這 就要進行數據庫重構造。.試述事務的概念及事務的四個特性。事務是用戶定義的一個數據庫操作 序列,這些操作要么全做要么全不做,是 一個不可分割的工作單位。事務具有四個 特性:原子性、一致性、隔離性和持續性)。 這個四個特性也簡稱為ACID特性。原子 性:事務是數據庫的邏輯工作單位,事務 中包括的諸操作要么都做,要么都不做。 一致性:事務執行的結果必須是使數據庫 從一個一致性狀態變到另一個一致性狀 態。隔離性:一個事務的執行不能被其他 事務干擾。即一個事務內部的操作及使用 的數據對其他并發事務是隔離的,并發執 行的各個事務之間不能互相干擾。持

55、續性: 持續性也稱永久性,指一個事務一旦提交, 它對數據庫中數據的改變就應該是永久性 的。接下來的其他操作或故障不應該對其 執行結果有任何影響。.為什么事務非正常結束時會影響數據 庫數據的正確性,請列舉一例說明之。事務執行的結果必須是使數據庫從 一個一致性狀態變到另一個一致性狀態。 如果數據庫系統運行中發生故障,有些事 務尚未完成就被迫中斷,這些未完成事務 對數據庫所做的修改有一部分已寫入物理 數據庫,這時數據庫就處于一種不正確的 狀態,或者說是不一致的狀態。例如某工 廠的庫存管理系統中,要把數量為Q的某 種零件從倉庫1移到倉庫2存放。則可 以定義一個事務 T , T 包括兩個操作; Q1=Q

56、1-Q,Q2=Q2+Q。如果T非正常終 止時只做了第一個操作,則數據庫就處于 不一致性狀態,庫存量無緣無故少了 Q。.數據庫中為什么要有恢復子系統?它 的功能是什么?因為計算機系統中硬件的故障、軟件 的錯誤、操作員的失誤以及惡意的破壞是 不可避免的,這些故障輕則造成運行事務 非正常中斷,影響數據庫中數據的正確性, 重則破壞數據庫,使數據庫中全部或部分 數據丟失,因此必須要有恢復子系統。恢 復子系統的功能是:把數據庫從錯誤狀態 恢復到某一已知的正確狀態(亦稱為一致 狀態或完整狀態)。.數據庫運行中可能產生的故障有哪幾 類?哪些故障影響事務的正常執行?哪些 故障破壞數據庫數據?數據庫系統中可能發生

57、各種各樣的 故障,大致可以分以下幾類:(1)事務 內部的故障;(2)系統故障;(3)介 質故障;(4)計算機病毒。事務故障、 系統故障和介質故障影響事務的正常執 行;介質故障和計算機病毒破壞數據庫數 據。.數據庫恢復的基本技術有哪些?數據轉儲和登錄日志文件是數據庫 恢復的基本技術。當系統運行過程中發生 故障,利用轉儲的數據庫后備副本和日志 文件就可以將數據庫恢復到故障前的某個 一致性狀態。.數據庫轉儲的意義是什么?試比較 各種數據轉儲方法。數據轉儲是數據庫恢復中采用的基 本技術。所謂轉儲即DBA定期地將數據庫 復制到磁帶或另一個磁盤上保存起來的過 程。當數據庫遭到破壞后可以將后備副本 重新裝入

58、,將數據庫恢復到轉儲時的狀態。 靜態轉儲:在系統中無運行事務時進行的 轉儲操作。如上圖所示。靜態轉儲簡單, 但必須等待正運行的用戶事務結束才能進 行。同樣,新的事務必須等待轉儲結束才 能執行。顯然,這會降低數據庫的可用性。 動態轉儲:指轉儲期間允許對數據庫進行 存取或修改。動態轉儲可克服靜態轉儲的 缺點,它不用等待正在運行的用戶事務結 束,也不會影響新事務的運行。但是,轉 儲結束時后援副本上的數據并不能保證正 確有效。因為轉儲期間運行的事務可能修 改了某些數據,使得后援副本上的數據不 是數據庫的一致版本。為此,必須把轉儲 期間各事務對數據庫的修改活動登記下 來,建立日志文件。這樣,后援副本加上

59、 日志文件就能得到數據庫某一時刻的正確 狀態。轉儲還可以分為海量轉儲和增量轉 儲兩種方式。海量轉儲是指每次轉儲全部 數據庫。增量轉儲則指每次只轉儲上一次 轉儲后更新過的數據。從恢復角度看,使 用海量轉儲得到的后備副本進行恢復一般 說來更簡單些。但如果數據庫很大,事務 處理又十分頻繁,則增量轉儲方式更實用 更有效。.什么是日志文件?為什么要設立日志 文件?(1)日志文件是用來記錄事務對 數據庫的更新操作的文件。(2)設立日 志文件的目的是:進行事務故障恢復;進 行系統故障恢復;協助后備副本進行介質 故障恢復。79.登記日志文件時為什么必須先寫日志 文件,后寫數據庫?把對數據的修改寫到數據庫中和把

60、 表示這個修改的日志記錄寫到日志文件中 是兩個不同的操作。有可能在這兩個操作 之間發生故障,即這兩個寫操作只完成了 一個。如果先寫了數據庫修改,而在運行 記錄中沒有登記這個修改,則以后就無法 恢復這個修改了。如果先寫日志,但沒有 修改數據庫,在恢復時只不過是多執行一 次UNDO操作,并不會影響數據庫的正確 性。所以一定要先寫日志文件,即首先把 日志記錄寫到日志文件中,然后寫數據庫 的修改。.針對不同的故障,試給出恢復的策略 和方法。(即如何進行事務故障的恢復?系 統故障的恢復?介質故障恢復?)答:事務故障的恢復:事務故障的恢 復是由DBMS自動完成的,對用戶是透明 的。DBMS執行恢復步驟是:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論