




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第十三章文件有關文件的基本概念順序文件索引文件索引順序文件直接存取文件多關鍵字文件13.1
有關文件的基本概念一、文件即為記錄的集合,和“查找
表”的差別在于,“文件”指的是儲在外存儲器中的記錄的集合。
記錄是文件中可以存取的數據的基本單位。二、文件可按其中記錄的類型不同而分成兩類:其一為操作系統的文件,文件中的記錄僅是一個字符組。由于操作系統中的文件僅是一維的連續字符序列,為了用戶存取和加工的方便,將文件中的信息劃分為若干組,其中每一組信息稱作一個記錄;其二為數據庫文件,文件中的記錄帶有結構,是數據項的集合。記錄是文件中可以存取的數據基本單位,數據項是文件中可以使用的數據最小單位。三、記錄中能識別不同記錄的數據項被稱為關鍵字,若該數據項能唯一識別一個記錄,則稱為主關鍵字,若能識別多個記錄則稱為次關鍵字。四、文件的邏輯結構指的是呈現在用戶面前的文件中記錄之間的邏輯關系;文件的物理結構指的是文件中的邏輯記錄在存儲器中的組織方式。五、文件的操作:檢索修改排序1.檢索順序存取:存取“當前記錄的”下一個記錄;直接存取:存取第i個記錄;按關鍵字存取:存取其關鍵字等于給定值的記錄。2.修改往文件中插入一個或一批記錄;從文件中刪除一個或一批記錄;更新文件中某個記錄的屬性。3.排序文件的操作方式可以實時處理或批量處理。本章討論文件的幾種常見的物理結構:順序文件索引文件索引順序文件直接存取文件多關鍵字文件13.2
順
序
文
件結構特點:記錄在文件中的排列順序是由記錄進入存儲介質的次序決定的,即文件物理結構中記錄的排列順序和文件的邏輯結構中記錄的排列順序一致。順序文件的具體組織形式有兩種:連續文件:次序相繼的兩個物理記錄其存儲位置相鄰;串聯文件:物理記錄之間的順序由指針相鏈。操作特點:便于進行順序存取;不便于進行直接存取,為取第i個記錄,必須先讀出前i-1個記錄,對于磁盤上的等長記錄的連續文件可以進行折半查找;插入新的記錄只能加在文件的末尾;刪除記錄時,只作標記;更新記錄必須生成新的文件。13.3索引文件一、結構特點:索引文件由“主文件”和多級“索引”組成;索引中的每個記錄由“關鍵字”和“指針”組成;通常,索引文件中的主文件是無序文件,索引是(按關鍵字有序)的有序文件;“索引”是在輸入數據建立文件時自動生成。初建時的“靜態索引”為無序文件,經過排序后成為有序文件。二、操作的特點:1.檢索方式為:直接存取和按關鍵字存取。“按關鍵字檢索”將分兩步進行:先查索引,然后根據索引中指針所指索取記錄;2.插入記錄時,“記錄”插入在主文件的末尾,而相應的“索引項”必須插入在索引的合適位置上。因此,最好在建索引表時留有一定“空位”;3.刪除記錄時,僅需刪除索引表中相應的索引項即可;4.更新記錄時,應將更新后的記錄插入在主文件的末尾,同時修改相應的索引項。1.多級靜態索引2.動態索引1.多級靜態索引主
文
件第三查找表…
...第二查找表…
...查
找
表…
...索
引
表…
...此時的索引文件結構:對主文件中每個記錄建立一個索引項:主關鍵字
記錄在主文件中的存儲位置稱作稠密索引,由這些索引項構成索引表。從索引表建立的索引稱查找表,其中每個索引項為:最大關鍵字其所在數據塊的存儲位置稱這類索引為非稠密索引。類似地,由查找表建立的索引為第二
查找表;由第二查找表建立的索引為第三查找表。優點:不需要建立多級索引;初建索引不需要進行排序;插入或刪除記錄時,修改索引方便。2.動態索引索引表采用查找樹表或哈希表。用查找樹表作索引時,查找索引所需訪問外存次數的最大值恰為查找樹的深度。可以作索引的樹表有:二叉排序樹、B-樹和鍵樹。稠密索引的優點是,可以實現“預查找”缺點是,索引表占用的存儲空間大。13.4
索引順序文件主文件按主關鍵字有序,對一組記錄建立一個索引項(建立非稠密索引)。結構特點:有兩種典型的索引順序文件:一、ISAM文件ISAM(Index
Sequential
AccessMethod)(索引順序存取方法)是一種專為磁盤存取設計的文件組織方法。關鍵字指針關鍵字指針1.文件的組織方式:主文件按柱面集中存放,同時建立三級索引:磁道索引、柱面索引和主索引。磁道索引結構基本索引項溢出索引項2101024主索引磁道索引r(14)
r(21)
r(38)r(41)
r(57)
r(63)r(72)
r(85)
r(99)溢出區磁道索引r(514) …………
r(1024)溢出區—個柱面….柱面索引992101024T0T1T2T3T4T52.操作的特點:檢索插入刪除檢索:可有兩種方式:順序存取—依關鍵字由小至大順序存取。按關鍵字存取—從主索引開始,到柱面索引,到磁道索引,最后取得記錄,先后訪問四次外存。插入:將記錄插入在某個磁道的合適位置上;將該磁道上關鍵字最大的記錄移出到本柱面的溢出區中;修改本磁道的索引項(包括基本索引項和溢出索引項)。刪除:在被刪記錄當前存儲位置上作“刪除標記”。3.文件重組在經過多次的插入和刪除操作之后,大量的記錄進入文件的“溢出區”而“基本存儲區”中出現很多已被刪去的記錄空間,此時的文件結構很不合理。因此,對ISAM文件, 需要周期地進行重整。4.柱面索引的位置ISAM文件占有多個柱面,其柱面索引本身占有一個柱面,為使
“磁頭”的平均移動距離最小,柱面索引應設在數據文件所占全部柱面的中間位置上。二、VSAM文件VSAM(Vistual
Storage
Access
Method)文件是利用操作系統中提供的虛擬
存儲器的功能組織的文件,免除了
用戶為讀/寫記錄時直接對外存進行的操作,對用戶而言,文件只有控
制區間和控制區域等邏輯存儲單位。…
............索引集B+樹順序集控制區域控制區間數據集1.文件的結構2.
控制區間是用戶進行一次存取的邏輯單位,可看成是一個邏輯磁道。但它的實際大小和物理磁道無關。控制區域由若干控制區間和它們的索引項組成,可看成是一個邏輯柱面。VSAM文件初建時,每個控制區間內的記錄數不足額定數,并且有的控制區間內的記錄數為零。3.順序集本身是一個單鏈表,它包含文件的全部索引項,同時,順序集中的每個結點即為B+樹的葉子結點,索引集中的結點即為B+樹的非葉結點。4.文件的操作檢索:可進行順序存取和按關鍵字存取;插入:按關鍵字大小插入在某個適當的控制區間中,當控制區間中的記錄數超過文件規定的大小時,要“分裂”控制區間,必要時,還需要“分裂”控制區域;刪除:必須“真實地”刪除記錄,因此要在控制區間內“移動”記錄。5.VSAM文件通常被作為大型索引順序文件的標準組織方式。其優點是:動態地分配和釋放空間,不需要重組文件;能較快地實現對
“后插入”的記錄的檢索;其缺點是:占有較多的存儲空間,一般只能保持約75%的存儲空間利用率。(因此,一般情況下,極少產生需要分裂控制區域的情況)13.5
直接存取文件1.和前幾節討論的文件組織方法
不同,直接存取文件的特點是,由
記錄的關鍵字“直接”得到記錄在外存上的映象地址。類似于哈希表的構造方法,根據文件中關鍵字的特點設計一種“哈希函數”和“處理沖突的方法”將記錄散列到外存儲設備上,又稱“散列文件”。2.哈希文件的結構由于記錄在外存上是成組存放的,因此允許多個記錄映象到同一個地址
上。在此,稱外存儲器中存放多個記
錄的“數據塊”為“桶”。因此由哈希數得到的映象地址為“桶地址”。例如:有一組關鍵字如下所列{589,063,269,505,764,182,166,330}假設哈希函數為keyMOD
7,每個桶可以容納
3個記錄(稱桶的容量為3),則哈希文件如下:基桶063
182589505
764269166330溢出桶在哈希文件中,“沖突”和“溢出是不同的概念。一般情況下,假設桶
的大小為m,則允許哈希地址產生m-1次的沖突,當發生第m次沖突時,才
需要進行“沖突處理”,對散列文件而言,通常采用鏈地址法處理沖突。為
區別起見,稱直接“散列”的數據塊為
“基桶”,而因“溢出”存放的數據塊
“溢出桶”。3.文件的操作檢索:只能進行按關鍵字的查找,不能進行順序查找。檢索時,先在基桶內進行查找,若不存在,則再到溢出桶中進行查找;插入:當查找不成功時,將記錄插入在相應的基桶或溢出桶內;刪除:對被刪記錄作特殊標記。4.優點:記錄隨機存放,不需要進行排序;插入、刪除方便,存取速度快;節省存儲空間,不需要索引區。缺點:不能進行順序存取;在經過多次插入和刪除操作之后,需進行“重組文件”的操作。13.6
多關鍵字文件一、多關鍵字文件的特點除需要對主關鍵字建立“主索引”外,尚需對各個次關鍵字建立“次索引”次索引項:次關鍵字(指向記錄的)指針二、次索引的組織方法1.多重鏈表文件特點:將所有具有相同次關鍵字的記錄鏈接在同一鏈表中,該鏈表的頭指針即為次索
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 柜子展廳轉讓協議書
- 治安調解協商協議書
- 早教加盟服務協議書
- 施工安全劃分協議書
- 游泳私教合同協議書
- 服裝托管終止協議書
- 無償捐贈委托協議書
- 果樹修剪技術協議書
- 民歌版權出售協議書
- 活動拍攝合同協議書
- 離婚協議書正規打印電子版(2025年版)
- 【數學】三角形 問題解決策略:特殊化課件2024-2025學年北師大版數學七年級下冊
- 【MOOC】跨文化交際入門-華中師范大學 中國大學慕課MOOC答案
- 人工智能導論(天津大學)知到智慧樹章節答案
- 中考數學計算題練習100道(2024年中考真題)
- 激光跟蹤儀使用手冊
- 住宅樓消防工程施工組織設計方案(DOC39頁)
- 慈溪市小學辦學水平四星級督導評估自評情況匯總表
- SMT不良品維修作業指導書
- 鄭州印象城市介紹旅游推介專題講授PPT課件
- 三相四線及三相三線錯誤接線向量圖分析及更正
評論
0/150
提交評論