




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
精品文檔-下載后可編輯一種分布式查詢處理研究-技術方案網格是一種新興的技術,正處在不斷發展和變化當中。目前學術界和商業界圍繞網格開展的研究有很多,其研究的內容和名稱也不盡相同因而網格尚未有的定義和內容定位。比如國外媒體常用“下一代互聯網”、“Internet2”、“下一代Web”等來稱呼網格相關技術。但“下一代互聯網(NGI)”和“Internet2”又是美國的兩個具體科研項目的名字,它們與網格研究目標相交叉,研究內容和重點有很大不同。企業界用的名稱也很多,有內容分發(ContentsDelivery)、服務分發(ServiceDelivery)、電子服務(e-service)、實時企業計算(Real-TimeEnterpriseComputing,簡稱RTEC)、分布式計算Peer-to-PeerComputing(簡稱P2P)、Web服務(WebServices)等。中國科學院計算所所長李國杰院士認為,網格實際上是繼傳統互聯網、Web之后的第三次浪潮,可以稱之為第三代互聯網應用。
網格中的資源是分布式的,所以基于網格的查詢是分布式查詢。分布式查詢已被廣泛地用于數據密集型的應用程序,用戶關心的數據存放于多個位置,而且是異構的、分散的和自治的,因此需要提供一種集成數據資源的方法。網格資源的異構特性及其網格環境動態變化的特點給分布式查詢處理技術帶來了新的挑戰,傳統的技術已經不能滿足網格環境的需要。
1分布式查詢處理原理分析
圖1是一個典型的分布式查詢處理(DistributedQueryProcessing,DQP)機制的示意圖,在很多與分布式查詢處理相關的文獻中都可以看到。這個圖表示了二個階段的優化,個階段是單節點優化,第二個階段是多節點優化。當一個查詢被提交以后,首先經過一個分析過程,分析器根據數據源的元數據信息進行類型和一致性檢查,將分析結果表示為一棵樹。然后將這棵樹提交到邏輯優化器產生一個邏輯計劃,邏輯計劃表示成另外一棵樹,它的葉子節點與執行查詢所需要的操作符相對應。通過物理優化,邏輯計劃轉化成一個物理計劃(也是一棵樹)。因為一個邏輯操作符可能與很多個物理操作符相對應,需要使用代價模型選擇一個執行時開銷可能的計劃。邏輯和物理優化器組成了單節點優化器并產生了一個連續計劃。
以上介紹了普通的DQP結構,下面結合網格的特點,給出在以服務為中心的網格環境中實現分布式查詢引擎(DQPE)必須滿足的一些條件。
(1)自適應性。網格環境中數據源的統計信息是不準確的,而且環境不可預測及易變,只根據編譯時得到的信息很難產生有效的查詢計劃。
(2)進度監控。查詢進度的監控是實現自適應性的基礎條件,并且必須解決基于OGSA(開放網格服務體系結構)統一的實現框架,否則無法在實際中應用。
(3)對數據庫中數據和元數據的標準訪問。在以服務為中心的體系結構中,數據源都被包裝為服務,查詢引擎需要訪問數據和元數據以獲得查詢優化時所需要的信息。
2與DQP設計相關的網格服務屬性
OGSA為網格中的資源共享提出了一個以服務為中心的框架。OGSA首先為網格服務提出了一套約定和行為,一個有狀態的服務實例支持可靠和安全調用、生命周期管理、通知、策略管理和信任狀管理。網格服務規范也定義了動態創建服務實例和發現這些實例的接口。網格服務能維護元數據,而且支持對這些元數據的查詢。下面著重討論一些與分布式查詢處理引擎實現有關的網格服務屬性。
2.1注冊和服務元數據
OGSA中的注冊機構擁有一個服務句柄(GSH)列表,每一個句柄擁有與這個句柄表示的服務有關的靜態元數據信息的一部分。一旦選擇了一個句柄,就可以進一步查詢與這個服務相關的更多的元數據。OGSA(OpenGridServicesArchitecture)被稱為是下一代的網格體系結構,它是在原來“五層沙漏結構”的基礎上,結合的WebService技術提出來的。OGSA包括兩大關鍵技術即網格技術和WebService技術。隨著網格計算研究的深入,人們越來越發現網格體系結構的重要。網格體系結構是關于如何建造網格的技術,包括對網格基本組成部分和各部分功能的定義和描述,網格各部分相互關系與集成方法的規定,網格有效運行機制的刻畫。顯然,網格體系結構是網格的骨架和靈魂,是網格的技術,只有建立合理的網格體系結構,才能夠設計和建造好網格,才能夠使網格有效地發揮作用。
注冊的另外一個用途就是DQP引擎需要發現監控服務,它監控網格上的計算資源,并提供有如處理器的數目、內存容量等的統計信息,還有像某一時刻某一節點處理器的負載、當前可用的內存、當前的網絡通信量等動態信息。
2.2動態服務創建和生命周期管理
一個分布式查詢處理引擎應該能動態地利用網格上可用的機器分發和執行一個個查詢子計劃,這就需要動態創建和部署能執行這些子計劃的服務,并且必須使服務實例提交完任務之后能撤銷,從而釋放它所利用的資源。
2.3通知機制
網格服務的狀態信息會隨著系統的運行而發生變化。網格服務之間的許多交互要求動態地監控狀態的變化。通知把一種傳統的發布(NotificationSource)和訂閱(NotificationSink)范式應用于這種監控。網格服務支持一個接口,以允許其他網格服務訂閱進行變更。
3OGSA環境中的DQP實現機制
這一節主要介紹在基于OGSA的環境中執行分布式查詢所涉及到的服務交互。
3.1查詢分析和解釋
圖2中設計了四個主體元素:客戶(Client)、注冊機構(Registry)、分析器(Parser)和網格數據服務GDS(GridDataService)。Registry是由許多組織共享的一個虛擬組織注冊機構。
從圖2中可以看出,客戶提交請求后,分析器為了獲得在類型檢查階段所需要的元數據信息,開始搜索與查詢相關的GDS。實際上,GDS句柄在DQP實例被創建時就已經可以得到。分析器訪問GDS,以獲得執行任務所需要的更多的元數據。
3.2單節點優化
網格資源監控服務(GRMS)通過圖3所示的注冊機構注冊,它部署在網格上并提供關于計算資源狀態的實時統計信息。分析器產生一個輸出并將其表示為一棵樹后,分布式查詢優化器將查閱注冊機構以獲得在查詢中涉及到的GDS的元數據、可用計算資源的信息以及當前計算負載。
3.3查詢計劃的調度和執行
執行者(Evaluator)是一個服務,它負責子計劃的執行。執行者工廠(EvaluatorFactory)是一個服務,它實現了網格服務工廠端口類型(GridServiceFactoryPortType)。正如圖4所示:當優化器使用從GDSs和GRMSs獲得的元數據產生了優化的子計劃后,它要把這些子計劃分布到各個節點上執行,其關鍵是子計劃與具體的機器資源的映射。
3.4查詢進度監控
優化器服務的內部部件也值得注意。圖5中解決的主要問題是基于進度監控的自適應行為的處理。可以使用OGSA通知機制創建一個進度監控框架。為了實現這個目標,優化器應當實現OGSA信息接收端口類型(NotificationSinkPorttype),并且應當有一個內部元件監聽Evaluators發來的消息。Evaluators充當了一個信息源的角色。很顯然,進度消息的內容在這里很重要。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 遼寧省丹東市五校協作體2025屆高三12月考-化學試題(含答案)
- 初中數學第四章 三角形單元復習題2024-2025學年北師大版七年級數學下冊
- 2《合理利用網絡》表格式公開課一等獎創新教學設計-3
- 藏族民間舞蹈的文化特征
- 化工安全作業票培訓講座
- 臨時工勞務派遣合同模板
- 員工服務合同協議書
- 人防工程專業分包合同
- 2025耕地流轉合同范本
- 2025年勞動合同書范本
- 內河船客運培訓課件
- 2023-2029年中國雞尾酒行業市場運行態勢及投資戰略規劃報告
- 2024年記者證考試挑戰試題及答案
- 健康廚房-家庭飲食指南
- 初中生物重要識圖填空速記54個-2025年中考生物一輪復習知識清單
- T-SCCX A 0010-2024 T-CQXS A 0001-2024 信息技術應用創新項目建設規范
- 合作合同范本 英文
- (二調)武漢市2025屆高中畢業生二月調研考試 政治試卷(含標準答案)
- 2025年共青團團課考試題庫及答案
- 2025年中國腰果行業市場深度分析及發展前景預測報告
- 工業機器人集成應用(ABB) 高級 課件 1.2.3 PLC設備選型方法與工作站PLC選型
評論
0/150
提交評論