大規模并行處理器上資源與性能優化的調度方法研究_第1頁
大規模并行處理器上資源與性能優化的調度方法研究_第2頁
大規模并行處理器上資源與性能優化的調度方法研究_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大規模并行處理器上資源與性能優化的調度方法研究大規模并行處理器在空間上堆疊大量橫向計算單元,通過提高并行度為許多計算帶來了性能加速。以圖形處理單元(GraphicProcessingUnit,GPU)為硬件平臺的通用計算GPU(General-purposeGPU,GPGPU)是大規模并行處理器的典型實例,加之CUDA和OpenCL等軟件開發平臺的推出,而備受親睞。很多操作系統、圖形圖像處理軟件、科學計算軟件等都引入了GPGPU性能加速,且每年都有大量的關于GPGPU并行算法的學術成果被發表,不斷拓展著GPGPU的應用范圍、提高算法的性能。然而,以GPGPU為代表的大規模并行處理器由于體系結構和CPU之間的差異為其性能有效發揮帶來了巨大的挑戰。在軟件方面,需要充分考慮這些差異,優化組合使用各種計算資源,才能充分發揮性能潛力;在硬件方面,需要不斷完善體系結構設計,改進優化調度機制與策略,才能保證計算資源充分利用,避免過度硬件開銷。而軟硬件調度系統是保證GPGPU資源和性能優化的關鍵。分別從資源分配、執行次序、并行度三個角度對現有調度系統的各層次調度機制和策略存在的問題進行了剖析,提出相應的調度優化方法,其具體的內容如下:(一)資源分配,是指GPGPU各種軟硬件資源的配給與管理機制,需要防止配給錯誤和訪問沖突。針對GPGPU內存資源分配機制進行了研究:(1)GPGPU的多地址空間的內存模型導致了數據管理的復雜化。提出了多地址空間封裝機制,將多地址副本整合成單一數據結構,在保持性能的同時簡化了資源利用。(2)GPGPU特有內存和核函數之間的靜態關聯導致其在多線程程序中產生資源訪問沖突。以紋理內存為例,提出內存資源池調度管理機制,將靜態資源實現動態化分配,提高了特有內存利用率。(二)執行次序優化,是指根據依賴關系與資源需求優化線程、線程塊(Cooperativethreadarray,CTA)、核函數等的時間分配和空間分布。針對線程和CTA的執行次序優化進行了研究:(1)探究GPGPU單指令流多線程的協同調度的設計合理性,研究了虛擬化平臺的VCPU協同調度,并針對其時間片碎片化問題提出了縮小CPU作用范圍的細粒度協同調度優化。該研究確認了GPGPU協同調度的合理性和GPGPU細粒度協同調度優化的性能優勢。(2)負載均衡是GPGPU性能的關鍵,然而現有CTA調度策略由于數據局部性優化而產生了CTA分配的不均衡。設計CTA負載均衡調度優化策略CLASO,通過信用額度控制CTA分發,提高了CTA負載均衡和性能,同時模塊化設計實現了對多種調度策略的兼容。(三)并行度優化,是指通過匹配源代碼、核函數、線程等計算任務和硬件平臺之間的并行度以減少調度開銷,提高資源利用率并避免資源擁塞。針對源代碼并行粒度和運行時線程級并行度的優化策略進行了研究:(1)現有GPGPU源代碼并行粒度調整算法不能支持足夠的語句類型。對此提出了多層次遞歸形式的源代碼模型,并設計了自動化源代碼并行粒度調整算法,實現了對包含在多層次分支、循環語句中的同步語句的支持。(2)現有線程級調度中面向CTA的并行度優化存在的調整粒度過粗和優化條件不準確等問題。提出了基于流水線停頓的Wa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論