國家自然科學基金面上青年基金項目進展報告_第1頁
國家自然科學基金面上青年基金項目進展報告_第2頁
國家自然科學基金面上青年基金項目進展報告_第3頁
國家自然科學基金面上青年基金項目進展報告_第4頁
國家自然科學基金面上青年基金項目進展報告_第5頁
已閱讀5頁,還剩26頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

國家自然科學基金面上青年基金項目進展報告項目的主要任務1.免疫計算的分層計算與負載平衡基于正常模型,人工免疫系統的3層是指固有免疫計算層、適應性免疫計算層和并行免疫計算層。對一種基于文件的人工免疫系統建立正常模型,用其正常組件文件的時空屬性唯一確定該人工免疫系統的正常狀態。正常模型為人工免疫系統的可信建模奠定基礎,可提高人工免疫系統的性能。人工免疫系統的正常模型圖1

基于文件人工免疫系統的正常模型文件的空間屬性是其絕對路徑名,文件的時間屬性是其最后修改時間。人工免疫系統的3層結構(圖2)在圖2中,第1層是固有免疫計算層,用來檢測所有的自體和異體,并識別所有已知的異體;第2層是適應性免疫計算層,用BP網絡、RBF網絡等神經網絡對未知的異體進行識別、學習和記憶,然后消除所有被人工免疫系統看作威脅的異體;第3層是并行免疫計算層,這一層為人工免疫系統提供了改善效率的輔助工具,是受自然免疫系統中用作生物基礎組織的并行免疫細胞和分子啟發而來的。

自體數據庫設計為正常模型的數據集,該自體數據庫用來在人工免疫系統中100%檢測自體和異體。所有已知異體的特征存儲在異體數據庫中,該異體數據庫用來識別所有已知的異體和大多數未知的異體。對于未知的異體,用神經網絡學習它們。與該未知異體最相似的已知異體將用作學習的樣本,以選擇該未知異體的最佳類似物。人工免疫系統中所有受損的文件在被識別為異體并要被刪除時,將記錄在臨時數據庫中。通過該臨時數據庫和所述自體數據庫,受損的人工免疫系統能最大可能地自動被修復。

并行免疫計算層的節點是計算機主機,其中表示節點的總數,并行節點為人工免疫系統提供了高性能的計算基礎組織。有關人工免疫系統正常模型的定理定理1

文件的時空屬性二元組唯一確定了該文件的狀態

。定理2

人工免疫系統

中所有文件都處于正常狀態時,其各個文件的時空屬性二元組

唯一確定了該系統的正常狀態

。定理3

基于人工免疫系統的正常模型,對其自體的檢測率從理論上可以達到100%,對其異體的檢測率從理論上也可以達到100%。定理4基于人工免疫系統的正常模型和神經網絡,同等誤差條件下對異體的識別率將比不采用正常模型更高。人工免疫系統的并行免疫計算層為固有免疫計算層和適應性免疫計算層提供高性能的計算基礎組織,解決有限計算和負載平衡的問題。一臺主機的計算能力和資源總是有限的,高負荷的計算是不可靠的、易摧毀的并且高風險的。當移動機器人等系統的免疫信息處理量超過單個處理器的負載能力時,便調用并行免疫計算層,并行免疫計算層還能用來實現數據的多備份和系統恢復。對于移動機器人等系統的每個功能模塊,其相應的免疫子系統監視和保護這個模塊,來維護每個功能模塊的局部免疫和移動機器人的整體免疫。免疫計算模塊建立在移動機器人等系統的功能模塊上,成為一系列相對獨立的免疫計算體。移動機器人的并行免疫計算(圖3)并行免疫計算的復雜度定理定理5

假設并行計算機有d個主機節點,且每個節點有2個處理器,那么,并行計算機解決導航問題的時間復雜度與單機解決此問題的時間復雜度之間的關系如下:

。定理6

假設并行計算機有d個主機節點,且每個節點有2個處理器,那么,并行計算機解決抗病毒問題的時間復雜度與單機解決此問題的時間復雜度之間的關系如下:。定理7

假設移動機器人的軟件系統由n個文件和m個文件夾組成,異體數據庫nonselfdb中共有K個已知異體,發生故障的機器人軟件系統中有k1個異體文件,其中k3個異體文件是該系統中正常文件的異常狀態。假設并行計算機有d個主機節點,且每個節點有2個處理器,那么,并行計算機解決抗病毒問題的時間復雜度與單機解決此問題的時間復雜度之間的關系如下:。2.免疫計算的算法設計基于正常模型和3層免疫計算模型,人工免疫系統的算法設計包括人工免疫系統的正常模型構建算法設計、基于正常模型的自體/異體檢測算法設計、基于異體數據庫的異體識別算法設計、基于BP神經網絡的未知異體識別算法設計、基于臨時數據庫的異體消除算法設計、基于正常模型的系統恢復算法設計和基于Java多線程技術的并行免疫計算算法設計。2.1人工免疫系統的正常模型構建算法第1步對系統進行備份,提供該備份系統的根目錄路徑;第2步讀取系統的根目錄,從其根目錄中查找文件;第3步如果當前目錄中至少存在一個未讀取的文件或子文件夾,那么依次讀取當前選定文件或子文件夾的絕對路徑名和最后修改時間,否則進入第9步;第4步建立到自體數據庫的JDBC連接,對自體數據庫進行初始化;第5步將該文件或子文件夾的絕對路徑名和最后修改時間添加到該自體數據庫中;第6步關閉自體數據庫的當前數據庫連接;第7步如果剛處理的是子文件夾,那么遞歸構建該文件夾所對應子系統的正常模型;第8步重復第3步;第9步如果已處理的文件有個,且已處理的文件夾有個,就結束算法。圖4用自體數據庫selfdb存儲的正常模型數據2.2

基于正常模型的自體/異體檢測算法第1步讀取系統的根目錄,從其根目錄中查找文件;第2步如果在當前目錄中至少存在一個未讀取的文件或文件夾,那么依次讀取當前選定文件或文件夾的絕對路徑名和最后修改時間,否則進入第9步;第3步建立到自體數據庫的JDBC連接;第4步用該文件或文件夾的絕對路徑名和最后修改時間查詢自體數據庫;第5步如果存在相匹配的記錄,那么該文件或文件夾標識為自體,否則標識為異體,并把其中的異體文件交由異體識別算法進行識別;第6步關閉自體數據庫的當前數據庫連接;第7步如果剛檢測的是子文件夾,那么遞歸檢測該文件夾所對應子系統中的各個文件;第8步重復第2步;第9步如果已處理的文件有個,且已處理的文件夾有個,就結束算法。圖5正常網頁系統的自體檢測2.3基于異體數據庫的異體識別算法第1步依次選定被檢測的異體文件,讀取其文件擴展名;第2步建立到異體數據庫的JDBC連接;第3步用該文件的擴展名查詢異體數據庫;第4步如果在異體數據庫中不存在與該異體文件的擴展名相匹配的記錄,那么該異體文件是未知的異體,需要用未知異體識別算法對它識別,否則從異體數據庫中讀取與之匹配的記錄,包括特征串、文件復制行為、對注冊表的行為和對郵件的調用等字段數據;第5步關閉異體數據庫的當前數據庫連接;第6步讀取該文件的數據,尋找與異體數據庫中記錄相匹配的特征串、文件復制行為、對注冊表的行為和對郵件的調用等信息,如果找到一致的特征匹配,那么該異體文件被識別為已知異體,在異體數據庫中已有其記錄,否則需要用未知異體識別算法對它識別;第7步關閉文件讀取器,結束算法。圖6已知異體識別算法的測試結果2.4基于BP神經網絡的未知異體識別算法第1步,依次選定已知異體識別算法所不能識別的未知異體文件,讀取其第個特征;第2步建立到異體數據庫的JDBC連接;第3步查詢異體數據庫中所有已知異體的第個特征,計算查到的特征與未知異體的特征之間的相似度,選擇其中最大的相似度及其對應的特征編碼;第4步根據最大相似度及其對應的特征編碼,計算未知異體的第個特征所對應的不確定編碼;第5步關閉異體數據庫的當前數據庫連接,結束算法。圖7BP神經網絡的訓練結果圖8BP神經網絡對未知異體的識別結果2.5基于臨時數據庫的異體消除算法第1步如果存在未消除的異體文件,就依次讀取選定異體文件或文件夾的絕對路徑名,否則進入第8步;第2步如果該異體是文件,就建立到自體數據庫的JDBC連接,否則進入第7步;第3步用該異體文件的絕對路徑名查詢該自體數據庫;第4步如果找到與之匹配的記錄,就推斷該異體文件是原來的正常文件受異體感染而產生的,然后根據其絕對路徑名、系統的根目錄路徑和其備份系統的根目錄路徑生成該異體文件的備份文件路徑,并將該異體文件的絕對路徑名和備份文件路徑存入臨時數據庫usefulfile中;第5步如果該異體文件處于打開狀態,就關閉該異體文件,然后刪除該異體文件;第6步關閉自體數據庫的當前數據庫連接;第7步如果該異體是子文件夾,并且該子文件夾非空,那么遞歸消除該文件夾中的異體文件;否則刪除該異體文件夾;第8步重復第1步;第9步如果已處理的異體有個,并且臨時數據庫usefulfile中有個記錄,就結束算法。圖9異體消除算法的測試結果圖10在臨時數據庫中添加了受異體感染的正常文件信息2.6基于正常模型的系統恢復算法第1步建立到自體數據庫的JDBC連接,并查詢該自體數據庫;第2步如果在自體數據庫中存在未讀取的記錄,依次讀取當前選定記錄的空間屬性,否則進入第5步;第3步如果該空間屬性所對應的文件不存在,就計算該文件的備份文件路徑,并用其備份文件恢復;第4步重復第2步;第5步關閉到自體數據庫的JDBC連接,并建立到臨時數據庫的JDBC連接;第6步如果在臨時數據庫中存在記錄,依次讀取當前選定的記錄,否則進入第9步;第7步根據該記錄的絕對路徑名和備份文件路徑,將相應的備份文件拷貝到該絕對路徑名所指定的位置;第8步重復第6步;第9步關閉臨時數據庫的當前數據庫連接,結束算法。圖11系統恢復算法的測試結果3.免疫計算的測不準特征在自然免疫系統中,抗體、免疫細胞和抗原都是納米量度的微觀世界事物,現有的生物醫學設備無法準確測量抗體識別未知異體的位置和時間,這和量子物理的盧森堡測不準原理類似,表現為微觀世界的測不準特征。這種生物醫學領域的測不準特征也影響到了人工免疫系統領域,因為人工免疫系統是根據生物醫學的免疫學說靈感啟發而設計的。在基于正常模型的人工免疫系統中,對未知異體的特征識別不可能是完全準確的,測量誤差和未知異體的復雜性是直接原因。因此,對未知異體的識別屬于非精確推理,這里采用相似度推理,尋找和未知異體最相似的已知異體。這種推理建立在概率和可信度的基礎上。所述未知異體的特征提取是和對已知異體的識別同步進行的,在讀取并通過異體數據庫匹配待識別異體的特征時,計算該異體的特征信息與異體數據庫中最相似的已知異體特征之間的相似度。該相似度是一種概率值,用來表示對待識別異體計算特征值的可信度。例如,蠕蟲病毒特征字符串的相似度是指在異體數據庫中和該特征串最相似的特征串與該特征串匹配的長度,除以最相似特征串的長度的比率,待識別蠕蟲病毒的特征字符串為“happybirthday”,在異體數據庫中和該特征串最相似的是已知蠕蟲病毒“歡樂時光”病毒的特征串“happytime”,這兩個特征串匹配的長度為6,歡樂時光”病毒的特征串長度為10,這樣其相似度為。因此,相似度必定為大于或等于0、小于或等于1的小數,是一種概率,表示未知異體特征提取的不確定性。未知異體的特征編碼就是由在異體數據庫中與之最相似的特征所對應的編碼值和這兩個特征之間的相似度決定的。4.分布式人工免疫系統的魯棒性分析自然免疫系統是天然的并行、分布式生物信息處理系統,人工免疫系統也具有分布式信息處理的特征。因此,根據已提出的多真體魯棒性歸約模型,可以用分布式系統的魯棒性分析方法分析人工免疫系統的魯棒性。問題歸約法是一種把問題由繁化簡、由多元轉化為一元的有效分析方法,用問題歸約法分析人工免疫系統的魯棒性,就能建立人工免疫系統的魯棒性歸約模型,并分析實際人工免疫系統的魯棒相關性。4.1人工免疫系統的分布式結構人工免疫系統主要包括幾個相對獨立的計算模塊:正常模型生成模塊、自體/異體檢測模塊、已知異體識別模塊、未知異體學習模塊、異體消除模塊和系統修復模塊。在理想情況下各個計算模塊完全獨立,該人工免疫系統是一種對等型的分布式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論