



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、人工神經網絡在醫學研究中的應用 作者:李麗霞 張敏 郜艷暉 張丕德 周舒冬【摘要】 人工神經網絡由于其具有高度的自適應性、非線性、善于處理復雜關系的特點,在許多研究領域得到了廣泛應用,并取得了令人矚目的成就。對其目前在醫學研究領域中的應用做一簡單綜述。 【關鍵詞】 人工神經網絡; 應用人工神經網絡(Artificial Neural Network,ANN)方法自從本世紀40年代被提出以來,
2、許多從事人工智能、計算機科學、信息科學的科學家都在對它進行研究,已在軍事、醫療、航天、自動控制、金融等許多領域取得了成功的應用。目前出現了許多模仿動物和人的智能形式與功能的某個方面的神經網絡,例如,Grossberg提出的自適應共振理論(Adaptive Resonance Theory,ART),T-Kohenen的自組織特征映射網絡(Self-Organizing feature Map,SOM),徑向基函數網絡(Radial Basis Function,RBF),Hopfield網等。進入90年代以后,由于計算機技術和信息技術的發展,以及各種算法的不斷提出,神經網絡的研究逐漸深化,應用
3、面也逐步擴大,本研究對常用的神經網絡方法及其在醫學領域中的應用做一簡單綜述。 1 自組織特征映射網絡(self-organizing feature map,SOM)在基因表達數據分析中的應用 1.1 方法介紹 腦神經學的研究表明,人腦中大量的神經元處于空間的不同區域,有著不同的功能,各自敏感著各自的輸入信息模式的不同特征。芬蘭赫爾辛基大學神經網絡專家T.Kohonen根據大腦神經系統的這一特性,于1981年提出了自組織特征映射網絡,它模擬人的大腦,利用競爭學習的方式進行網絡
4、學習,具有很強的自組織、自適應學習能力,魯棒性和容錯能力,其理論及應用發展很快,目前已在信息處理、模式識別、圖像處理、語音識別、機器人控制、數據挖掘等方面都有成功應用的實例。 Kohonen網絡由輸入層和競爭層組成,網絡結構見圖1。輸入層由N個神經元組成,競爭層由M個輸出神經元組成,輸入層與競爭層各神經元之間實現全互連接,競爭層之間實行側向連接。設輸入向量為x=(x1,xd)T ,輸出神經元j對應的權重向量為wj=(wj1,wjd)T ,對每一輸出神經元計算輸入向量x 和權重向量wj 間的距離,據此利用競爭學習規則對權向量進行調節。在網絡的競爭層,各神經元競爭對輸入模式
5、的響應機會,最后僅一個神經元成為勝利者,并對與獲勝神經元有關的各權重朝著更有利于它競爭的方向調整,這樣在每個獲勝神經元附近形成一個“聚類區”,學習的結果使聚類區內各神經元的權重向量保持與輸入向量逼近的趨勢,從而使具有相近特性的輸入向量聚集在一起,這種自組織聚類過程是系統自主、無教師示教的聚類方法,能將任意維輸入模式在輸出層映射成一維或二維離散圖形,并保持其拓撲結構不變。網絡通過對輸入模式的學習,網絡競爭層神經元相互競爭,自適應地形成對輸入模式的不同響應,模擬大腦信息處理的聚類功能、自組織、自學習功能,實現用低維目標空間的點去表示高維原始空間的點,其工作原理和聚類算法及改進方法參見相關文獻1。&
6、#160; 1.2 應用 基因芯片技術的應用使得人們可以從基因水平探討疾病的病因及預后,而基因芯片產生的數據具有高維度(變量多)、樣本量小、高噪聲的特點,樣本量遠小于變量數,如何從海量的數據中挖掘信息或知識成為重大課題。聚類分析是數據挖掘中的一類重要技術,傳統方法主要有系統聚類、k-means聚類等,但在處理復雜非線性關系及變量間的交互作用時效果較差,受異常值影響較大。近年來神經網絡技術法成為聚類領域的研究熱點,其中自組織特征映射網絡由于其良好的自適應性,其算法對基因表達數據的聚類有較高的穩定性和智能性,尤其在處理基因表達中有缺失數據及原始空間到
7、目標空間存在非線性映射結構時有較好的體現,適用于復雜的多維數據的模式識別和特征分類等探索性分析,同時可實現聚類過程和結果的可視化2。目前Kohonen網絡已被成功用到許多基因表達數據的分析中,Jihua Huang等3設計6×6的網絡對酵母細胞周期數據進行分析,總正確率為67.7%;曹暉等4將其算法改進后用在酵母菌基因表達數據中,總正確率高達84.73%,有較高的聚類效能;鄧慶山5將該模型與K平均值聚類方法結合用于公開的結腸基因表達數據集和白血病基因表達數據集,聚類的準確率分別為94.12%和90.32%。目前Kohonen網絡在醫學領域中主要應用前景有: 發現與疾病相關的新的未知基
8、因,對目標基因進一步研究,提高診斷的正確率,并對藥物的開發研究提供重要的線索; 對腫瘤組織的基因表達譜數據聚類,以期發現新的、未知的疾病亞型(腫瘤亞型),以便提出更加有針對性的治療方案,為從分子水平對疾病分型、診斷、預后等提供依據; 發現與已知基因有相似功能的基因,為推斷未知基因的可能功能提供線索。 2 BP神經網絡在醫學研究中的應用 2.1 BP神經網絡在疾病輔助診斷中的應用 BP神經網絡是目前應用最多的神經網絡,一般由一個輸入層(input layer)、一個輸出層(output layer)、
9、一個或幾個中間層(隱層)組成。每一層可包含一個或多個神經元,其中每一層的每個神經元和前一層相連接,同一層之間沒有連接。輸入層神經元傳遞輸入信息到第一隱層或直接傳到輸出層,隱層的神經元對輸入層的信息加權求和,加一個常數后,經傳遞函數運算后傳到下一個隱層(或輸出層),常用的傳遞函數是logistic函數,即h=1/(1+exp(-z) ,輸出層神經元對前一層的輸入信息加權求和經傳遞函數0 (線性或logistic函數或門限函數)運算后輸出,BP神經網絡一般采用BP算法訓練網絡,關于BP算法及改進可參考相關文獻1。 人工神經網絡具有強大的非線性映射能力,含一個隱層的網絡可以實
10、現從輸入到輸出間的任意非線性映射,是典型的非線性數學模型,建立BP神經網絡模型的一般步驟為: BP網訓練集、校驗集、測試集的確定; 輸入數據的預處理:使輸入變量的取值落在0到1的范圍內,如果是無序分類變量,以啞變量的形式賦值; 神經網絡模型的建立及訓練:學習率、傳遞函數、隱層數、隱單元數的選擇,注意防止過度擬合。一般使用靈敏度、特異度、陽性預測值、陰性預測值、ROC曲線對模型的預測性能進行評價。 BP神經網絡已廣泛用于臨床輔助診斷中,白云靜等6用于中醫證候的非線性建模,建立了RA證侯BP網絡模型和DN證侯BP網絡模型,結果顯示平均診斷準確率分別為90.72%、92.21
11、%,具有較高的診斷、預測能力。曹志峰7采用PROBEN1中的甲狀腺疾病數據庫用于甲狀腺疾病(甲亢、甲減、正常)的診斷,結果顯示訓練樣本的正確識別率為99.3% ,測試樣本的正確識別率為98.2%,提示對臨床診斷甲狀腺疾病提供有益的幫助;還有學者用于急性心肌梗塞、甲狀腺功能紊亂、乳腺癌、前列腺癌、宮頸癌、肺癌、卵巢癌、急性肺梗塞等的輔助診斷等8。 2.2 BP神經網絡在生存分析中的應用 傳統的生存分析方法有非參數、半參數、參數模型,參數模型主要有指數回歸模型、Weibull回歸模型,都要求對基線風險做一定的假設,但實際資料常常不符合條件
12、,生存分析中應用最為廣泛的半參數模型:Cox比例風險模型,但它要求滿足比例風險的假定,在很多情況下也難以滿足。基于神經網絡的生存分析模型可以克服這些困難,可以探測復雜的非線性效應,復雜的交互效應,模型中協變量的效應可以隨時間變化,對數據的分布不做要求。目前一些策略被用到神經網絡預測方法中分析含有刪失的生存數據,主要有Faraggi-Simon(1995)法、Liestol-Andersen-Andersen(1994) 法、改良uckley-James(1979)法等。 BP神經網絡建立生存分析模型常用的方法有9:連續時間模型(continuous time model
13、s)與離散時間模型(discrete time models)。常用的Faraggi和Simon10提出的連續時間模型擴展了Cox回歸模型,允許非線性函數代替通常的協變量的線性組合,這種方法既保持了Cox回歸模型的比例風險的特點,又提供了處理復雜非線性關系、交互作用能力的好方法。 離散時間模型常用的模型有: 輸出層為單個結點:模型的輸出層只有一個神經元結點,是最簡單的神經網絡模型,生存時間被分成兩個區間,當研究者僅僅對某一時間點的預后感興趣時,例如預測癌癥患者的5年生存情況,如欲預測多個時間點,則需建立多個神經網絡模型(每個模型對應一個時間區間); 輸出層為多個結點:生
14、存時間被分成幾個離散的區間,估計某個時間區間事件發生的概率,Liestol法是常用的離散時間模型。還有研究者在建立多個時間區間模型時將時間也做為一個輸入變量,也有學者將神經網絡納入Bayes方法的研究框架。 一般采用靈敏度、特異度、一致性指數C(Concordance index)作為預測準確性的評價指標,神經網絡在生存分析中的應用主要在于11:個體患者預后的預測,研究預后因子的重要性,研究預后因子的相互作用,對于預測變量的影響力強弱及解釋性,還有待進一步探討。 國外Ruth M.Ripley等等還將神經網絡用于ECG、EEG等信號的識別和處理、醫學圖像分析中,取得了較好的結果。 人工神經網絡是在研究生物神經網絡的基礎上建立的模型,迄今為止有代表性的網絡模型已達數10種,人工神經網絡不需要精確的數學模型,沒有任何對變量的假設要求,能通過模擬人的智能行為處理復雜的、不確定的、非線性問題。在醫學研究領域,變量間關系往往非常復雜,為了探測變量間的復雜模式,神經網絡正逐漸變成分析數據的流行工具。目前國際上已出現許多著名的神經網絡專業雜志:Neur
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 嶺南師范學院《峨眉武術2》2023-2024學年第二學期期末試卷
- 四川長江職業學院《升學與就職指導》2023-2024學年第二學期期末試卷
- 上海工商職業技術學院《跨國公司管理》2023-2024學年第二學期期末試卷
- 四川省瀘州市瀘縣一中2025年高三5月選考模擬考試物理試題含解析
- 景德鎮藝術職業大學《小學教育專業導論與職業生涯規劃》2023-2024學年第二學期期末試卷
- 沙洲職業工學院《科技英語翻譯》2023-2024學年第二學期期末試卷
- 深圳大學《合唱》2023-2024學年第二學期期末試卷
- 四川化工職業技術學院《道路橋梁工程施工技術》2023-2024學年第二學期期末試卷
- 寧波諾丁漢大學《園藝生態學》2023-2024學年第二學期期末試卷
- 二零二五版銷售提成合同書
- 寧夏低空經濟發展現狀與策略實施路徑探索
- 《化學鍵的斷裂與形成》課件
- 2025-2030中國藜麥行業市場發展趨勢與前景展望戰略研究報告
- 第2單元 社會服務(整單元教學設計)-2023-2024學年四年級下冊綜合實踐活動蘇教版
- 學校校服定制合同協議
- 慢性腎臟病患者管理及一體化治療
- 漢中漢源電力招聘試題及答案
- 《半導體集成電路》課件-半導體集成電路的制造工藝
- 第十八屆“地球小博士”全國地理知識科普競賽題庫(附答案)
- MOOC 大學生創新與創業實踐-西南交通大學 中國大學慕課答案
- JJF 1338-2012相控陣超聲探傷儀校準規范
評論
0/150
提交評論