




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、個人資料整理 僅限學習使用目錄目 錄 i摘 要 ii第一部分 數學建模 11 數學建模的介紹 12 數學建模的主要內容 13 數學建模的流程 24 數學建模的主要算法 25 數學建模的軟件 3第二部分 生物信息學 31 什么是生物信息學 32 生物信息學的研究方向 3 第三部分生物信息學與數學建模的交叉 31 方法和技術的交叉 31.1 數學統計方法 41.2 動態規劃方法 41.3 機器學習 41.4 數據挖掘 41.5 生物分子的計算機模擬 52 目的上的相似 5第四部分數學建模在生物信息學中的部分應用 51 運用數學模型的預測 52 運用數學模型的數據分析 6 參考文獻 7數學建模在生物
2、信息學中的應用研究摘要本文首先介紹了數學建模和生物信息學的基礎知識,然后分析了數學建模 和生物信息學的交叉知識點。分析顯示,數學建模和生物信息學不僅在統計方 法和數據挖掘等使用方法和技術方面存在交叉知識點,還在目的上具有一定的 相似性,即兩者都是對大量的數據進行統計和分析,都以解決問題為最終目 的。最后,文章重點回顧了數學建模在生物信息學中數據分析和結構預測方面 的部分應用。關鍵詞 :數學建模 生物信息學應用研究第一部分數學建模1數學建模的介紹從航空航天領域中的火箭發射、武器的自動導航,到企業中該如何配置人 力、物力和財力,進而用最小的成本產生最大的利潤,再到生活中如何規劃自 己有限的時間復習
3、期末考試,等等。這都或多或少地運用到了數學建模的知 識。 數學建模是一個將實際問題用數學的語言、方法,去近似刻畫、建立相應數學 模型并解決科研、生產和生活中的實際問題的過程。數學建模的問題比較廣 泛,涉及到多學科知識,它不追求解決方法的天衣無縫,不追求所用數學知識 的高深,也不追求理論的嚴密邏輯,它以解決問題為主要目的。模型的建立,即把錯綜復雜的實際問題簡化、抽象化為具有合理的數學結 構的過程。通過調查、收集數據資料,觀察和研究實際對象的固有特征和內在 規律,抓住問題的主要矛盾,建立起反映實際問題的數量關系,然后利用數學 的理論和方法去分折和解決問題。隨著科學技術的飛速發展,人們越來越認識到數
4、學的重要性:數學的思考 方式具有根本的重要性,數學為組織和構造知識提供了方法,將它用于技術時 能使科學家和工程師生產出系統的、能復制的、且可以傳播的知識數學對 于經濟競爭是必不可少的,數學科學是一種關鍵性的、普遍的、可實行的技 術。在當今高科技與計算機技術日新月異且日益普及的社會里,高新技術的發 展離不開數學的支持,沒有良好的數學素養已無法實現工程技術的創新與突 破。2數學建模的主要內容數學建模理論包含統計回歸模型、優化模型、圖論模型、微分模型和概率模型等1-3】,如表 1 所示表 1 數學建模的主要內容統計回歸模型 運籌與優化模型 圖論與網絡模型 微分差分模型 概率模型數學挖掘博弈論聚類分析
5、線性規劃層次分析整數規劃線性回歸目標規劃非線性回歸動態規劃主成分分析非線性規劃時間序列分析多目標決策數據擬合與插值存貯論模型圖論模型GM模型最小生成樹 隨機模擬 微分方程模型最大流問題計算機模擬穩定性模型最短路徑問題決策論模型差分方差模型最長路徑問題排隊論模型灰色預測模型PERT網絡圖模型馬氏鏈模型偏微分方程模型最小費用流問題3數學建模的流程圖 1 數學建模的流程 34數學建模的主要算法蒙特卡羅算法 該算法又稱隨機性模擬算法,是通過計算機仿真來解決 問題的算法,同時可以通過模擬可以來檢驗自己模型的正確性。數據處理算法 通常會遇到大量的數據需要數據擬合、參數估計、插值 等處理,通常使用 Matl
6、ab 作為工具規劃算法 遇到線性規劃、整數規劃、多元規劃、二次規劃等最優化問 題,可以用數學規劃算法來描述,通常使用 Lingo 軟件實現。圖論算法 包括最短路、網絡流、二分圖等算法。動態規劃、回溯搜索、分治算法、分支定界等算法。非經典算法 模擬退火法、神經網絡、遺傳算法為最優化理論的三大非 經典算法。5數學建模的軟件數學建模有專用的軟件: Matlab 7 , Lingo 8 為其中最主要的軟件,其他 重要的軟件有 Mathematice ,S-plus ,SAS等。第二部分 生物信息學1什么是生物信息學生物信息學是一門新興的交叉學科,它使用數學和計算機這兩項工具,對 日益增長的生物數據進行
7、快速、高效的組織與分析。生物信息學的近期任務是 大規模的基因組測序中的信息分析、新基因和新 SNP的發現與鑒定、完整基因 組的比較研究、大規模基因功能表達譜的分析、生物大分子的結構模擬與藥物 分析,其遠期任務是非編碼區信息結構分析、遺傳密碼起源和生物進化的研 究。2 生物信息學的研究方向生物信息學的發展異常迅速,現主要包括 DNA序列對比、蛋白質結構對比 與預測、編碼區的基因識別、序列重疊群 (Contigs> 裝配、基于結構的藥物設 計、非編碼區的分析研究、遺傳密碼的起源、分子進化與比較基因組學、生物 系統的建模和仿真、生物信息學技術方法的研究等幾個研究方向【4-6】。第三部分 生物信
8、息學與數學建模的交叉 生物信息學是利用數學和計算機作為工具,不可避免地與數學建模,這一利用 計算機和數學理論解決實際問題的學科,無論在研究方法和技術上,還是在運 用目的上均產生一定的交叉。1方法和技術的交叉 生物信息學所使用的方法與技術包括數學統計方法、動態規劃方法、機器學習 與模式識別技術、數據庫技術與數據挖掘、人工神經網絡技術、生物分子的計 算機模擬等,而這些恰恰是數學建模領域的核心理論與知識。1.1 數學統計方法 數據統計、因素分析、多元回歸分析是生物學研究必備的工具,而這些是數學 建模的統計回歸模型中最為基礎的知識;隱馬爾科夫模型 <Hidden Markov Models)在序
9、列分析方面有著重要的應用,與隱馬爾科夫模型相關的技術是馬 爾科夫鏈 <Markov Chain ),而馬爾科夫鏈模型正是數學建模中針對離散狀態按 照離散時間的隨機轉移而建立的模型。總之,生物信息學和數學建模有的第一 個共同點是,都有對海量數據進行統計分析的過程。1.2 動態規劃方法動態規劃 <Dynamic Programming)是一種解決多階段決策過程的最優化方 法,在每個階段做出一定的決策并影響后續的決策,最終選擇一個最優決策。當兩個 DNA序列長度較小時,采用動態規劃算法可以很好地解決兩個序列 的相似性問題。當序列長度太長時,改進的 BALST和 FASTA算法也是基于動態
10、 規劃的思想。同時,動態規劃在數學建模領域也被用來解決最短路線、庫存管 理、資源分配等生產和生活中的現實問題。1.3 機器學習 機器學習一般采用遺傳算法、神經網絡或聚類分析等,模擬人類的學習過 程,以計算機為工具獲取知識、積累經驗,在擁有大樣本、多向量數據的數據 分析中發揮著日益重要的作用。比如,聚類分析已經運用于癌癥類型的分類, 神經網絡和隱馬爾可夫模型對于缺乏完備理論體系的生物領域也同樣奏效。以 上聚類分析、神經網絡和隱馬爾可夫模型均為數學建模中的重點方法。1.4 數據挖掘 數據挖掘又被稱作數據庫中的知識發現,在此意義上,生物信息學也是在 海量的生物數據中發掘生命的奧秘。基因序列包括外顯子
11、和內含子,其中外顯 子只占其中的一小部分。大部分的內含子序列的作用并不為人知,如何從這些 簡單的 ACGT序列中發現內含子如何參與基因的轉錄與翻譯變得異常重要。比 如,利用一階和二階馬爾可夫鏈的方法偵測密碼區。1.5 生物分子的計算機模擬 所謂生物分子的計算機模擬就是從分子或者原子水平上的相互作用出發,建立 分子體系的數學模型,利用計算機進行模擬實驗,預測生物分子的結構和功 能,預測動力學及熱力學等方面的性質,常用的方法是蒙特卡羅法和模擬退火 方法。2 目的上的相似 數學建模與生物信息學都會對大量的數據進行統計和分析,都以解決問題 為最終目的,并且以求得滿意解為重點,因為有時全局最優解難以得到
12、。另外,數學建模和生物信息學的研究都更強調能否具有實用性。比如生物 信息學的機器學習技術中運用到了神經網路或隱馬氏模型,但人們目前并不清 楚該算法或模型是如何到達解的,即對其具體的機理并不十分了解。但這并不 妨礙我們使用這種方法,因為這種方法具有使用成功性和可用性。在這個意義 上,數學建模也經常通過此類“黑箱”操作達到特定解。正如Cynthia Gibas和 Per Jambeck 在 Developing Bioinformatics Computer Skills的前言所說,生 物信息 學“ is often less about developing perfectly elegant
13、algorithms than it is about answering practical questions”。從這個意義上說,數學建模與生物信息學有著目的上的相似性。第四部分 數學建模在生物信息學中的部分應用1. 運用數學模型的預測1993 年 Rost 和 Sander6 提出了三級網絡模型,這種神經網絡方法已經成 為了蛋白質結構預測普遍采用的方法。 2003 年閆化軍等 7 人也通過神經網絡算 法預測蛋白質二級結構。 2007 年林衛中等 8 人將 GM(1,1模型應用于蛋白質二 級結構類型的預測,把提取出的蛋白質氨基酸的排列信息作為偽氨基酸成分, 從而較大的提高了預測的成功率。
14、2008 年邱望仁等 9 人將 OET-KNN算法應用于 蛋白質二級結構類型的預測,通過 LZ 復雜度的算法計算了偽氨基酸的成分,再 用 OET-KNN算法分類預測,從而也較大的提高了預測的成功率。Bader 等10 人將 Logistic 回歸模型用來預測蛋白質之間的生物學關系,這2006 年種運用使得通過遺傳學和基因表達數據來分析蛋白質數據成為了可能 王明會等 11人將 Markov 鏈模型應用于蛋白質可溶性的預測,預測精度普遍好于 或接近于神經網絡、信息論和支持向量機法的結果,而且該模型的運算復雜度 低,耗時也更短。 2006 年張菁晶等 12 人將隱馬爾可夫模型運用于目標基因全基 因組
15、的預測,同量高、準確度高并且操作簡單,尤其在多結構域蛋白家族的預 測上優勢明顯。 2008 年劉桂霞等 13 人提出了一種帶偏差單元的遞歸神經網絡模 型。該模型根據 BP算法得出權系數調整規則,使得收斂速度比一般的 BP 網絡 更快,對于預測蛋白質關聯圖有一定的實用價值。2. 運用數學模型的數據分析1997 年 Carr 等14 研究了大鼠脊髓的基因活動,通過聚類分析證明具有已 知相似功能的基因屬于一類。 2006 年張文彤等 15 人綜合了聚類方法和進化樹分 析的優點,通過先聚類將數據拆分,然后根據聚類的類別構建進化樹,這種方 法可以很好地在大樣本數據中應用,并以甲型流感病毒的 H3A1序列
16、作為實例, 構建拼接出了完整的進化樹結果。2006 年徐麗等 16 人針對 Viterbi 算法和 Baum-Welch算法在隱馬爾可夫模 型 <Hidden Markov Model )的參數估計中無法找到全局最優解,提出了基于遺 傳算法的 HMM參數估計,這種方法用于多序列對比研究時可以更好的避免局部 最優解。 2007 年周曉彥等 17 人通過綜合模糊數學和核判別方法的優點,提出了 一種基于模糊核判別分析的基因表達數據分析方法,并以多發性骨髓瘤的基因 表達數據為例證實了這種方法的可行性和精確性。 2007 年劉萬霖等 18 人介紹了 構建基因調控網絡的多種算法和方法,比如馬爾可夫鏈
17、可以用于分析時間序列 微陣列表達數據;將隨機和概率等引入布爾網絡模型,可以增強基因網絡調控 的精確性;貝葉斯網絡模型在 Friedman 和 Pe'er 等人做出了開拓性的工作后, 在基因表達數據和調控網絡方面得到了快速的發展。參考文獻1 馮杰等 . 數學建模原理與案例 . 科學出版社 ,2007.2 高隆昌 , 楊元著 . 數學建模基礎理論 .科學出版社 ,2007.3 戴朝壽 , 孫世良 . 數學建模簡明教程 . 高等教育出版社 ,2007.4 陶士珩 . 生物信息學 . 科學出版社 ,2007.5 DAVID W. MOUNT. 生物信息學 : 中文版 . 高等教育出版社 ,20
18、03.6 Rost B, Sander C. Proc. Natl. Acad. Sci. USA, Biothysics, 1993,90:7558-75627 閆 化 軍, 傅 彥 , 章 毅 等 . 神 經 網絡 方 法 預 測 蛋 白 質二 級 結構 . 計 算機 科 學.2003,30(11>:48-528 林衛中 , 肖絢 . 基于 GM(1,1>模型的蛋白質二級結構類型預測. 計算機工程與應用 ,2007, 43(34>: 41-459 邱望仁 , 肖絢 , 林衛中 . 基于 OET-KNN算法的蛋白質二級結構類型預測 . 計算機工程 與應用 , 2008, 44(29>: 204-21010 Bader JS,Chaudhuri A,Rothberg JM,et al.Gaining confidence in high-throughput protein interaction network. Nat Biotechnol,2004,22: 78-8511 王明會 , 李 驁, 王嫻等 . Markov 鏈模型在蛋白質可溶性預測中的應用 . 生物醫學工 程學雜志 , 2006, 23(5>: 1109-111312 張 菁 晶 , 馮 晶
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 股東質押股份合同
- 鐵路旅客運輸服務站臺服務課件
- 閘門橡膠條施工方案
- 《GB 18278.1-2015醫療保健產品滅菌 濕熱 第1部分:醫療器械滅菌過程的開發、確認和常規控制要求》(2025版)深度解析
- 中國交際文化課件
- 中華誦讀名篇小學生課件
- 勞務中介合同樣本
- 世紀英才文化課件大全
- 南京郵電大學《建設工程造價A》2023-2024學年第一學期期末試卷
- 文華學院《學術規范與學術寫作公管》2023-2024學年第一學期期末試卷
- 北京海淀區2023-2024學年八年級下學期期中考試物理試題(原卷版)
- 煤礦汛期安全知識培訓課件
- 安寧療護服務流程的質量評估指標
- 《玉米栽培技術與病蟲害防治》課件
- 衛生院、社區衛生服務中心關于開具死亡醫學證明流程中死者死亡信息核實補充制度
- 2025年主管護師中級考試題庫及答案參考
- 【語文】《短文兩篇:陋室銘》課件 2024-2025學年統編版語文七年級下冊
- 舞蹈療法在兒童精神疾病康復中的應用-洞察分析
- 2025年春新人教版語文一年級下冊教學課件 18 棉花姑娘
- 工貿企業負責人安全培訓
- 《陪診從業人員能力培訓標準》
評論
0/150
提交評論