




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、生物信息基礎Basics in Bioinformatics生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室2生物信息學 引論生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室3內容提要什么是生物信息學生物信息學的研究內容生物信息學的研究意義生物信息學所涉及到的方法與技術引言物理和化學的發展 認識物質的組成,從分子、原子、電子等各層次上深 入地了解微觀世界, 物質的合成和分解天文技術/空間技術的發展 了解地球以外的客觀世界電子、信息科學與技術的發展 提供能力強大的計算軟硬件生命科學的發展 認識生命過程的物質基礎,
2、認識生命信息的組織、傳 遞和表達Q1: 生物體與其它物體有何差別?生物體的生長發育是生命信息控 制之下的復雜而有序的過程Q2: 生物體與其它物質有何差別?生物具有某種程度的智能生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室4生命科學生命過程的物質 基礎,生命信息 的組織、傳遞與 表達物理生命科學是一個交叉學科 研究生命過程的物質基礎,生命信息的組織、 傳遞和表達化學分子 生物學遺傳學信息技術生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室5生物信息學分子生物學數據深層次 生物學知識分子生物信息學 研究在分子生
3、物學水平上的生物信息數據的獲 取、存儲、分析和利用分子生物信息學 Molecular Bioinformatics生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室6挖掘分析生物信息學 與數據結構的區別與聯系分子生物學數據計算機計算(算法)+生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室7分子生物學的信息處理流程實驗數據信息收集表示/刻畫特征分析/ 比較建模/ 推理應 用基因工程 蛋白質設計 疾病診斷 疾病治療 開發新藥知識生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗
4、室8生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室9生物信息學以計算機和信息技術為工具,采用數學和信息科 學的理論、方法和技術去分析分子生物學數據, 以揭示在生物體的信息組織、表達和傳遞研究重點在核酸和蛋白質兩個方面,包括它們 的序列、結構和功能以及應用具體包括但不限于:以基因組DNA序列信息分析作為出發點認識遺傳信息的組織規律、破譯遺傳語言辨別隱藏在DNA序列中的基因,掌握基因調控信息對蛋白質空間結構進行模擬和預測,依據蛋白質結 構和功能的關系進行藥物分子設計等生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗
5、室10生物信息學的基本任務收集和管理分子生物學數據對數據進行分析和挖掘在DNA分析方面,著重分析DNA序列中的基因信息及 基因表達調控信息,分析基因表達數據,分析基因之 間的相互作用關系,比較不同種屬的基因組,研究基 因組中非編碼區域的生物學功能在蛋白質分析方面,著重分析蛋白質序列與蛋白質結 構及功能之間的關系,預測蛋白質的結構和功能,研 究蛋白質的進化關系開發分析工具生物分子序列比較工具 / 基因識別工具 / 生物分子結構 預測工具 /基因表達數據分析工具生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室1內容提要什么是生物信息學生物信息學的研究內容生
6、物信息學的研究意義生物信息學所涉及到的方法與技術12生物體中的信息與系統細胞存儲、復制、傳遞和表達 遺傳信息的系統分子生物信息的載體生物體的生長發育是生命信息控制之下的復 雜而有序過程, 本質是遺傳信息的傳遞和表達生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室13生物分子中的信息載體信息存儲的兩種載體DNA序列蛋白質的氨基酸序列 如何借助計算機去處理和 分析呢?記錄觀測數據,設計算法, 通過編程語言實現生物信息學的研究任務從分子生物學實驗所獲得的實驗數據去研 究生命信息的組織、表達與傳遞生物信息基礎 - Basics in Bioinformatic
7、s模式識別與智能系統實驗室14生物分子中的信息生物分子至少攜帶3種信息遺傳信息與功能相關的結構信息進化信息想象一下:從一個細胞開始,全自動地發育成一個 基本一樣的個體.生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室15生物分子所攜帶的三種信息遺傳信息控制生物體性狀的基因: DNA片段生物體生長發育的本質: 遺傳信息的傳遞和表達與功能相關的結構信息蛋白質的氨基酸序列決定蛋白質的空間結構蛋白質結構的信息隱含在氨基酸序列之中蛋白質的空間結構決定其功能基本假設進化信息DNA序列和蛋白質的氨基酸序列都含有進化信息通過比較不同種屬的同源蛋白質,可以分析蛋白質甚至
8、種屬之 間的進化關系,推測它們共同的祖先蛋白質通過比較相似的蛋白質序列(如肌紅蛋白和血紅蛋白),可以發 現由于基因復制而產生的分子進化證據生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室16生物信息學的典型研究問題序列分析序列對齊序列結構和功能預測基因定位與識別結構分析蛋白質結構比較蛋白質結構預測基因表達數據分析將表達模式相似的基因聚為一類, 以尋找相關基因,分析基因的功能蛋白質組學蛋白質之間相互作用網絡推斷生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室17生物信息基礎 - Basics in Bioinfo
9、rmatics模式識別與智能系統實驗室18序列分析從DNA序列與氨基酸序列數據中進行信息 和模式發現尋找進化聯系尋找基因組的編碼區尋找序列中的功能信號區全基因組序列的拼接與組裝識別非編碼區,探索其功能單核苷酸多態性 (Single Nucleotide Polymorphism: SNP)序列分析序列比對(Sequences Alignment)生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室19序列分析分子進化和基因組比較系統實驗室2生物信息基礎 - Basics in Bioinformatics模式識別與智能0舉例 : 序列標注與基因識別序列標注
10、/基因識別5ATGCCTACGATGCCTACCCTACGATGCCTAGGTTACCCCTACGATGCCTAATCGTTACCATCTGCCTAGGTTACCC。把序列讀一遍,指出 哪些部位記載了什么內容。不得了、這里說“眼睛長在耳朵后”生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室21生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室22類比舉例: 語法未知的字符串青孤黃不海城沙破長遙百樓云望戰蘭暗玉 穿終雪門金不山關甲還 青海長云暗雪山,孤城遙望玉門關。黃沙百戰 穿金甲,不破樓蘭終不還。 如果不知道字符
11、的組織規則語法,即使我 們能夠讀懂每個字符,我們仍不能理解整個內 容。生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室23結構分析蛋白質結構和功能的預測分析蛋白質家族保守序列尋找從氨基酸組成辨識蛋白質蛋白質二級結構預測蛋白質的三維結構蛋白質的物理性質預測其他特殊局部信息:其它特殊局部結構包括膜 蛋白的跨膜螺旋、信號肽、卷曲螺旋(CoiledCoils)等,具有明顯的序列特征和結構特征, 也可以用計算方法加以預測生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室24蛋白質的結構決定其功能蛋白質的氨基酸序列決定蛋白質
12、分子的結 構這是目前基本共認的假設蛋白質結構的信息隱含在蛋白質的氨基酸序列 之中蛋白質的空間結構決定蛋白質的功能例: 蛋白質結構預測若序列A對應的結構信息已知: .-Gly-Ala-Glu-Phe-Gly-Ala-Glu-Phe-Ala-Glu-Phe-Gly-Ala-Glu-Phe. 試推測未知序列B的可能結構.-Gly-Ala-Glu-Phe-Glu-Ala-Gly-Phe-Ala-Glu-Phe-Gly-Ala-Gly-Phe.生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室25基因表達數據分析基因表達數據:生物芯片技術的迅速發展,使我們可能得到
13、同一時間 成千上萬個基因的表達水平的數據基因表達數據的意義:提供了深入研究基因功能、基因相互作用、基因網絡 等復雜網絡問題的有力工具與智能系統實驗室2生物信息基礎 - Basics in Bioinformatics模式識別6生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室27基因調控網絡與信號轉導基因的表達過程受到蛋白質的調控一個基因的表達與否、表達量,均受到細胞中各種蛋白的調控; 基因的調控可以看作是細胞中各基因對應的 mRNA 與各種蛋白 的一個相互作用網絡信號轉導是指,當細胞受到某種影響,其中某個蛋白質的含量發 生變化,從而引起一系列的蛋白質的
14、表達變化的過程和路徑它對于研究藥理、病理、細胞的分化、發育、進化等重大問題都 十分重要信號轉導和基因調控網絡,與基因表達數據分析是緊密相 關的生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室28內容提要什么是生物信息學生物信息學的研究內容生物信息學的研究意義生物信息學所涉及到的方法與技術生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室29生物信息學的研究意義基于分子生物學的實驗數據認識生物的本 質引進現代信息學方法,研究生物分子中信息的 組織和結構,傳遞與調控,破譯基因組信息, 闡明生物信息之間的關系在醫學上的
15、重要意義探索疾病的發病機理為疾病的診斷和治療提供依據為設計新藥提供依據曼哈頓原子彈研制計劃人類基因組計劃阿波羅登月計劃1941.12.6 - 1945.7.16羅斯福批準 耗資20億美元原子半徑 原子體積10-10m10-30m31990.10.1 - 2003.4.23克林頓、布萊爾批準 耗資30億美元1961.5.25 - 1969.7.20肯尼迪批準 耗資240億美元人類歷史上的三大科技工程人體半徑 人體體積100m100m3太陽系半徑1012m 太陽系體積1034m3生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室30生物信息基礎 - Basi
16、cs in Bioinformatics模式識別與智能系統實驗室31后基因組時代的呼喚傳統生物學是一門實驗科學現代生物學的發展數據獲取日益實現自動化、半工業化需要從數據庫中實現數據挖掘、知識發現收集到海量數據難以完全依賴實驗手段對新數據進行分析,必須借助計算機實現分析 和篩選解決更復雜層次的生物學問題復雜的基因調控網絡、代謝網絡細胞間信號轉導過程生物個體全部基因表達變化研究范式的變化: 舊的范式: 從理論推測出發,用實驗去追蹤或檢驗推測的正確性新的范式: 從數據出發,通過數據分析,挖掘出數據中蘊含的特 定模式,反過來去尋求生物學上的理論解釋生物信息基礎 - Basics in Bioinfor
17、matics模式識別與智能系統實驗室32生物信息學與生物學實驗的關系傳統生物學是一門實驗科學,生物信息學是一門 借助計算機和信息技術的交叉學科生物信息學與生物學實驗作為生物信息學基礎和出發點的核酸、蛋白質序列數 據都來自于分子生物學實驗海量分子生物學數據需要發展新的“計算”手段,逐 個用實驗手段去確定結構與功能已不可能各種“XXX-組學”的研究開辟了生物學研究的新紀元(系統生物學)生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室33內容提要什么是生物信息學生物信息學的研究內容生物信息學的研究意義生物信息學所涉及到的方法與技術生物信息基礎 - Basic
18、s in Bioinformatics模式識別與智能系統實驗室34生物信息學所用的方法和技術數理統計方法動態規劃方法機器學習與模式識別技術數據庫技術及數據挖掘分子模型化技術生物分子的計算機模擬生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室35數理統計方法生物活動常常以大量、重復的形式出現,既受到 內在因素的制約,又受到外界環境的隨機干擾。 因此,概率論和數理統計是現代生物學研究中一 種常用的分析方法多元統計分析是生物學研究必備的工具隱馬爾科夫模型(Hidden Markov Models)在序列分 析方面有著重要的應用與隱馬爾科夫模型相關的技術是馬爾
19、科夫鏈(Markov Chain)生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室36動態規劃方法動態規劃(Dynamic Programming)是一 種解決多階段決策過程的最優化方法或復 雜空間的優化搜索方法是生物信息學中常用的一種基本優化方法在DNA序列或者蛋白質序列的比對、基因識別、RNA結構預測、隱馬爾科夫模型求解、生物分子探 針優化設計等方面有重要應用動態規劃解決問題的基本過程是:將一個復雜問題的全局解分解為一系列局部解,逆 序遞推求出局部最優解,隨著執行過程的推進,“局部”逐漸接近“全局”,最終獲得全局最優解機器學習與模式識別技術機器學習
20、是指借助計算機從經驗數據中尋找其中所蘊含的內在 規律、關系或結構等人工智能中偏于理論的分支模式識別也叫模式分類,是利用計算機對觀測對象(或客體)進 行自動識別或分類,將相同或相似的觀測對象(或客體) 歸入同一類別中比如:人臉識別、指紋指標、虹膜識別、掌紋識別、聲紋識別、 步態識別、字符識別、表情識別、物體識別等模式識別是機器學習的一個應用領域 模式(pattern)是觀測對象所具有的某種規律或結構生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室37生物信息基礎 - Basics in Bioinformatics模式識別與智能系統實驗室38數據庫技術及數據挖掘數據挖掘(data mining)又稱數據庫中的知識發現 (Knowledge Discovery in Database)它是從數據庫或數據倉庫中發現并提取隱藏在其中 的信息的一種新技術,它能自動分析數
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國圖書館打印計費系統行業投資前景及策略咨詢研究報告
- 陜西省咸陽市本年度(2025)小學一年級數學統編版課后作業((上下)學期)試卷及答案
- 見習期教師考核自我鑒定(3篇)
- DB21-T1812-2019-平菇熟料袋式栽培技術規程-遼寧省
- 2025至2031年中國單向碳纖維預浸布行業投資前景及策略咨詢研究報告
- 2025云南普洱綠佳食品有限公司招聘56人筆試參考題庫附帶答案詳解
- DB13-T3019-2018-高速公路收費站服務規范-河北省
- 什么是夢想演講稿三分鐘(4篇)
- 纖維增強塑料壓力容器企業ESG實踐與創新戰略研究報告
- 電氣音響、信號及類似裝置企業ESG實踐與創新戰略研究報告
- 慢性病護理的畢業論文范文
- 《特斯拉汽車供應鏈管理》課件
- 內河船舶船員基本安全知識考試題庫300題(含答案)
- 無人機操控 教學設計公開課教案教學設計課件
- 2024 年普通高等學校招生全國統一考試新課標 I 卷-數學試卷-全國
- 《瑞幸咖啡財務造假案例分析》8400字(論文)
- 安全生產法律法規注冊安全工程師考試(初級)試題與參考答案(2024年)一
- (試卷)2024貴州省初中學業水平考試·物理
- 云南省職業技能大賽(健康照護賽項)理論參考試題及答案
- 自然辯證法論述題146題帶答案(可打印版)
- DB43T 2534-2022 電力氣象服務技術規范
評論
0/150
提交評論