第一章-生物信息學緒論_第1頁
第一章-生物信息學緒論_第2頁
第一章-生物信息學緒論_第3頁
第一章-生物信息學緒論_第4頁
第一章-生物信息學緒論_第5頁
已閱讀5頁,還剩100頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章生物信息學緒論金萍南京師范大學比較基因組學與生物信息學實驗室1內容一、生物信息學定義二、生物信息學的開展歷史三、生物信息學的主要研究內容四、生物信息學的研究意義五、生物信息學所用的方法和技術六、生物信息學學習方法七、研究生物信息學的一般步驟八、生物信息學的展望2一、生物信息學定義3生物信息學〔Bioinformatics〕名詞的由來八十年代末期,林華安博士認識到將計算機科學與生物學結合起來的重要意義,開始留意要為這一領域構思一個適宜的名稱。起初,考慮到與將要支持他主辦一系列生物信息學會議的佛羅里達州立大學超型計算機計算研究所的關系,他使用的是“CompBio〞;之后,又將其更改為兼具法國風情的“bioinformatique〞,看起來似乎有些古怪。因此不久,他便進一步把它更改為“bio-informatics〔bio/informatics〕〞。但由于當時的電子郵件系統與今日不同,該名稱中的-或/符號經常會引起許多系統問題,于是林博士將其去除,今天我們所看到的“bioinformatics〞就正式誕生了,林博士也因此贏得了“生物信息學之父〞的美譽。4生物信息學之父——林華安Dr.HwaA.Lim〔林華安〕1987年提出“Bio-informatique〞→“Bioinformatics〞1955年出生于馬來西亞。聯合國Bioinformatics專家,UniversityofTexasatDallas分子與細胞生物學AdjunctProfessor、中國科學院基因遺傳研究所客座教授。1981年英國倫敦大學帝國學院(ImperialCollege,LondonUniversity)畢業,1986年獲得美國RochesterUniversity生化物理學博士學位,30歲取得佛羅里達州立大學終生教授。1992年受聘擔任美國國家癌癥中心及美國國家科學基金會審核委員。1995年后,歷任多家生物科技公司生化信息執行長、副總裁等高層管理職位。1997年,創立結合軟件與數據分析的專業參謀公司D’Trends,效勞生物技術、制藥及衛生保健等機構。5什么是生物信息學

?6背景人類基因組方案(HumanGenomeProject,HGP):1990年正式啟動,旨在完成人類基因組約30億個堿基的全序列測定。海量生物數據的迅速膨脹:DNA、RNA和蛋白質序列,蛋白質二級結構和三維結構數據,蛋白質相互作用數據等。對大量生物數據的管理、分析和信息化需求促進了生物信息學的迅速開展。7生命信息的組織、傳遞、表達物理化學分子生物學遺傳學信息技術各學科參與、協作:生命科學、數學、物理學、化學、計算機科學、材料科學以及倫理、法律等社會科學……生物信息學誕生8生物信息學定義的歷史演變定義一:生物信息學是一門收集、分析遺傳數據以及分發給研究機構的新學科〔Bioinformaticsisanewsubjectofgeneticdatacollection,analysisanddisseminationtotheresearchcommunity〕。(Dr.HwaA.Lim,1987)定義二:生物信息學特指數據庫類的工作,包括持久穩固的在一個穩定的地方提供對數據的支持〔Bioinformaticsreferstodatabase-likeactivities,involvingpersistentsetsofdatathataremaintainedinaconsistentstateoveressentiallyindefiniteperiodsoftime〕。(Dr.HwaA.Lim,1994)定義三:生物信息學是在大分子方面的概念型的生物學,并且使用了信息學的技術,這包括了從應用數學、計算機科學以及統計學等學科衍生而來各種方法,并以此在大尺度上來理解和組織與生物大分子相關的信息。(Luscombe,2001)9生物信息學說文解字:生物+信息+學(bioinformatics)biology+information+theory廣義:

應用信息科學的方法和技術,研究生物體系和生物過程中信息的存貯、信息的內涵和信息的傳遞,研究和分析生物體細胞、組織、器官的生理、病理、藥理過程中的各種生物信息,或者也可以說成是生命科學中的信息科學。狹義:

應用信息科學的理論、方法和技術,管理、分析和利用生物分子數據。

10“生物信息學和計算生物學〞方案NIH于2003年形成了一個通向生命科學未來的“中長期開展規劃〞--國立衛生研究院路線圖〔NIH

Roadmap〕。NIH路線圖中啟動了一個“生物信息學和計算生物學〞方案,希望通過這個工程的實施而鋪設一條通向生命科學未來的“信息高速公路〞。該工程方案從2004年開始,建立數個“國立生物醫學計算中心〞,以便開發相關軟件和數據管理工具。11計算生物學計算生物學〔ComputationalBiology〕是生物學的一個分支。根據美國國家衛生研究所〔NIH〕的定義,它是指開發和應用數據分析及理論的方法、數學建模、計算機仿真技術等,用于生物學、行為學和社會群體系統的研究的一門學科。12生物信息學與計算生物學區別與聯系有些人將計算生物學作為生物信息學的同義詞處理;但是另外一些人認為計算生物學和生物信息學應當被作為不同的條目處理。生物信息學主要側重于對生物學中所得信息的采集、存貯、分析處理與可視化方面,而計算生物學主要側重于使用計算技術對生物學問題進行研究方面。13生物信息學根本思想的產生生物信息學的迅速開展二十世紀50年代二十世紀80-90年代生物科學和技術的開展人類基因組方案的推動二、生物信息學的開展歷史14〔一〕前基因組時代的生物信息學屬于生物物理學范疇的傳統生物信息學可以追溯到很久以前,如研究生物發光、生物電、生物磁和激素等信息物質的傳遞現象及其相應測定技術。以研究序列比對為標志的現代生物信息學那么起源于20世紀70~80年代。這一階段的主要成就包括核酸和蛋白質序列的初步分析、生物學數據庫的建立以及檢索工具的開發。例如Dayhoff的替換矩陣、Neelleman和Wunsch的序列比對〔sequencealignment〕及GenBank〔由美國國立生物技術信息中心建立和維護的核酸與蛋白質序列數據庫〕等大型數據庫的建立,形成了生物信息學的雛形。1520世紀50年代,生物信息學開始孕育20世紀60年代,生物分子信息在概念上將計算生物學和計算機科學聯系起來20世紀70年代,生物信息學的真正開端(序列比對算法)20世紀80年代初期,生物信息分析方法的開展20世紀80年代以后,生物信息效勞機構和數據庫20世紀90年代后,HGP促進生物信息學的迅速開展生物信息學的孕育和初步形成161956:美國田納西州首次召開了“生物學中的理論研討會〞;1962:Zucherkandl和Pauling研究了序列變化與進化的關系,開創了一個新的領域——分子進化;1967:Dayhoff研制出蛋白質序列圖集,即后來著名的蛋白質信息源PIR;1970:Needleman和Wunsch提出了著名的序列比對算法,是生物信息學開展中最重要的奉獻;1970:Gibbs和McIntyre發表著名的矩陣打點做圖法;1978:Gingeras等人研制了核酸序列中酶切位點識別程序;1981:Smith和Waterman提出了著名的公共子序列識別算法,同年Doolittle提出了關于序列模式的概念;171982:GenBank第3版本正式發行;1983:Wilbur和Lipman發表了數據庫相似序列搜索算法;1986:日本核酸序列數據庫DDBJ誕生;1986:蛋白質數據庫SWISS-PROT誕生;1988:美國國家生物技術信息中心NCBI誕生;1988:成立歐洲分子生物學網絡(EMBNet),EMBL數據庫誕生;1988:Person和Lipman發表了著名的序列比較算法FASTA;1990:快速相似性序列搜索算法BLAST問世,1987年BLAST的改進版本PSI-BLAST投入使用18〔二〕基因組時代的生物信息學以基因組方案的實施為標志的基因組時代〔1990年至2001年〕是生物信息學成為一個較完整的新興學科并得到高速開展的時期。這一時期生物信息學確立了自身的研究領域和學科特征,成為生命科學的熱點學科和重要前沿領域之一。這一階段的主要成就包括大分子序列以及表達序列標簽〔expressedsequencetag,EST〕數據庫的高速開展、BLAST〔basiclocalalignmentsearchtool〕和FASTA〔fastalignment〕等工具軟件的研制和相應新算法的提出、基因的尋找與識別、電子克隆〔insilicocloning〕技術等,大大提高了管理和利用海量數據的能力。19人類基因組方案(HGP,HumanGenomeProject)目標:整體上破解人類遺傳信息的奧秘由美國NIH和能源部提出和帶頭,美、英、德、法、日、中共同參與的國際合作工程。重大國際研究工程:測定人類基因組全部DNA序列,構建人類基因組遺傳圖譜和物理圖譜。1990年:正式啟動,30億美元。2001年:人類基因組草圖公開發表。2003年:美國宣布該工程完成。20HGP的歷史回憶1984.12猶他州阿爾塔組織會議,初步研討測定人類整個基因組DNA序列的意義1985Dulbecco在《Science》撰文“腫瘤研究的轉折點:人類基因組的測序〞美國能源部(DOE)提出“人類基因組方案〞草案1987美國能源部和國家衛生研究院〔NIH〕聯合為“人類基因組方案〞下撥啟動經費約550萬美元1989美國成立“國家人類基因組研究中心〞,Watson擔任第一任主任1990.10經美國國會批準,人類基因組方案正式啟動21第一個自由生物體流感嗜血菌(H.inf)的全基因組測序完成1996完成人類基因組方案的遺傳作圖啟動模式生物基因組方案H.inf全基因組Saccharomycescerevisiae釀酒酵母Caenorhabditiselegans秀麗線蟲221997大腸桿菌(E.coli)全基因組測序完成1998完成人類基因組方案的物理作圖開始人類基因組的大規模測序Celera公司參加,與公共領域競爭啟動水稻基因組方案1999.7第5屆國際公共領域人類基因組測序會議,加快測序速度大腸桿菌及其全基因組水稻基因組方案231999.7第5屆國際公共領域人類基因組測序會議,加快測序速度2000Celera公司宣布完成果蠅基因組測序國際公共領域宣布完成第一個植物基因組——擬南芥全基因組的測序工作Drosophilamelanogaster果蠅Arabidopsisthaliana擬南芥242001年2月15日《Nature》封面2001年2月16日《Science》封面2000.6.26公共領域和Celera公司同時宣布完成人類基因組工作草圖2001.2.15《Nature》刊文發表國際公共領域結果2001.2.16《Science》刊文發表Celera公司及其合作者結果2526我國對人類基因組方案的奉獻27人類基因組方案準備用15年時間投入30億美元,完成人全部24(22+X+Y)條染色體中3.2×109個堿基對的序列測定,主要任務包括做圖〔遺傳圖譜\物理圖譜以及轉錄圖譜的繪制〕、測序和基因識別,其根本任務是解讀和破譯生物體的生老病死以及與疾病相關的遺傳信息。28人類基因組人類基因組的組成線粒體基因組(16.6kb)細胞核基因組(3200Mb)基因外序列基因和基因有關序列約10%約90%專一或中等重復序列Non-codingDNA假基因內含子基因片段<10%>90%專一的或低拷貝數序列中度至高度重復序列20~30%70~80%分散重復序列串聯重復序列/成簇重復序列約60%約40%蛋白編碼基因rRNA基因tRNA基因CodingDNA估計10萬→最初公布3.5萬→目前研究確定2.45萬29籠統的說,人類基因組方案為我們研究生物信息的組織、結構、遺傳、表達帶來了極大的方便,使人類對自身有一個根本的了解。人類是最高級、最復雜、最重要的生物,如果搞清楚人類基因組,那么再研究其它的生物就容易得多。研究多種模式生物基因組將有助于研究地球生物的進化史。人類基因組方案的實施意義引言30HGP帶來的科學挑戰隨著實驗數據和可利用信息急劇增加,信息的管理和分析成為HGP的一項重要的工作發現生物學規律解讀生物遺傳密碼認識生命的本質研究基因組數據之間的關系分析現有的基因組數據利用數學模型和計算技術31基因組方案帶來的科學挑戰隨著實驗數據和可利用信息急劇增加,信息的管理和分析成為基因組方案的一項重要的工作。1、信息的整合2、信息的儲存3、信息的比較4、信息的分析5、信息的分解基因組學功能基因組學3233生物信息學的研究結構基因組學時期34基因組數據庫蛋白質序列數據庫蛋白質結構數據庫DDBJEMBLGenBankSWISS-PROT

PDBPIR1生物分子數據的收集與管理352數據庫搜索及序列比較搜索同源序列在一定程度上就是通過序列比較尋找相似序列序列比較的一個根本操作就是比對〔Alignment〕,即將兩個序列的各個字符〔代表核苷酸或者氨基酸殘基〕按照對應等同或者置換關系進行比照排列,其結果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區域,也可用于研究一組蛋白質之間的進化關系。363運用計算機軟件進行序列拼接374基因識別與定位385基因相關的SNP研究SingleNucleotidePolymorphisms(SNP),是指在基因組上單個核苷酸的變異,一般而言,SNP是指變異頻率大于1%的單核苷酸變異3940基因變異與疾病40與以前的該RILs的重組圖譜比較分析,在150個RILs中鑒定出2334個重組框,平均每個框的大小約164kb利用slidingwindow方法分析SNP位點與表型間的關系與重組位點利用全基因組重測序分析表型差異Slidingwindow方法416非編碼區信息結構分析在微生物中,非編碼區只占整個基因組序列的10%~20%;但在高等生物和人類基因組中,非編碼序列那么占了基因組序列的絕大局部。在人的基因組中,非編碼序列超過95%42非蛋白編碼區約占人類基因組的95%,其生物學意義目前尚不是很清楚,但從演化觀點來看,其中必然蘊含著重要的生物學功能,由于它們并不編碼蛋白,一般認為,它們的生物學功能可能表達在對基因表達的時空調控上。對非蛋白編碼區進行生物學意義分析的策略有兩種,一種是基于已有的已經為實驗證實的所有功能的DNA元件的序列特征,預測非蛋白編碼區中可能含有的功能的DNA元件,從而預測其可能的生物學功能,并通過實驗進行驗證;另一種那么是通過數理理論直接探索非蛋白編碼區的新的未知的序列特征,并從理論上預測其可能的信息含義,最后同樣通過實驗驗證。436比較基因組學比較基因組學(ComparativeGenomics)是基于基因組圖譜和測序根底上,對的基因和基因組結構進行比較,來了解基因的功能、表達機理和物種進化的學科。44比較基因組分析各類功能基因中氨基酸在物種間差異比例差異同源蛋白GO分類進化關系分析457基因組演化與物種演化(生命之樹)46生物進化譜系樹大鼠、小鼠、狗、大熊貓、牛……家雞、火雞……斑馬魚……擬南芥、水稻、楊樹、釀酒葡萄、短柄草、黃瓜、高粱、玉米……1535個細菌基因組、49個真菌基因組和78個古細菌……

利什曼原蟲、椎體蟲……四類藍藻……隱藻……蜜蜂……47盡管已經在分子演化方面取得了許多重要的成就,但僅僅依靠某些基因或者分子的演化現象,就想說明物種整體的演化歷史似乎不太可靠。例如,智人與黑猩猩之間有98%-99%的結構基因和蛋白質是相同的,然而表型上卻具有如此巨大的差異,這就不能不使我們聯想到形形色色千差萬別的建筑樓群,它們的外觀如此不同,但根底的部件組成卻是幾乎一樣的,差異就在于這些根底部件的組織方式不同,這就提示我們基因組整體組織方式而不僅僅是個別基因在研究物種演化歷史中的重要作用。由于基因組是物種所有遺傳信息的儲藏庫,從根本上決定著物種個體的發育和生理,因此,從基因組整體結構組織和整體功能調節網絡方面,結合相應的生理表征現象,進行基因組整體的演化研究,將是揭示物種真實演化歷史的最正確途徑。488基因表達數據的分析與處理基因表達數據分析是目前生物信息學研究的熱點和重點目前對基因表達數據的處理主要是進行聚類分析,將表達模式相似的基因聚為一類,在此基礎上尋找相關基因,分析基因的功能所用方法主要有:相關分析方法、模式識別技術中的層次式聚類方法、人工智能中的自組織映射神經網絡、主元分析方法等表達數據缺點:僅反映mRNA豐度,噪聲,…49蛋白質三維結構測定主要方法:X射線晶體結構分析、多維核磁共振〔NMR〕波譜分析和電子顯微鏡二維晶體三維重構〔電子晶體學,EC〕等物理方法9蛋白質結構及功能預測50基因組和蛋白質組研究的迅猛開展,使許多新蛋白序列涌現出來,然而要想了解它們的功能,只有氨基酸序列是遠遠不夠的,因為蛋白質的功能是通過其三維高級結構來執行的,而且蛋白質三維結構也不一定是靜態的,在行使功能的過程中其結構也會相應的有所改變。因此,得到這些新蛋白的完整、精確和動態的三維結構就成為擺在我們面前的緊迫任務。目前除了通過諸如X射線晶體結構分析、多維核磁共振〔NMR〕波譜分析和電子顯微鏡二維晶體三維重構〔電子晶體學,EC〕等物理方法得到蛋白質三維結構蛋白質結構51另外一種廣泛使用的方法就是通過計算機輔助預測的方法,目前,一般認為蛋白質的折疊類型只有數百到數千種,遠遠小于蛋白質所具有的自由度數目,而且蛋白質的折疊類型與其氨基酸序列具有相關性,這樣就有可能直接從蛋白質的氨基酸序列通過計算機輔助方法預測出蛋白質的三維結構52基因組對生命體的整體控制必須通過它所表達的全部蛋白質來執行,由于基因芯片技術只能反映從基因組到RNA的轉錄水平上的表達情況,由于從RNA到蛋白質還有許多中間環節的影響,因此僅憑基因芯片技術我們還不能最終掌握生物功能具體執行者——蛋白質的整體表達狀況;近幾年在開展基因芯片的同時,人們也開展了一套研究基因組所有蛋白質產物表達情況——蛋白質組研究技術,從技術上來講包括二維凝膠電泳技術和質譜測序技術。通過二維凝膠電泳技術可以獲得某一時間截面上蛋白質組的表達情況,通過質譜測序技術就可以得到所有這些蛋白質的序列組成。這些都是技術實現問題,最重要的就是如何運用生物信息學理論方法去分析所得到的巨量數據,從中復原出生命運轉和調控的整體系統的分子機制。10蛋白質組研究

53蛋白質組研究541〕、診斷類藥物:生物芯片設計遺傳病:基因診斷感染性疾病:抗體、基因芯片、PCR技術11藥物設計:55病人/健康人基因芯片診斷及早治療,對癥下藥562〕、預防類藥物:計算機輔助疫苗設計計算機預測抗原表位57

所謂基因組藥物(Genomicdrug)是指利用基因序列數據,經生物信息學分析、高通量基因表達、高通量功能篩選和體內外藥效研究開發得到的新藥候選物.實際上利用了反向生物學的原理.沿著從基因序列一蛋白質一功能一藥物的途徑研制新藥,其優勢是取自龐大的人類基因資源及其編碼蛋白質做為原材料,具有巨大的開發潛力。3〕、開發基因組藥物58美國的人類基因組科學公司(HGS公司)。根據其1999年2月公布的消息,在功能基因組研究領域,HGS公司己發現95%的人類cDNA;克隆了9000個人類分泌蛋白質的全長cDNA;發現了3000個基因的可能醫學應用;發現了35個新的白細胞介素類分子和40個新的生長因子類分子;已有3個基因組藥物進入臨床。594〕、尋找藥物作用新靶點基因組比較:抗微生物同源性搜索表達差異分析60理想的抗生素靶標應為微生物細胞存活所必須,在病原體中高度保守,且在人體中不存在或與人類基因有根本差異。基因組研究促進了新靶標的發現:61生物信息學和人類基因組方案為藥物靶標的發現和新藥的研制開創了新天地,未來的藥物設計將是基于生物信息學的知識挖掘的過程.通過數據分析首先確立靶標分子預測蛋白質分子結構設計藥物分子與靶標分子相互作用62計算機輔助分子建模,分子三維結構可視化。1982年,Dock程序已成功的有HIV蛋白酶抑制劑、二氫葉酸復原酶抑制劑等5〕、計算機輔助藥物設計63開發階段:藥物基因組學減少藥物副作用防止開發風險646566〔三〕后基因組時代的生物信息學隨著人類基因組方案的順利進行,人類全基因組測序工作已經完成。測序工作的完成并不代表基因組方案的結束,相反標志著“后基因組信息學〞的開始。基因組學研究也由結構基因組轉向了功能基因組的研究,通過對基因組的分析來了解生物體的功能成為后基因組時代的主要目標。后基因組時代,生物綜合論將成為生物學的主流研究方法。人們在網絡觀點下、在分子相互作用網絡水平理解生物學的根本原理。后基因組生物信息學有時也稱為功能基因組系統學。功能基因組系統學的出現,是生物信息學領域的一個重大變化,它由主要以整理、儲存、分析生物學數據或知識轉變為綜合多種生物分子及其相互作用的知識來了解生物系統的功能。67后基因組研究對象的多層次性后基因組研究對象是多層次的,人們從包括基因組〔Genome〕、轉錄組〔Transcriptome〕、蛋白質組〔Proteome〕、相互作用組〔Interactome)、定位組〔Localizome〕、折疊子組〔foldome〕、代謝組〔Metabolome〕、表型組〔Phenome〕等方面,從組的角度研究各類生物學過程。如果說基因組問題涉及遺傳圖譜〔Geneticmap〕、限制性圖譜〔Restrictionmap〕和物理圖譜〔Physicalmap〕,那么其它的組學涉及功能圖譜〔Functionalmaps〕。68但現在更加合理的看法是基因組只是細胞中分子之間相互作用的整個網絡的一局部。基因組只是細胞指令的大倉庫,相互作用網絡本身才是那個所謂的指令系統,這個系統遵循固有程序引導發育過程,并產生生殖細胞。后基因組生物信息學是以對一系列生物學知識的綜合為特征的,是在網絡觀點下、在分子網絡層次上研究和理解生命的根本規律。69功能基因組學開展趨勢功能基因組學開展的一個最新和重要領域是系統生物學〔SystemsBiology〕,系統生物學研究問題有如下三個特點:1、更好整合生物過程不同階段的分散數據如整合基因組、轉錄組、蛋白質組和代謝組的數據,得到對生物學過程的總體認識。另外一個方面是為了滿足整合數據庫的復雜查詢。2、對復雜生物過程的更好模擬包括蛋白質折疊和復雜系統建模〔如信號/代謝通路和發病機理〕3、生物過程動態研究從一個通路的成分到一個通路的動力學70功能基因組系統學正如前面所述,在相互作用網絡背景下闡釋“功能〞是功能基因組系統學的一個主要特點。另外一個特點是復雜系統的思想,把生物體看作一個復雜系統進行研究。主要有三個特征:1多層次數據整合整合包括基因組、蛋白質組、轉錄、表達和調控路徑等方面數據2系統的復雜性特點具有復雜系統的自組織、自調控和突變等特點3信息學分析采用信息學方法對多種數據進行分析是功能基因組系統學的又一特點71傳統生物學關注的是一個一個的通路,而后基因組生物信息學那么希望研究各個通路之間的相互作用,構成一個復雜的相互作用網絡,從而從更高的層面上理解生命過程。通俗地說:傳統生物學看到的是樹木,后基因組生物信息學那么看到的是森林。72圖中顯示了基于信息學方法、整合多層次數據在網絡層面研究細胞內復雜生物過程的根本思想。基于知識的網絡預測73一切從基因組開始…

—“基因組到生命〞〔Genomes

to

Life,GTL〕方案7475高通量測序在組學中的應用從頭測序基因組重測序轉錄組測序SmallRNA測序Listeretal.CurrentOpinioninPlantBiology(2023)12:10776777879分子生物網絡的分類分子生物網絡的分類標準基于分子生物學的分類標準。分子生物網絡分類基因調控網絡信號轉導網絡表觀遺傳調控網絡疾病基因網絡代謝網絡蛋白質互作網絡801.信號傳導網絡cAMP與蛋白激酶對細胞活性的影響812.基因調控網絡823.蛋白質互作網絡人類蛋白質互作網絡834.代謝網絡84855.疾病基因網絡866.表觀遺傳調控網絡87888990三、生物信息學的主要研究內容生物信息的存儲與查詢;序列比對;基因預測及基因組分析;比較基因組與系統發育分析;RNA結構預測;蛋白質結構預測;分子設計與藥物設計;生物網絡;生物芯片。91生物信息學系統化概圖92四、生物信息學的研究意義生物信息學將是21世紀生物學的核心

認識生物本質了解生物分子信息的組織和結構,破譯基因組信息,說明生物信息之間的關系改變生物學的研究方式改變傳統研究方式,引進現代信息學方法在醫學上的重要意義為疾病的診斷和治療提供依據為設計新藥提供依據93五、生物信息學所用的方法和技術

1、數學統計方法(高維、樣本量的問題)2、動態規劃方法3、機器學習與模式識別技術〔從數據中學習〕4、數據庫技術及數據挖掘5、人工神經網絡技術6、專家系統7、分子模型化技術8、量子力學和分子力學計算9、生物分子的計算機模擬10、因特網〔Internet〕技術(Grid計算)。。。94生物信息學的相關雜志95六、生物信息學學習方法〔一〕采用多學科交叉的方法來學習例如,一個生物信息學問題的解決,可能需要在實驗生物學充分的實驗證據根底之上進行計算生物學的算法與理論推導,加上高效的編程和簡明的界面設計才能最終完成。生物學,計算機科學和數學等多個相關學科。96〔二〕以網絡作為平臺和工具進行學習例如,大量的序列數據保存在網絡的生物信息學效勞器中,生物信息數據的提交、發布、提取、查詢相關、比對和其他計算等都需要通過網絡實現,也可以通過網絡共享數據乃至進行生物信息學方面的并行計算,大量生物信息學工具軟件、教學課件、參考資料、論壇和新聞組等資源都是存在于網絡之中,因此,必須熟練掌握以網絡作為平臺和工具的方法學習生物信息學。97〔三〕在理論和實踐的高度互動中學習例如蛋白質和核酸序列等生物信息學的研究對象來自于試驗研究,而算法那么屬于理論研究,所以生物信息學屬于一門理論性和實踐性高度互動的學科,即具有很強的理論性,又具有很強的實踐

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論