




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1比較基因組學(xué)比較基因組學(xué)原理及應(yīng)用原理及應(yīng)用成員:韓柳 閻永偉 黃繼 馬壽光朱琳 姜南 李春麗2比較基因組學(xué)比較基因組學(xué)相關(guān)概念相關(guān)概念韓柳3基因組學(xué)概念及范疇基因組學(xué)概念及范疇基因組基因組( (genome) )泛指一個(gè)有生命體、病毒或細(xì)胞器的全部泛指一個(gè)有生命體、病毒或細(xì)胞器的全部遺傳物質(zhì);在真核生物,基因組是指一套染色遺傳物質(zhì);在真核生物,基因組是指一套染色體(單倍體)體(單倍體)DNA。 基因組學(xué)基因組學(xué)(genomics)就是發(fā)展和應(yīng)用就是發(fā)展和應(yīng)用DNA制圖、測(cè)序新技術(shù)以制圖、測(cè)序新技術(shù)以及計(jì)算機(jī)程序,分析生命體(包括人類(lèi))全部及計(jì)算機(jī)程序,分析生命體(包括人類(lèi))全部基因組結(jié)構(gòu)及
2、功能?;蚪M結(jié)構(gòu)及功能。4基因組學(xué)概念基因組學(xué)概念5比較基因組學(xué)概念 定義:定義:比較基因組學(xué)(Comparative Genomics)是基于基因組圖譜和測(cè)序基礎(chǔ)上,對(duì)已知的基因和基因組結(jié)構(gòu)進(jìn)行比較,來(lái)了解基因的功能、表達(dá)機(jī)理和物種進(jìn)化的學(xué)科。 研究?jī)?nèi)容:研究?jī)?nèi)容:種間的比較基因組學(xué) 和 種內(nèi)的比較基因組學(xué)67概念工具:工具: 1、FASTA 2、BLAST 3、CLUSTAL W基因組分類(lèi):基因組分類(lèi): 1、通過(guò)比較確知其功能的。 2、在數(shù)據(jù)庫(kù)中有相匹配的蛋白,但不知道其功能。 3、在現(xiàn)有的數(shù)據(jù)庫(kù)中找不到任何相匹配的蛋白質(zhì)序列的新基因。89部分真核、原核生物基因組成成份分析部分真核、原核生
3、物基因組成成份分析10通過(guò)基因組數(shù)據(jù)進(jìn)行比較基因組學(xué)研究通過(guò)基因組數(shù)據(jù)進(jìn)行比較基因組學(xué)研究 例子: 尿殖道支原體帶有已知最小的基因組,可依此確定能自我復(fù)制的細(xì)胞必需的一套最少的核心基因。 流感嗜血桿菌的基因組為1.83MB,尿殖道支原體的基因組只有0.58Mb,二者相差3倍多,那么,基因組是大小影響了基因的數(shù)目還是基因的尺度?11 流感嗜血桿菌的基因大小平均900bp,尿殖道支原體的基因?yàn)?040bp,他們基因大小差不多 流感嗜血桿菌中平均1024bp有一個(gè)基因,尿殖道支原體平均1235bp有一個(gè)基因。 結(jié)論:結(jié)論:基因尺度減小并不引起基因密度的增加和基因本身尺寸的減小。 二者的差別在于基因數(shù)
4、量上,流感嗜血桿菌基因有1743個(gè)ORF,而尿殖道支原體只有470個(gè)ORF12比較基因組有助于解決進(jìn)化距離問(wèn)題比較基因組有助于解決進(jìn)化距離問(wèn)題13 測(cè)序技術(shù)與測(cè)序技術(shù)與 比較基因組學(xué)比較基因組學(xué) 閻永偉14 比較基因組學(xué)是在基因組圖譜和測(cè)序的基礎(chǔ)上,利用某個(gè)基因組研究獲得的信息推測(cè)其他原核生物、真核生物類(lèi)群中的基因數(shù)目、位置、功能、表達(dá)機(jī)制和物種進(jìn)化的學(xué)科。 該學(xué)科的發(fā)展及所取得的成果與序列的積累相同步,尤其是人類(lèi)全基因組序列的分析與比較使比較基因組學(xué)成為整個(gè)生物學(xué)領(lǐng)域最新、最重要、進(jìn)展最快和影響最大的學(xué)科之一。 15 1. 已完成的測(cè)序已完成的測(cè)序 比較基因組學(xué)從一開(kāi)始就是人類(lèi)基因組計(jì)劃的一
5、部分。 人類(lèi)基因組計(jì)劃的原始計(jì)劃是測(cè)定人類(lèi)和一部分模式生物(如細(xì)菌,酵母,果蠅,秀麗隱桿線(xiàn)蟲(chóng),小鼠等)的全基因組序列。16Homo sapiens 2010年全部完成Pan troglodytes Lander et al. 2005 ;Mus musculus Waterston et al. 2002 ;Rattus norvegicus Gibbs et al. 2004 ;Drosophila melanogaster Adams et al. 2000 ;Escherichia coli Blattner et al. 1997 ;Saccharomyces cerevisiae G
6、offeau et al. 1996 ;Ciona intestinalis Dehal et al. 2002, Small et al. 2007;Caenorhabditis elegans Stain et al. 2003, Stein et al. 1998 。17HGP完成以后: Gallus gallus 雞 Blattner et al. 2004 , Bos taurus 牛 Elsik et al. 2009, Canis familiaris 狗 Lindblad-Toh et al. 2005,Apis mellifera 蜜蜂 Lindblad-Toh et al.
7、 2006, Anthocidaris crassispina 紫海丹 Sodergren et al. 2006Macaca mulatta 恒河猴 Gibbs et al. 2007 18 In Entrez Genome,10001000 complete Prokaryotic Genomes are available!測(cè)序完成情況統(tǒng)計(jì)測(cè)序完成情況統(tǒng)計(jì)192.2.測(cè)序技術(shù)概述測(cè)序技術(shù)概述 絕大多數(shù)生物的遺傳物質(zhì)為DNA,然而遺傳信息卻僅僅由四種堿基A,T,C,G排列組合而成。 自從DNA的雙螺旋結(jié)構(gòu)被發(fā)現(xiàn)以后,能夠知道DNA分子上四種堿基的順序就成為了一個(gè)新的熱點(diǎn)。 于是,繼蛋白質(zhì)和
8、RNA測(cè)序之后,又出現(xiàn)了DNA測(cè)序。20自1977年出現(xiàn)DNA測(cè)序技術(shù)至今, 第一代測(cè)序技術(shù) 第二代測(cè)序技術(shù) 第三代測(cè)序技術(shù)21(1)測(cè)序技術(shù)的出現(xiàn)及第一代測(cè)序技術(shù) 1)測(cè)序技術(shù)的出現(xiàn) 1975年,Sanger和Coulson發(fā)明了“加減法”測(cè)定DNA序列;1977年,又引入ddNTP,發(fā)明了雙脫氧終止法; 1977,Maxam和Gilbert發(fā)明了化學(xué)降解法測(cè)定DNA序列。22 Fig1. 雙脫氧終止法測(cè)序232)第一代測(cè)序技術(shù) 傳統(tǒng)的化學(xué)降解法、雙脫氧鏈終止法以及在它們的基礎(chǔ)上發(fā)展來(lái)的各種DNA測(cè)序技術(shù)統(tǒng)稱(chēng)為第一代DNA測(cè)序技術(shù)。 第一代測(cè)序技術(shù)在分子生物學(xué)研究中發(fā)揮過(guò)重要的作用,如人類(lèi)基
9、因組計(jì)劃主要基于第一代DNA測(cè)序技術(shù)。 24 目前基于熒光標(biāo)記和Sanger的雙脫氧鏈終止法原理的熒光自動(dòng)測(cè)序儀(如ABI 3730XL)仍被廣泛地應(yīng)用。 雜交測(cè)序技術(shù)也是第一代測(cè)序技術(shù),但是并非基于以上兩種原理。速度快,但是誤差大。25 Fig.2 ABI 3730XL26(2)第二代測(cè)序技術(shù) 后基因組時(shí)代亦即功能基因組時(shí)代的測(cè)序技術(shù),顯著特征是高通量、低成本。 主要包括羅氏454公司的GS FLX測(cè)序平臺(tái)、Illumina公司的Solexa Genome Analyzer測(cè)序平臺(tái)和ABI公司的SOLiD測(cè)序平臺(tái)。27 Fig.3 Roche 454GS FLX 平臺(tái)2829Fig.4 Il
10、luminaSolexa平臺(tái)3031 Fig.5 ABI SOLiD平臺(tái)3233參考文獻(xiàn): DNA測(cè)序技術(shù)的發(fā)展歷史與最新進(jìn)展, 解增言等;DNA測(cè)序技術(shù)發(fā)展及其展望, 孫海汐等。34(3)第三代測(cè)序技術(shù) 以單分子測(cè)序?yàn)樘攸c(diǎn); 如: BioScience Corporation的HeliScope Single Molecular Sequencer; Pacific Biosciences的Single Molecule RealTime (SMRT)DNA sequencing technology(正在研制);Oxford Nanopore Technologies Ltd的納米孔單分子
11、測(cè)序技術(shù)。 中科院北京基因組研究所,2013年,第一臺(tái)國(guó)產(chǎn)樣機(jī)35 測(cè)序技術(shù)與比較基因組學(xué)測(cè)序技術(shù)與比較基因組學(xué) DNA測(cè)序已經(jīng)成為分子生物學(xué)研究中一種基本的研究手段與工具,對(duì)于這種手段的需要也已經(jīng)極大地促進(jìn)了DNA測(cè)序技術(shù)的進(jìn)步與發(fā)展。 在此基礎(chǔ)上,將會(huì)有更多的生物的全基因組序列被測(cè)定,那么針對(duì)任何一種生物的比較基因組學(xué)研究將會(huì)變得更加簡(jiǎn)單。36基因組序列分析的計(jì)算方法基因組序列分析的計(jì)算方法 1. 引言 2. 點(diǎn)陣圖 3. 兩序列比對(duì) 4. 多序列比對(duì) 5. 數(shù)據(jù)庫(kù)搜索朱琳37引言引言l 人類(lèi)基因組計(jì)劃(HGP) 遺傳圖、物理圖、序列圖和轉(zhuǎn)錄圖 l 區(qū)分兩個(gè)概念: 同源性 -共同的祖先 相
12、似性 -定量特征 高度相似很可能是同源序列;相似性很低的序列也可能具有同源序列38點(diǎn)陣圖點(diǎn)陣圖ACTGTTAGACTTTAGCA C T G T T A G| | | | | | | A C T - T T A G39兩序列比對(duì)兩序列比對(duì) 面臨的問(wèn)題: 進(jìn)化的過(guò)程中同源序列可經(jīng)過(guò)多次的插入或缺失,導(dǎo)致它們長(zhǎng)度不同,這就給比對(duì)帶來(lái)了麻煩。要解決的問(wèn)題: 最優(yōu)比對(duì)算法-尋找最佳的缺失方式使比對(duì)序列的相似度達(dá)到整體最大40Needleman-wunsch全局比對(duì)算法全局比對(duì)算法 首先構(gòu)建具有m行n列的矩陣M,根據(jù)殘基配對(duì)的函數(shù),給每個(gè)矩陣單元格賦值,將矩陣初始化。再進(jìn)行變換操作,規(guī)則是將某單元格右下
13、方路徑中的最大值疊加到該單元格即M(I,j)=M(I,j)+maxM(i+1,j+1);M(i+1,j+2,jmax)-gap penalty ; M(i+2,imax,j+1)-gap penalty使用最簡(jiǎn)單的打分系統(tǒng)進(jìn)行比對(duì),殘基相同時(shí)分值是1,不同時(shí)分值為0,空位罰分。此外還有Smith-waterman 算法41 基因組比對(duì)基因組比對(duì) 只能對(duì)序列密切相關(guān)或非常相似的基因組比對(duì),序列太長(zhǎng),既有的算法無(wú)能為力方法:suffix tree 數(shù)據(jù)結(jié)構(gòu) 軟件MUMer 能找出兩個(gè)基因組的DNA序列上最大且唯一的匹配區(qū)域,然后除去序列中用Smith-waterman 最佳局部比對(duì)算法對(duì)大量插入序
14、列、重復(fù)序列、短變異區(qū)域進(jìn)行局部鑒定時(shí)插入的空位,完成這兩個(gè)基因組序列的比對(duì)。42多序列比對(duì)多序列比對(duì) 三條或多條序列的同時(shí)比對(duì)是序列的分析中最常用的技術(shù)之一。通過(guò)一系列同源序列的全局比對(duì)來(lái)實(shí)現(xiàn)的遞進(jìn)法:基本思想是同源序列與系統(tǒng)發(fā)育相關(guān)。具體步驟: 1、比對(duì)所有可能的序列對(duì)。 2、用相鄰連接法使用兩兩比對(duì)的相似度分值構(gòu)建(tree)。 3、這種樹(shù)用于指導(dǎo)遞進(jìn)的多序列比對(duì)。43數(shù)據(jù)庫(kù)搜索數(shù)據(jù)庫(kù)搜索 三大核酸數(shù)據(jù)庫(kù):GenBank、EMBL、DDBJ44 數(shù)據(jù)庫(kù)搜索使用的最廣泛的算法: FASTA算法和BLAST算法。 FASTA算法運(yùn)用一種包括四個(gè)連續(xù)階段的啟發(fā)式方法來(lái)檢測(cè)被查序列與一組序列是相
15、似性。 BLAST算法采用非??斓乃惴▉?lái)查找數(shù)據(jù)庫(kù)中與預(yù)查詢(xún)序列最相似是序列?;舅枷胧牵簝蓚€(gè)同源序列即使有很大的差異,也有可能共有高分值的相似片段,這使我們可以理解可靠的區(qū)分相關(guān)和非相關(guān)的序列。45蛋白質(zhì)序列分析蛋白質(zhì)序列分析 對(duì)新蛋白質(zhì)序列進(jìn)行分析的第一步是用BLAST進(jìn)行數(shù)據(jù)庫(kù)搜索。l如果有明顯相似性可以推測(cè)其序列的功能l如果沒(méi)有,可用模式識(shí)別方法根據(jù)特定的結(jié)構(gòu)域或蛋白質(zhì)家族的特征進(jìn)行搜索。 -模式數(shù)據(jù)庫(kù)已經(jīng)成為識(shí)別新序列的特定功能活性的重要工具。InterPro數(shù)據(jù)庫(kù)是最重要的蛋白質(zhì)模式數(shù)據(jù)庫(kù)之一。46 此外還有 蛋白質(zhì)信號(hào)肽的識(shí)別及亞細(xì)胞定位的預(yù)測(cè) 預(yù)測(cè)卷曲螺旋和螺旋-轉(zhuǎn)角-螺旋結(jié)構(gòu)
16、 蛋白質(zhì)折疊的識(shí)別與分類(lèi)等47 種內(nèi)比較基因組學(xué)種內(nèi)比較基因組學(xué) 模式生物模式生物 姜南48 種內(nèi)基因組的比較 同種群體內(nèi)基因組存在大量的變異和多態(tài)性,正是這種基因組序列的差異構(gòu)成了不同個(gè)體與群體對(duì)疾病的易感性和對(duì)藥物與環(huán)境因子不同反應(yīng)的遺傳學(xué)基礎(chǔ)。 49 我總結(jié)了: 凡是能夠用來(lái)研究同一種群內(nèi)兩個(gè)個(gè)體基因組的不同的分子手段都屬于種內(nèi)比較基因組學(xué)的范疇。 主流方法是分子標(biāo)記技術(shù):RAPD,RFLP,AFLP,基因芯片。 回顧分子標(biāo)記50水產(chǎn)界舉例 李太武老師等用20條隨機(jī)引物對(duì)皺紋盤(pán)鮑、雜色鮑進(jìn)行RAPD分析, 結(jié)果均能產(chǎn)生清晰可重復(fù)擴(kuò)增產(chǎn)物, 計(jì)算出各群體擴(kuò)增位點(diǎn)的多態(tài)性比例分別為43.66
17、%和53.05%, 群體平均遺傳雜合度分別為0.1557和0.1686, 群體間的遺傳距離0.2898, 表明皺紋盤(pán)鮑與雜色鮑的親緣關(guān)系較遠(yuǎn) 。51模式生物 基因進(jìn)化上的保守往性和遺傳密碼的通用性,從某一生物得到的有關(guān)基因性質(zhì)或功能方面的信息往往也適用于其他生物。 個(gè)體小,易操作,易培養(yǎng),繁殖快。 病毒,大腸桿菌,酵母,線(xiàn)蟲(chóng),果蠅,斑馬魚(yú),小鼠,擬南芥52種間比較基因組學(xué)研究種間比較基因組學(xué)研究馬壽光 黃繼53 通過(guò)對(duì)不同親緣關(guān)系物種的基因組序列進(jìn)行比較,能夠鑒定出編碼序列、非編碼調(diào)控序列及給定物種獨(dú)有的序列。而基因組范圍之內(nèi)的序列比對(duì),可以了解不同物種在核苷酸組成、同線(xiàn)性關(guān)系和基因順序方面的
18、異同,進(jìn)而得到基因分析預(yù)測(cè)與定位、生物系統(tǒng)發(fā)生進(jìn)化關(guān)系等方面的信息。54 1 全基因組的比較研究 2 系統(tǒng)發(fā)生的進(jìn)化關(guān)系分析55 比較基因組學(xué)的基礎(chǔ)是相關(guān)生物基因組的相似性。兩種具有較近共同祖先的生物,它們之間具有種屬差別的基因組是由祖先基因組進(jìn)化而來(lái),兩種生物在進(jìn)化的階段上越接近,它們的基因組相關(guān)性就越高。如果生物之間存在很近的親緣關(guān)系,那么它們的基因組就會(huì)表現(xiàn)出同線(xiàn)性(synteny),即基因序列的部分或全部保守。1.全基因組的比較研究56 Synteny 可以這樣假設(shè),人與小鼠或其它哺乳動(dòng)物有一個(gè)共同的祖先,在漫長(zhǎng)的進(jìn)化中,染色體發(fā)生斷裂,重排,加上基因內(nèi)部的變化,成為各種不同的物種。但
19、是未發(fā)生斷裂重排的完整片段內(nèi)部的基因組織和連鎖順序在不同的物種中保持不變,這就是synteny,是基因組比較作圖的基礎(chǔ)所在。57 在各種不同的物種中,絕大多數(shù)的核心生物功能是由相當(dāng)數(shù)量的orthologous蛋白承擔(dān),所謂or-thologous蛋白就是一些在不同物種中有共同祖先的蛋白質(zhì)。在不同的物種中這些蛋白的數(shù)量十分相似,它們主要是在生物體中執(zhí)行中介代謝,DNA,RNA代謝,蛋白折疊,trafficking,和降解的功能。在較為復(fù)雜的生物中,隨著功能不斷地復(fù)雜,就會(huì)出現(xiàn)許多蛋白以執(zhí)行其復(fù)雜的功能,而維持最基本生命活動(dòng)的蛋白是保守的。兩種物種中蛋白總數(shù)上的差別是由承擔(dān)各自特有任務(wù)的蛋白數(shù)目的
20、不同而造成的。58 可以利用模基因組之間編碼順序上和結(jié)構(gòu)上的同源性,通過(guò)已知基因組的作圖信息定位另外基因組中的基因,從而揭示基因潛在的功能、闡明物種進(jìn)化關(guān)系及基因組的內(nèi)在結(jié)構(gòu)。59 人類(lèi)與多個(gè)靈長(zhǎng)類(lèi)動(dòng)物的比較基因組學(xué)研究,在闡明靈長(zhǎng)類(lèi)特異基因調(diào)節(jié)元件和劃分多基因的外顯子方面顯示出了很大的優(yōu)勢(shì)。 林木可與擬南芥(已經(jīng)獲得了全基因組序列,一些基因的功能已被注釋?zhuān)┖兔麠畹裙δ芑蚪M研究較深入的物種進(jìn)行比較基因組學(xué)研究,這將為林木上相關(guān)基因功能的研究提供便利。60 生物最本質(zhì)的特征是進(jìn)化,比較基因組學(xué)同樣以進(jìn)化理論作為理論基石,同時(shí)其研究結(jié)果又前所未有地豐富和發(fā)展了進(jìn)化理論。 當(dāng)在兩種以上的基因組間
21、進(jìn)行序列比較時(shí),實(shí)質(zhì)上就得到了序列在系統(tǒng)發(fā)生樹(shù)中的進(jìn)化關(guān)系?;蚪M信息的增多使得在基因組水平上研究分子進(jìn)化、基因功能成為可能。2.系統(tǒng)發(fā)生的進(jìn)化關(guān)系分析61 通過(guò)對(duì)多種生物基因組數(shù)據(jù)及其垂直進(jìn)化、水平演化過(guò)程進(jìn)行研究,就可以對(duì)與生命至關(guān)重要的基因的結(jié)構(gòu)及其調(diào)控作用有所了解。但由于生物基因組中約有15145的基因與“橫向遷移現(xiàn)象”有關(guān),即基因可以在同時(shí)存在的種群間遷移,這樣就會(huì)導(dǎo)致與進(jìn)化無(wú)關(guān)的序列差異。62 橫向遷移現(xiàn)象 對(duì)人類(lèi)基因組的分析發(fā)現(xiàn),有幾十個(gè)人的基因只與細(xì)菌基因相似,而在果蠅、線(xiàn)蟲(chóng)中都不存在。如果以人的這些基因序列來(lái)研究進(jìn)化將會(huì)得到荒謬的結(jié)論。所以在當(dāng)前的分子進(jìn)化研究中必須選擇垂直進(jìn)
22、化的分子作為樣本 。并且在系統(tǒng)發(fā)生分析中需要建立較完整的生物進(jìn)化模型,以避免基因轉(zhuǎn)移和欠缺合適的多物種共有保守序列的影響。63 Z曲線(xiàn)的GC輪廓圖方法 基因組序列變換為等價(jià)的三維空間曲線(xiàn)Z 曲線(xiàn),經(jīng)過(guò)適當(dāng)?shù)耐队昂妥鶚?biāo)旋轉(zhuǎn)后得到Z曲線(xiàn),后者又稱(chēng)為累積GC 輪廓圖(Cumulative GC profile)。定義:在基因組某一堿基處的G+C 含量正比于Z曲線(xiàn)在該點(diǎn)切線(xiàn)的斜率。而在某一窗口中的平均G+C 含量則正比于此量在該窗口內(nèi)的定積分。 對(duì)于任一給定的DNA 序列,有唯一的一條Z 曲線(xiàn)與之對(duì)應(yīng);反之,給定一條Z 曲線(xiàn),它所代表的DNA 序列可以唯一地導(dǎo)出。因此,Z 曲線(xiàn)攜帶了DNA 序列的全部
23、息。對(duì)兩個(gè)基因組或染色體序列的比較,可以通過(guò)對(duì)它們所對(duì)應(yīng)的Z 曲線(xiàn)的比較來(lái)進(jìn)行。64 在研究物種間的進(jìn)化關(guān)系時(shí), 傳統(tǒng)的分子進(jìn)化研究方法一般選取一個(gè)大分子 ( 如16SRNA) 的序列為標(biāo)準(zhǔn),研究其在各個(gè)物種同源序列之間的差異, 并以此構(gòu)建進(jìn)化樹(shù)。但是一個(gè)物種的基因組編碼了成千上萬(wàn)個(gè)序列, 以其中一個(gè)序列的差異來(lái)代表整個(gè)生物體的差異是不全面的。因此, 從全基因組的水平來(lái)研究生物的進(jìn)化應(yīng)該更為合理。利用比較基因組學(xué)的方法在基因組水平上構(gòu)建的進(jìn)化樹(shù)將會(huì)更加合理的闡述物種之間的進(jìn)化關(guān)系。65 物種序列的優(yōu)化選擇:當(dāng)在比較 4080 My進(jìn)化距離的 DNA序列時(shí),其編碼序列與一些重要的非編碼序列將是保
24、守的,如人與鼠。然而至今在這一進(jìn)化距離內(nèi)保守的非編碼序列中只有少數(shù)被鑒定為有特征性的功能元件,其它的僅被認(rèn)為是臨近或 200 kb 附近基因的轉(zhuǎn)錄調(diào)控元件。在進(jìn)化距離較遠(yuǎn)( 450 My ) 的序列比較時(shí), 將主要揭示保守的編碼序列, 主要是因?yàn)榈鞍踪|(zhì)要維持其功能, 因此對(duì)替換更為嚴(yán)謹(jǐn)保守,進(jìn)化的稍慢一點(diǎn)。所以在建立多序列比較時(shí)加入一支稍遠(yuǎn)的物種序列 ( 450 My ) 將提高保守序列的鑒別能力。比較分析較近的物種序列如: 人與himpanzees或與其它的類(lèi)人猿可以用來(lái)鑒定在近期進(jìn)化史上發(fā)生的基因改變和重組等。因此在建立多序列的比較分析中加入一支近距離的物種序列不僅有助于編碼和非編碼的功能
25、序列的識(shí)別, 也能揭示那些相關(guān)物種特征的基因組信息、66 在進(jìn)行 DNA序列比較而鑒定保守序列時(shí), 有兩種比較分析手段: 局部比對(duì)和整體比對(duì)。局部比對(duì)是對(duì)序列亞區(qū)分析獲得最高一致性的計(jì)算方法, 其基本原理是在兩序列排隊(duì)時(shí)采用不同的比對(duì)方法,排除了從頭到尾的單一匹配方式。例如當(dāng)兩長(zhǎng)序列進(jìn)行匹配時(shí), 可能內(nèi)含的同源基因亞區(qū)的排列順序或基因的走向不同, 因此對(duì)這種比對(duì)采用多種方式進(jìn)行搜索分析的結(jié)果將比較準(zhǔn)確, 常用的分析工具是 PipMarker 服務(wù)器。整體比對(duì)是尋找所要比較的整個(gè)基因序列上的最大的同源性分值, 它適用于高度分化但組織結(jié)構(gòu)同源的序列比對(duì), 整體比對(duì)適用于基因序列整體上同源性較高的比
26、較分析, 如保守片斷 ( conserved segments ) 的比對(duì), 可以使用 VISTA進(jìn)行分析。67 時(shí)間復(fù)雜度O(n2); Sij = max of 0 Si-1,j-1 + (xi, yj) Si-1,j - d (從左到右) Si,j-1 - d (從上到下) 本例中:gap: d=12,線(xiàn)性罰分模型。68 兩條序列如下:L D S C HG E S L C Kr 目標(biāo):使用局部?jī)?yōu)化算法尋找比對(duì)的結(jié)果目標(biāo):使用局部?jī)?yōu)化算法尋找比對(duì)的結(jié)果69 兩條序列如下:L D S C HG E S L C Kr 目標(biāo):使用局部?jī)?yōu)化算法尋找比對(duì)的結(jié)果目標(biāo):使用局部?jī)?yōu)化算法尋找比對(duì)的結(jié)果70G
27、apLDSCHGap000000G0SijE0S0L0C0K0Smith-Waterman算法;算法;Sij = max of Si-1, j-1 + (xi, yj) Si-1, j - d (從左到右從左到右) Si, j-1 - d (從上到下從上到下) 071GapLDSCHGap000000G0SijE0S0L0C0K0-12-12-372GapLDSCHGap000000G000E0S0L0C0K0-12-12-473GapLDSCHGap000000G000000E002000S002600L040050C001092K000008-12-274GapLDSCHGap000000
28、G000000E002000S002600L040050C001092K000008L D S C HG E S L C K75中性突變與隨機(jī)漂移學(xué)說(shuō)的核心就是認(rèn)為大部分對(duì)生物種群的遺傳結(jié)構(gòu)與進(jìn)化有貢獻(xiàn)的分子突變?cè)谧匀贿x擇的意義上都是中性或近中性的,因而自然選擇對(duì)這些突變并不起到篩選的作用。中性突變產(chǎn)生后是通過(guò)一代一代的隨機(jī)漂移,或者被固定在種群中并占有一定的比例,或者消失。生物種群內(nèi)的遺傳多樣性,如蛋白質(zhì)(酶)以及DNA的多態(tài)性,都是通過(guò)這類(lèi)中性或近中性突變的隨機(jī)漂移而產(chǎn)生的。中性理論并不是說(shuō)所有突變都是中性的,實(shí)際上,相當(dāng)大的一部分突變是有害的,這一部分突變具體有多少與有關(guān)分子本身可容許的
29、變化程度有關(guān)。有害的突變產(chǎn)生后,會(huì)影響攜帶這些突變的蛋白質(zhì)以及基因的正常功能,影響生物的生存與繁殖,因此很快就會(huì)被淘汰掉,從而在進(jìn)化上是沒(méi)有意義的。另一方面,對(duì)生物有利的所謂正突變其實(shí)是很少的,從而對(duì)種群的遺傳結(jié)構(gòu)也沒(méi)有什么貢獻(xiàn),不能說(shuō)明分子進(jìn)化中的多態(tài)性現(xiàn)象。自然選擇只對(duì)那些對(duì)種群的遺傳結(jié)構(gòu)并不重要的有害突變和正突變起作用,卻不能決定對(duì)種群的遺傳結(jié)構(gòu)起重要作用的中性或近中性突變的命運(yùn),中性或近中性突變的命運(yùn)是由隨機(jī)因素決定的。因此,又可以把中性理論看作是一種“幸運(yùn)者生存”的學(xué)說(shuō)。 763從模式生物基因組研究中得出一些規(guī)律3.1模式生物基因組一般都比較小,但是編碼基因的比例較高,重復(fù)順序和非編
30、碼順序較少,是一些“壓縮”的基因組3.2模式生物基因組的G+C%比較高同時(shí) CpG島的比例也比較高。Fugurubripes的G+C%時(shí)442%(這是脊椎動(dòng)物種最高的),而人類(lèi)則是403%。這可能是因?yàn)榈偷壬镏芯幋a順序的比例比較高,另一個(gè)原因與模式生物的密碼子第三位的堿基選擇有關(guān)。3.3模式生物的基因組中,內(nèi)含子和外顯子的結(jié)構(gòu)組織比較保守,剪切位點(diǎn)在多種生物中一致。這是Fugu rubripes和現(xiàn)有的哺乳動(dòng)物的基因組順序比較的結(jié)果3.4在幾種模式生物都發(fā)現(xiàn)了重復(fù)(duplication)。同時(shí)存在兩份或兩份以上的順序一致或十分相似的編碼蛋白的DNA順序,稱(chēng)為冗余。理解重復(fù)的真正本質(zhì)是闡明基
31、因組中基因生物功能和物種進(jìn)化的前提。3.5生物體的復(fù)雜性一般表現(xiàn)在“生物學(xué)”的復(fù)雜性,與基因組的 C值大小及基因數(shù)量未必一定呈線(xiàn)性關(guān)系。77 首先比較基因組學(xué)建立的基礎(chǔ)是功能元件由于選擇的作用其進(jìn)化的速率稍慢一點(diǎn), 這有背于中性理論; 其次在序列的比較中對(duì)保守區(qū)域的thresholds ( length and percent identity ) 的選擇還沒(méi)有一套有效的方法, 往往兩個(gè)物種不同區(qū)域的thresholds 各異78比較基因組學(xué)的應(yīng)用揭示非編碼功能序列揭示非編碼功能序列發(fā)現(xiàn)新基因發(fā)現(xiàn)新基因發(fā)現(xiàn)功能性發(fā)現(xiàn)功能性SNPSNP闡述物種間的進(jìn)化史闡述物種間的進(jìn)化史闡明人類(lèi)疾病過(guò)程的分子機(jī)
32、制闡明人類(lèi)疾病過(guò)程的分子機(jī)制 李春麗79比較基因組學(xué)與進(jìn)化比較基因組學(xué)與進(jìn)化 古細(xì)菌古細(xì)菌-產(chǎn)甲烷球菌產(chǎn)甲烷球菌l 與原核生物共同之處:與原核生物共同之處: 1 染色體組織與結(jié)構(gòu):環(huán)狀基因組、基因的操縱子結(jié)構(gòu)等染色體組織與結(jié)構(gòu):環(huán)狀基因組、基因的操縱子結(jié)構(gòu)等 2 能量產(chǎn)生和固氮基因與細(xì)菌基因有很高的同源能量產(chǎn)生和固氮基因與細(xì)菌基因有很高的同源 3 與細(xì)胞分裂有關(guān)的蛋白質(zhì)、與細(xì)胞分裂有關(guān)的蛋白質(zhì)、20多個(gè)編碼無(wú)機(jī)離子運(yùn)輸?shù)岸鄠€(gè)編碼無(wú)機(jī)離子運(yùn)輸?shù)鞍椎陌椎腛RF與細(xì)菌基因同源與細(xì)菌基因同源 4 調(diào)控模式類(lèi)似于原核生物調(diào)控模式類(lèi)似于原核生物l 與真核生物共同之處:與真核生物共同之處: 1 細(xì)胞遺傳信息
33、傳遞,尤其是轉(zhuǎn)錄和翻譯系統(tǒng)細(xì)胞遺傳信息傳遞,尤其是轉(zhuǎn)錄和翻譯系統(tǒng) 2 分泌系統(tǒng)分泌系統(tǒng)l 說(shuō)明該細(xì)菌與真核生物親緣關(guān)系較近。說(shuō)明該細(xì)菌與真核生物親緣關(guān)系較近。 80比較基因組學(xué)與進(jìn)化比較基因組學(xué)與進(jìn)化 比較基因組學(xué)提供的結(jié)果表明,在進(jìn)化系統(tǒng)樹(shù)上,比較基因組學(xué)提供的結(jié)果表明,在進(jìn)化系統(tǒng)樹(shù)上,古細(xì)菌與真核生物親緣關(guān)系比原核生物更近。古細(xì)菌與真核生物親緣關(guān)系比原核生物更近。 自養(yǎng)生物的三個(gè)分支,細(xì)菌、古細(xì)菌和真核自養(yǎng)生物的三個(gè)分支,細(xì)菌、古細(xì)菌和真核生物中,細(xì)菌的分化發(fā)生較早。生物中,細(xì)菌的分化發(fā)生較早。81比較基因組學(xué)的具體應(yīng)用方法和策比較基因組學(xué)的具體應(yīng)用方法和策略略 序列的比對(duì)分析序列的比對(duì)分
34、析 確定基因組序列的進(jìn)化關(guān)系確定基因組序列的進(jìn)化關(guān)系 基因共線(xiàn)性基因共線(xiàn)性synteny : 染色體片段的分析染色體片段的分析 物種序列的優(yōu)化選擇物種序列的優(yōu)化選擇 對(duì)對(duì)DNADNA序列的信息注釋序列的信息注釋82比較基因組學(xué)研究舉例比較基因組學(xué)研究舉例 原核模式生物比較基因組學(xué)原核模式生物比較基因組學(xué) 釀酒酵母基因組釀酒酵母基因組 人類(lèi)基因組人類(lèi)基因組83模式生物比較基因組研究特點(diǎn)模式生物比較基因組研究特點(diǎn)l 1 1 模式生物基因組一般都比較小模式生物基因組一般都比較小,但編碼基因的但編碼基因的比例較高比例較高,重復(fù)序列和非編碼序列較少重復(fù)序列和非編碼序列較少,是是 “壓壓縮縮”的基因組的基
35、因組。l 2 2 模式生物基因組中模式生物基因組中G+ C%含量高含量高,同時(shí)同時(shí)CpG島島的比例也比較高。的比例也比較高。l 3 3 一些模式生物,特別在人的基因組中發(fā)現(xiàn)了重一些模式生物,特別在人的基因組中發(fā)現(xiàn)了重復(fù)。復(fù)。l 4 4 各種不同的物種中各種不同的物種中,大多數(shù)重要生物學(xué)功能是大多數(shù)重要生物學(xué)功能是由相當(dāng)數(shù)量的同源序列基因蛋白承擔(dān)由相當(dāng)數(shù)量的同源序列基因蛋白承擔(dān)。l 5 5 同線(xiàn)同線(xiàn)( synteny) 連鎖的同源基因在不同物種基因連鎖的同源基因在不同物種基因組中有相同連鎖關(guān)系組中有相同連鎖關(guān)系。84模式生物基因組的研究模式生物基因組的研究l 尿殖道支原體是已知最小的基因組尿殖道
36、支原體是已知最小的基因組0.58Mb ,由此可能確,由此可能確定能自我復(fù)制的細(xì)胞必需的一套最少的核心基因。定能自我復(fù)制的細(xì)胞必需的一套最少的核心基因。l 流感嗜血桿菌的基因組為流感嗜血桿菌的基因組為1.83Mbl 流感嗜血桿菌基因大小平均流感嗜血桿菌基因大小平均900 bp,尿殖道支原體的,尿殖道支原體的基因?yàn)榛驗(yàn)?040bp,基因大小差不多;,基因大小差不多;l 流感嗜血桿菌中平均流感嗜血桿菌中平均1042 bp 有有1個(gè)基因,尿殖道支個(gè)基因,尿殖道支原體中平均原體中平均1235 bp 有有1個(gè)基因。個(gè)基因。 可見(jiàn)基因組尺度減小并可見(jiàn)基因組尺度減小并不引起基因密度的增加和基因尺寸的減小。不
37、引起基因密度的增加和基因尺寸的減小。l 二者差別在于基因數(shù)量上,流感嗜血桿菌基因組有二者差別在于基因數(shù)量上,流感嗜血桿菌基因組有1743個(gè)個(gè)ORF,尿殖道支原體只有,尿殖道支原體只有470個(gè)個(gè)ORF。 85模式生物基因組的研究模式生物基因組的研究 通過(guò)對(duì)尿殖道支原體與流感嗜血桿菌這兩通過(guò)對(duì)尿殖道支原體與流感嗜血桿菌這兩個(gè)親緣關(guān)系較遠(yuǎn)的生物基因組的比較,選個(gè)親緣關(guān)系較遠(yuǎn)的生物基因組的比較,選取其共同的基因(共取其共同的基因(共240個(gè)),再加上一些個(gè)),再加上一些其他基因,最后組成一套含其他基因,最后組成一套含256個(gè)基因的最個(gè)基因的最小基因組。小基因組。86人類(lèi)基因組基因的三條推測(cè)依據(jù)人類(lèi)基因
38、組基因的三條推測(cè)依據(jù) 1. 根據(jù)已測(cè)定大片段DNA中ORF的比例;2. CpG island的個(gè)數(shù)(56%的已知基因5都與CpG相連,而人基因組中有45000個(gè)Islands)3. ESTs 已經(jīng)報(bào)道的是第22染色體和第21染色體。第21染色體全長(zhǎng)33.65 Mb,長(zhǎng)臂上有33.546Mb,仍有7個(gè)缺口,長(zhǎng)約3kb,99.7%。 Chromosome21上有127個(gè)已知基因,98個(gè)推測(cè)的基因59個(gè)pseudo genes。Chromosome22中有545個(gè)編碼基因 第21+22染色體共占2%的人類(lèi)總DNA,共有77%基因87模式生物基因組研究對(duì)人類(lèi)基因組模式生物基因組研究對(duì)人類(lèi)基因組研究的促
39、進(jìn)作用研究的促進(jìn)作用 1 利用基因序列上的同源性克隆人類(lèi)疾病基因利用基因序列上的同源性克隆人類(lèi)疾病基因 當(dāng)人類(lèi)當(dāng)人類(lèi)cDNA 與已知功能的模式生物基因高與已知功能的模式生物基因高度相關(guān)度相關(guān),當(dāng)該表型的候選基因定位于與當(dāng)該表型的候選基因定位于與cDNA 相相同的位置上同的位置上,就有助于識(shí)別該基因。就有助于識(shí)別該基因。 2 模式生物基因組研究揭示了人類(lèi)疾病基因的功模式生物基因組研究揭示了人類(lèi)疾病基因的功能。能。 由于某些模式生物基因的功能已知由于某些模式生物基因的功能已知,這就對(duì)人這就對(duì)人類(lèi)疾病基因的功能研究有很大的促進(jìn)作用。這一類(lèi)疾病基因的功能研究有很大的促進(jìn)作用。這一跨種關(guān)系使模式生物基因的有效功能數(shù)據(jù)立刻用跨種關(guān)系使模式生物基因的有效功能數(shù)據(jù)立刻用于研究它的高等生物的同源體。于研究它的高等生物的同源體。88模式生物基因組研究對(duì)人類(lèi)基因組模式生物基因組研究對(duì)人類(lèi)基因組研究的促進(jìn)作用研究的促
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 轉(zhuǎn)讓鋼廠(chǎng)項(xiàng)目協(xié)議書(shū)
- 餐廳臨時(shí)出租協(xié)議書(shū)
- 針灸推拿醫(yī)生協(xié)議書(shū)
- 裝修公司學(xué)徒協(xié)議書(shū)
- 營(yíng)運(yùn)車(chē)輛入股協(xié)議書(shū)
- 銀行貸款免還協(xié)議書(shū)
- 餐廳經(jīng)營(yíng)轉(zhuǎn)讓協(xié)議書(shū)
- 食品貨車(chē)司機(jī)協(xié)議書(shū)
- 閑置水廠(chǎng)合作協(xié)議書(shū)
- 音樂(lè)機(jī)構(gòu)入股協(xié)議書(shū)
- DB23T 3711-2024市縣級(jí)礦產(chǎn)資源總體規(guī)劃編制技術(shù)規(guī)程
- 智能座艙域控制器液冷散熱設(shè)計(jì)及仿真研究
- 2025年沈陽(yáng)汽車(chē)城開(kāi)發(fā)建設(shè)集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 田徑理論考試復(fù)習(xí)題庫(kù)300題(含各題型)
- 泛海三江JB-QGL-9000、JB-QTL-9000、JB-QBL-9000火災(zāi)報(bào)警控制器
- 員工團(tuán)建就餐合同
- 電氣工程及其自動(dòng)化畢業(yè)設(shè)計(jì) 基于PLC的噴涂機(jī)器人控制系統(tǒng)的設(shè)計(jì)
- 滑雪培訓(xùn)服務(wù)合同
- 肌肉注射課件(共45張課件)
- 工程經(jīng)濟(jì)學(xué)(青島理工大學(xué))知到智慧樹(shù)章節(jié)測(cè)試課后答案2024年秋青島理工大學(xué)
- 2025年國(guó)家電網(wǎng)有限公司招聘筆試參考題庫(kù)含答案解析
評(píng)論
0/150
提交評(píng)論