比較基因組學原理及應用-文檔資料_第1頁
比較基因組學原理及應用-文檔資料_第2頁
比較基因組學原理及應用-文檔資料_第3頁
比較基因組學原理及應用-文檔資料_第4頁
比較基因組學原理及應用-文檔資料_第5頁
已閱讀5頁,還剩86頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1比較基因組學比較基因組學原理及應用原理及應用成員:韓柳 閻永偉 黃繼 馬壽光朱琳 姜南 李春麗2比較基因組學比較基因組學相關概念相關概念韓柳3基因組學概念及范疇基因組學概念及范疇基因組基因組( (genome) )泛指一個有生命體、病毒或細胞器的全部泛指一個有生命體、病毒或細胞器的全部遺傳物質;在真核生物,基因組是指一套染色遺傳物質;在真核生物,基因組是指一套染色體(單倍體)體(單倍體)DNA。 基因組學基因組學(genomics)就是發展和應用就是發展和應用DNA制圖、測序新技術以制圖、測序新技術以及計算機程序,分析生命體(包括人類)全部及計算機程序,分析生命體(包括人類)全部基因組結構及

2、功能。基因組結構及功能。4基因組學概念基因組學概念5比較基因組學概念 定義:定義:比較基因組學(Comparative Genomics)是基于基因組圖譜和測序基礎上,對已知的基因和基因組結構進行比較,來了解基因的功能、表達機理和物種進化的學科。 研究內容:研究內容:種間的比較基因組學 和 種內的比較基因組學67概念工具:工具: 1、FASTA 2、BLAST 3、CLUSTAL W基因組分類:基因組分類: 1、通過比較確知其功能的。 2、在數據庫中有相匹配的蛋白,但不知道其功能。 3、在現有的數據庫中找不到任何相匹配的蛋白質序列的新基因。89部分真核、原核生物基因組成成份分析部分真核、原核生

3、物基因組成成份分析10通過基因組數據進行比較基因組學研究通過基因組數據進行比較基因組學研究 例子: 尿殖道支原體帶有已知最小的基因組,可依此確定能自我復制的細胞必需的一套最少的核心基因。 流感嗜血桿菌的基因組為1.83MB,尿殖道支原體的基因組只有0.58Mb,二者相差3倍多,那么,基因組是大小影響了基因的數目還是基因的尺度?11 流感嗜血桿菌的基因大小平均900bp,尿殖道支原體的基因為1040bp,他們基因大小差不多 流感嗜血桿菌中平均1024bp有一個基因,尿殖道支原體平均1235bp有一個基因。 結論:結論:基因尺度減小并不引起基因密度的增加和基因本身尺寸的減小。 二者的差別在于基因數

4、量上,流感嗜血桿菌基因有1743個ORF,而尿殖道支原體只有470個ORF12比較基因組有助于解決進化距離問題比較基因組有助于解決進化距離問題13 測序技術與測序技術與 比較基因組學比較基因組學 閻永偉14 比較基因組學是在基因組圖譜和測序的基礎上,利用某個基因組研究獲得的信息推測其他原核生物、真核生物類群中的基因數目、位置、功能、表達機制和物種進化的學科。 該學科的發展及所取得的成果與序列的積累相同步,尤其是人類全基因組序列的分析與比較使比較基因組學成為整個生物學領域最新、最重要、進展最快和影響最大的學科之一。 15 1. 已完成的測序已完成的測序 比較基因組學從一開始就是人類基因組計劃的一

5、部分。 人類基因組計劃的原始計劃是測定人類和一部分模式生物(如細菌,酵母,果蠅,秀麗隱桿線蟲,小鼠等)的全基因組序列。16Homo sapiens 2010年全部完成Pan troglodytes Lander et al. 2005 ;Mus musculus Waterston et al. 2002 ;Rattus norvegicus Gibbs et al. 2004 ;Drosophila melanogaster Adams et al. 2000 ;Escherichia coli Blattner et al. 1997 ;Saccharomyces cerevisiae G

6、offeau et al. 1996 ;Ciona intestinalis Dehal et al. 2002, Small et al. 2007;Caenorhabditis elegans Stain et al. 2003, Stein et al. 1998 。17HGP完成以后: Gallus gallus 雞 Blattner et al. 2004 , Bos taurus 牛 Elsik et al. 2009, Canis familiaris 狗 Lindblad-Toh et al. 2005,Apis mellifera 蜜蜂 Lindblad-Toh et al.

7、 2006, Anthocidaris crassispina 紫海丹 Sodergren et al. 2006Macaca mulatta 恒河猴 Gibbs et al. 2007 18 In Entrez Genome,10001000 complete Prokaryotic Genomes are available!測序完成情況統計測序完成情況統計192.2.測序技術概述測序技術概述 絕大多數生物的遺傳物質為DNA,然而遺傳信息卻僅僅由四種堿基A,T,C,G排列組合而成。 自從DNA的雙螺旋結構被發現以后,能夠知道DNA分子上四種堿基的順序就成為了一個新的熱點。 于是,繼蛋白質和

8、RNA測序之后,又出現了DNA測序。20自1977年出現DNA測序技術至今, 第一代測序技術 第二代測序技術 第三代測序技術21(1)測序技術的出現及第一代測序技術 1)測序技術的出現 1975年,Sanger和Coulson發明了“加減法”測定DNA序列;1977年,又引入ddNTP,發明了雙脫氧終止法; 1977,Maxam和Gilbert發明了化學降解法測定DNA序列。22 Fig1. 雙脫氧終止法測序232)第一代測序技術 傳統的化學降解法、雙脫氧鏈終止法以及在它們的基礎上發展來的各種DNA測序技術統稱為第一代DNA測序技術。 第一代測序技術在分子生物學研究中發揮過重要的作用,如人類基

9、因組計劃主要基于第一代DNA測序技術。 24 目前基于熒光標記和Sanger的雙脫氧鏈終止法原理的熒光自動測序儀(如ABI 3730XL)仍被廣泛地應用。 雜交測序技術也是第一代測序技術,但是并非基于以上兩種原理。速度快,但是誤差大。25 Fig.2 ABI 3730XL26(2)第二代測序技術 后基因組時代亦即功能基因組時代的測序技術,顯著特征是高通量、低成本。 主要包括羅氏454公司的GS FLX測序平臺、Illumina公司的Solexa Genome Analyzer測序平臺和ABI公司的SOLiD測序平臺。27 Fig.3 Roche 454GS FLX 平臺2829Fig.4 Il

10、luminaSolexa平臺3031 Fig.5 ABI SOLiD平臺3233參考文獻: DNA測序技術的發展歷史與最新進展, 解增言等;DNA測序技術發展及其展望, 孫海汐等。34(3)第三代測序技術 以單分子測序為特點; 如: BioScience Corporation的HeliScope Single Molecular Sequencer; Pacific Biosciences的Single Molecule RealTime (SMRT)DNA sequencing technology(正在研制);Oxford Nanopore Technologies Ltd的納米孔單分子

11、測序技術。 中科院北京基因組研究所,2013年,第一臺國產樣機35 測序技術與比較基因組學測序技術與比較基因組學 DNA測序已經成為分子生物學研究中一種基本的研究手段與工具,對于這種手段的需要也已經極大地促進了DNA測序技術的進步與發展。 在此基礎上,將會有更多的生物的全基因組序列被測定,那么針對任何一種生物的比較基因組學研究將會變得更加簡單。36基因組序列分析的計算方法基因組序列分析的計算方法 1. 引言 2. 點陣圖 3. 兩序列比對 4. 多序列比對 5. 數據庫搜索朱琳37引言引言l 人類基因組計劃(HGP) 遺傳圖、物理圖、序列圖和轉錄圖 l 區分兩個概念: 同源性 -共同的祖先 相

12、似性 -定量特征 高度相似很可能是同源序列;相似性很低的序列也可能具有同源序列38點陣圖點陣圖ACTGTTAGACTTTAGCA C T G T T A G| | | | | | | A C T - T T A G39兩序列比對兩序列比對 面臨的問題: 進化的過程中同源序列可經過多次的插入或缺失,導致它們長度不同,這就給比對帶來了麻煩。要解決的問題: 最優比對算法-尋找最佳的缺失方式使比對序列的相似度達到整體最大40Needleman-wunsch全局比對算法全局比對算法 首先構建具有m行n列的矩陣M,根據殘基配對的函數,給每個矩陣單元格賦值,將矩陣初始化。再進行變換操作,規則是將某單元格右下

13、方路徑中的最大值疊加到該單元格即M(I,j)=M(I,j)+maxM(i+1,j+1);M(i+1,j+2,jmax)-gap penalty ; M(i+2,imax,j+1)-gap penalty使用最簡單的打分系統進行比對,殘基相同時分值是1,不同時分值為0,空位罰分。此外還有Smith-waterman 算法41 基因組比對基因組比對 只能對序列密切相關或非常相似的基因組比對,序列太長,既有的算法無能為力方法:suffix tree 數據結構 軟件MUMer 能找出兩個基因組的DNA序列上最大且唯一的匹配區域,然后除去序列中用Smith-waterman 最佳局部比對算法對大量插入序

14、列、重復序列、短變異區域進行局部鑒定時插入的空位,完成這兩個基因組序列的比對。42多序列比對多序列比對 三條或多條序列的同時比對是序列的分析中最常用的技術之一。通過一系列同源序列的全局比對來實現的遞進法:基本思想是同源序列與系統發育相關。具體步驟: 1、比對所有可能的序列對。 2、用相鄰連接法使用兩兩比對的相似度分值構建(tree)。 3、這種樹用于指導遞進的多序列比對。43數據庫搜索數據庫搜索 三大核酸數據庫:GenBank、EMBL、DDBJ44 數據庫搜索使用的最廣泛的算法: FASTA算法和BLAST算法。 FASTA算法運用一種包括四個連續階段的啟發式方法來檢測被查序列與一組序列是相

15、似性。 BLAST算法采用非常快的算法來查找數據庫中與預查詢序列最相似是序列。基本思想是:兩個同源序列即使有很大的差異,也有可能共有高分值的相似片段,這使我們可以理解可靠的區分相關和非相關的序列。45蛋白質序列分析蛋白質序列分析 對新蛋白質序列進行分析的第一步是用BLAST進行數據庫搜索。l如果有明顯相似性可以推測其序列的功能l如果沒有,可用模式識別方法根據特定的結構域或蛋白質家族的特征進行搜索。 -模式數據庫已經成為識別新序列的特定功能活性的重要工具。InterPro數據庫是最重要的蛋白質模式數據庫之一。46 此外還有 蛋白質信號肽的識別及亞細胞定位的預測 預測卷曲螺旋和螺旋-轉角-螺旋結構

16、 蛋白質折疊的識別與分類等47 種內比較基因組學種內比較基因組學 模式生物模式生物 姜南48 種內基因組的比較 同種群體內基因組存在大量的變異和多態性,正是這種基因組序列的差異構成了不同個體與群體對疾病的易感性和對藥物與環境因子不同反應的遺傳學基礎。 49 我總結了: 凡是能夠用來研究同一種群內兩個個體基因組的不同的分子手段都屬于種內比較基因組學的范疇。 主流方法是分子標記技術:RAPD,RFLP,AFLP,基因芯片。 回顧分子標記50水產界舉例 李太武老師等用20條隨機引物對皺紋盤鮑、雜色鮑進行RAPD分析, 結果均能產生清晰可重復擴增產物, 計算出各群體擴增位點的多態性比例分別為43.66

17、%和53.05%, 群體平均遺傳雜合度分別為0.1557和0.1686, 群體間的遺傳距離0.2898, 表明皺紋盤鮑與雜色鮑的親緣關系較遠 。51模式生物 基因進化上的保守往性和遺傳密碼的通用性,從某一生物得到的有關基因性質或功能方面的信息往往也適用于其他生物。 個體小,易操作,易培養,繁殖快。 病毒,大腸桿菌,酵母,線蟲,果蠅,斑馬魚,小鼠,擬南芥52種間比較基因組學研究種間比較基因組學研究馬壽光 黃繼53 通過對不同親緣關系物種的基因組序列進行比較,能夠鑒定出編碼序列、非編碼調控序列及給定物種獨有的序列。而基因組范圍之內的序列比對,可以了解不同物種在核苷酸組成、同線性關系和基因順序方面的

18、異同,進而得到基因分析預測與定位、生物系統發生進化關系等方面的信息。54 1 全基因組的比較研究 2 系統發生的進化關系分析55 比較基因組學的基礎是相關生物基因組的相似性。兩種具有較近共同祖先的生物,它們之間具有種屬差別的基因組是由祖先基因組進化而來,兩種生物在進化的階段上越接近,它們的基因組相關性就越高。如果生物之間存在很近的親緣關系,那么它們的基因組就會表現出同線性(synteny),即基因序列的部分或全部保守。1.全基因組的比較研究56 Synteny 可以這樣假設,人與小鼠或其它哺乳動物有一個共同的祖先,在漫長的進化中,染色體發生斷裂,重排,加上基因內部的變化,成為各種不同的物種。但

19、是未發生斷裂重排的完整片段內部的基因組織和連鎖順序在不同的物種中保持不變,這就是synteny,是基因組比較作圖的基礎所在。57 在各種不同的物種中,絕大多數的核心生物功能是由相當數量的orthologous蛋白承擔,所謂or-thologous蛋白就是一些在不同物種中有共同祖先的蛋白質。在不同的物種中這些蛋白的數量十分相似,它們主要是在生物體中執行中介代謝,DNA,RNA代謝,蛋白折疊,trafficking,和降解的功能。在較為復雜的生物中,隨著功能不斷地復雜,就會出現許多蛋白以執行其復雜的功能,而維持最基本生命活動的蛋白是保守的。兩種物種中蛋白總數上的差別是由承擔各自特有任務的蛋白數目的

20、不同而造成的。58 可以利用模基因組之間編碼順序上和結構上的同源性,通過已知基因組的作圖信息定位另外基因組中的基因,從而揭示基因潛在的功能、闡明物種進化關系及基因組的內在結構。59 人類與多個靈長類動物的比較基因組學研究,在闡明靈長類特異基因調節元件和劃分多基因的外顯子方面顯示出了很大的優勢。 林木可與擬南芥(已經獲得了全基因組序列,一些基因的功能已被注釋)和毛果楊等功能基因組研究較深入的物種進行比較基因組學研究,這將為林木上相關基因功能的研究提供便利。60 生物最本質的特征是進化,比較基因組學同樣以進化理論作為理論基石,同時其研究結果又前所未有地豐富和發展了進化理論。 當在兩種以上的基因組間

21、進行序列比較時,實質上就得到了序列在系統發生樹中的進化關系。基因組信息的增多使得在基因組水平上研究分子進化、基因功能成為可能。2.系統發生的進化關系分析61 通過對多種生物基因組數據及其垂直進化、水平演化過程進行研究,就可以對與生命至關重要的基因的結構及其調控作用有所了解。但由于生物基因組中約有15145的基因與“橫向遷移現象”有關,即基因可以在同時存在的種群間遷移,這樣就會導致與進化無關的序列差異。62 橫向遷移現象 對人類基因組的分析發現,有幾十個人的基因只與細菌基因相似,而在果蠅、線蟲中都不存在。如果以人的這些基因序列來研究進化將會得到荒謬的結論。所以在當前的分子進化研究中必須選擇垂直進

22、化的分子作為樣本 。并且在系統發生分析中需要建立較完整的生物進化模型,以避免基因轉移和欠缺合適的多物種共有保守序列的影響。63 Z曲線的GC輪廓圖方法 基因組序列變換為等價的三維空間曲線Z 曲線,經過適當的投影和座標旋轉后得到Z曲線,后者又稱為累積GC 輪廓圖(Cumulative GC profile)。定義:在基因組某一堿基處的G+C 含量正比于Z曲線在該點切線的斜率。而在某一窗口中的平均G+C 含量則正比于此量在該窗口內的定積分。 對于任一給定的DNA 序列,有唯一的一條Z 曲線與之對應;反之,給定一條Z 曲線,它所代表的DNA 序列可以唯一地導出。因此,Z 曲線攜帶了DNA 序列的全部

23、息。對兩個基因組或染色體序列的比較,可以通過對它們所對應的Z 曲線的比較來進行。64 在研究物種間的進化關系時, 傳統的分子進化研究方法一般選取一個大分子 ( 如16SRNA) 的序列為標準,研究其在各個物種同源序列之間的差異, 并以此構建進化樹。但是一個物種的基因組編碼了成千上萬個序列, 以其中一個序列的差異來代表整個生物體的差異是不全面的。因此, 從全基因組的水平來研究生物的進化應該更為合理。利用比較基因組學的方法在基因組水平上構建的進化樹將會更加合理的闡述物種之間的進化關系。65 物種序列的優化選擇:當在比較 4080 My進化距離的 DNA序列時,其編碼序列與一些重要的非編碼序列將是保

24、守的,如人與鼠。然而至今在這一進化距離內保守的非編碼序列中只有少數被鑒定為有特征性的功能元件,其它的僅被認為是臨近或 200 kb 附近基因的轉錄調控元件。在進化距離較遠( 450 My ) 的序列比較時, 將主要揭示保守的編碼序列, 主要是因為蛋白質要維持其功能, 因此對替換更為嚴謹保守,進化的稍慢一點。所以在建立多序列比較時加入一支稍遠的物種序列 ( 450 My ) 將提高保守序列的鑒別能力。比較分析較近的物種序列如: 人與himpanzees或與其它的類人猿可以用來鑒定在近期進化史上發生的基因改變和重組等。因此在建立多序列的比較分析中加入一支近距離的物種序列不僅有助于編碼和非編碼的功能

25、序列的識別, 也能揭示那些相關物種特征的基因組信息、66 在進行 DNA序列比較而鑒定保守序列時, 有兩種比較分析手段: 局部比對和整體比對。局部比對是對序列亞區分析獲得最高一致性的計算方法, 其基本原理是在兩序列排隊時采用不同的比對方法,排除了從頭到尾的單一匹配方式。例如當兩長序列進行匹配時, 可能內含的同源基因亞區的排列順序或基因的走向不同, 因此對這種比對采用多種方式進行搜索分析的結果將比較準確, 常用的分析工具是 PipMarker 服務器。整體比對是尋找所要比較的整個基因序列上的最大的同源性分值, 它適用于高度分化但組織結構同源的序列比對, 整體比對適用于基因序列整體上同源性較高的比

26、較分析, 如保守片斷 ( conserved segments ) 的比對, 可以使用 VISTA進行分析。67 時間復雜度O(n2); Sij = max of 0 Si-1,j-1 + (xi, yj) Si-1,j - d (從左到右) Si,j-1 - d (從上到下) 本例中:gap: d=12,線性罰分模型。68 兩條序列如下:L D S C HG E S L C Kr 目標:使用局部優化算法尋找比對的結果目標:使用局部優化算法尋找比對的結果69 兩條序列如下:L D S C HG E S L C Kr 目標:使用局部優化算法尋找比對的結果目標:使用局部優化算法尋找比對的結果70G

27、apLDSCHGap000000G0SijE0S0L0C0K0Smith-Waterman算法;算法;Sij = max of Si-1, j-1 + (xi, yj) Si-1, j - d (從左到右從左到右) Si, j-1 - d (從上到下從上到下) 071GapLDSCHGap000000G0SijE0S0L0C0K0-12-12-372GapLDSCHGap000000G000E0S0L0C0K0-12-12-473GapLDSCHGap000000G000000E002000S002600L040050C001092K000008-12-274GapLDSCHGap000000

28、G000000E002000S002600L040050C001092K000008L D S C HG E S L C K75中性突變與隨機漂移學說的核心就是認為大部分對生物種群的遺傳結構與進化有貢獻的分子突變在自然選擇的意義上都是中性或近中性的,因而自然選擇對這些突變并不起到篩選的作用。中性突變產生后是通過一代一代的隨機漂移,或者被固定在種群中并占有一定的比例,或者消失。生物種群內的遺傳多樣性,如蛋白質(酶)以及DNA的多態性,都是通過這類中性或近中性突變的隨機漂移而產生的。中性理論并不是說所有突變都是中性的,實際上,相當大的一部分突變是有害的,這一部分突變具體有多少與有關分子本身可容許的

29、變化程度有關。有害的突變產生后,會影響攜帶這些突變的蛋白質以及基因的正常功能,影響生物的生存與繁殖,因此很快就會被淘汰掉,從而在進化上是沒有意義的。另一方面,對生物有利的所謂正突變其實是很少的,從而對種群的遺傳結構也沒有什么貢獻,不能說明分子進化中的多態性現象。自然選擇只對那些對種群的遺傳結構并不重要的有害突變和正突變起作用,卻不能決定對種群的遺傳結構起重要作用的中性或近中性突變的命運,中性或近中性突變的命運是由隨機因素決定的。因此,又可以把中性理論看作是一種“幸運者生存”的學說。 763從模式生物基因組研究中得出一些規律3.1模式生物基因組一般都比較小,但是編碼基因的比例較高,重復順序和非編

30、碼順序較少,是一些“壓縮”的基因組3.2模式生物基因組的G+C%比較高同時 CpG島的比例也比較高。Fugurubripes的G+C%時442%(這是脊椎動物種最高的),而人類則是403%。這可能是因為低等生物中編碼順序的比例比較高,另一個原因與模式生物的密碼子第三位的堿基選擇有關。3.3模式生物的基因組中,內含子和外顯子的結構組織比較保守,剪切位點在多種生物中一致。這是Fugu rubripes和現有的哺乳動物的基因組順序比較的結果3.4在幾種模式生物都發現了重復(duplication)。同時存在兩份或兩份以上的順序一致或十分相似的編碼蛋白的DNA順序,稱為冗余。理解重復的真正本質是闡明基

31、因組中基因生物功能和物種進化的前提。3.5生物體的復雜性一般表現在“生物學”的復雜性,與基因組的 C值大小及基因數量未必一定呈線性關系。77 首先比較基因組學建立的基礎是功能元件由于選擇的作用其進化的速率稍慢一點, 這有背于中性理論; 其次在序列的比較中對保守區域的thresholds ( length and percent identity ) 的選擇還沒有一套有效的方法, 往往兩個物種不同區域的thresholds 各異78比較基因組學的應用揭示非編碼功能序列揭示非編碼功能序列發現新基因發現新基因發現功能性發現功能性SNPSNP闡述物種間的進化史闡述物種間的進化史闡明人類疾病過程的分子機

32、制闡明人類疾病過程的分子機制 李春麗79比較基因組學與進化比較基因組學與進化 古細菌古細菌-產甲烷球菌產甲烷球菌l 與原核生物共同之處:與原核生物共同之處: 1 染色體組織與結構:環狀基因組、基因的操縱子結構等染色體組織與結構:環狀基因組、基因的操縱子結構等 2 能量產生和固氮基因與細菌基因有很高的同源能量產生和固氮基因與細菌基因有很高的同源 3 與細胞分裂有關的蛋白質、與細胞分裂有關的蛋白質、20多個編碼無機離子運輸蛋多個編碼無機離子運輸蛋白的白的ORF與細菌基因同源與細菌基因同源 4 調控模式類似于原核生物調控模式類似于原核生物l 與真核生物共同之處:與真核生物共同之處: 1 細胞遺傳信息

33、傳遞,尤其是轉錄和翻譯系統細胞遺傳信息傳遞,尤其是轉錄和翻譯系統 2 分泌系統分泌系統l 說明該細菌與真核生物親緣關系較近。說明該細菌與真核生物親緣關系較近。 80比較基因組學與進化比較基因組學與進化 比較基因組學提供的結果表明,在進化系統樹上,比較基因組學提供的結果表明,在進化系統樹上,古細菌與真核生物親緣關系比原核生物更近。古細菌與真核生物親緣關系比原核生物更近。 自養生物的三個分支,細菌、古細菌和真核自養生物的三個分支,細菌、古細菌和真核生物中,細菌的分化發生較早。生物中,細菌的分化發生較早。81比較基因組學的具體應用方法和策比較基因組學的具體應用方法和策略略 序列的比對分析序列的比對分

34、析 確定基因組序列的進化關系確定基因組序列的進化關系 基因共線性基因共線性synteny : 染色體片段的分析染色體片段的分析 物種序列的優化選擇物種序列的優化選擇 對對DNADNA序列的信息注釋序列的信息注釋82比較基因組學研究舉例比較基因組學研究舉例 原核模式生物比較基因組學原核模式生物比較基因組學 釀酒酵母基因組釀酒酵母基因組 人類基因組人類基因組83模式生物比較基因組研究特點模式生物比較基因組研究特點l 1 1 模式生物基因組一般都比較小模式生物基因組一般都比較小,但編碼基因的但編碼基因的比例較高比例較高,重復序列和非編碼序列較少重復序列和非編碼序列較少,是是 “壓壓縮縮”的基因組的基

35、因組。l 2 2 模式生物基因組中模式生物基因組中G+ C%含量高含量高,同時同時CpG島島的比例也比較高。的比例也比較高。l 3 3 一些模式生物,特別在人的基因組中發現了重一些模式生物,特別在人的基因組中發現了重復。復。l 4 4 各種不同的物種中各種不同的物種中,大多數重要生物學功能是大多數重要生物學功能是由相當數量的同源序列基因蛋白承擔由相當數量的同源序列基因蛋白承擔。l 5 5 同線同線( synteny) 連鎖的同源基因在不同物種基因連鎖的同源基因在不同物種基因組中有相同連鎖關系組中有相同連鎖關系。84模式生物基因組的研究模式生物基因組的研究l 尿殖道支原體是已知最小的基因組尿殖道

36、支原體是已知最小的基因組0.58Mb ,由此可能確,由此可能確定能自我復制的細胞必需的一套最少的核心基因。定能自我復制的細胞必需的一套最少的核心基因。l 流感嗜血桿菌的基因組為流感嗜血桿菌的基因組為1.83Mbl 流感嗜血桿菌基因大小平均流感嗜血桿菌基因大小平均900 bp,尿殖道支原體的,尿殖道支原體的基因為基因為1040bp,基因大小差不多;,基因大小差不多;l 流感嗜血桿菌中平均流感嗜血桿菌中平均1042 bp 有有1個基因,尿殖道支個基因,尿殖道支原體中平均原體中平均1235 bp 有有1個基因。個基因。 可見基因組尺度減小并可見基因組尺度減小并不引起基因密度的增加和基因尺寸的減小。不

37、引起基因密度的增加和基因尺寸的減小。l 二者差別在于基因數量上,流感嗜血桿菌基因組有二者差別在于基因數量上,流感嗜血桿菌基因組有1743個個ORF,尿殖道支原體只有,尿殖道支原體只有470個個ORF。 85模式生物基因組的研究模式生物基因組的研究 通過對尿殖道支原體與流感嗜血桿菌這兩通過對尿殖道支原體與流感嗜血桿菌這兩個親緣關系較遠的生物基因組的比較,選個親緣關系較遠的生物基因組的比較,選取其共同的基因(共取其共同的基因(共240個),再加上一些個),再加上一些其他基因,最后組成一套含其他基因,最后組成一套含256個基因的最個基因的最小基因組。小基因組。86人類基因組基因的三條推測依據人類基因

38、組基因的三條推測依據 1. 根據已測定大片段DNA中ORF的比例;2. CpG island的個數(56%的已知基因5都與CpG相連,而人基因組中有45000個Islands)3. ESTs 已經報道的是第22染色體和第21染色體。第21染色體全長33.65 Mb,長臂上有33.546Mb,仍有7個缺口,長約3kb,99.7%。 Chromosome21上有127個已知基因,98個推測的基因59個pseudo genes。Chromosome22中有545個編碼基因 第21+22染色體共占2%的人類總DNA,共有77%基因87模式生物基因組研究對人類基因組模式生物基因組研究對人類基因組研究的促

39、進作用研究的促進作用 1 利用基因序列上的同源性克隆人類疾病基因利用基因序列上的同源性克隆人類疾病基因 當人類當人類cDNA 與已知功能的模式生物基因高與已知功能的模式生物基因高度相關度相關,當該表型的候選基因定位于與當該表型的候選基因定位于與cDNA 相相同的位置上同的位置上,就有助于識別該基因。就有助于識別該基因。 2 模式生物基因組研究揭示了人類疾病基因的功模式生物基因組研究揭示了人類疾病基因的功能。能。 由于某些模式生物基因的功能已知由于某些模式生物基因的功能已知,這就對人這就對人類疾病基因的功能研究有很大的促進作用。這一類疾病基因的功能研究有很大的促進作用。這一跨種關系使模式生物基因的有效功能數據立刻用跨種關系使模式生物基因的有效功能數據立刻用于研究它的高等生物的同源體。于研究它的高等生物的同源體。88模式生物基因組研究對人類基因組模式生物基因組研究對人類基因組研究的促進作用研究的促

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論