3基因基因組和基因組學課件_第1頁
3基因基因組和基因組學課件_第2頁
3基因基因組和基因組學課件_第3頁
3基因基因組和基因組學課件_第4頁
3基因基因組和基因組學課件_第5頁
已閱讀5頁,還剩287頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2023/1/41第三章基因、基因組和基因組學

基因的化學本質是DNA,它是遺傳信息的物質載體,傳遞著支配生命活動的指令,是構建生物體藍圖中的一頁,也是可以人工操作用于改造生命屬性的元件。2022/12/261第三章基因、基因組和基因組學2023/1/42

基因組是指生物體的細胞中一套完整的遺傳信息,包括所有的基因和基因間區域。

專門研究基因組結構和功能的學科,稱為基因組學,它主要通過基因組作圖、基因測序和基因定位等方法來研究基因組結構和變異。2022/12/262基因組是指生物體的細胞中一套完2023/1/43第一節基因的概念一、對基因的認識對基因的認識和研究大體上可以分為三個階段:1)在20世紀50年代以前,主要從細胞的染色體水平上進行研究,屬于基因的染色體遺傳學階段;2)50年代以后,主要從DNA大分子水平上進行研究,屬于基因的分子生物學階段;2022/12/263第一節基因的概念一、對基因的認識2023/1/443)最近20多年來,由于重組DNA技術的完善和應用,人們改變了從表型到基因的傳統研究途徑,而能夠直接從克隆目的基因出發,研究基因的功能及其與表型的關系,使基因的研究進入了反向生物學階段。反向生物學是指利用重組DNA技術和離體定向誘變的方法研究結構已知基因的相應功能,在體外使基因突變,再導入體內,檢測突變的遺傳效應,即以表型來探索基因的結構和功能。2022/12/2643)最近20多年來,由于重組DNA技術2023/1/45二、基因概念的擴展分子生物學和分子遺傳學的不斷發展,特別是DNA分子克隆技術、DNA序列的快速測定,以及核酸分子雜交技術等現代實驗手段的不斷涌現,為進一步深入研究基因結構和功能提供了條件,“移動基因”、“斷裂基因”、“假基因”、“重疊基因”等有關基因的新概念,豐富了對基因本質的認識。2022/12/265二、基因概念的擴展2023/1/461、移動基因移動基因(movablegenes)又稱轉位因子(transposableelements)。由于它可以從染色體基因組上的一個位置轉移到另一個位置,甚至在不同染色體之間躍遷,因此也稱跳躍基因(jumpinggenes)。2022/12/2661、移動基因2023/1/47轉位和易位是兩個不同的概念。易位是指染色體發生斷裂后,通過同另一條染色體斷端連接轉移到另一條染色體上。此時,染色體斷片上的基因也隨著染色體的重接而移動到新的位置。轉位則是在轉位酶的作用下,轉位因子或是直接從原來位置上切離下來,然后插入染色體新的位置;或是染色體上的DNA序列轉錄成RNA,隨后反轉錄為cDNA,再插入染色體上新的位置。這樣,在原來位置上仍然保留轉位因子,而其拷貝則插入新的位置,也就是使轉位因子在基因組中的拷貝數又增加一份。2022/12/267轉位和易位是兩個不同的概念。2023/1/482、斷裂基因或不連續基因通過對真核生物編碼基因的研究發現,在編碼序列中間插有與氨基酸編碼無關的DNA間隔區,這些間隔區稱為內含子(intron)、內元、介入序列或間隔子;而編碼區則稱為外顯子(exon)、外元或表達子。含有內含子的編碼序列稱為不連續基因或斷裂基因(splitgenes)。2022/12/2682、斷裂基因或不連續基因2023/1/49斷裂基因最早是在腺病毒中發現的。Sharp及其同事在R-嚕噗(R-loop)實驗中發現,腺病毒的hexon基因在與其相對應的成熟轉錄產物mRNA進行雜交時,會出現DNA嚕噗環(圖3-1)。說明:mRNA分子與其模板DNA相比,丟失了一些基因片段。后來證實,這些片段是在mRNA加工過程中從初級轉錄本上被“剪切出去”的。2022/12/269斷裂基因最早是在腺病毒中發現的。Sha2023/1/4102022/12/26102023/1/411內含子的起源和它存在的生物學意義是一個極其誘人的研究課題,但是目前還不完全清楚,可能與基因的分子進化相關。2022/12/2611內含子的起源和它存在的生物學意義2023/1/412斷裂基因在表達時首先轉錄成初級轉錄產物,即前體mRNA或核內不均一RNA(hnRNA);然后經過刪除和連接,除去無關的DNA內含子序列的轉錄物,稱為成熟的mRNA分子。這種刪除內含子、連接外顯子的過程,稱為RNA拼接(RNAsplicing)(圖3-2)。2022/12/2612斷裂基因在表達時首先轉錄成初級轉錄產2023/1/4132022/12/26132023/1/414例外:現在已經知道,并非所有的內含子都“含而不顯”。有些內含子可以編碼蛋白質,這些蛋白質的功能與內含子序列的刪除或傳播擴散相關。如1980年,Church等人發現酵母線粒體細胞色素氧化酶基因的內含子產物是該基因mRNA前體進行拼接的反式作用因子。2022/12/2614例外:2023/1/415真核生物的外顯子也并非都“顯“(編碼氨基酸)。除了tRNA基因和rRNA基因的外顯子是理所當然地不顯以外,幾乎全部的蛋白質基因的首尾兩個外顯子都只有部分核苷酸序列編碼氨基酸,還有完全不編碼氨基酸的外顯子(如人類尿激酶基因的第一個外顯子的88個核苷酸序列)。2022/12/2615真核生物的外顯子也并非都“顯“(編碼2023/1/4163、假基因有些基因核苷酸序列與相應的正常功能基因基本相同,但卻不能合成出功能蛋白質,這些失活基因稱為假基因(pseudogene),通常用ψ表示。1977年在爪蟾的5S基因家族中首先發現了假基因。以后在珠蛋白基因家族、免疫球蛋白基因家族以及組織相容性抗原基因家族中也都發現了假基因。2022/12/26163、假基因2023/1/417如:珠蛋白基因編碼血紅蛋白的珠蛋白鏈,人類珠蛋白基因由分別位于不同染色體上的兩個相關的基因家族(α和β)組成,其中,人類的β簇分布在50kb范圍的DNA上,包含5個有功能的基因(ε,兩個γ,δ,β)和一個假基因ψβ1。兩個γ基因只有一個氨基酸的差別,第136位在γG中為Gly,而在γA為Ala。2022/12/2617如:2023/1/418α簇含有3個功能基因,3個假基因和1個未知功能的θ基因,排列順序為ξ、ψξ、ψα2、ψα1、α2、α1、θ(圖3-3)。序列分析表明,ψα1基因同三個有功能的α-珠蛋白基因DNA序列相似(ψα1基因同有功能的α2基因的序列相似性為73%),只是假基因中含有很多突變,如起始密碼子ATG變成GTG;5’端的兩個內含子也有突變,可能導致RNA拼接的破壞;在編碼區內也存在許多點突變和缺失。2022/12/2618α簇含有3個功能基因,3個假基因和12023/1/4192022/12/26192023/1/420假基因的來源:來源一:ψα1假基因被認為是由α-珠蛋白基因復制產生的:開始復制生成的基因是有功能的,后來在進化中產生了一個失活突變。由于該基因是復制產生的,所以盡管失去了功能,但是不至影響到生物體的存活。隨后在假基因中又積累了更多的突變,從而形成了現今的假基因序列。2022/12/2620假基因的來源:2023/1/421除了重復的假基因外,在真核生物的染色體基因組中還存在著一類加工的假基因(processedpseudogene)。這類假基因不與“親本基因”連鎖,結構與轉錄本而非“親本基因”相似,如都沒有啟動子和內含子,但在基因的3’端都有一段延伸的腺嘌呤短序列,類似mRNA3’末端的polyA尾巴。這些特征表明(假基因的來源二):這類假基因很可能來自加工后的RNA的DNA拷貝,稱為加工的假基因。2022/12/2621除了重復的假基因外,在真核生物的染色2023/1/4224、重疊序列傳統的基因概念把基因看作彼此獨立的、非重疊的實體。但是,隨著DNA測序技術的發展,在一些噬菌體和動物病毒中發現,不同基因的核苷酸序列有時是可以共用的。也就是說,它們的核苷酸序列可以是彼此重疊的。這種具有獨立性但使用部分共同序列的基因稱為重疊基因(overlappinggenes)或嵌套基因(nestedgenes)。2022/12/26224、重疊序列2023/1/423如:大腸桿菌ΦX174噬菌體單鏈DNA共有5387個核苷酸。如果使用單一的讀碼結構,它最多只能編碼1795個氨基酸。按每個氨基酸的平均分子量為110計算,該噬菌體所合成的全部蛋白質總分子量最多為197000。2022/12/2623如:2023/1/424但實際測定發現:ΦX174噬菌體共編碼11種蛋白質,總分子量高達262000。如何設計實驗解釋?1977年,Sanger等人測定了ΦX174噬菌體的核苷酸序列,發現它的一部分DNA能夠編碼兩種不同的蛋白質,從而解釋了上述矛盾。2022/12/2624但實際測定發現:2023/1/425根據Sanger等人的研究,ΦX174噬菌體DNA中存在兩種不同的重疊基因:第一種是一個基因的核苷酸序列完全包含在另一個基因的核苷酸序列中。例如,B基因位于A基因之中,E基因位于D基因中,只是它們的讀碼結構不同,因此編碼不同的蛋白質(圖3-4)。2022/12/2625根據Sanger等人的研究,ΦX172023/1/426第二種類型,兩個基因的核苷酸序列的末端密碼子相互重疊。例如,A基因終止密碼子的3個核苷酸TGA,與C基因的起始密碼子ATG相互重疊了2個核苷酸;D基因的終止密碼子TAA與J基因的起始密碼子ATG重疊了一個核苷酸。后來在G4病毒的單鏈環狀DNA基因組中還發現三個基因共有一段重疊的DNA序列。2022/12/2626第二種類型,兩個基因的核苷酸序列的末2023/1/427不僅在細菌、噬菌體和病毒等低等生物基因組中存在重疊序列,在一些真核生物中也存在不同于原核生物的其它類型的重疊序列。有一種特殊的重疊基因,一個基因的編碼序列完全寓居于另一個基因的內含子序列中。例如果蠅的GART基因(該基因編碼參與嘌呤生物合成的酶蛋白)的內含子中寓居著一個與之無關的編碼蛹角質膜蛋白(cuticleprotein)的基因,但是它的轉錄方向與GART基因相反。2022/12/2627不僅在細菌、噬菌體和病毒等低等生物基2023/1/428重疊基因是近年來在基因結構與功能研究上的一個非常有意義的發現。它修正了關于各個基因的多核苷酸序列彼此分立、互不重疊的傳統觀念。目前在ΦX174噬菌體、G4噬菌體以及一些病毒和少數真核基因中發現了重疊基因的現象。但是,它是否具有普遍意義,特別是在真核生物中是否廣泛存在,都還有待于進一步深入研究。2022/12/2628重疊基因是近年來在基因結構與功能研究2023/1/429三、基因的種類和結構1、基因的種類基因按其功能主要分為結構基因、調控基因和RNA基因。(1)、結構基因(structuregene):結構基因是能決定某些多肽鏈(蛋白質)或酶分子結構的基因。結構基因的突變可導致特定蛋白質(或酶)一級結構的改變。2022/12/2629三、基因的種類和結構1、基因的種類2023/1/430(2)、調控基因(regulatorgene):調控基因是具有調節控制結構基因表達功能的基因。調控基因的突變可以影響一個或多個結構基因的功能,導致蛋白質(或酶)量或活性的改變。(3)、RNA基因:有的基因只轉錄不翻譯,如核糖體RNA基因和轉運RNA基因,產物分別為rRNA和tRNA。2022/12/2630(2)、調控基因(regulator2023/1/431圖3-6原核基因的典型結構2、基因的結構2022/12/2631圖3-6原核基因的典型結構2、基因的2023/1/432圖3-5真核基因的典型結構2022/12/2632圖3-5真核基因的典型結構2023/1/433真核生物基因以單順反子的形式存在,編碼單基因產物。原核生物的基因以多順反子的形式存在,轉錄產生的mRNA,可同時編碼兩種甚至數種基因產物。2022/12/2633真核生物基因以單順反子的形式存在,編2023/1/434四、生物體內基因的大小和數目1、基因的大小真核生物中,由于內含子序列的存在,基因比實際編碼蛋白質的序列要大得多。外顯子的大小與基因的大小沒有必然的聯系。與整個基因相比,編碼蛋白質的外顯子要小得多,大多數外顯子編碼的氨基酸數小于100。2022/12/2634四、生物體內基因的大小和數目1、基因2023/1/435內含子通常比外顯子大得多,因此基因的大小取決于它所包含的內含子的長度,一些基因的內含子特別長,例如哺乳動物的二氫葉酸還原酶基因含有6個外顯子,其mRNA的長度為2kb,但基因的總長度達25~31kb,含有長達幾十kb的內含子。內含子之間也有很大的差別,大小從幾百個堿基對到幾萬個堿基對不等。2022/12/2635內含子通常比外顯子大得多,因此基因的2023/1/436基因的大小還與所包含的內含子的數目有關。在不同的基因中,內含子的數目變化很大,有些斷裂基因含有一個或少數幾個內含子,如珠蛋白基因;某些基因含有較多的內含子,如雞卵清蛋白基因有7個內含子,伴清蛋白基因含有16個內含子。2022/12/2636基因的大小還與所包含的內含子的數目有2023/1/437由于基因的大小取決于內含子的長度和數目,導致酵母和高等真核生物的基因大小差異很大。大多數酵母基因小于2kb,很少有超過5kb的。而高等真核生物的大多數基因長度在5~100kb之間。2022/12/2637由于基因的大小取決于內含子的長度和數2023/1/438種類平均外顯子數目平均基因長度(kb)平均mRNA長度(kb)酵母11.61.6真菌31.51.5藻蟲44.03.0果蠅411.32.7雞913.92.4哺乳動物716.62.2表3-1不同生物的平均基因大小2022/12/2638種類平均外顯子數目平均基因長度(kb2023/1/4392、基因的數目從基因組的大小可以粗略地算出基因的數目。雖然一些基因通過選擇性表達可以產生一個以上的產物,但這種現象并不常見,對基因數目的計算影響不大。2022/12/26392、基因的數目2023/1/440為準確地確定基因數目,需要知道整個基因組的DNA序列和基因密度。目前已知酵母基因組的全序列,其基因密度較高,平均每個開放閱讀框(openreadingframe,ORF)為1.4kb,基因間的平均分隔為600bp,即大約70%的序列為開放閱讀框。其中約一半基因是已知的基因或與已知基因有關的基因,其余是新基因。因此可推測未發現基因的數目。2022/12/2640為準確地確定基因數目,需要知道整個基2023/1/441種類基因組大小(bp)基因數目人3.3×10930000~35000果蠅1.4×1088750酵母1.3×1076100大腸桿菌4.2×1064288支原體1.0×106750噬菌體T41.6×105200表3-2不同生物的基因數目2022/12/2641種類基因組大小(bp)基因數目人3.2023/1/442如果不知道基因組的基因密度,就難以估計基因數目。可采取的方法有:基因分離鑒定計算表達基因的數目突變分析2022/12/2642如果不知道基因組的基因密度,就難以估2023/1/443五、基因簇與重復基因

1、基因家族和基因簇基因家族(genefamily)是真核生物基因組中來源相同、結構相似、功能相關的一組基因。盡管基因家族各成員序列上具有相關性,但序列相似的程度以及組織方式不同。其中大部分有功能的家族成員之間相似程度很高,有些家族成員間的差異很大,甚至有無功能的假基因。2022/12/2643五、基因簇與重復基因

2023/1/444基因家族的成員在染色體上的分布形式是不同的:有些基因家族的成員在特殊的染色體區域上成簇存在;另一些基因家族的成員在整個染色體上廣泛地分布,甚至可存在于不同的染色體上。2022/12/2644基因家族的成員在染色體上的分布形式是2023/1/445根據家族成員的分布形式,可以把不同的基因家族分為成簇存在的基因家族(clusteredgenefamily)即基因簇以及散布的基因家族(interspersedgenefamily)。2022/12/2645根據家族成員的分布形式,可以把不同的2023/1/446(1)基因簇(genecluster):基因家族的各成員緊密成簇排列成大段的串聯重復單位,定位于染色體的特殊區域。它們是同一個祖先基因擴增的產物。基因簇中也包括沒有生物功能的假基因。通常基因簇內各序列間的同源性大于基因簇間的序列同源性。2022/12/2646(1)基因簇(geneclust2023/1/447(2)散布的基因家族:家族成員在DNA上無明顯的物理聯系,甚至分散在多條染色體上。各成員在序列上有明顯差別,其中也含有假基因。但這種假基因與基因簇中的假基因不同,它們來源于RNA介導的轉座作用。2022/12/2647(2)散布的基因家族:家族成員在DN2023/1/448按照基因家族成員之間序列相似的程度,可把基因家族分為以下幾類:(1)經典的基因家族,家族中各基因的全序列或至少編碼序列具有高度的同源性,如rRNA基因家族和組蛋白基因家族。在進化過程中,這些家族成員有自動均一化的趨勢。它們的特點是:①各成員間有高度的序列一致性,甚至完全相同;②拷貝數高,常有幾十個甚至幾百個拷貝;③非轉錄的間隔區短而且一致。2022/12/2648按照基因家族成員之間序列相似的程度,2023/1/449(2)基因家族各成員的編碼產物上具有大段的高度保守氨基酸序列,這對基因發揮功能是必不可少的。基因家族的各基因中有部分十分保守的序列,但總的序列相似性卻很低。(3)家族各成員的編碼產物之間只有一些很短的保守氨基酸序列。從DNA水平上看,這些基因家族成員之間的序列同源性更低。但其基因編碼產物具有相同的功能,因為在蛋白質中存在發揮生物功能所必不可少的保守區域。2022/12/2649(2)基因家族各成員的編碼產物上具有2023/1/450(4)超基因家族(genesuperfamily),家族中各基因序列間沒有同源性,但其基因產物的功能相似。蛋白質產物中雖沒有明顯保守的氨基酸序列,但從整體上看卻有相同的結構特征,如免疫球蛋白家族。2022/12/26502023/1/4512、重復序列除了基因家族外,染色體上還有大量無轉錄活性的重復DNA序列家族,主要是基因以外的DNA序列。重復序列有兩種組織形式:一種是串聯重復DNA,成簇存在于染色體的特定區域;另一種是散布的重復DNA,重復單位并不成簇存在,而是分散于染色體的各個位點上,來源于RNA介導的轉座作用。散布的重復序列家族的許多成員是可轉移的元件,是不穩定的,可轉移到基因組的不同位置。2022/12/26512、重復序列2023/1/452(1)串聯重復DNA有些高度重復DNA序列的堿基組成和浮力密度同主體DNA有區別,在浮力密度梯度離心時,可形成不同于主DNA帶的衛星帶,稱為衛星DNA。衛星DNA由非常短的串聯重復DNA序列組成。這些序列一般對應于染色體上的異染色質區域。2022/12/2652(1)串聯重復DNA2023/1/453有些高度重復序列的堿基組成與主體DNA相差不大,不能通過浮力密度梯度離心法分離,但可以通過其它方法鑒定(如限制性作圖),這樣的DNA序列稱為隱蔽衛星DNA。2022/12/2653有些高度重復序列的堿基組成與主體DN2023/1/454根據重復單位的大小,這些非編碼的高度重復的DNA序列可以進一步分為衛星DNA(satelliteDNA)、小衛星DNA(minisatelliteDNA)、微衛星DNA(microsatelliteDNA)三類(表3-3)。2022/12/2654根據重復單位的大小,這些非編碼的高度2023/1/455分類長度重復單位大小(bp)染色體定位衛星DNA100kb~數Mb衛星序列2和35整個染色體衛星序列125~48大多數染色體著絲粒和其它異染色質區域α171所有染色體著絲粒(Sau3A家族)681,9,13,14,15,21,22號和染色體的著絲粒小衛星DNA0.1~20kb端粒家族6所有染色體端粒高變家族微衛星DNA小于150bp9~241~4所有染色體,通常靠近端粒所有染色體表3-3人類基因組的主要串聯重復序列2022/12/2655分類長度重復單位大小(bp)染色體定2023/1/4562、散布的重復DNA重復序列以散在方式分布于基因組內。根據重復序列的長短不同,可以分為短散布元件和長散布元件。短散布元件的重復序列長度在500bp以下,在人基因組中的重復拷貝數達10萬以上。長散布元件的重復序列在1000bp以上,在人類基因組中有上萬份拷貝。2022/12/26562、散布的重復DNA2023/1/457在人類基因組中有一種中等重復序列,長約300bp,30萬個成員分散分布在單倍體基因組中,在其170bp處有一個限制性酶AluI的酶切位點,因此被稱為Alu基因家族(Alufamily)。人類基因組中,大約平均每隔6kb左右就有一個Alu序列,一般出現在內含子或基因附近,可以作為人類DNA片段的特征標記。2022/12/2657在人類基因組中有一種中等重復序列,長2023/1/458Alu家族的廣泛存在暗示它可能具有一定的功能。部分Alu序列中有14bp與乳頭瘤病毒、乙型肝炎病毒的復制起始區有同源性,因此推測Alu家族可能和真核基因組的復制區相連接。但是Alu家族的成員數要比推測的復制區多10倍。2022/12/2658Alu家族的廣泛存在暗示它可能具有一2023/1/459第二節基因組基因組(genome)一詞最早出現于1922年,指的是單倍體細胞中所含的整套染色體。近年來,學術界更多地把基因組定義為整套染色體中的全部基因。隨著對不同生物的基因組DNA的測序,人們發現,對基因組這個名詞需要做出更精確的定義。現在認為,基因組指的是細胞或生物體中所有的DNA,包括所有的基因和基因間隔區域。2022/12/2659第二節基因組基因組(genome)2023/1/460原核生物基因組就是原核細胞內構成染色體的一個DNA分子。真核生物有細胞核,染色體位于細胞核內,所以真核生物的核基因組是指單倍體細胞核內整套染色體所含有的DNA分子。除了核基因組以外,真核細胞內還有細胞器基因組,即動物細胞和植物細胞的線粒體基因組以及存在于植物細胞的葉綠體基因組。2022/12/2660原核生物基因組就是原核細胞內構成染色2023/1/461目前已經完成了多種模式生物如大腸桿菌、酵母菌、線蟲、果蠅和小鼠以及芥南菜等的基因組測序工作,2001年,人類基因組的測序工作也基本完成。2022/12/2661目前已經完成了多種模式生物如大腸桿菌2023/1/462一、原核生物基因組原核生物的遺傳信息是雙鏈脫氧核糖核酸分子(DNA)。在原核生物中有兩類DNA分子:一是染色體,攜帶了細胞生存和繁殖所必需的所有遺傳信息;二是質粒,是細胞核外獨立存在的DNA分子,與細胞的生長沒有必然的關系。2022/12/2662一、原核生物基因組2023/1/4631、細菌染色體的結構所有已知的原核生物的染色體都由DNA的四種不同堿基構成:腺嘌呤(A),鳥嘌呤(G),胸腺嘧啶(T),胞嘧啶(C)。每個物種具有特定的平均G+C含量,變化范圍從24%(支原體)到76%(微球菌),多數為50%左右。2022/12/26631、細菌染色體的結構2023/1/464原核生物一般只有一個染色體即一個DNA分子。但是在不同生長條件下,染色體分子可能有一個、兩個、甚至更多的拷貝。例如,當大腸桿菌在適宜的生長培養基中培養時,可以有四個以上的染色體拷貝。2022/12/2664原核生物一般只有一個染色體即一個DN2023/1/4652、其它自主的遺傳物質:質粒和噬菌體質粒是細菌染色體外的可以自主復制的DNA分子。大多數質粒都是環狀超螺旋雙鏈DNA,

稱為共價閉合環狀分子。細胞中質粒DNA分子具有穩定的拷貝數。正常生理條件下,其拷貝數在世代之間保持不變。2022/12/26652、其它自主的遺傳物質:2023/1/466質粒DNA和寄主細胞染色體DNA分離:

密度梯度離心。當含有溴化乙錠(EtBr)的氯化銫(CsCl)溶液加到大腸桿菌裂解液中時,染色體DNA和質粒DNA因為結合的EtBr分子數不同而具有不同的密度,在密度梯度離心時形成不同的平衡條帶,達到分離目的(圖3-7)。

2022/12/2666質粒DNA和寄主細胞染色體DNA分離2023/1/467圖3-7氯化銫密度梯度離心法制備質粒

2022/12/2667圖3-7氯化銫密度梯度離心法制備2023/1/468噬菌體是以細菌為寄主的病毒。噬菌體被一層蛋白包膜覆蓋,可以在細菌外生存,再結合到細菌上。噬菌體由兩類生物大分子組成,即蛋白質和核酸。一種病毒顆粒具有一種類型的核酸。2022/12/2668噬菌體是以細菌為寄主的病毒。2023/1/469噬菌體的核酸:最常見的是雙鏈線性DNA。此外也有雙鏈環狀DNA、單鏈環狀DNA、單鏈線性DNA以及單鏈RNA等多種形式。2022/12/2669噬菌體的核酸:2023/1/470圖3-8噬菌體的生長周期

識別如HIV2022/12/2670圖3-8噬菌體的生長周期識別如2023/1/471適當條件下,噬菌體基因組DNA開始表達噬菌體的殼體蛋白、噬菌體組裝所需蛋白等,在宿主細胞內完成子代噬菌體的組裝,并裂解宿主細胞,釋放子代噬菌體,進入裂解期。噬菌體需要結合到宿主細胞上才能生長和繁殖2022/12/2671適當條件下,噬菌體基因組DNA開始表2023/1/472二、真核生物基因組大多數真核生物基因組包含于細胞核內,大部分DNA序列不編碼蛋白質。1、C值矛盾與基因組大小一個單倍體基因組的全部DNA含量總是恒定的,這是物種的一個特征,通常稱為該物種的C值。不同物種的C值差異很大,從小于106bp到1011bp。由圖3-9可見,隨著生物的進化,生物體的結構和功能越復雜,其C值就越大。2022/12/2672二、真核生物基因組2023/1/473圖3-9單倍體基因組DNA含量在低等真核生物中與形態復雜性有一定的正相關,但在高等真核生物中卻非如此,它們的單倍體基因組DNA含量變化不定。

2022/12/2673圖3-9單倍體基因組DNA含量2023/1/474在結構、功能很相似的同類生物中,甚至在親緣關系非常接近的物種之間,C值可以相差數十倍乃至上百倍。突出的例子是兩棲動物,C值小的可以低至109bp以下,C值大的可以高達1011bp。而哺乳類動物C值均在109bp。這種現象稱為C值矛盾。2022/12/2674在結構、功能很相似的同類生物中,甚至2023/1/4752、重復序列

真核生物基因組序列包括三種類型,分別是快復性組分即高度重復序列,占總DNA的25%;中度復性成分即中度重復序列,占總DNA的30%;慢復性組分即非重復序列,占總DNA的45%。2022/12/26752、重復序列2023/1/4763、細胞器基因組除了在低等的真核生物中有一些線性的細胞器DNA外,大多數真核生物中,細胞器基因組都是環狀非重復DNA序列。每個細胞中有多個細胞器,因此有多個獨立存在的細胞器基因組。2022/12/26763、細胞器基因組2023/1/477(1)線粒體基因組動物細胞線粒體基因組比較小,人、鼠和牛的線粒體基因組都只有16.5kb。與核DNA相比,線粒體DNA所占的比例不到1%。酵母線粒體基因組很大,釀酒酵母的線粒體基因組為84kb,而且每個線粒體中有4個拷貝。2022/12/2677(1)線粒體基因組2023/1/478圖3-10人線粒體基因組

2022/12/2678圖3-10人線粒體基因組2023/1/479現代研究發現線粒體DNA的重要性。線粒體有自己的蛋白質合成體系,其中rRNA和tRNA均由線粒體自身基因組編碼合成。線粒體tRNA比核基因編碼的tRNA要小,核糖體也比較小。其RNA聚合酶、氨酰-tRNA合成酶和核糖體蛋白質均由核基因編碼,但卻是細胞器專用的,不同于細胞質中的蛋白質合成系統。2022/12/2679現代研究發現線粒體DNA的重要性。2023/1/480線粒體中其它蛋白質的合成也常常由核基因和線粒體基因共同參與。如酵母線粒體中ATP合成酶、細胞色素c氧化酶的各亞基、細胞色素bc1復合物都是核基因組和細胞器基因組共同編碼的。2022/12/2680線粒體中其它蛋白質的合成也常常由核基2023/1/481(2)葉綠體基因組葉綠體基因組相對來說比較大,從高等植物的140kb到低等真核生物的200kb。葉綠體基因組可編碼與蛋白質合成有關的rRNA和tRNA,以及大約50種蛋白質,包括RNA聚合酶和一些核糖體蛋白。2022/12/2681(2)葉綠體基因組2023/1/4824、染色體和染色質染色體是細胞在有絲分裂時遺傳物質存在的特定形式,是間期細胞染色質結構緊密包裝的結果。染色體和染色質是真核生物遺傳物質存在的兩種不同形態,反映了它們處于細胞分裂周期的不同功能階段,兩者不存在成分上的差異。2022/12/26824、染色體和染色質2023/1/483染色質(chromatin)是指真核生物細胞核中,在細胞分裂期間能被堿性染料著色的物質,由DNA、組蛋白、非組蛋白和少量RNA組成,是細胞分裂間期遺傳物質的存在形式。染色質由最基本的單位——核小體成串排列而成的。2022/12/26832023/1/484染色質根據形態特征和染色性能可分為兩種類型:常染色質(euchromatin)和異染色質(heterochromatin)。常染色質中DNA的包裝比(packingration)約為1000~2000,即DNA的實際長度是染色質長度的1000倍~2000倍。2022/12/2684染色質根據形態特征和染色性能可分為兩2023/1/485構成常染色質的DNA主要是單一序列DNA和中度重復序列DNA。常染色質中并非所有基因都具有轉錄活性,處于常染色質狀態只是基因轉錄的必要條件,而不是充分條件。2022/12/2685構成常染色質的DNA主要是單一序列D2023/1/486異染色質分為結構異染色質或組成型異染色質和兼性異染色質。結構異染色質指的是除復制期外,在整個細胞周期均處于聚縮狀態,DNA包裝比在整個細胞周期中基本沒有較大變化的異染色質,主要包括衛星DNA序列、著絲粒區、端粒、次縊痕和染色體臂的某些節段等。2022/12/2686異染色質分為結構異染色質或組成型異染2023/1/487兼性異染色質是指在某些細胞類型或一定的發育階段,原來的常染色質聚縮,并喪失基因轉錄活性,變為異染色質。兼性異染色質的總量隨不同細胞類型而變化,一般胚胎細胞含量很少,而高度特化的細胞含量較多,說明隨著細胞分化,較多的基因漸次以聚縮狀態而關閉,再也不能接近基因活化蛋白。染色質的緊密折疊壓縮可能是關閉基因活性的一種途徑。2022/12/2687兼性異染色質是指在某些細胞類型或一定2023/1/488最典型的例子就是哺乳動物雌性個體中的兩個X染色體中有一個隨機失活,失去轉錄活性而導致異染色質化。2022/12/2688最典型的例子就是哺乳動物雌性個體中的2023/1/4895、染色體功能實現的三要素任何真核生物染色體的生物學功能都嚴格依賴于三種DNA序列結構:復制起點、著絲粒和端粒。2022/12/26895、染色體功能實現的三要素2023/1/490(1)復制起點(ARS)DNA序列分析發現,不同來源的ARS序列包含一段11~14bp的高度同源的富含AT的共有序列及其上下游各200bp左右的區域,這是維持ARS功能所必需的。絕大多數真核細胞的染色體,含有多個復制起點,以確保染色體快速復制。2022/12/2690(1)復制起點(ARS)2023/1/491(2)著絲粒DNA序列(CEN)著絲粒就是細胞分裂過程中染色體與紡錘絲(spindlefiber)結合的區域。因此,著絲粒在細胞分裂過程中對于母細胞中的遺傳物質能否均衡地分配到子細胞中去是至關重要的。缺少著絲粒的染色體片斷,就不能和紡錘絲相連,在細胞分裂過程中容易丟失。2022/12/2691(2)著絲粒DNA序列(CEN)2023/1/492CEN序列的共同特點是含有兩個相鄰的核心區:80~90bp的AT區;11bp的保守區。缺失損傷試驗和插入突變實驗發現一旦傷及這兩個核心區序列,CEN即喪失生物學功能。2022/12/2692CEN序列的共同特點是含有兩個相鄰的2023/1/493(3)端粒DNA序列(TEL)端粒由一系列短重復序列構成,在人類的DNA里,端粒長約10至15kb,由重復的GGGTTA組成。其它生物端粒的重復序列也多為T和G,端粒的重復序列不是染色體DNA復制時連續合成的,而是由端粒酶(telomerase)合成、添加到染色體末端的。2022/12/2693(3)端粒DNA序列(TEL)2023/1/4942022/12/26942023/1/495端粒酶是由RNA和蛋白質組成的核糖核蛋白,具有逆轉錄酶的性質,可以以特異的內在RNA為模板,合成端粒重復序列,添加到染色體的3’端。端粒與細胞壽命有關,在細胞內起著細胞分裂計時器的作用,端粒長度與細胞分裂次數和細胞的衰老有關。腫瘤細胞具有端粒酶活性,使癌細胞獲得無限增殖的能力。2022/12/2695端粒酶是由RNA和蛋白質組成的核糖核2023/1/496三、人類基因組計劃“人類基因組計劃

(HumanGenomeProject,HGP)”和“曼哈頓原子彈計劃”、“人類登月計劃”一起被譽為二十世紀科學史上的三個里程碑。1985年5月,美國能源部正式提出開展人類基因組的測序工作,形成了能源部的“人類基因組計劃”草案。1986年,美國生物學家、諾貝爾獎獲得者RenatoDulbecco在“Science”上發表短文首次提出人類基因組計劃的設想,2022/12/2696三、人類基因組計劃“人類基因組計劃2023/1/497并建議組織國家級和國際級的項目來進行這方面的研究。1986年3月美國能源部在召開的一次專門會議上,正式提出實施測定人類基因組全順序的計劃。1988年4月,國際人類基因組織(HUGO)成立。1988年10月美國能源部和美國國立衛生研究院達成協議,共同管理和實施這一計劃。1990年10月由美國國會批準正式啟動HGP研究,隨后法國、英國、意大利、德國、日本等也相繼宣布開始各自的HGP研究。中國于1987年在“863計劃”中開始設立人類基因組研究課題。2022/12/2697并建議組織國家級和國際級的項目來進行2023/1/498人類基因組計劃是一項國際性的研究計劃,目標是通過以美國為主的全球性的國際合作,在大約15年的時間里完成人類24條染色體的基因組作圖和DNA全長序列分析,進行基因的鑒定和功能分析。人類基因組計劃的最終目標是確定人類基因組所攜帶的全部遺傳信息,并確定、闡明和記錄組成人類基因組的全部DNA序列。2022/12/2698人類基因組計劃是一項國際性的研究計劃2023/1/499具體任務有以下幾個方面:(1)基因組作圖繪制兩大人類基因組圖譜,即遺傳連鎖圖譜和物理圖譜。遺傳連鎖圖譜是通過家譜分析和遺傳性狀的連鎖分析而建立的;物理圖譜是通過對構成人類基因組的脫氧核糖核酸分子的化學測定而繪制的,包括限制酶切圖譜、排序的脫氧核糖核酸克隆庫以及對表達基因或無特征(功能不清)的脫氧核糖核酸片段的低分辨圖譜。2022/12/2699具體任務有以下幾個方面:2023/1/4100所有圖譜的目標都是把有關基因的遺傳信息,按其在每條染色體上相對位置線性地系統地排列出來。2022/12/26100所有圖譜的目標都是把有關基因的遺傳2023/1/4101(2)基因組測序(genomesequencing)基因組的核苷酸順序是分辨率最高的物理圖譜,就人而言,意味著要排出30億個核苷酸的順序。同時,測定其它生物的基因組順序,以便與人類基因組進行比較研究。(3)基因識別(geneidentification)在作圖、基因定位和測序的同時,識別出基因的序列,設法克隆基因,以及著手研究基因的生物學功能。2022/12/261012023/1/4102(4)模式生物(modelorganism)研究

從模式生物獲得的數據資料,可以為人類基因組的研究進行技術的探索和經驗的積累。有助于闡明人類的生物學規律。常用的模式生物有大腸桿菌、酵母菌、線蟲、果蠅和小鼠等。在研究植物基因組時常用的模式生物是擬南芥菜(Arabideopisthaliana)。2022/12/261022023/1/4103斑馬魚小鼠2022/12/26103斑馬魚2023/1/4104(5)發展生物信息學和計算機學

隨著基因組研究的開展,全世界各個實驗室每天都產生大量的數據,其中包括DNA測序、蛋白質的氨基酸序列、基因組作圖標記與定位等。涉及數據的收集、甄別、組裝、詮釋、分配和使用等各個環節,因此,需要建立各種類型的數據庫,發展新的計算機設備和軟件,使生物學同信息科學和計算機科學緊密結合,形成了生物信息學(bioinformatics)和計算生物學(computationalbiology)。2022/12/261042023/1/4105第三節基因組學基因組研究應該包括兩方面的內容:以全基因組測序為目標的結構基因組學和以基因功能鑒定為目標的功能基因組學。結構基因組學代表基因組分析的早期階段,以建立生物體高分辨率遺傳圖譜、物理圖譜和大規模測序為基礎。功能基因組學代表基因分析的新階段,是利用結構基因組學提供的信息系統地研究基因功能,以高通量、大規模的實驗方法以及統計與計算機分析為特征。2022/12/26105第三節基因組學基因組研究應該包括2023/1/4106隨著人類基因組作圖和基因組測序工作的完成,當前的研究重心從結構基因組學轉移到功能基因組學。2022/12/26106隨著人類基因組作圖和基因組測序工作2023/1/4107一、結構基因組學

結構基因組學的內容包括基因組作圖和基因組測序。2022/12/26107一、結構基因組學2023/1/4108又稱染色體作圖:由于人的染色體巨大,不能直接用于測序,將人類基因組這一的研究對象進行分解,將其分為容易操作的小的結構區域,這個過程簡稱為染色體作圖。人類最大的1號染色體有263Mb,最小的21號染色體也有50Mb。根據使用的標記和手段的不同,染色體作圖可以分為遺傳連鎖作圖和物理作圖。2022/12/26108又稱染色體作圖:2023/1/4109(1)遺傳學圖又稱連鎖圖譜(linkagemap),它是以具有遺傳多態性(在一個遺傳位點具有一個以上的等位基因,在群體中的出現頻率皆高于1%的遺傳標記)為“路標”,以遺傳學距離(在減數分裂事件中兩個位點之間進行交換、重組的百分率,1%的重組率稱為1cM)為圖距的基因組圖。2022/12/26109(1)遺傳學圖又稱連鎖圖譜(lin2023/1/4110人類基因組遺傳連鎖圖的繪制需要應用多態性標記。人的DNA序列上平均每幾百個堿基會出現一些變異(variation),這些變異通常不產生病理性后果,并按照孟德爾遺傳規律由親代傳給子代,從而在不同個體間表現出不同,因而被稱為多態性(Polymorphism)。現在的多態性標記主要有三種:2022/12/26110人類基因組遺傳連鎖圖的繪制需要應用2023/1/4111限制性片段長度多態性(

RFLP)

RFLP是第1代標記,用限制性內切酶特異性切割DNA鏈,由于DNA的一個“點”上的突變所造成的能切與不能切兩種狀況,而產生不同長度的片段(等位片段),可用凝膠電泳顯示多態性,用作基因突變分析、基因定位和遺傳病基因的早期檢測等方面。2022/12/26111限制性片段長度多態性(RFLP)2023/1/4112DNA重復序列的多態性標記

人類基因的多態性較多的是由重復序列造成的,這也是人類基因組的重要特點之一。重復序列的多態性有小衛星DNA多態性或不同數目的串聯重復(VNTR)的多態性和微衛星的DNA多態性等多種。2022/12/26112DNA重復序列的多態性標記2023/1/4113指的是基因組DNA中有數十到數百個核苷酸片段的重復,重復的次數在人群中有高度變異,總長不超過20kb,是一種遺傳信息量很大的標記物,可以用Southern雜交或PCR法檢測。2022/12/26113指的是基因組DNA中有數十到數百個2023/1/4114是基因組中由1-6個堿基的重復,如(CA)n,(GT)n等產生的,以CA重復序列的利用度為最高。微衛星DNA重復序列在染色體DNA中散在分布,其數量被認為可達五到十萬,是目前最有用的遺傳標記。第二代DNA遺傳標記多指STR標記。2022/12/26114是基因組中由1-6個堿基的重復,如2023/1/4115單核苷酸多態性標記(SNP),是1996年美國MIT的E.Lander提出的,被稱為“第三代DNA遺傳標記”。這種遺傳標記的特點是單個堿基的置換,與第一代的RFLP及第二代的STR以長度的差異作為遺傳標記的特點不同,而且SNP的分布密集,每千個核苷酸中可出現一個SNP標記位點,2022/12/26115單核苷酸多態性標記(SNP),是12023/1/4116在人類基因組中有300萬個以上的SNP遺傳標記,這可能達到了人類基因組多態位點數目的極限。這些SNP標記以同樣的頻率存在于基因組編碼區或非編碼區,存在于編碼區的SNP約有20萬個,稱為cSNP(codingSNP)。2022/12/26116在人類基因組中有300萬個以上的S2023/1/4117(2)物理圖譜(physicalmap)是指DNA序列上兩點的實際距離,通常由DNA的限制酶片段或克隆的DNA片段有序排列而成,其基本單位是千堿基對(Kb)或百萬堿基對(Mb)。連鎖圖譜2022/12/26117(2)物理圖譜(physical2023/1/4118物理圖譜反應的是DNA序列上兩點之間的實際距離,而遺傳圖譜則反應這兩點之間的連鎖關系。在DNA交換頻繁的區域,兩個物理位置相距很近的基因或DNA片段可能具有較大的遺傳距離,而兩個物理位置相距很遠的基因或DNA片段則可能因該部位在遺傳過程中很少發生交換而具有很近的遺傳距離。2022/12/26118物理圖譜反應的是DNA序列上兩點之2023/1/4119全基因組的“鳥槍法”測序策略全基因組的“鳥槍法”測序策略,是指在獲得一定的遺傳和物理圖譜信息的基礎上,繞過建立連續的BAC克隆系的過程,直接將基因組DNA分解成小片段,進行隨機測序,并輔以一定數量的10kb克隆和BAC克隆的末端測序結果,在此基礎上進行序列拼接,直接得到待測基因組的完整序列。2022/12/26119全基因組的“鳥槍法”測序策略2023/1/41202022/12/261202023/1/4121這一策略從一提出就受到質疑,并不為主流的公共領域所采納。1995年,由CraigVenter領導的私營研究所TIGR(TheInstituteofGenomicResearch)將這種方法應用于對嗜血流感桿菌(H.influenzae)全基因組的測序中,成功的測定了它的全基因組序列。該方法隨后在對包括枯草桿菌、大腸桿菌等20多種微生物的基因組測序中得到了成功的應用。2022/12/26121這一策略從一提出就受到質疑,并不為2023/1/41221998年,TIGR和PE公司聯合組建了一個新的Celera公司,宣布計劃采用全基因組的“鳥槍法”測序策略,在2003年底前測定人類的全部基因組序列。接著,Celera公司與加州大學伯克利果蠅計劃(BDGD)合作,僅用了4個月的時間,就用全基因組的“鳥槍法”測序策略完成了果蠅基因組120Mb的全序列測定和組裝,證明了這一技術路線的可行性,成為利用同一策略進行人類基因組測序的一次預實驗。2022/12/261221998年,TIGR和PE公司聯合2023/1/4123cDNA測序人類基因組中發生轉錄表達的序列(即基因)僅占總序列的約5%,對這一部分序列進行測定將直接導致基因的發現。由于與重要疾病相關的基因或具有重要生理功能的基因具有潛在的應用價值,使得cDNA測序受到制藥工業界和研究機構的青睞,紛紛投入重金進行研究并搶占專利。2022/12/26123cDNA測序2023/1/4124cDNA測序的研究重點首先放在基因表達的短CDNA序列(EST)測序。比較不同條件下(如正常組織和腫瘤組織)的EST測序結果,可以獲得豐富的生物學信息(如基因表達與腫瘤發生、發展的關系)。其次,利用EST可以對基因進行染色體定位。2022/12/26124cDNA測序的研究重點首先放在基因2023/1/4125至2005年5月13日,公共數據庫內有26,858,818條EST(其中人類EST有6,057,800),更多的EST和全長cDNA則掌握在一批以基因組信息為產品的生物技術公司手中。2022/12/26125至2005年5月13日,公共數據庫2023/1/4126隨著研究的深入,EST測序固有的局限性變得日益顯著。首先,由于文庫構建的原因,絕大多數EST分布在基因的3’端,數據庫中代表基因5’上游信息的EST只占很小的比例。其次,EST的長度都在300~500bp之間,僅從EST中很難獲得基因結構的全部信息(如基因的不同拼接形式)。2022/12/26126隨著研究的深入,EST測序固有的局2023/1/4127鑒于此,cDNA研究的熱點目前已由EST轉變為全長cDNA研究。美國國立癌癥研究院(NCI)最近決定資助每年獲得2萬條全長cDNA的計劃。日本的人類基因組計劃也將獲得全長cDNA列為重點,到1999年底已獲得40,000條全長cDNA。為了獲得全長cDNA,除了利用cDNA末端快速擴增法(RACE)得到cDNA末端(主要是5’端)的序列以外,另外一個關鍵是構建高質量的全長cDNA文庫。2022/12/26127鑒于此,cDNA研究的熱點目前已由2023/1/4128模式生物體的基因組測序意義:可以為人類基因組的研究進行技術的探索和經驗的積累;有助于人們在基因組水平上認識進化規律;可以通過對不同生物體中的同源基因的研究,以及利用模式生物體的轉基因和基因剔除術(knockout)等方法研究基因的功能。2022/12/26128模式生物體的基因組測序2023/1/4129人類基因組的測序1998年,由PE公司和TIGR合作成立的Celera公司宣布將在3年時間內完成人類基因組全序列的測定工作,建立用于商業開發的數據庫,并對一大批重要的人類基因注冊專利。面對私營領域的挑戰,公共領域的測序計劃也加快了步伐。2022/12/26129人類基因組的測序2023/1/41302000年6月25日,美、英、日、法、德和中國的16個測序中心或協作組獲得了占人類基因組21.1%的完成序列及覆蓋人類基因組65.7%的工作草圖,兩者相加達到86.8%。同時,對整條染色體的精細測序也獲得突破性進展。1999年12月,英、日、美、加拿大和瑞典科學家共同完成了人類22號染色體的常染色體部分共33.4Mb的測序。2022/12/261302000年6月25日,美、英、日、2023/1/41312001年2月15日,國際公共領域人類基因組計劃和美國的Celera公司分別在“Nature”和“Science”雜志上公布了人類基因組序列工作草圖,完成全基因DNA序列95%的測序。2003年4月14日,國際人類基因組測序共同負責人FrancisCollins博士宣布,人類基因組序列圖繪制成功,全基因組測序完成99%。2022/12/261312001年2月15日,國際公共領域2023/1/4132二、功能基因組學人類功能基因組學涉及眾多的新技術,包括生物信息學技術、生物芯片技術、轉基因和基因敲除技術、酵母雙雜交技術、基因表達譜系分析、蛋白質組學技術、高通量細胞篩選技術等等。以解決有關基因功能研究中的基本問題:基因何時開始表達;基因表達產物定位于何處;該基因將與其它哪些基因相互影響;該基因如出現突變將會導致什么后果等2022/12/26132二、功能基因組學人類功能基因組學涉2023/1/41331、蛋白質組學是對蛋白質性質和功能的大規模研究,包括對蛋白質的表達水平、翻譯后修飾以及與其它分子的相互作用的研究,從而可以得到細胞進程在蛋白質水平上的宏觀映象。蛋白質作為mRNA的產物在細胞中行使著大部分的功能,但是蛋白質水平與mRNA水平之間并不一定有嚴格的線性關系。2022/12/261331、蛋白質組學2023/1/4134實驗證明,組織中mRNA豐度與蛋白質豐度的相關性并不好,尤其對于低豐度蛋白質來說,相關性更差。蛋白質復雜的翻譯后修飾、蛋白質的亞細胞定位或遷移、蛋白質-蛋白質相互作用等都幾乎無法從mRNA水平來判斷。蛋白質本身的存在形式和活動規律,必須從直接對蛋白質的研究來解決。內容:蛋白質分離

蛋白質分析

蛋白質相互作用蛋白質組學在精神科學領域的應用2022/12/26134實驗證明,組織中mRNA豐度與蛋白2023/1/41352、生物信息學人類基因組計劃的直接結果是獲得了海量的不連續的數據。蛋白質的復雜結構,繁雜的種類和活躍多樣的相互作用,更是給生物信息學以很大的挑戰。生物信息學是利用計算機對生命科學研究中的生物信息進行存儲、檢索和分析的科學。其研究主要是利用計算機存儲核酸和蛋白質序列,研究科學算法,編制相應的軟件對序列進行分析、比較與預測,從中發現規律。2022/12/261352、生物信息學2023/1/4136生物信息學數據庫目前,已經有美國的GenBank,歐洲的EMBL和日本的DDBJ等國際性DNA數據庫,用戶可以通過光盤或其他存儲媒體以及通過Internet獲得這些序列,包括最新的序列。蛋白質的一級結構也建立了相應的數據庫,其中著名的有PIR和SWISS-PORT等;迄今為止,已經有約6000種蛋白質的空間結構被闡明,記錄這些詳盡空間結構的數據庫為美國的PDB。2022/12/26136生物信息學數據庫2023/1/4137生物信息學的目標和任務生物信息學的研究目標是認識生命的起源、進化、遺傳和發育的本質,破譯隱藏在DNA序列中的遺傳語言,揭示基因組信息結構的復雜性及遺傳語言的根本規律,揭示人體生理的病理過程的分子基礎,為人類疾病的診斷、預防和治療提供最合理而有效的方法和途徑。目前生物信息主要的任務是:2022/12/26137生物信息學的目標和任務2023/1/4138(1)獲取人和各種生物的完整基因組(2)發現新基因和新的單核苷酸多態性(3)獲取蛋白質組信息(4)蛋白質結構及新藥設計(5)生物信息分析的技術與方法研究

完2022/12/26138(1)獲取人和各種生物的完整基因組2023/1/4139

結真核生物基因是以單順反子的形式存在,編碼的是單基因產物;而原核生物基因卻是以多順反子的形式存在,由它轉錄產生的是一種大分子量的mRNA,可同時編碼兩種甚至數種基因產物。原核生物的基因和真核生物的基因都可以分為編碼區和非編碼區。2022/12/261392023/1/4140絕大多數真核生物其編碼區被非編碼區所打斷,稱為斷裂基因;但是絕大多數的原核生物,其編碼區則是連續的。當然,某些真核生物的基因也可能是連續,而某些原核生物中也有斷裂基因存在。基因的大小與外顯子沒有關系,而是決定于內含子的大小和數目。內含子越多,片段越長,則其基因越大。真核生物中,從酵母到人類,基因的平均大小略有增加。根據基因密度可推知基因組中基因的數目。生物從低等到高等,基因數目2022/12/26140絕大多數真核生物其編碼區被非編碼區2023/1/4141逐漸增加。真核生物基因組中來源相同,結構相似,功能相關的一組基因,稱為基因家族。根據家族成員在染色體上的分布形式,基因家族又分為在染色體上串聯重復存在的基因簇和在染色體上散在分布的散在基因家族。除了能編碼蛋白的基因家族外,染色體上還存在大量無轉錄活性的重復DNA序列。根據重復單位的大小,一些高度重復序列又分為了衛星DNA、小衛星和微衛星DNA。2022/12/26141逐漸增加。真核生物基因組中來源相同2023/1/4142基因組可分為原核生物基因組、真核生物基因組和細胞器基因組。原核生物基因組簡單,只有一個染色體組成,其類核外可能有質粒DNA存在;真核生物的線粒體和葉綠體基因組,能夠合成部分所需的蛋白質。真核生物的基因組比較復雜,可分為非重復序列、中度重復序列和高重復序列。2022/12/26142基因組可分為原核生物基因組、真核生2023/1/4143C值矛盾描述了真核基因組中編碼潛力和DNA含量并非一致。人類基因組計劃自1990年啟動到現在,其基本任務已經完成,成功繪制了人類的遺傳學和物理學圖譜,并完成人類基因組的全部測序工作。在繪制遺傳學圖譜時,主要用到2022/12/26143C值矛盾描述了真核基因組中編碼潛力2023/1/4144的遺傳標記有RFLP、STR和SNP等。物理圖譜的繪制實際上是對DNA序列兩點間的實際距離的測定,用到的遺傳標記主要為STS。利用全基因組的“鳥槍法”測序策略,除了人類基因組序列外,還得到了數十幾種模式生物的基因組序列。研究基因組的科學即為基因組學,包括結構基因組學和功能基因組學。結構基因組學的主要任務已經完成,即人類基因組的作圖、測序和基因定位。目前,對基因組的研究進入了功能基因組學時代。功能基2022/12/26144的遺傳標記有RFLP、STR和SN2023/1/4145因組學以高通量、大規模實驗方法以及統計與計算機分析為特征。基因芯片、基因表達系列分析、定位克隆等都是功能基因組學的主流研究方法。蛋白質組學是功能基因組學的一個分支,包括結構蛋白質組學和功能蛋白質組學,采用的主要研究方法有蛋白質分離中的2D電泳,蛋白質分析中的質譜分析和蛋白質相互作用研究中用到的酵母雙雜交、蛋白質芯片等等。2022/12/26145因組學以高通量、大規模實驗方法以及復習思考題基因的種類基因的結構原核基因和真核基因的異同。病毒、原核基因組和真核基因組的異同。2023/1/4146復習思考題基因的種類2022/12/261462023/1/4147第三章基因、基因組和基因組學

基因的化學本質是DNA,它是遺傳信息的物質載體,傳遞著支配生命活動的指令,是構建生物體藍圖中的一頁,也是可以人工操作用于改造生命屬性的元件。2022/12/261第三章基因、基因組和基因組學2023/1/4148

基因組是指生物體的細胞中一套完整的遺傳信息,包括所有的基因和基因間區域。

專門研究基因組結構和功能的學科,稱為基因組學,它主要通過基因組作圖、基因測序和基因定位等方法來研究基因組結構和變異。2022/12/262基因組是指生物體的細胞中一套完2023/1/4149第一節基因的概念一、對基因的認識對基因的認識和研究大體上可以分為三個階段:1)在20世紀50年代以前,主要從細胞的染色體水平上進行研究,屬于基因的染色體遺傳學階段;2)50年代以后,主要從DNA大分子水平上進行研究,屬于基因的分子生物學階段;2022/12/263第一節基因的概念一、對基因的認識2023/1/41503)最近20多年來,由于重組DNA技術的完善和應用,人們改變了從表型到基因的傳統研究途徑,而能夠直接從克隆目的基因出發,研究基因的功能及其與表型的關系,使基因的研究進入了反向生物學階段。反向生物學是指利用重組DNA技術和離體定向誘變的方法研究結構已知基因的相應功能,在體外使基因突變,再導入體內,檢測突變的遺傳效應,即以表型來探索基因的結構和功能。2022/12/2643)最近20多年來,由于重組DNA技術2023/1/4151二、基因概念的擴展分子生物學和分子遺傳學的不斷發展,特別是DNA分子克隆技術、DNA序列的快速測定,以及核酸分子雜交技術等現代實驗手段的不斷涌現,為進一步深入研究基因結構和功能提供了條件,“移動基因”、“斷裂基因”、“假基因”、“重疊基因”等有關基因的新概念,豐富了對基因本質的認識。2022/12/265二、基因概念的擴展2023/1/41521、移動基因移動基因(movablegenes)又稱轉位因子(transposableelements)。由于它可以從染色體基因組上的一個位置轉移到另一個位置,甚至在不同染色體之間躍遷,因此也稱跳躍基因(jumpinggenes)。2022/12/2661、移動基因2023/1/4153轉位和易位是兩個不同的概念。易位是指染色體發生斷裂后,通過同另一條染色體斷端連接轉移到另一條染色體上。此時,染色體斷片上的基因也隨著染色體的重接而移動到新的位置。轉位則是在轉位酶的作用下,轉位因子或是直接從原來位置上切離下來,然后插入染色體新的位置;或是染色體上的DNA序列轉錄成RNA,隨后反轉錄為cDNA,再插入染色體上新的位置。這樣,在原來位置上仍然保留轉位因子,而其拷貝則插入新的位置,也就是使轉位因子在基因組中的拷貝數又增加一份。2022/12/267轉位和易位是兩個不同的概念。2023/1/41542、斷裂基因或不連續基因通過對真核生物編碼基因的研究發現,在編碼序列中間插有與氨基酸編碼無關的DNA間隔區,這些間隔區稱為內含子(intron)、內元、介入序列或間隔子;而編碼區則稱為外顯子(exon)、外元或表達子。含有內含子的編碼序列稱為不連續基因或斷裂基因(splitgenes)。2022/12/2682、斷裂基因或不連續基因2023/1/4155斷裂基因最早是在腺病毒中發現的。Sharp及其同事在R-嚕噗(R-loop)實驗中發現,腺病毒的hexon基因在與其相對應的成熟轉錄產物mRNA進行雜交時,會出現DNA嚕噗環(圖3-1)。說明:mRNA分子與其模板DNA相比,丟失了一些基因片段。后來證實,這些片段是在mRNA加工過程中從初級轉錄本上被“剪切出去”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論