




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一節基因組概述第一節基因組概述一、定義基因組(genome),又稱染色體組一個物種單倍體的染色體數目,物種全部遺傳信息的總和物種遺傳信息的“總詞典”控制發育的“總程序”生物進化歷史的“總檔案”一、定義基因組(genome),又稱染色體組原核生物基因組:原核生物DNA分布在整個細胞之中,有時相對集中在類核體上。類核體上的DNA是一條共價、閉合雙鏈分子,類核體通常也稱為染色體。這條染色體的DNA就是原核細胞的基因組。真核生物基因組:一個物種的單倍體的各條染色體中的全部DNA為該物種的基因組(genome)。例如,人有23對染色體,配子——單倍體是23條染色體,這23條染色體中的全部DNA就是人體基因組。原核生物基因組:原核生物DNA分布在整個細胞之中,有時相對集相關定義:轉錄組(transcriptome):一個細胞、組織或生物體的全部RNA的集合,轉錄組包括編碼RNA和非編碼RNA.蛋白組(proteome):指由整個基因組編碼的一組完整的蛋白質。有時候也用于描述特定的細胞或組織產生的一組蛋白質.相關定義:基因組學(genomics)1986年提出,研究基因組的組成、結構和功能的學科,分為結構基因組學(structuralgenomics)與功能基因組學(functionalgenomics)。基因組學(genomics)1986年提出,研究基因組的組成結構基因組學(structuralgenomics):研究基因組的結構并構建高分辨的遺傳圖、物理圖、序列圖和轉錄圖以及研究蛋白質組成與結構的學科。功能基因組學(functionalgenomics):即后基因組學,指利用結構基因組學研究所得到的各種遺傳信息在基因組水平上研究編碼序列及非編碼序列生物學功能的學科。結構基因組學(structuralgenomics):研究蛋白質組學(proteomics)鑒定蛋白質的產生過程、結構、功能和相互作用方式蛋白質組學(proteomics)鑒定蛋白質的產生過程、結構基因組學研究的最終目標獲得生物體全部基因組序列鑒定所有基因的功能明確基因之間的相互作用關系闡明基因組的進化規律基因組學研究的最終目標獲得生物體全部基因組序列CREDIT:JOESUTLIFFScience,Vol291:1221.FishinginaMoreEffectiveWay!CREDIT:JOESUTLIFFScience,VC值:一個物種單倍體基因組的DNA含量。
一個物種DNA的C值是相對恒定的。從原核生物到真核生物,其基因組大小和DNA含量是隨生物進化復雜程度的增加而穩步上升。二、基因組的大小C值:一個物種單倍體基因組的DNA含量。二、基因組的大小10物種C值范圍顯花植物鳥類哺乳類爬行類兩棲類骨魚類軟骨魚類棘皮類甲殼類昆蟲類軟體類蠕蟲類霉菌類藻類真菌類革蘭氏陽性菌革蘭氏陰性菌枝原體堿基對數10610710810910101011不同類生物的C值分布物種C值范圍顯花植物鳥類哺乳類爬行類兩棲類骨魚類軟骨魚類棘皮11C值悖論概念:生物的C值(或基因組大小)并不與生物復雜程度相關的現象,又稱C值矛盾。如:爪蟾的基因組大小和人類相似;兩棲類最小的基因組和最大的基因組之間相差約100倍植物與原生動物,可能具有比人類更大的基因組C值矛盾在進化中的原因和機制尚不清楚C值悖論12三、基因組中基因的歸類1、從進化的角度: 人類基因組中原核生物和真核生物共有的基因約為21%,與生命基本功能相關真核生物特有的基因約為32%,編碼的蛋白質參與真核細胞中原核細胞不存在的功能,如和細胞器或細胞骨架相關動物特有的基因為24%,這些基因對多細胞分化和不同組織類型發育是必需的脊椎動物特有的基因占22%,通常編碼免疫系統和神經系統的蛋白質三、基因組中基因的歸類1、從進化的角度:132、根據真核生物共有蛋白質組的功能轉錄和翻譯相關,約占35%代謝相關,約占22%轉運相關,約占12%DNA復制和修飾相關,約占10%蛋白質折疊和降解相關,約占8%細胞周期相關,約占6%2、根據真核生物共有蛋白質組的功能143、根據基因是否必需:管家基因(house-keepinggene):或組成型基因(constitutivegene),是維持細胞生存不可缺少的,在所有類型細胞中發揮功能奢侈基因(luxurygene):與細胞分化有關,是與組織特異性表達有關的基因,是特定細胞類型所必需的并只在其中表達3、根據基因是否必需:154、根據基因的表達量:高豐度mRNA(abundantmRNA),由少于100種的不同mRNA組成,每個細胞中有1000~10000個拷貝,通常占mRNA總量的大部分,達到50%稀有mRNA(scarcemRNA
),或稱為復雜mRNA(complexmRNA),組成了大部分不同的mRNA,約為上萬種,每種mRNA分子的量通常少于10個4、根據基因的表達量:16四、基因組中其它序列的分布desert:長度超過500kb不含基因的序列區 約20%的人類基因組區域由沒有基因的“沙漠”序列組成。重復序列:重復序列占人類基因組的50%以上轉座子占基因組的45%,所有的轉座子都是多拷貝的。加工后假基因(mRNA序列的一個拷貝插入到基因組形成的),總共約3000條,占總DNA序列的的0.1%簡單重復序列約占基因組的3% 簡單重復序列:(Simplesequencerepeats)又
稱微衛星DNA(Micro-satellite
DNA)或短串聯重復(Short
Tandem
Repeats)串聯重復序列:主要位于端粒和著絲粒區域片段復制序列約占基因組的5% 片段重復序列(Segmentalduplications):長10~300kb的DNA片段復制一個拷貝到新的區域四、基因組中其它序列的分布desert:長度超過500kb不17不同物種中不同類別序列所占的比例單拷貝序列中度重復序列高度重復序列不同物種中不同類別序列所占的比例單拷貝序列中度重復序列高度重181、單拷貝序列在一個基因組中只有1個拷貝或2—3個拷貝;不同生物基因組中單拷貝序列所占的比例是不同的;原核生物中只含有單拷貝序列。人類基因組中的單拷貝序列小于50%隨著基因組大小的增加,單拷貝序列的長度也增加;兩棲類和植物基因組C值的增加并非是單拷貝序列的增加,而是重復序列DNA比例的增加;
由此可見,非重復DNA含量與生物的進化程度是一致的1、單拷貝序列由此可見,非重復DNA含量與生物的進化程度是一192、中度重復序列重復單位平均長度約300bp,重復次數10-105次;不同種屬之間比例差異很大,一般約占10-40%;
在人約為12%,大多不編碼蛋白質;依據重復順序的長度,中度重復順序可分為兩種類型:
(1)短分散組分(2)長分散組分2、中度重復序列重復單位平均長度約300bp,重復次數10-20(1)短分散組分(shortinterspersednucleotideelements,SINES)平均長度約為300bp,拷貝數可達10萬左右;與平均長度約為1000bp的單拷貝順序間隔排列;
例如:
人珠蛋白基因含有8個功能基因和3個假基因
Alu家族、Hinf家族(1)短分散組分21(2)長分散組分
(Longinterspersednucleotideelements,LINES)長度約為3500-5000bp,重復次數約為10-104;含有長度不等的間隔序列;
例如:人基因組中所有LINES之間的平均距離為2.2kb,拷貝數約10000,如KpnⅠ家族等。(2)長分散組分223、高度重復序列重復單位平均長度約6-200bp,重復次數為106以上
(1)
衛星DNA:真核細胞染色體具有的高度重復核苷酸序列的DNA。總量可占全部DNA的10%以上,主要存在于染色體的著絲粒區域,通常不被轉錄。因其堿基組成中GC含量少,具有不同的浮力密度,在氯化銫密度梯度離心后呈現與大多數DNA有差別的“衛星”帶而得名。注意:并非所有的高度重復DNA都能形成衛星DNA3、高度重復序列23生物學基因組學課件24衛星DNA主要序列總長度/bp所占比例浮力密度ⅠACAAACT1.1×10725%1.687ⅡATAAACT3.6×1068%1.693ⅢACAAATT3.6×1068%1.697隱蔽衛星AATATAG1.700果蠅(D.virilis)的衛星DNA衛星DNA主要序列總長度/bp所占比例浮力密度ⅠACAAAC25哺乳動物衛星序列一般由許多分級的重復序列單位形成 如小鼠衛星DNA用EcoRII酶切,產生一個234bp的單體片段,該片段幾乎無變異重復,占衛星序列總長度的60%~70%
234bp片段的1/2重復序列單位:前117bp和后117bp對應排列,非常相似,只有22個位點不同哺乳動物衛星序列一般由許多分級的重復序列單位形成26衛星DNA的分布:著絲粒、端粒和Y染色體長臂的異染色質區。與基因表達調控,同源染色體之間的配對與重組,染色體結構穩定性的維持,RNA前體的加工等過程有關。衛星DNA的分布:27(2)
可變數目串聯重復序列(variablenumbertandemrepeat,VNTR)或短串聯重復序列(shorttandemrepeat,STR):
小衛星(minisatellite):重復單位為10-100bp
微衛星(microsatellite):重復單位小于10
bp,通常重復10-60次CTAGCTTATATATATATATATATATATATAAGCTTGC(2)可變數目串聯重復序列(variablenumbe28小衛星DNA可用于遺傳作圖小衛星序列中發生遺傳交換的頻率很高,為10-4每kbDNA,是減數分裂中同源重組頻率,即衛星序列間重組頻率的10倍小衛星DNA可用于遺傳作圖小衛星序列中發生遺傳交換的頻率很高29親子鑒定:父母含不同長度的小衛星等位片段每一個子代都以常規方式從親本一方得到一條等位片段小衛星DNA序列的高度變異性,使每個個體都形成獨特的帶型,而子代有50%的條帶一方來自于特定的親本親子鑒定:30NothingwouldbemorespecificandreliablethanDNAforindividualidentification.IndividualIdentificationNothingwouldbemorespecific31
基因家族(genefamily):真核生物基因組中有許多來源相同、結構相似、功能相關的基因,這樣的一組基因稱為基因家族。五、基因家族
例如:組蛋白基因家族、珠蛋白基因家族、免疫球蛋白基因家族等基因家族(genefamily):真核生物基因組中有許32Alu家族是哺乳動物基因組中含量最豐富的一種中度重復序列家族,在人基因組中重復達30萬-50萬次,約3-6%;Alu家族每個成員的長度約300bp,由于每個單位長度中有一個限制性內切酶AluI的切點(AG↓CT),從而將其切成長130和170bp的兩段,因而定名為Alu家族;Alu序列分散在整個基因組中;少數成簇分布Alu序列具有種屬的特異性(一)、Alu家族1.Alu序列特征Alu家族是哺乳動物基因組中含量最豐富的一種中度重復序列家族33正向重復序列170bp130bp+31bp130bp正向重復序列正向重復序列正向重復序列6-20bp6-20bp>>>>>>130bp由兩個約130bp的正向重復構成的二聚體;第二個單體中有一個31bp的插入序列,不同成員之間核苷酸順序相似但不相同;兩側為6-20bp的正向重復順序,不同成員的側翼重復順序各不相同;人類Alu序列特征:AluI正向重復序列170bp130bp+31bp130bp正向重復34可能參與hnRNA的加工與成熟;可能與遺傳重組及染色體穩定性有關;Alu序列中的某些區段有形成Z-DNA的能力;可能具有轉錄調節作用;某些Alu序列可能具有癌基因的轉化抑制作用;2.Alu家族的功能:可能參與hnRNA的加工與成熟;2.Alu家族的功能:35(二)、KpnⅠ家族
KpnⅠ家族是中度重復序列中僅次于Alu家族的第二大家族。用限制性內切酶KpnⅠ消化人類及其它靈長類動物的DNA,在電泳譜上可以看到4個不同長度的片段,分別為1.2、1.5、1.8和1.9kb,這就是所謂的KpnⅠ家族
KpnⅠ家族的拷貝數約為3000-4800個,占人體基因組的1%(二)、KpnⅠ家族36
以319bp長度的串聯重復存在于人體基因組中;用內切酶HinfⅠ消化人體DNA,可以分離到這一片段;約有50-100個拷貝,分散在不同的區域;
319bp單位可以再分成兩個亞單位,分別為172bp和
147bp,它們之間有70%的同源性;(三)、Hinf家族以319bp長度的串聯重復存在于人體基因組中;(三)、Hi37
基本單位是dTdG雙核苷酸,多個dTdG雙核苷酸串聯重復在一起,分散于人體基因組中;人基因組中dTdG交替順序平均長度40bp,達105拷貝;
(四)、多聚dT-dG家族基本單位是dTdG雙核苷酸,多個dTdG雙核苷酸串聯(四38六、細胞器基因組細胞器基因組的基本特征:絕大多數細胞器基因組是單鏈環狀DNA分子,在線粒體在被稱為線粒體DNA(mtDNA),葉綠體中被稱為葉綠體DNA(ctDNA)在低等真核生物中,線粒體DNA是線性的葉綠體基因組相對較大,高等植物中通常為140kb哺乳動物線粒體基因組約為16.5kb;植物線粒體基因組大小差異較大,但最小也有100kb線粒體基因組含編碼蛋白質.rRNA和tRNA的基因六、細胞器基因組細胞器基因組的基本特征:線粒體基因組含編碼蛋392、線粒體DNA的結構:人類線粒體DNA含22條tRNA基因、2條rRNA基因和13條蛋白質編碼基因14條基因順時針方向表達,8條逆時針方向表達哺乳動物線粒體基因的排列非常緊湊,沒有內含子,并且部分基因重疊D環,一個和DNA復制起始有關的區域2、線粒體DNA的結構:40七、基因簇和假基因
基因簇(genecluster):具有某種相似特征并且緊密連鎖成簇狀分布在染色體某一區域的基因群;假基因(pseudogene):在多基因家族中,某些成員并不產生有功能的基因產物,但在結構和DNA序列上與有功能的基因具有相似性;七、基因簇和假基因基因簇(genecluster):具有41
16pter~p1211p1516pter~p1211p1542假基因特征:1.缺少轉錄識別位點(非洲爪蟾5SrRNA基因)2.缺少內含子(α珠蛋白家族假基因)3.發生突變假基因特征:43生物學基因組學課件44人類基因組特征:約含有30億個堿基對,有功能的占10%;各種重復序列的比例高達50%以上;編碼序列只占2%,約編碼3萬個基因。但60%的基因在表達時發生可變剪接,蛋白質組的組成可達5-6萬個;每條染色體含堿基8千萬至3億不等。人類基因組特征:45第二節人類基因組計劃第二節人類基因組計劃4620世紀人類科技發展史上的三大創舉
90年代人類基因組計劃40年代第一顆原子彈爆炸60年代人類首次登上月球20世紀人類科技發展史上的三大創舉90年代人類基因組計劃447人類基因組計劃的啟動1986年諾貝爾獎獲得者R.Dulbecco(杜爾貝科)提出人類基因組計劃人類基因組計劃的啟動1986年諾貝爾獎獲得者R.Dulbe48美國政府決定于1990年正式啟動HGP,預計用15年時間,投入30億美元,完成HGP。
HGP逐漸擴展為多國協作計劃。參與者包括:美、英、日、法、德和中國(1993年)1996,完成標記密度為0.6cM的人類基因組遺傳圖譜,100kb的物理圖譜2000,完成草圖2001年2月,公布人類基因組圖譜的修訂版2002,完成測序工作美國政府決定于1990年正式啟動HGP,預計用15年時49二000年六月二十六日克林頓宣布人類基因組草圖繪制完成二000年六月二十六日克林頓宣布50美國國家人類基因組研究所所長弗朗西斯·柯林斯在介紹情況。美國國家人類基因組研究所所長弗朗西斯·柯林斯在介紹情況。51人類基因組草圖基本信息由31.65億bp組成含3~3.5萬基因與蛋白質合成有關的基因占2%人類基因組人類蛋白質61%與果蠅同源43%與線蟲同源46%與酵母同源人類基因組草圖基本信息由31.65億bp組成人類基因組人類蛋52同時發表論文
美國Science,Vol.291,No.5507
英國Nature,Vol.409,p.8602001年2月16日,人類基因組“精細圖”完成,(99%)2003年4月14日,人類基因組序列圖亦稱“完成圖”(99.99%),提前繪制成功。同時發表論文
美國Science,Vol.291,53DAN測序膠圖DAN測序膠圖54人類基因組計劃的科學意義(1)確定人類基因組中約3萬個編碼基因的序列及其在基因組中的物理位置,利于研究基因的產物及其功能。(2)了解轉錄和剪接調控元件的結構與位置,從整個基因組結構的宏觀水平上理解基因轉錄與轉錄后調節。人類基因組計劃的科學意義(1)確定人類基因組中約3萬個編碼基55(4)研究空間結構對基因調節的作用。(3)從整體上了解染色體結構,包括各種重復序列以及非轉錄“框架序列”的大小和組織,了解各種不同序列在形成染色體結構、DNA復制、基因轉錄及表達調控中的影響與作用。(5)發現與DNA復制、重組等有關的序列。(4)研究空間結構對基因調節的作用。(3)從整體上了解染色體56(6)研究DNA突變、重排和染色體斷裂等,了解疾病的分子機制,包括遺傳性疾病、易感性疾病、放射性疾病甚至感染性疾病引發的分子病理學改變及其進程,為這些疾病的診斷、預防和治療提供理論依據。(7)確定人類基因組中轉座子、逆轉座子和病毒殘余序列,研究其周圍序列的性質。了解有關病毒基因組侵染人類基因組后的影響,可能指導人類有效地利用病毒載體進行基因治療。(8)研究染色體和個體之間的多態性。(6)研究DNA突變、重排和染色體斷裂等,了解疾病的分子機制57生物學基因組學課件58第一節基因組概述第一節基因組概述一、定義基因組(genome),又稱染色體組一個物種單倍體的染色體數目,物種全部遺傳信息的總和物種遺傳信息的“總詞典”控制發育的“總程序”生物進化歷史的“總檔案”一、定義基因組(genome),又稱染色體組原核生物基因組:原核生物DNA分布在整個細胞之中,有時相對集中在類核體上。類核體上的DNA是一條共價、閉合雙鏈分子,類核體通常也稱為染色體。這條染色體的DNA就是原核細胞的基因組。真核生物基因組:一個物種的單倍體的各條染色體中的全部DNA為該物種的基因組(genome)。例如,人有23對染色體,配子——單倍體是23條染色體,這23條染色體中的全部DNA就是人體基因組。原核生物基因組:原核生物DNA分布在整個細胞之中,有時相對集相關定義:轉錄組(transcriptome):一個細胞、組織或生物體的全部RNA的集合,轉錄組包括編碼RNA和非編碼RNA.蛋白組(proteome):指由整個基因組編碼的一組完整的蛋白質。有時候也用于描述特定的細胞或組織產生的一組蛋白質.相關定義:基因組學(genomics)1986年提出,研究基因組的組成、結構和功能的學科,分為結構基因組學(structuralgenomics)與功能基因組學(functionalgenomics)。基因組學(genomics)1986年提出,研究基因組的組成結構基因組學(structuralgenomics):研究基因組的結構并構建高分辨的遺傳圖、物理圖、序列圖和轉錄圖以及研究蛋白質組成與結構的學科。功能基因組學(functionalgenomics):即后基因組學,指利用結構基因組學研究所得到的各種遺傳信息在基因組水平上研究編碼序列及非編碼序列生物學功能的學科。結構基因組學(structuralgenomics):研究蛋白質組學(proteomics)鑒定蛋白質的產生過程、結構、功能和相互作用方式蛋白質組學(proteomics)鑒定蛋白質的產生過程、結構基因組學研究的最終目標獲得生物體全部基因組序列鑒定所有基因的功能明確基因之間的相互作用關系闡明基因組的進化規律基因組學研究的最終目標獲得生物體全部基因組序列CREDIT:JOESUTLIFFScience,Vol291:1221.FishinginaMoreEffectiveWay!CREDIT:JOESUTLIFFScience,VC值:一個物種單倍體基因組的DNA含量。
一個物種DNA的C值是相對恒定的。從原核生物到真核生物,其基因組大小和DNA含量是隨生物進化復雜程度的增加而穩步上升。二、基因組的大小C值:一個物種單倍體基因組的DNA含量。二、基因組的大小68物種C值范圍顯花植物鳥類哺乳類爬行類兩棲類骨魚類軟骨魚類棘皮類甲殼類昆蟲類軟體類蠕蟲類霉菌類藻類真菌類革蘭氏陽性菌革蘭氏陰性菌枝原體堿基對數10610710810910101011不同類生物的C值分布物種C值范圍顯花植物鳥類哺乳類爬行類兩棲類骨魚類軟骨魚類棘皮69C值悖論概念:生物的C值(或基因組大小)并不與生物復雜程度相關的現象,又稱C值矛盾。如:爪蟾的基因組大小和人類相似;兩棲類最小的基因組和最大的基因組之間相差約100倍植物與原生動物,可能具有比人類更大的基因組C值矛盾在進化中的原因和機制尚不清楚C值悖論70三、基因組中基因的歸類1、從進化的角度: 人類基因組中原核生物和真核生物共有的基因約為21%,與生命基本功能相關真核生物特有的基因約為32%,編碼的蛋白質參與真核細胞中原核細胞不存在的功能,如和細胞器或細胞骨架相關動物特有的基因為24%,這些基因對多細胞分化和不同組織類型發育是必需的脊椎動物特有的基因占22%,通常編碼免疫系統和神經系統的蛋白質三、基因組中基因的歸類1、從進化的角度:712、根據真核生物共有蛋白質組的功能轉錄和翻譯相關,約占35%代謝相關,約占22%轉運相關,約占12%DNA復制和修飾相關,約占10%蛋白質折疊和降解相關,約占8%細胞周期相關,約占6%2、根據真核生物共有蛋白質組的功能723、根據基因是否必需:管家基因(house-keepinggene):或組成型基因(constitutivegene),是維持細胞生存不可缺少的,在所有類型細胞中發揮功能奢侈基因(luxurygene):與細胞分化有關,是與組織特異性表達有關的基因,是特定細胞類型所必需的并只在其中表達3、根據基因是否必需:734、根據基因的表達量:高豐度mRNA(abundantmRNA),由少于100種的不同mRNA組成,每個細胞中有1000~10000個拷貝,通常占mRNA總量的大部分,達到50%稀有mRNA(scarcemRNA
),或稱為復雜mRNA(complexmRNA),組成了大部分不同的mRNA,約為上萬種,每種mRNA分子的量通常少于10個4、根據基因的表達量:74四、基因組中其它序列的分布desert:長度超過500kb不含基因的序列區 約20%的人類基因組區域由沒有基因的“沙漠”序列組成。重復序列:重復序列占人類基因組的50%以上轉座子占基因組的45%,所有的轉座子都是多拷貝的。加工后假基因(mRNA序列的一個拷貝插入到基因組形成的),總共約3000條,占總DNA序列的的0.1%簡單重復序列約占基因組的3% 簡單重復序列:(Simplesequencerepeats)又
稱微衛星DNA(Micro-satellite
DNA)或短串聯重復(Short
Tandem
Repeats)串聯重復序列:主要位于端粒和著絲粒區域片段復制序列約占基因組的5% 片段重復序列(Segmentalduplications):長10~300kb的DNA片段復制一個拷貝到新的區域四、基因組中其它序列的分布desert:長度超過500kb不75不同物種中不同類別序列所占的比例單拷貝序列中度重復序列高度重復序列不同物種中不同類別序列所占的比例單拷貝序列中度重復序列高度重761、單拷貝序列在一個基因組中只有1個拷貝或2—3個拷貝;不同生物基因組中單拷貝序列所占的比例是不同的;原核生物中只含有單拷貝序列。人類基因組中的單拷貝序列小于50%隨著基因組大小的增加,單拷貝序列的長度也增加;兩棲類和植物基因組C值的增加并非是單拷貝序列的增加,而是重復序列DNA比例的增加;
由此可見,非重復DNA含量與生物的進化程度是一致的1、單拷貝序列由此可見,非重復DNA含量與生物的進化程度是一772、中度重復序列重復單位平均長度約300bp,重復次數10-105次;不同種屬之間比例差異很大,一般約占10-40%;
在人約為12%,大多不編碼蛋白質;依據重復順序的長度,中度重復順序可分為兩種類型:
(1)短分散組分(2)長分散組分2、中度重復序列重復單位平均長度約300bp,重復次數10-78(1)短分散組分(shortinterspersednucleotideelements,SINES)平均長度約為300bp,拷貝數可達10萬左右;與平均長度約為1000bp的單拷貝順序間隔排列;
例如:
人珠蛋白基因含有8個功能基因和3個假基因
Alu家族、Hinf家族(1)短分散組分79(2)長分散組分
(Longinterspersednucleotideelements,LINES)長度約為3500-5000bp,重復次數約為10-104;含有長度不等的間隔序列;
例如:人基因組中所有LINES之間的平均距離為2.2kb,拷貝數約10000,如KpnⅠ家族等。(2)長分散組分803、高度重復序列重復單位平均長度約6-200bp,重復次數為106以上
(1)
衛星DNA:真核細胞染色體具有的高度重復核苷酸序列的DNA。總量可占全部DNA的10%以上,主要存在于染色體的著絲粒區域,通常不被轉錄。因其堿基組成中GC含量少,具有不同的浮力密度,在氯化銫密度梯度離心后呈現與大多數DNA有差別的“衛星”帶而得名。注意:并非所有的高度重復DNA都能形成衛星DNA3、高度重復序列81生物學基因組學課件82衛星DNA主要序列總長度/bp所占比例浮力密度ⅠACAAACT1.1×10725%1.687ⅡATAAACT3.6×1068%1.693ⅢACAAATT3.6×1068%1.697隱蔽衛星AATATAG1.700果蠅(D.virilis)的衛星DNA衛星DNA主要序列總長度/bp所占比例浮力密度ⅠACAAAC83哺乳動物衛星序列一般由許多分級的重復序列單位形成 如小鼠衛星DNA用EcoRII酶切,產生一個234bp的單體片段,該片段幾乎無變異重復,占衛星序列總長度的60%~70%
234bp片段的1/2重復序列單位:前117bp和后117bp對應排列,非常相似,只有22個位點不同哺乳動物衛星序列一般由許多分級的重復序列單位形成84衛星DNA的分布:著絲粒、端粒和Y染色體長臂的異染色質區。與基因表達調控,同源染色體之間的配對與重組,染色體結構穩定性的維持,RNA前體的加工等過程有關。衛星DNA的分布:85(2)
可變數目串聯重復序列(variablenumbertandemrepeat,VNTR)或短串聯重復序列(shorttandemrepeat,STR):
小衛星(minisatellite):重復單位為10-100bp
微衛星(microsatellite):重復單位小于10
bp,通常重復10-60次CTAGCTTATATATATATATATATATATATAAGCTTGC(2)可變數目串聯重復序列(variablenumbe86小衛星DNA可用于遺傳作圖小衛星序列中發生遺傳交換的頻率很高,為10-4每kbDNA,是減數分裂中同源重組頻率,即衛星序列間重組頻率的10倍小衛星DNA可用于遺傳作圖小衛星序列中發生遺傳交換的頻率很高87親子鑒定:父母含不同長度的小衛星等位片段每一個子代都以常規方式從親本一方得到一條等位片段小衛星DNA序列的高度變異性,使每個個體都形成獨特的帶型,而子代有50%的條帶一方來自于特定的親本親子鑒定:88NothingwouldbemorespecificandreliablethanDNAforindividualidentification.IndividualIdentificationNothingwouldbemorespecific89
基因家族(genefamily):真核生物基因組中有許多來源相同、結構相似、功能相關的基因,這樣的一組基因稱為基因家族。五、基因家族
例如:組蛋白基因家族、珠蛋白基因家族、免疫球蛋白基因家族等基因家族(genefamily):真核生物基因組中有許90Alu家族是哺乳動物基因組中含量最豐富的一種中度重復序列家族,在人基因組中重復達30萬-50萬次,約3-6%;Alu家族每個成員的長度約300bp,由于每個單位長度中有一個限制性內切酶AluI的切點(AG↓CT),從而將其切成長130和170bp的兩段,因而定名為Alu家族;Alu序列分散在整個基因組中;少數成簇分布Alu序列具有種屬的特異性(一)、Alu家族1.Alu序列特征Alu家族是哺乳動物基因組中含量最豐富的一種中度重復序列家族91正向重復序列170bp130bp+31bp130bp正向重復序列正向重復序列正向重復序列6-20bp6-20bp>>>>>>130bp由兩個約130bp的正向重復構成的二聚體;第二個單體中有一個31bp的插入序列,不同成員之間核苷酸順序相似但不相同;兩側為6-20bp的正向重復順序,不同成員的側翼重復順序各不相同;人類Alu序列特征:AluI正向重復序列170bp130bp+31bp130bp正向重復92可能參與hnRNA的加工與成熟;可能與遺傳重組及染色體穩定性有關;Alu序列中的某些區段有形成Z-DNA的能力;可能具有轉錄調節作用;某些Alu序列可能具有癌基因的轉化抑制作用;2.Alu家族的功能:可能參與hnRNA的加工與成熟;2.Alu家族的功能:93(二)、KpnⅠ家族
KpnⅠ家族是中度重復序列中僅次于Alu家族的第二大家族。用限制性內切酶KpnⅠ消化人類及其它靈長類動物的DNA,在電泳譜上可以看到4個不同長度的片段,分別為1.2、1.5、1.8和1.9kb,這就是所謂的KpnⅠ家族
KpnⅠ家族的拷貝數約為3000-4800個,占人體基因組的1%(二)、KpnⅠ家族94
以319bp長度的串聯重復存在于人體基因組中;用內切酶HinfⅠ消化人體DNA,可以分離到這一片段;約有50-100個拷貝,分散在不同的區域;
319bp單位可以再分成兩個亞單位,分別為172bp和
147bp,它們之間有70%的同源性;(三)、Hinf家族以319bp長度的串聯重復存在于人體基因組中;(三)、Hi95
基本單位是dTdG雙核苷酸,多個dTdG雙核苷酸串聯重復在一起,分散于人體基因組中;人基因組中dTdG交替順序平均長度40bp,達105拷貝;
(四)、多聚dT-dG家族基本單位是dTdG雙核苷酸,多個dTdG雙核苷酸串聯(四96六、細胞器基因組細胞器基因組的基本特征:絕大多數細胞器基因組是單鏈環狀DNA分子,在線粒體在被稱為線粒體DNA(mtDNA),葉綠體中被稱為葉綠體DNA(ctDNA)在低等真核生物中,線粒體DNA是線性的葉綠體基因組相對較大,高等植物中通常為140kb哺乳動物線粒體基因組約為16.5kb;植物線粒體基因組大小差異較大,但最小也有100kb線粒體基因組含編碼蛋白質.rRNA和tRNA的基因六、細胞器基因組細胞器基因組的基本特征:線粒體基因組含編碼蛋972、線粒體DNA的結構:人類線粒體DNA含22條tRNA基因、2條rRNA基因和13條蛋白質編碼基因14條基因順時針方向表達,8條逆時針方向表達哺乳動物線粒體基因的排列非常緊湊,沒有內含子,并且部分基因重疊D環,一個和DNA復制起始有關的區域2、線粒體DNA的結構:98七、基因簇和假基因
基因簇(genecluster):具有某種相似特征并且緊密連鎖成簇狀分布在染色體某一區域的基因群;假基因(pseudogene):在多基因家族中,某些成員并不產生有功能的基因產物,但在結構和DNA序列上與有功能的基因具有相似性;七、基因簇和假基因基因簇(genecluster):具有99
16pter~p1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蘭州博文科技學院《文化項目案例解讀》2023-2024學年第一學期期末試卷
- 山東省淄博市恒臺縣2025屆三年級數學第二學期期末聯考模擬試題含解析
- 云南省曲靖市馬龍縣2025屆四下數學期末經典模擬試題含解析
- 華北水利水電大學《文學改編影視研究》2023-2024學年第二學期期末試卷
- 山西傳媒學院《汽車美容與裝飾》2023-2024學年第二學期期末試卷
- 天津石油職業技術學院《測試技術與信號處理》2023-2024學年第二學期期末試卷
- 長春電子科技學院《高級日語聽力I》2023-2024學年第二學期期末試卷
- 江西省宜春市四校2025年高三下期中考試(物理試題文)試題含解析
- 銀川第二中學2024-2025學年高三下學期總復習階段測試生物試題試卷含解析
- 2024北京五中分校初二(下)期中數學試題及答案
- 礦山協議合同范本
- 【抖音直播帶貨發展中存在的問題及對策(任務書+開題報告)3400字】
- 【基于單片機的兒童防走失模塊設計11000字】
- 建筑施工企業主要負責人(A類)題庫與參考答案
- DZ∕T 0382-2021 固體礦產勘查地質填圖規范(正式版)
- 2024年時事政治必考題庫及答案(真題匯編)
- 《研學旅行課程設計》課件-研學課程方案設計
- 教科版六年級下學期小升初科學模擬試卷(附答案)
- 林長巡查工作實施方案
- AQ 2079-2020 海洋石油生產設施發證檢驗工作通則
- ifix培訓教程課件
評論
0/150
提交評論