




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第1章基因組1.2基因組序列復雜性1.2.1C值與C值悖理基因組:一個物種單倍體染色體的數目及其所攜帶的全部基因稱為該物種的基因組(genome)。
C值(Cvalue):是指一個單倍體基因組中DNA的總量,一個特定的種屬具有特征的C值。最小的:原核生物支原體基因組小于106bp;最大的:某些植物和兩棲類基因組大于1011bp。圖總的趨勢是:隨著生物結構與功能復雜性而增加生物的復雜性與基因組的大小并不完全成比例增加。如:蕨類的低等植物Psilotum
nudum,其基因組大小為2.5×1012bp,相當于模式植物擬南芥基因組的3000倍。
Cvalueparadox(C值悖理):C值的大小并不能完全說明生物進化的程度和遺傳復雜性的高低,也就是說,物種的C值和它進化復雜性之間沒有嚴格的對應關系。1.2.1序列復雜性序列復雜性:基因組中單拷貝的DNA序列稱為單一序列,多拷貝的DNA序列稱為重復序列,不同序列的DNA總長稱為復雜性(complexity)?;蚪M復雜性與基因組大小
真核生物基因組DNA組分為非均一性,可分為3種類型:快速復性組分,居間復性組分和緩慢復性組分。
如果基因組中每一種基因只有一個,即都是單拷貝序列,那么基因組愈大則基因組的復雜性愈大,復性速率愈小,C0t1/2與非重復序列的基因組大小呈正比。1.2.3基因組的序列組成單拷貝序列(uniquesequence)亦稱非重復序列(nonrepetitivesequence):在一個基因組中只有一個拷貝(或2-3個拷貝)中度重復序列(moderatelyrepetitivesequence)高度重復序列(highlyrepetitivesequence)1.2.3基因組的序列組成高度重復序列
重復單位長度在數個堿基對至數千堿基對之間,拷貝數幾百個至上百萬個。高等真核生物高度重復序列DNA有如下一些特點:它們都是由極其相似的重復拷貝首尾相連串接排列;在介質氯化銫中作密度梯度離心時,可形成特異的衛星帶,故又稱衛星DNA(sateliteDNA);集中分布在染色體的特定區段,如著絲粒和近端粒區。中度重復序列其長度(由100bp到幾千bp)和拷貝數差別很大,一般分散在整個基因組中。有多種類型的中度重復序列,其表達產物常是細胞大量需要的,如rRNA、tRNA和組蛋白等。還有如哺乳類的:短散在元件(shortinterspersednuclear,SINE),長度在500bp以下,拷貝數可達10萬以上。如Alu序列。長散在元件(longinterspersednuclear,LINE),長度在1000bp以下,拷貝數1萬左右。類似于逆轉錄酶基因,L1。1、rRNA基因真核生物的rRNA有28s、18s、5.8s和5s4種,其中28s、18s和5.8s3種的編碼基因串聯排列,組成一個轉錄單位,在人類基因組中約有300個拷貝,分布在13、14、15、21和22號染色體上。5srRNA基因單獨為一個轉錄單位,在人類基因組中約有2000個拷貝,位于1號染色體。rRNA基因可以作為一種遺傳標志,在分子遺傳學中有重要的意義。2、tRNA基因:每一種tRNA基因的拷貝數有幾十到幾百個。同一種tRNA基因常常串聯在一起排列成基因簇,各個編碼tRNA基因之間也有間隔區有的tRNA基因編碼序列中插入有內含子3、Alu家族:每個長度約300bp,富含CG,因在其第170bp處有一個限制性內切酶AluI(AGCT)的位點而得名占人類基因組的3%~6%,Alu家族分散于整個基因組的間隔序列中,多位于一些編碼基因的5’端和3’端的遠端,個別的也有存在于內含子中。Alu序列具有種屬特異性,其功能可能與hnRNA的加工成熟,DNA復制及轉錄調節有關。單一序列
不同生物基因組中單一序列與重復序列的比例差異很大:原核生物絕大部分為單一序列(90%)。低等真核生物,大部分(80%)為單一序列。動物細胞中,中度重復序列與高度重復序列約占50%。大多數植物與兩棲類單一序列只占基因組DNA的很少比例(20%)。基因主要位于單一序列部分生物種屬基因組的序列組成不同生物基因組序列組成不同生物基因組的序列組成差別極大,原核生物基因組重復序列的含量很少。真核生物中大型基因組有很高比例的重復序列,植物中多倍體的重復序列比例高于兩倍體物種。1.3基因與基因家族基因(gene):用來表示決定可遺傳的某一表型的遺傳物質。
即由不同的DNA片段共同組成的一個完整的表達單元,有一個特定的表達產物,表達產物可以是RNA分子,亦可為多肽分子。組成基因的DNA成分包括:編碼初級轉錄物的全部序列;為正確啟動轉錄及進行轉錄物加工所必需的最低要求的DNA序列;調節轉錄速率所必需的DNA序列,如涉及轉錄的誘導與抑制的序列以及組織與發育專一性表達的序列。基因分為兩大類,即編碼RNA的基因與編碼蛋白質的基因。1.3.1編碼RNA基因細胞中絕大多數的RNA分子都與遺傳信息的傳遞有關,涉及前體RNA的加工與mRNA的翻譯;大多數編碼RNA的基因都是多拷貝;RNA基因大致可分為6個類群:即rRNA基因、tRNA基因、scRNA基因、snRNA基因、snoRNA基因、小分子干擾RNA基因。rRNA基因約占總量的80%
真核生物:18S,5.8S,28S和5SrRNA;原核生物16S,23S和5SrRNA。tRNA基因約占總量的15%
真核生物每種tRNA基因的拷貝數從數個至數百個不等。scRNA基因:編碼小分子細胞質RNA(small
cytoplasmicRNA,胞質內小RNA)。僅知3種類型:7SLRNA、7SKRNA、4.5SRNA7SLRNA是細胞質信號序列識別顆粒(signalsequencerecognitionpartcle,SRP)組裝的骨架SRP可與正在合成的多肽鏈信號肽序列結合,介導后者與內質網接觸真核生物蛋白質合成后的定向運輸SnRNA基因:
編碼小分子細胞核RNA(small
nuclerRNA,核內小RNA)。它們始終與蛋白質結合形成核蛋白復合物,即snRNP,參與mRNA前體的剪接加工。剪接復合體:snRNP+mRNA
真核生物mRNA的剪接機制---剪接分兩步:
5’位點剪斷與(分支點)形成套索狀中間體同步進行
3’位點剪斷和外顯子連接同步進行。內含子的切除snoRNA基因
編碼小分子核仁RNA(smallnuclearRNA,核仁小RNA)。作用場所主要位于核仁區其功能是修飾rRNA,如指定特定位置的堿基甲基化或將某些堿基轉變為假尿嘧啶。miRNA
:
miRNA(microRNA,微小RNA)是小分子干擾RNA的主要活性形式,系由原miRNA(pri-miRNA)加工產生。
長度22nt的成熟miRNA。
功能:促使靶mRNA的降解或阻止和干擾靶mRNA的翻譯。小分子干擾RNAsiRNA:產生于雙鏈RNA(主要來源于內源轉座子、反向重復DNA、病毒mRNA、轉基因表達產物)。
功能:主要涉及基因沉默、阻止翻譯和染色體重建piRNA(pivi-interactingRNA):動物中發現。
功能:抑制內源逆轉座子的表達,保持基因組的穩定性。1.3.2編碼蛋白質基因均由RNA聚合酶轉錄。斷裂基因(splitgene):外顯子(exon)和內含子(intron)初級轉錄物:
------mRNA前體5’帽的形成
------mRNA前體3’-端切除及加polyA尾
-----內含子被切除--------成熟的mRNA。1.3.3基因家族多基因家族(genefamily):是真核生物基因組的共同特征,它們來自一個共同的祖先,因基因加倍和趨異產生許多在DNA序列組成上基本一致而略有不同的成員。同一家族的基因成員在序列組成上相似,擔負類似的生物學功能。如人體血紅蛋白的α-和β-球蛋白亞基組成了2個基因亞家族,其中α球蛋白基因有3個成員,β-球蛋白基因有5個成員?;蚣易逯饕a生于祖先基因的重復及其突變。組蛋白基因家族超基因家族(supergenefamily):
系指起源于共同的祖先,由相似DNA序列組成的許多基因亞家族或相似的基因成員構成的群體,它們具有相似的功能。如免疫球蛋白基因家族:
IgG,IgM,IgA,IgE,IgD聯合基因(unionofgenomicsequence)基因組中一段連續的DNA序列,編碼一組關聯的彼此重疊的功能產物。1.3.4異常結構基因重疊基因(overlappinggene):
編碼序列彼此重疊的基因,含有不同蛋白質的編碼序列。
病毒基因組、某些高等生物線粒體基因組和核基因組中發現。主要類型:單個的mRNA可編碼2種或多種蛋白質,如大腸桿菌噬菌體ΦΧ174基因組長5386bp,共編碼11個基因。由不同的啟動子轉錄的彼此重疊的mRNA,各自編碼不同的蛋白質。如人類核基因組INK4a/ARF座位有2個蛋白質產物p19和p16。GenomeorganizationoftheSARS-CoV基因內基因(genes-within-genes)
:常常一個基因的內含子中包含其他基因。如人類基因組神經成纖維細胞瘤Ⅰ型基因的一個內含子中含有3個較短的基因,分別為OGMP,EV12A和EV128。反義基因(antisencegene)
:與已知基因編碼序列互補的負鏈編碼的基因。人類基因組中含有大約1600個反義基因。不對稱轉錄(asymmetrictranscription)
在DNA分子雙鏈上某一區段,一股鏈用作模板指導轉錄,另一股鏈不轉錄;模板鏈并非永遠在同一條單鏈上。5
3
3
5
模板鏈編碼鏈編碼鏈模板鏈結構基因轉錄方向轉錄方向1.3.5假基因假基因(pseudogene):
系指來源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可轉錄的假基因。如編碼序列出現終止密碼子突變,或者插入和缺失某些核苷酸使mRNA移碼,造成翻譯中途停止或異常延伸,合成無活性的蛋白質。第一類假基因:稱為重復的假基因。由重復產生的假基因其位置一般與起源的基因拷貝鄰近排列,保留著祖先基因的組成特點,有些細胞器(線粒體)基因組的基因轉移至核基因組。第二類假基因:稱為加工的假基因。這類假基因由RNA反轉錄為cDNA后再整合到基因組中。已不含原來基因的內含子以及兩側序列;分散在整個基因組中;大多數為5′殘缺。第三類假基因:為殘缺基因,它們缺失了或長或短的基因片段,常常位于基因家族內部,由不等交換及重排產生。第2章
遺傳圖繪制測序策略-----作圖法測序:
繪制高密度分子標記遺傳圖和大分子DNA克隆重疊群(contig)覆蓋的基因組物理圖根據分子標記所在的位置將遺傳圖和物理圖彼此銜接繪制基因組整合圖在此基礎上,將單個大分子DNA克隆逐個隨機測序,隨后進行序列組裝。這是一種由上而下(uptodown)的測序策略。鳥槍法測序:全基因組鳥槍法隨機測序,隨后將序列重疊的片段構建重疊群。以大分子DNA克隆為基準,將隨機測序搭建的重疊群歸并到所在的大分子克隆內。最后以分子標記為基點將歸并的鳥槍法DNA片段錨定到染色體上?!瑼TGCCGTAGGCCTAGCTAGGCCTAGCTCGGA……
………ATGCCGTAGGCCTAGCTCGGA……基因組DNABAC文庫根據物理圖譜正確定位的BAC或contig用于霰彈法測序的候選克隆用于霰彈法測序的亞克隆測序并組裝完整的基因組序列逐步克隆法(ClonebyClone)
全基因組霰彈法(WholeGenomeShot-gun)基因組DNA
霰彈法克隆測序并進行全基因組序列組裝完整的基因組序列遺傳作圖(geneticmapping)
采用遺傳學分析方法將基因或其他DNA分子標記標定在染色體上構建連鎖圖稱之為遺傳連鎖圖(geneticlinkagemap)或遺傳圖(geneticmap)。這一方法包括雜交實驗,家系分析。遺傳圖的圖距單位為厘摩(cM),每單位厘摩定義為1%交換率。遺傳圖的繪制是人類基因組研究的第一步,即以染色體上某一點為遺傳標記,以與之相伴遺傳的特征為對象,經連鎖分析,將編碼該特征的基因定位于染色體特定位置。cM值越大,兩者之間距離越遠。通過遺傳圖分析,可大致了解各個基因或DNA片段之間的相對距離與方向,了解哪個基因更靠近著絲粒,哪個更靠近端粒等。遺傳距離是通過遺傳連鎖分析獲得的,研究中所使用的DNA標志越多,越密集,所得到的遺傳連鎖圖的分辨率就越高。物理作圖(physicalmapping)
采用分子生物學技術直接將DNA分子標記、基因或克隆標定在基因組的實際位置所構建的位置圖稱之為物理圖。物理圖的距離依作圖方法而異,如輻射雜種(radiationhybrid)作圖的圖距單位為厘鐳(cR),限制性片段作圖與克隆作圖的圖距為DNA的分子長度,即堿基對。由于方法的局限遺傳圖和物理圖均會產生某些偏差,通過共同的作圖標記可以相互校正,由此獲得的基因組連鎖圖稱之為基因組圖(genomemapping)。2.2遺傳作圖標記2.2.1基因標記
在經典遺傳學中,研究一種性狀的遺傳必須要求同一性狀至少有2種不同的存在形式或稱表型。如孟德爾在研究豌豆性狀的遺傳規律時就選用了如植株高與矮這種相對性狀,每個相對性狀都由一個不同的等位基因(allele)控制。HLA-B位點至少有60個等位基因。2.2.2DNA標記DNA標記:
基因之外的作圖工具統稱為DNA標記。限制性片段長度多態性
(restrictionfragmentlengthpolymorphisms,RFLP)簡單序列長度多態性
(simplesequencelengthpolymorphisms,SSLPs)單核苷酸多態性
(singlenucleotidepolymorphisms.SNPs)A.限制性片段長度多態性
(restrictionfragmentlengthpolymorphisms,RFLP)
其基本設想是,由于同源染色體同一區段DNA序列的差異,當用限制酶處理時,可產生長度不同的限制性片段。這些DNA片段經瓊脂糖凝膠電泳分離,可直接顯示不同個體同一位點DNA組成的差異。提供大量位點多態性信息。RELP被稱為第一代分子標記。DNA標記特征:處于染色體上的位置相對固定;同一親本及其子代相同位點上的多態性片段特征不變;同一凝膠電泳可顯示不同多態性片段,具有共顯性特點。B.簡單序列長度多態性
(simplesequencelengthpolymorphisms,SSLPs)SSLP產生于重復序列的可變排列,同一位點重復序列的重復次數不同,表現出DNA序列的長度變化。與RELP不同的是,SSLP具多等位性(multiallelic),每個SSLP都有多個長度不一的變異體。分布具有多態性頻率高以及分布比較均勻的特點,SSLP標記又稱為第二代分子標記,有時稱為SSR。小衛星序列(minisatellite):可變串聯重復(variablenumberoftandemrepeats,VNTR),其重復單位為數十個核苷酸微衛星序列(microsatellite):簡單串聯重復(STR)重復單位為1~6個核苷酸,由10~50個重復單位串聯組成。平均每6kb有一個SSLP位點,人類基因組中,76%的重復序列為A、AC、AAAN、AAN或AG,豐度依次遞減。作圖中應用最廣的重復序列為AG。微衛星序列應用較普遍,原因有二小衛星序列在基因組中的分布很不均勻,大多集中在染色體的端部和著絲粒區,而微衛星則分布在整個基因組中,并且密度高;微衛星序列便于PCR分析,當PCR擴增的DNA長度少于300bp時,反應既快速又精確。C.單核苷酸多態性
(singlenucleotidepolymorphisms.SNPs)
基因組中單個核苷酸的突變,每個單核苷酸位置最多只有4種形式,A、T、C、G。某些群體在特定的單苷核酸位置只有2個或3個SNP,這些位點稱為雙等位(biallele)或三等位(triallele)。
人類基因組中位于基因內部的SNP至少超過200,000,基因外部的點突變是基因內部的10倍甚至更多,整個SNP數目約在1,000萬左右。ATGCACACACACACACACATGCACACACACACACACACACATypeofvariationamongpopulationSNPSTR對某一特定的SNP,同一家系的成員可能有相同的基因型。如SNP在基因組中的數量極大,人群中幾乎任何2個個體的基因組都有許多SNP。SNP分子標記具有分布密集的特點,在親緣關系非常接近的生態型或種內因遺傳漂變而隔離的群體,尤其在人類不同種族的多態性檢測中被廣泛采用。又稱為第三代分子標記第3章
物理圖繪制物理作圖:
以DNA分子的序列排列為基礎的非遺傳學的作圖技術統稱為物理作圖。物理作圖的方法和策略有多種多樣,常用的有:限制性作圖;基于克隆的基因組作圖;熒光原位雜交;序列標簽位點作圖。3.1限制性作圖3.2基于克隆的基因組作圖3.2.1大分子DNA的克隆載體細菌人工染色體(bacterialartificialchromosome,BAC):
BAC載體源于大腸桿菌中天然的F質粒。F質粒有較大的克隆容量,可達300kb以上可采取類似制備質粒的方法直接提取克隆的DNA。3.2.2重疊群組建重疊群(contig):相互重疊的DNA片段組成的物理圖稱為重疊群??寺≈丿B群的組建:最早采用的是染色體步移(chromosomewalking)法。首選從基因組文庫中挑取一個指定的或隨機的克隆,將該起始克隆的末端序列作為探針,在基因組文庫中尋找與之重疊的第二個克隆。再按同樣的操作程序尋找第三個重疊的克隆,依次延伸,直到完成所需要的重疊群。該方法速度緩慢僅適合于小基因組及小區段染色體的物理圖繪制。Contig3.2.3指紋作圖克隆指紋(clonefingerprinting)排序:指紋:系指克隆的DNA序列所具有的特定的DNA片段組成。這些DNA片段可以通過不同的方法產生,經凝膠電泳顯示后組成特定排列模式的DNA條帶,即指紋??寺≈讣y:每個克隆的DNA序列都具有特征性的指紋,這些指紋稱為克隆指紋。如果兩個DNA克隆含有部分相同的指紋,那么這兩個克隆就含有部分重疊的DNA序列,它們在基因組中應該相鄰排列。>20kb~300bpMolecularweightmarkerevery5thlane
BACclones培養提取BACDNAHindIII完全酶切
1%瓊脂糖凝膠電泳
指紋圖譜法
(WalkingbyFingerprintingdatabase)
挑取靠近空洞(gap)的種子克隆,酶切構建其指紋圖譜,在FPC數據庫中進行比對,搜索含有此克隆的重疊克隆群信息,從中確定覆蓋空洞區域的克隆,達到延伸目的。限制性帶型(restrictionpatterns)指紋:
用不同限制性酶處理樣品,經凝膠分離產生DNA條帶。如果2個克隆產生的DNA條帶有部分是相同的,說明它們含有重疊的序列。HindIII完全酶切HindIII完全酶切FPC數據庫中比對CloneACloneBCloneCCABSTS作圖(STScontentmaping)指紋:當需將某一克隆重疊群錨定到現有的已具有STS標記的物理圖上時,這一方法特別有效。因為STS是單一序列,并且序列已知。根據選定的某個STS序列設計專一性引物,可對大量的單個克隆進行PCR檢測,凡是能擴增出條帶的克隆均含有序列重疊的插入子。3.4輻射雜種作圖構建詳細的大基因組物理圖的主流技術為STS定位(STSmaping)的輻射雜種(radiationhybrid)作圖。主要原理是:基因組中單一序列
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 跨部門合作的經驗分享計劃
- 如何制定投資回報分析報告計劃
- 2025年阿德福韋酯合作協議書
- 2025-2030中國銅合金散熱器材料行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國運算跨導放大器行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國運動帽行業市場深度調研及競爭格局與投資研究報告
- 2025-2030中國車載GPS導航儀行業市場發展分析及競爭格局與投資前景研究報告
- 2025-2030中國超細六胺行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國超聲心動圖(ECG)設備行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國表盤指示外卡鉗行業市場發展趨勢與前景展望戰略研究報告
- 雷鋒叔叔你在哪里教學反思
- 軟件詳細設計說明書(例)
- 鋼拱橋專項吊裝方案終稿
- 24式太極拳教案(1~4課)
- 哈薩克斯坦鐵路車站代碼
- 產業經濟學的課后復習答案
- 中國綠色經濟發展之路(PPT-37張)課件
- 客房控制系統——RCU系統培訓PPT通用通用課件
- 履帶式液壓挖掘機挖掘機構設計
- 川崎病診治指南最新ppt課件
- (會議紀要(2011)第29期)河南煤業化工集團有限責任公司會議紀要
評論
0/150
提交評論