基因組學理論課 真核生物基因組_第1頁
基因組學理論課 真核生物基因組_第2頁
基因組學理論課 真核生物基因組_第3頁
基因組學理論課 真核生物基因組_第4頁
基因組學理論課 真核生物基因組_第5頁
已閱讀5頁,還剩75頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

真核生物基因組分析一真核生物基因結構1啟動子元件啟動子(Promoter)

在蛋白質編碼基因中,啟動子一般指基因5’端上游一段啟動基因轉錄的核酸序列,是RNA聚合酶和轉錄因子結合的部位。而在rRNA和tRNA基因中,同時也包含了基因轉錄起始位點下游的一段序列。RNAPolIIisthefocusofeukaryotictranscription,becauseitisthemoststudiedpolymerase,andisalsoresponsiblefortranscribingmostgenes-indeed,essentiallyallprotein-encodinggenesRNAPolItranscribethelargeribosomalRNAprecursorgeneRNAPolIIItranscribetRNAgene,somesmallnuclearRNAgenesandthe5SrRNAgenesRNAPolIIformsapre-initiationcomplexwithGTFsatthepromoterTheinvolvedGTFIIs(generaltranscriptionfactorforPol

II)TFIID=TBP(TATAboxbindingprotein)+TAFs(TBPassociationfactors)TFIIA,B,F,E,HThetranscriptionineukaryotes5TBPinTFIIDbindstotheTATAboxTFIIAandTFIIBarerecruitedwithTFIIBbindingtotheBRERNAPolII-TFIIFcomplexisthenrecruitedTFIIEandTFIIHthenbindupstreamofPolIItoformthepre-initiationcomplex

PromotermeltingusingenergyfromATPhydrolysisbyTFIIHPromoterescapesafterthephosphorylationoftheCTDtail.PromoterescaperequiresphosphorylationoftheRNApolymeraseII“tail”Stimulatedby

phosphorylationoftheCTD(C-terminaldomain)tailoftheRNAPolIICTDcontainstheheptapeptiderepeatTyr-Ser-Pro-Thr-Ser-Pro-SerPhosphorylationoftheCTD“tail”isconductedbyanumberofspecifickinasesincludingasubunitofTFIIHinvivo,transcriptioninitiationrequiresadditionalproteinsRNAPolI&IIIrecognizedistinctpromoters,usingdistinctsetsoftranscriptionfactors,butstillrequireTBP.PolI:transcribesrRNAprecursorencodinggene(multi-copygene)PolIII:transcribestRNAgenes,snRNAgenesand5SrRNAgenesRNAPolIpromoterrecognitionUpstreamcontrolelementUBFbindstotheupstreamofUCE,bringSL1tothedownstreampartofUCE.SL1inturnrecruitsRNAPolItothecorepromoterfortranscriptionTFIIICbindstothepromoter,recruitingTFIIIB,whichinturnrecruitsRNAPolIIIRNAPolIIIpromoterarefounddownstreamoftranscriptionstartsite.RNA聚合酶啟動子位置啟動子的復雜性所轉錄的基因RNA聚合酶Ⅰ-45至+20簡單核糖體RNA18s,28s,5.8srRNARNA聚合酶Ⅱ上游遠端至-25非常復雜蛋白質編碼基因RNA聚合酶Ⅲ+50至+100簡單tRNA,5sRNA其他snRNA3種真核生物RNA聚合酶2斷裂基因--內含子和外顯子內含子(intron)定義:任何存在于基因內部的核苷酸序列,在RNA拼接過程中被移除,并形成最終成熟的轉錄物。種類:已發現真核細胞中至少有8種明顯不同的內含子,其中,GU-AG規則(GU-AGrule)和AU-AC(AU-ACrule)的內含子與真核細胞蛋白編碼基因有關系。內含子和外顯子的長度: 已經發現的內含子至少長60nt,平均長度3,000nt,最長的可達800,000nt; 在脊椎動物中外顯子長度的變化范圍也很廣,于100-2000bp之間,常見的長約450bp。GU-AG規則:幾乎所有蛋白質編碼基因內含子序列5’端起始的兩個核苷酸總是5’-GU-3’,而3’端的最后兩個堿基總是5’-AG-3’。外顯子(exon)定義:由基因編碼的,在內含子被剪切后存在于成熟mRNA中的核苷酸序列。外顯子既包含了蛋白質的編碼區域,同時也有部分區域是非編碼的,如mRNA的5’-非翻譯區(5’-untranslatedregion,5’-UTR)和3’-UTR。對于一個轉錄本(transcript)而言,一些外顯子可以全部或僅部分占據5’-UTR和3’-UTR。例如,對于一個轉本而言,翻譯起始位點不一定在1號外顯子內,也可位于后面的外顯子內。真核基因的內含子/外顯子結構和對應的hnRNA轉錄物經過加工后的mRNA:(a)顯示了與酵母內含子的5′和3′剪接位點相關聯的保守序列。每個核苷酸旁的下標數字表示該核苷酸在所有已知酵母基因內含子中的出現頻率。(b)剪接體通過配對識別剪接位點,從而產生mRNA以供核糖體翻譯之用。不同生物基因組內含子數量不同:在簡單的真核基因組中內含子一般出現得較少(如酵母基因組6000多個基因中總共只有239個內含子

95%的人類基因至少有一個內含子,某些單個基因中就具有100個或更多內含子內含子在給定基因中的位置具有進化保守性,在同源基因的序列比對中內含子經常出現在相同的位置。EukaryoticGeneSeveralConceptsinRNASplicing5’splicesite(5’剪接位點):theexon-intronboundaryatthe5’endoftheintron3’splicesite(3’剪接位點):theexon-intronboundaryatthe3’endoftheintronBranchpointsite(分枝位點):anAclosetothe3’endoftheintron,whichisfollowedbyapolypyrimidinetract(Pytract).RNAsplicingiscarriedoutbyalargecomplexcalledspliceosomeThesplicingofintronsfrompre-mRNAaremediatedbythe

spliceosome(剪接體).Thespliceosomecomprisesabout150proteinsand5snRNAs.ThefiveRNAs(U1,U2,U4,U5,andU6,100-300nt)arecalledsmallnuclearRNAs(snRNAs).ThecomplexesofsnRNAandproteinsarecalled

smallnuclearribonuclear

proteins(snRNP).ManyfunctionsofthespliceosomearecarriedoutbyitsRNAcomponents.ThreerolesofsnRNPsinsplicing1.Recognizingthe5’splicesiteandthebranchsite.2.Bringingthosesitestogether.3.Catalyzing(orhelpingtocatalyze)theRNAcleavage.Note:RNA-RNA,RNA-proteinandprotein-proteininteractionsareallimportantduringsplicing.U1recognize5’splicesite.U2bindstothebranchsite,andthenAcomplexisformed.U4,U5andU6formthetri-snRNPParticle.Withtheentryofthetri-snRNP,theAcomplexisconvertedintotheBcomplex.AComplexB

ComplexU1leavesthecomplex,andU6replacesitatthe5’splicesite.U4isreleasedfromthecomplex,allowingU6tointeractwithU2.ThisarrangementcalledtheCcomplex.(Ccomplex,沒有該復合物的圖)BComplexCcomplexinwhichthecatalysishasnotoccurredyet1streaction2ndreactionFormationoftheCcomplexproducestheactivesite,withU2andU6RNAsbeingbroughttogetherFormationoftheactivesiteallowingthebranchedAresiduetoattackthe5’splicesitetoaccomplishthefirsttransesterficationreaction.U5snRNPhelpstobringthetwoexonstogether,andaidsthesecondtransesterificationreaction,inwhichthe3’-OHofthe5’exonattacksthe3’splicesite.ReleaseofthemRNAproductandthesnRNPsAcomplexBcomplexCcomplex(沒有該complex的圖)splicesome-mediatedsplicingreactionsAsmallgroupofintronaresplicedbyminorspliceosomeItisknownAT-ACspliceosome.TheterminioftheoriginallyidentifiedintronsthatissplicecontainAUat5’ss,andACatthe3’ss.Itsplicesintronsharboringdeterminantsequencesdistinctfromthoserecognizedbythemajorspliceosome.Thechemicalpathwayisthesameasthemajorspliceosome,butU11andU12areusedinplacesofU1andU2,respectively.除U5完全相同外,MajorSpliceosome中的U1、U2、U4、U6在MinorSpliceosome中的對應物分別為U11、U12、

U4atac和U6atac3基因的可變剪接(AlternativeSplicing,AS)真核mRNA原始轉錄體(primarytranscripts):轉錄發生在細胞核內并生產原始錄體(hnRNA,pre-mRNA)復雜原始轉錄體--在不同的時(不同發育階段)空(不同組織細胞),同一原始轉錄體因轉錄起點、剪接方式或終止點的不同,可產生兩種或多種成熟mRNA和多肽鏈。例如果蠅肌球蛋白重鏈轉錄體,在不同發育階段有三種不同表達產物。人的降鈣素基因相關肽(calcitoningenerelatedpeptide)原始轉錄體,在甲狀腺、腦等不同組織細胞內,因剪接方式不同使其表達產物不同。

大部分真核基因被加工成一種類型的mRNA(maturemRNA),約有60%的人類基因可剪接產生兩種或多種mRNA序列,即存在可變剪接現象。有一個人類基因已被證明,相同的原始轉錄物可以產生64種不同的mRNA(isoforms)。外顯子的相互排斥:小鼠肌鈣蛋白T基因的外顯子3和4是相互排斥的,外顯子3用在平滑肌中,而外顯子4用于其他所有組織中DifferentwaysofalternativesplicingAlternativesplicingisregulatedbyactivatorsandrepressorsTheregulatingsequences:

exonic(orintronic)splicingenhancers(ESEorISE)or

silencers(ESSandISS).Activatorsareproteinsbindtoenhancerstoenhancesplicing.Repressorsareproteinsbindtosilencerstorepresssplicing.RepressorRepressorstopssplicingthatwouldotherwiseoccurActivatorActivatorinitiatessplicingthatotherwisewouldn’toccurAlternativeSplicingBasicMechanism4轉錄后加工--加帽、剪接和加尾:RNA聚合酶Ⅱ轉錄物在加工前稱為hnRNA(異質RNA),通過加帽(capping)、剪接和多聚腺苷酸化轉化成適合核糖體翻譯的mRNA。加帽(capping)--是指所有發生在hnRNA5′末端的化學改變(包括甲基化作用)。多聚腺酸化(polyadenylation)--指用一段大約由250個腺嘌呤(A)組成的序列替換hnRNA3′端的過程,這段序列不被翻譯。基因組上的非編碼RNA

(non-codingRNA,ncRNA)含有30億對堿基的人類基因組僅含有2-3萬個蛋白質基因,是果蠅的兩倍,啤酒酵母的4倍。顯而易見,生物的復雜性不由編碼蛋白質的數目決定。人類基因組的蛋白質編碼區的總和占總基因組長度為1-2%,那么其他98%的基因組有什么功能呢?(1)24%的基因組是插入編碼序列的內含子序列;人類基因平均每個基因有7個內含子。但這么冗長的內含子序列有什么生物學功能呢?(2)其他74%的基因組的功能是什么?【注:90%以上的基因組都是轉錄的!】ncRNA非編碼RNA(non-codingRNA,ncRNA)是指各種不翻譯成蛋白質的RNA分子。過去也稱此類RNA為小RNA(smallRNA)。但有些ncRNA分子其實相當大,例如長非編碼RNA(longnon-codingRNA)。DNA序列中專門轉錄成非編碼RNA的部分稱為RNA基因或是非編碼RNA基因。非編碼RNA基因包括tRNA、rRNA以及一些小RNA,如snoRNAs、snRNAs、microRNAs、siRNAs與piRNAs(piwi-interactingRNA)等。MostoftheRNAtranscribedfromyourgenomedoesn’tmakeprotein.CarinaDennistalkstotherevolutionarieswhobelievethatitfunctionsingene-regulatorynetworksthatunderliethecomplexityofhigherorganisms.36人類基因組絕大部分都被轉錄成RNA,細胞內非編碼RNA的數量是編碼RNA的上百倍。這促使許多科學家認為生物體復雜性被隱藏在它們所輸出的非編碼RNA內,而非編碼序列內。

MicroRNAs微RNA(microRNAs,miRNA)是真核生物中廣泛存在的一種長約21到23個核苷酸的單鏈RNA分子,可調節其他基因的表達。miRNA由RNAPolII

從基因組DNA轉錄而來,但無法進一步轉譯成蛋白質。miRNA通過與靶信使核糖核酸(mRNA)特異結合,從而抑制轉錄后基因表達,在調控基因表達、細胞周期、生物體發育時序等方面起重要作用。在動物中,一個miRNA通常可以調控數十個基因的表達。ThediscoveryofmiRNAs

miRNAwasfirstdiscoveredin1993byVictorAmbrosatHarvard(lin-4)ThesecondmiRNA

Let-7wasdiscoveredin2000byFrankSlackasapostdocatHarvard

(Ruvkunlab)VictorAmbrosGaryRuvkunThefirstdiscoveredmiRNA

lin-4in1993RuvkunG,WightmanB,HaI.The20yearsittooktorecognizetheimportanceoftinyRNAs.Cell.2004Jan23;116(2Suppl):S93-6.LeeR,FeinbaumR,AmbrosV.AshorthistoryofashortRNA.Cell.2004Jan23;116(2Suppl):S89-92ThoughttobeanodditynotageneralphenomenonBreakthroughwithBlastNofthesecondmiRNA(stRNA)let-7PasquinelliAE,ReinhartBJ,SlackF,MartindaleMQ,KurodaMI,MallerB,HaywardDC,BallEE,DegnanB,MullerP,SpringJ,SrinivasanA,FishmanM,FinnertyJ,CorboJ,LevineM,LeahyP,DavidsonE,RuvkunG.Conservationofthesequenceandtemporalexpressionoflet-7heterochronicregulatoryRNA.Nature.2000Nov2;408(6808):86-9.ThenumberoftheidentifiedmiRNAsisgrowingrapidlyinrecentyears.Over24,521

miRNAshavebeenfounduntiltheJuneof2013(ThemiRBaseSequenceDatabase).ThesemiRNAsarefromprimates,rodents,birds,fish,worms,flies,plantsandviruses.Thedataarefreelyavailabletoallthroughthewebinterfaceathttp://microrna.sanger.ac.uk/sequences/andinflatfileformfromftp://ftp.sanger.ac.uk/pub/mirbase/sequences/.MicroRNA(miRNA):

Atypeofnon-codingsmallRNA(~21–23nucleotides)producedbyDicerfromastem-loopstructuredRNAprecursor(~70-90nts

ong)(結構和來源).miRNAsarewidelyexpressedinanimalandplantcellsandfunctionsintheformofRNA–proteincomplexes,termedmiRISCs.miRNAshavebeenimplicatedinthecontrolofdevelopmentbecausetheyleadtothedestructionortranslationalsuppressionoftargetmRNAswithhomologytothemiRNA(生物學功能和機制).ThemiRNAgenesandStructureofpri-miRNAs(PrimarymiRNAs)Pri-miRNAsbearthe5’capand3’poly(A)tails44miRNAprocessingPri-miRNA(miRNA初級轉錄產物)Drosha(1)pre-miRNA(miRNA前體)Dicer(2)miRNAExportin5(Exp5)transportspre-miRNAtothecytoplasmAtypicalmetazoanpri-miRNAconsistsofastemofapproximately33bp,withaterminalloopandflankingsegments.Theterminalloopisunessential,whereastheflankingssRNAsegmentsarecriticalforprocessing.Thecleavagesiteisdeterminedmainlybythedistance(approximately11bp)fromthestem-ssRNAjunction.HumanDroshaandDicersharethesameRNaseIIIdomainsanddsRNAbindingdomain.RISC

(RNAinducedsilencingcomplexes)RISC:thekeycomponentisArgonaute(AGO)Argonaute(AGO):AlargeproteinfamilythatconstituteskeycomponentsofRISCs.AGOproteinsarecharacterizedbytwouniquedomains,PAZandPIWI,whosefunctionsarenotfullyunderstood.CurrentevidencesuggeststhatthePAZdomainbindsthesiRNAormiRNA,whereasthePIWI

domainofsomeAGOproteinsconferssliceractivity.PAZandPIWIdomainsarebothessentialtoguidetheinteractionbetweenthesiRNAandthetargetmRNAforcleavageortranslationalrepression.DistinctAGOmembershavedistinctfunctions.Forexample,humanAGO2programsRISCstocleavethemRNAtarget,whereasAGO1andAGO3donot.Eulalioetal.Ce1l132,2008MechanismsofmiRNA-MediatedTranslationalInhibition(A)Inhibitionoftranslationelongation:miRNAsrepresstranslationoftargetmRNAsbyblockingtranslationelongationorbypromotingprematuredissociationofribosomes(ribosomedrop-off)(B)Co-translationalproteindegradation:Theproteinisnormallytranslatedafterwhichitisimmediatelydegradedproteolytically.(C)Competitionforthecapstructure:ArgonauteproteinscompetewitheIF4Eforbindingtothecapstructure.(D)Inhibitionofribosomalsubunitjoining:ArgonauteproteinsrecruiteIF6,whichpreventsthelargeribosomalsubunitfromjoiningthesmallsubunit.二重復序列重復序列是指在基因組中具有多個拷貝的相同或近似序列的DNA片段。重復序列一般可以分為兩類:高度重復序列和中度重復序列串聯重復DNA和分散在整個基因組中的重復片段1高度重復序列:衛星DNA、小/微衛星

重復頻度>105。在真核生物基因組中,約有45%~60%的DNA中G:C堿基對含量較高,相對浮力密度大,將DNA打碎后,進行密度梯度離心分離,可見一主峰和1~2個小峰,這種小峰被看成是主峰的衛星,稱為衛星DNA,它是多種短重復序列的混合物。根據衛星DNA的長度,又可分成3種。衛星DNA(satelliteDNA):

其重復序列長度在5bp~200bp,串聯排列,通常存在著幾百萬個拷貝,累積總長度最長可達100Mb

它們主要存在于異染色質以及中心粒和端粒附近,通常不轉錄。

小衛星DNA(mini-satelliteDNA):重復序列長度在15~70bp之間,串聯排列,總長度在0.5kb~30kb

主要分布于常染色體,在人群中有高度的多態性,即拷貝數在人際之間存在較大差異。微衛星DNA(micro-satelliteDNA)

由2~6個核苷酸長的重復序列組成,又稱為簡單串聯重復序列(simpletandemrepeatsSTRs)以(CA)n、(CAG)n較常見,重復次數多為15~60次,總長度一般在400bp以下。存在于常染色體,除著絲粒及端粒區域外,微衛星DNA在染色體的其他區域均廣泛均勻分布。很隨機地分布在整個基因組中,而不像衛星或小衛星那樣串聯成簇存在微衛星DNA在基因組中的功能尚不清楚,已知其有自身特異結合蛋白,是一種非常活躍的堿基序列,且能直接編碼蛋白質;在人類基因組中,由CA重復序列構成的微衛星如5′-CACACACACACA-3′大約每1萬bp出現一次,占整個基因組的0.5%(總共15Mb),而單堿基重復(即5′-AAAAAAAA-3′)占人類基因組的0.3%山羊皮膚轉錄組中的微衛星DNARepeatsMotif345678910111213TotalAC/GT------2102408011532CCG/CGG--GC/CTG---11910951234AGG/CCT---925371153AACTG/AGTTC-56157ACC/GGT---26215153AG/CT------1912143149AT/AT------21149347AAAAC/GTTTT-33235ACCCCC/GGGGGT33

33微衛星的產生機理

大多認為是DNA復制和修復過程中的復制滑移(replicationslippage),滑鏈錯配(slipped-strandmispairing)或染色體減數分裂時姊妹染色單體不均等交換的結果。微衛星DNA的核心序列是高度保守的,而微衛星DNA本身重復單位的變異則是形成多態性的基礎,其高度多態性主要表現在核苷酸重復單位數目的多態性(拷貝數多態性)。 重復單位數目的多態性是由于STR在精子和卵子產生時,以及在生殖細胞減數分裂過程中發生不相等的交叉重組造成的。由于這種不相等的交叉重組,使STR的長度在每一個個體中有差別,這也是進行DNA指紋分析的基礎。中度重復序列由較大的片段(由100bp到幾千bp)串聯重復組成,分散在整個基因組中,重復頻度不等一般具有種屬特異性,可作為DNA標記有多種類型的中度重復序列,其表達產物常是細胞大量需要的,如rRNA、tRNA和組蛋白等。1、rRNA基因真核生物的rRNA有28s、18s、5.8s和5s4種,其中28s、18s和5.8s3種的編碼基因串聯排列,組成一個轉錄單位,在人類基因組中約有300個拷貝,分布在13、14、15、21和22號染色體上。在每個轉錄單位的各種rRNA編碼基因間都有一個基因間隔區,在28srRNA基因中還存在插入序列,在轉錄時一并轉錄,形成rRNA前體,經轉錄后加工,切除間隔區,插入序列等加工成3種成熟的rRNA。5srRNA基因單獨為一個轉錄單位,在人類基因組中約有2000個拷貝,位于1號染色體。rRNA基因可以作為一種遺傳標志,在分子遺傳學中有重要的意義。2、tRNA基因:每一種tRNA基因的拷貝數有幾十到幾百個。同一種tRNA基因常常串聯在一起排列成基因簇,各個編碼tRNA基因之間也有間隔區有的tRNA基因編碼序列中插入有內含子(在酵母中大約有10%的tRNA),一般定位于反義密碼環的3’端3、Alu家族:每個長度約300bp,富含CG,因在其第170bp處有一個限制性內切酶AluI(AGCT)的位點而得名占人類基因組的3%~6%,Alu家族分散于整個基因組的基因間隔序列中,多位于一些編碼基因的5’端和3’端的遠端,個別的也有存在于內含子中。Alu序列具有種屬特異性,其功能尚不完全清楚,可能與hnRNA的加工成熟,DNA復制及轉錄調節有關。三、基因家族(genefamily)是一組功能相似且核苷酸序列具有一定同源性的基因,他們產生的機制可能由某一共同祖先基因經重復和突變產生,這一組基因就稱為基因家族,被其編碼的同源蛋白稱為蛋白質家族,具有相似的功能。在真核細胞編碼蛋白質的基因中,約有25%~50%是以單個基因存在于基因組中。而剩余的基因都有2個或2個以上序列相似而又不全相同的基因。基因家族有大有小,從幾個到幾十個,少數情況可有幾百個,稱為超級家族。珠蛋白和組蛋白基因家族是研究得最多的例子。組蛋白基因家族四移動基因

移動基因包含兩類:一類為插入序列(insertionsequence,IS),另一類為轉座子(transposon,Tn)轉座:由轉座酶介導對應的插入序列或轉座子以保守(重復拷貝的數目沒有變化)或復制(拷貝數增加)的方式從基因組的一個部位插入到另一個部位的過程。插入序列(insertionsequence,IS):末端反向重復(回文序列)+中間的編碼轉座酶(transposase)基因轉座子(包括復合型轉座子和Tn3系轉座子)

復合型轉座子:指兩個IS元件“包夾”著其他基因(如抗生素耐藥基因)形成的轉座子ReplicativeTransposition;Tn3Elementencodesatransposasefortransposition,arepressorthatregulatesthetransposaseandanantibioticresistancegeneAgain,theendsoftheelementarecriticalformovement五人類基因組人類基因組概貌:人類基因組結構大編碼蛋白質的結構基因比例極少作為真核生物,人類基因組也具有真核生物基因組的一般結構特點--假基因

CpG島甲基化等。2假基因凡DNA序列與結構基因類似但不能翻譯為功能型蛋白質的基因稱為假基因(pseudogene)根據是否保留相應功能基因的間隔序列(如內含子),分兩大類:

保留了間隔序列,稱為復制型假基因(duplicatedpseudogene),與對應的功能基因十分相似,僅發生了某些位點的突變、插入和缺失和移碼突變。同時這類假基因啟動子區域也發現有堿基突變發生,導致喪失正常功能。它與其相對應的功能基因通常在同一條染色體上,也稱非加工假基因(non-processedpseudogene)。

缺少間隔序列,稱為已加工假基因(processedpseudogene),由于一些反轉錄病毒的感染,在真核生物細胞中產生了反轉錄酶。當某些mRNA表達時,被反轉錄酶反轉錄為cDNA并重新整合進入基因組中(很可能發生在生殖細胞中),并在長期進化選擇過程中因為隨機突變積累而喪失功能。3DNA甲基化是哺乳動物基因組復制后最常見的調節方式之一,由甲基轉移酶介導,將基因啟動子區域的胞嘧啶(C)轉變為5-甲基胞嘧啶(5-mC)。DNA甲基化與基因表達呈負相關,即基因在它不表達的組織中被甲基化,而在特異表達的組織中非甲基化。甲基化一方面可在發育和分化中調控基因表達,另一方面還可中和潛在的危險的DNA序列,如外源病毒和轉座子等。DNA甲基化調控基因表達直接的機制:可能是因為甲基基團從DNA分子的大溝中突出,阻礙了轉錄因子與基因相互作用從而抑制基因的表達DNA甲基化是腫瘤中最常見的一種分子改變,包括基因組總體甲基化水平降低和某些基因啟動區域的高甲基化(hypermethylation)。基因組總體甲基化水平降低導致染色體的不穩定發生于細胞周期調控基因、DNA修復基因、血管形成基因及細胞凋亡基因相應的CpG

島的甲基化,則引起轉錄沉默(silencing),進而促進了腫瘤細胞形成。4CpG島CG兩聯核苷酸的出現頻率低:

CG兩聯核苷酸的出現頻率僅為其隨機出現頻率的20%許多人類基因5’端的1-2kb片段中發現CpG島:

這些CpG島一般跨越基因的-1500~+500,并且其CpG密度達到隨機預測的水平。CpG島常出現的位置:

CpG與已知轉錄增強子如Sp1等的結合位點有關人類基因組大約有45000個CpG島,有一半左右與已知的管家基因關聯,其余的CpG島有許多和組織特異性基因的啟動子相關聯

CpG島很少出現在不含基因的區域或那些發生多次突變的基因中

兔α-類球蛋白基因族:人類基因組富含GC的一組組織特異性基因。對應基因的區域用黑色框來表示,而兔基因組中主要短散布元件的拷貝(C重復)用數字標注并表示為黑色箭頭。下一幅圖顯示200bp滑動窗口中出現核苷酸G或C的頻率。底部兩附圖表示200bp滑動窗口中兩聯核苷酸CpG和GpC和出現次數。在α-θ1球蛋白基因的5′端都出現了CpG

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論