




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
分子生態(tài)學(xué)第五章分子進(jìn)化和系統(tǒng)發(fā)生
OrangutanGorillaChimpanzeeHuman分子生態(tài)學(xué)OrangutanGorillaChimpanze1分子進(jìn)化(molecularevolution):生物在分子水平上的進(jìn)化,即核酸和蛋白質(zhì)等生物大分子在生物傳代過(guò)程中的演變。特點(diǎn)進(jìn)化速率的相對(duì)恒定性進(jìn)化速率的不均衡性(或保守性)分子進(jìn)化的概念分子進(jìn)化(molecularevolution):生物在分2生物大分子在相當(dāng)長(zhǎng)的時(shí)間內(nèi)速率進(jìn)化保持穩(wěn)定以相同的同源生物大分子在不同生物中進(jìn)化速率大致相同進(jìn)化速率的相對(duì)恒定性生物大分子在相當(dāng)長(zhǎng)的時(shí)間內(nèi)速率進(jìn)化保持穩(wěn)定進(jìn)化速率的相對(duì)恒定3分子進(jìn)化速率:蛋白質(zhì)或核酸等大分子中的氨基酸或核苷酸在單位時(shí)間內(nèi)的替換率,以年為單位,可表示為:
K=d/2tNK:分子進(jìn)化速率d:生物大分子發(fā)生氨基酸或核苷酸替換的數(shù)目N:生物大分子總的氨基酸或核苷酸的數(shù)目t:進(jìn)化分歧時(shí)間分子進(jìn)化速率:蛋白質(zhì)或核酸等大分子中的氨基酸或核苷酸在單位時(shí)4X:ACTGATCGAA-TTCAGATTTCAGGA25Y:ACAGATCGCAGTGC-GCTTGCAGGA25已知兩條序列的分歧時(shí)間t=20Mad=7N=25(比對(duì)后的序列長(zhǎng)度)K=d/2tN=7/(2×20×106×25)=7×10-9X:ACTGATCGAA-TTCAGATTTCAGGA5進(jìn)化速率恒定性的實(shí)例血紅蛋白α鏈:
7種動(dòng)物以及人兩兩之間的血紅蛋白α鏈氨基酸差異數(shù)與物種分歧時(shí)間呈線性相關(guān)關(guān)系,即進(jìn)化速率大致相同。進(jìn)化速率恒定性的實(shí)例血紅蛋白α鏈:
7種動(dòng)物以及人兩兩之間的6進(jìn)化速率的相對(duì)恒定性指的是以年為單位的進(jìn)化速率即每年每個(gè)位點(diǎn)的替換數(shù),而不是以生物的世代為單位的進(jìn)化速率即每代每個(gè)位點(diǎn)的替換數(shù)以世代為單位世代時(shí)間長(zhǎng)的生物進(jìn)化速率慢世代時(shí)間短的生物進(jìn)化速率快進(jìn)化速率的相對(duì)恒定性指的是以年為單位的進(jìn)化速率即每年每個(gè)位點(diǎn)7進(jìn)化速率恒定性說(shuō)明生物大分子的進(jìn)化不可能是由自然選擇引起的,如果是由自然選擇引起的,替換率應(yīng)該隨著選擇系數(shù)的改變而改變適合度和選擇系數(shù)Darwinianfitness(W):某個(gè)基因型的繁殖能力=后代數(shù)量/具有該基因型的親本數(shù)量Selectivecoefficient(S):該基因型受到的選擇壓力=1-w進(jìn)化速率恒定性說(shuō)明生物大分子的進(jìn)化不可能是由自然選擇引起的,8選擇作用GenotypeG1G1G1G2G2G2161020#ofbreedingadults1284040#ofoffspringOffspring/adultratio128/16=840/10=440/20=2FitnessW(relativetothebest)8/8=14/8=0.52/8=0.251-1=01-0.5=0.51-0.25=0.75SelectioncoefficientS=1-W選擇作用GenotypeG1G1G1G29UnpollutedtreePollutedtreeUnpollutedtreePollutedtree10進(jìn)化速率的不均衡性
功能不同的生物大分子具有不同的進(jìn)化速率功能上重要的大分子或大分子的局部比較保守,在進(jìn)化速率上明顯低于那些功能上不重要的大分子或大分子局部進(jìn)化速率的不均衡性
功能不同的生物大分子具有不同的進(jìn)化速率11蛋白水平上進(jìn)化速率不均衡性的體現(xiàn)不同蛋白一般進(jìn)化速率不等蛋白水平上進(jìn)化速率不均衡性的體現(xiàn)不同蛋白一般進(jìn)化速率不等12同一蛋白不同區(qū)域進(jìn)化速度不等同一蛋白不同區(qū)域進(jìn)化速度不等13核酸水平上進(jìn)化速率不均衡性的體現(xiàn)非編碼區(qū)進(jìn)化速率高于編碼區(qū)密碼子中的同義替換比變義替換發(fā)生的頻率高;內(nèi)含子內(nèi)的堿基替換速率明顯高于外顯子;外顯子內(nèi)部功能不重要的部分進(jìn)化速率一般快于功能不重要的部分;假基因進(jìn)化速率也較快。核酸水平上進(jìn)化速率不均衡性的體現(xiàn)非編碼區(qū)進(jìn)化速率高于編碼區(qū)14第五章分子進(jìn)化和系統(tǒng)發(fā)生ppt課件15進(jìn)化速率的不均衡性說(shuō)明功能上重要的生物大分子的進(jìn)化并非是完全隨機(jī)的,而是存在著某種的制約因素或控制機(jī)制(選擇壓)進(jìn)化速率的不均衡性說(shuō)明功能上重要的生物大分子的進(jìn)化并非是完全16中性突變理論的提出1968年,日本遺傳學(xué)家木村資生(MotooKimura)在《Nature》雜志發(fā)表了“論分子水平上的進(jìn)化速率”的評(píng)述,根據(jù)不少核苷酸和氨基酸的替換并不影響生物大分子的生物學(xué)功能的事實(shí),提出了生物進(jìn)化在分子水平上的“中性理論”;次年,美國(guó)學(xué)者金和朱克斯(J.K.King&T.H.Jukes)在《Science》雜志上刊出“非達(dá)爾文主義的進(jìn)化”一文,呼應(yīng)木村資生的觀點(diǎn)。中性突變理論的提出1968年,日本遺傳學(xué)家木村資生(Moto17中性突變理論的主要內(nèi)容在分子水平上,多數(shù)(不是全部)突變是選擇中性或非常接近選擇中性的,不影響個(gè)體的適合度中性突變?cè)谏锶后w中通過(guò)一代又一代的遺傳漂變被隨機(jī)消除或固定保留,從而形成進(jìn)化性的結(jié)果,因而進(jìn)化的動(dòng)力是遺傳漂變中性突變理論的主要內(nèi)容在分子水平上,多數(shù)(不是全部)突變是選18中性突變理論的主要論據(jù)分子層次上的大多數(shù)變異是選擇中性的在生物基因組中,非編碼的DNA占絕大部分同義突變不改變蛋白功能的異義突變不影響適合度的異義突變自然界中廣泛存在“過(guò)量”的遺傳多態(tài)性多態(tài)性是突變和遺傳漂變平衡的結(jié)果不是適應(yīng)性進(jìn)化的結(jié)果中性突變理論的主要論據(jù)分子層次上的大多數(shù)變異是選擇中性的19按群體遺傳學(xué)的數(shù)學(xué)模式計(jì)算出來(lái)的自然選擇代價(jià)過(guò)高,不符合實(shí)際情況。根據(jù)自然選擇學(xué)說(shuō),不利突變占很大比例,使群體的適合度總量下降,造成種群數(shù)量不斷減少。分子進(jìn)化速率恒定,即進(jìn)化速率與種群大小、世代壽命和物種的生殖力均無(wú)關(guān),也不受環(huán)境因素所影響。中性學(xué)說(shuō)對(duì)此能作出既簡(jiǎn)明又合理的解釋。按群體遺傳學(xué)的數(shù)學(xué)模式計(jì)算出來(lái)的自然選擇代價(jià)過(guò)高,不符合實(shí)際20假設(shè)種群數(shù)量為N的一個(gè)二倍體群體中,每個(gè)配子每代的突變率為υ,則每代將產(chǎn)生2Nυ個(gè)新突變。假設(shè)一個(gè)突變最終被固定的概率為μ,則每代每位點(diǎn)的突變替換數(shù)(進(jìn)化速率)為:K=2Nυμ由于群體中有2N個(gè)配子,在隨機(jī)交配的情況下,每個(gè)配子中的突變被遺傳的機(jī)會(huì)都相同,即μ=1/2N于是2Nυ個(gè)突變中僅有υ個(gè)被保留,即:K=υ可見,在中性突變情況下,進(jìn)化速率是一個(gè)恒定值且等于其突變率。假設(shè)種群數(shù)量為N的一個(gè)二倍體群體中,每個(gè)配子每代的突變率為υ21功能越重要的大分子保守性越強(qiáng)功能重要的大分子中的突變大多數(shù)是有害的,少量是中性的,有害突變?cè)谶M(jìn)化過(guò)程中被快速清除(負(fù)選擇Negative或PurifyingSelection),導(dǎo)致其進(jìn)化速率減慢功能重要的大分子中極少數(shù)突變是有益的,有益突變?cè)黾觽€(gè)體適合度,在進(jìn)化過(guò)程中會(huì)被快速固定(正選擇PositiveSelection),導(dǎo)致進(jìn)化速率加快功能越重要的大分子保守性越強(qiáng)22蛋白編碼序列選擇壓力評(píng)估Ka/KsKa:non-synonymousmutationKs:synonymousmutationKa/Ks
<1negativeselectionKa/Ks
=1neutralselectionKa/Ks
>1positiveselection蛋白編碼序列選擇壓力評(píng)估Ka/Ks23自然選擇理論個(gè)體和種群表現(xiàn)型、種群進(jìn)化的規(guī)律——自然選擇相互補(bǔ)充中性理論生物大分子分子水平的進(jìn)化規(guī)律——遺傳漂變自然選擇理論相互補(bǔ)充中性理論24系統(tǒng)發(fā)生樹(phylogenetictree):描述任何生物實(shí)體之間系統(tǒng)發(fā)生關(guān)系假說(shuō)的樹狀圖,也可以叫做進(jìn)化樹(evolutionarytree)。
系統(tǒng)發(fā)生和系統(tǒng)發(fā)生樹系統(tǒng)發(fā)生(或系統(tǒng)演化、系統(tǒng)發(fā)育phylogeny):是指任何生物實(shí)體(基因、個(gè)體、種群、物種或種上高級(jí)階元)的起源和演化(進(jìn)化)關(guān)系。系統(tǒng)發(fā)生樹(phylogenetictree):描述任何生25系統(tǒng)發(fā)生樹的要素拓?fù)浣Y(jié)構(gòu)(Topology):即樹的分枝型式ABCDE外部節(jié)點(diǎn):稱為操作分類單元,可以是基因、個(gè)體、種群、物種或種上高級(jí)階元內(nèi)部節(jié)點(diǎn):代表進(jìn)化事件發(fā)生的位置,或分類單元進(jìn)化歷程中的祖先分支和支長(zhǎng)1009510075節(jié)點(diǎn)支持度系統(tǒng)發(fā)生樹的要素拓?fù)浣Y(jié)構(gòu)(Topology):即樹的分枝型式26一種拓?fù)浣Y(jié)構(gòu)可以有多種表現(xiàn)型式====一種拓?fù)浣Y(jié)構(gòu)可以有多種表現(xiàn)型式====27BifurcationTrifurcation=/一個(gè)節(jié)點(diǎn)與大于3個(gè)以上的分枝相連接稱為多歧分枝(polytomy):表示該分支的系統(tǒng)發(fā)生關(guān)系未完全解析。BifurcationTrifurcation=/一個(gè)28系統(tǒng)發(fā)生樹的類型無(wú)根樹(unrootedtree):只反映分類單元之間的距離,而不涉及誰(shuí)是誰(shuí)的祖先問(wèn)題。ABCDRootRootedtree有根樹(rootedtree):反應(yīng)了樹上物種或者基因進(jìn)化的時(shí)間順序,通過(guò)分析有根樹的長(zhǎng)度,可以了解不同的物種或者基因以什么方式和速率進(jìn)化。系統(tǒng)發(fā)生樹的類型無(wú)根樹(unrootedtree):只反映29OUT(4)OUT數(shù)目與可能的有根數(shù)和無(wú)根樹數(shù)目之間的關(guān)系UnrootedTree(3)RootedTree(15)ACBDADCBOUT(4)OUT數(shù)目與可能的有根數(shù)和無(wú)根樹數(shù)目之間的關(guān)系30Taxa(n)rooted(2n-3)!/(2n-2(n-2)!)unrooted(2n-5)!/(2n-3(n-3)!)21133141535105156954105710,3959548135,13510,39592,027,025135,1351034,459,4252,027,025OUT數(shù)目與可能的有根數(shù)和無(wú)根樹數(shù)目之間的關(guān)系Taxa(n)rootedunrooted2113314131系統(tǒng)發(fā)生分析一般要求構(gòu)建一顆有根樹,但是構(gòu)建系統(tǒng)發(fā)生樹的計(jì)算機(jī)軟件通常產(chǎn)生的是無(wú)根樹,因此需要對(duì)其進(jìn)行準(zhǔn)確的賦根以轉(zhuǎn)換為有根樹。最常用的方法是利用外群(outgroup)來(lái)確定樹根。外群選擇:與內(nèi)群具有較近的系統(tǒng)發(fā)生關(guān)系,但是要比內(nèi)群分類單元相互之間的系統(tǒng)發(fā)生關(guān)系遠(yuǎn)。系統(tǒng)發(fā)生分析一般要求構(gòu)建一顆有根樹,但是構(gòu)建系統(tǒng)發(fā)生樹的計(jì)算32系統(tǒng)發(fā)生樹的類型未標(biāo)度樹(unscaledtree):各分枝的長(zhǎng)度不表示遺傳變異的量,但在有根樹中,節(jié)點(diǎn)的位置仍可以與相對(duì)分歧時(shí)間相對(duì)應(yīng)。標(biāo)度樹(scaledtree):各分枝的長(zhǎng)度代表遺傳變異的量。NJ:遺傳距離MP、ML和BI:堿基替換數(shù)系統(tǒng)發(fā)生樹的類型未標(biāo)度樹(unscaledtree):各分33構(gòu)建系統(tǒng)發(fā)生樹的理論基礎(chǔ)生物進(jìn)化論——生物共祖
地球上的一切生命形式,不管是現(xiàn)存的還是滅絕了的,都有一個(gè)可以追溯到30億年以前生存的共同祖先。親緣關(guān)系越近的物種相似程度越高。構(gòu)建系統(tǒng)發(fā)生樹的理論基礎(chǔ)生物進(jìn)化論——生物共祖34每個(gè)生物個(gè)體都有自己的直接祖先,遺傳物質(zhì)DNA在從祖先到后代的遺傳過(guò)程中伴隨著突變。大多數(shù)遺傳變異發(fā)生在不同的位點(diǎn)上,并且能夠在進(jìn)化過(guò)程中保留下來(lái)。越早期發(fā)生的核苷酸替換在所有后代中分布越廣;越近期發(fā)生的核苷酸替換,分布越局限于近期分歧的類群中。越早發(fā)生分歧的DNA序列,累積的核苷酸替換越多,相似性越低。基本假設(shè)每個(gè)生物個(gè)體都有自己的直接祖先,遺傳物質(zhì)DNA在從祖先到后代35構(gòu)建系統(tǒng)發(fā)生樹的步驟獲得同源DNA數(shù)據(jù)序列比對(duì)選擇構(gòu)建系統(tǒng)發(fā)生樹的方法和核苷酸替換模型構(gòu)建系統(tǒng)發(fā)生樹及其可靠性評(píng)估構(gòu)建系統(tǒng)發(fā)生樹的步驟獲得同源DNA數(shù)據(jù)序列比對(duì)選擇構(gòu)建系統(tǒng)發(fā)36獲得同源DNA數(shù)據(jù)測(cè)序GenBankOUT要有代表性多基因(或多位點(diǎn))同源性獲得同源DNA數(shù)據(jù)測(cè)序OUT要有代表性37直系同源(Orthologs)
vs旁系同源(Paralogs)直系同源:由共同的祖先基因進(jìn)化而產(chǎn)生的同源基因。旁系同源:由基因復(fù)制而產(chǎn)生的同源基因。直系和旁系同源是兩個(gè)不同的進(jìn)化事件,用于分子進(jìn)化分析的序列必須是直系同源的,才能真實(shí)反映進(jìn)化過(guò)程Species1Species2直系同源(Orthologs)vs旁系同源(Para38第五章分子進(jìn)化和系統(tǒng)發(fā)生ppt課件39基因樹和物種樹物種樹:代表一個(gè)物種或群體進(jìn)化歷史的系統(tǒng)發(fā)生樹,各個(gè)節(jié)點(diǎn)代表物種發(fā)生分歧(生殖隔離)的時(shí)間或事件基因樹:由來(lái)自各個(gè)物種的一個(gè)基因構(gòu)建的系統(tǒng)發(fā)生樹,各個(gè)節(jié)點(diǎn)代表基因分離的時(shí)間基因樹不完全等同于物種樹基因樹和物種樹物種樹:代表一個(gè)物種或群體進(jìn)化歷史的系統(tǒng)發(fā)生樹40基因或DNA片段的選擇根據(jù)研究對(duì)象之間的親緣關(guān)系遠(yuǎn)近選擇進(jìn)化速率適中的基因或DNA片段親緣關(guān)系近——選擇進(jìn)化速率快的基因或DNA片段親緣關(guān)系遠(yuǎn)——選擇進(jìn)化速率慢的基因或DNA片段基因或DNA片段的選擇根據(jù)研究對(duì)象之間的親緣關(guān)系遠(yuǎn)近選擇進(jìn)化41DNA序列比對(duì)目的:找出同源序列演化過(guò)程中的同源位點(diǎn)。重要性:只有正確的比對(duì)結(jié)果才會(huì)能推出正確的系統(tǒng)發(fā)生。空位(gap):在序列比對(duì)時(shí),由于序列長(zhǎng)度不同,需要插入一個(gè)或幾個(gè)位點(diǎn)以取得最佳比對(duì)結(jié)果,這樣在其中一序列上產(chǎn)生中斷現(xiàn)象,這些中斷的位點(diǎn)稱為空位ATGAGGTTGTTTTCATATATGAGGTT---TTCATATDNA序列比對(duì)目的:找出同源序列演化過(guò)程中的同源位點(diǎn)。ATG42DNA序列比對(duì)程序自動(dòng)比對(duì)(Clustal,Muscle等)手工校正編碼蛋白基因序列ATGAGGTTGTTTTCATATATGAGGTT---TTCATATATGAGGTTGTTTTCATATATGAGGTTTTCATATDNA序列比對(duì)程序自動(dòng)比對(duì)(Clustal,Muscle等)43編碼tRNA和rRNA基因的序列tRNA二級(jí)結(jié)構(gòu)rRNA二級(jí)結(jié)構(gòu)編碼tRNA和rRNA基因的序列tRNA二級(jí)結(jié)構(gòu)rRNA二級(jí)44基于距離(distances)數(shù)據(jù)的方法:UPGMA非加權(quán)分組平均法(unweightedpairgroupmethodwitharithmeticmeans)Fitch-Margoliash法ME最小進(jìn)化方法(minimumevolution)NJ鄰接法(neighborjoiningmethod)基于特征(characters)數(shù)據(jù)的方法:MP最大簡(jiǎn)約法(maximumparsimonymethod)ML最大似然法(maximumlikelihoodmethod)BI貝葉斯推斷法(Bayesianinference)構(gòu)建系統(tǒng)發(fā)生樹的方法基于距離(distances)數(shù)據(jù)的方法:構(gòu)建系統(tǒng)發(fā)生樹的方45基于距離數(shù)據(jù)的方法根據(jù)一定的假設(shè)(核苷酸替換模型)推導(dǎo)出分類單元兩兩之間的遺傳距離,構(gòu)建遺傳距離矩陣。根據(jù)遺傳距離矩陣,依次將分類單元聚類,從而構(gòu)建出系統(tǒng)發(fā)生樹。基于距離數(shù)據(jù)的方法根據(jù)一定的假設(shè)(核苷酸替換模型)推導(dǎo)出分類46遺傳距離的計(jì)算未校正的遺傳距離(p-distance)P=nd/nn為比對(duì)后的序列長(zhǎng)度;nd為序列之間的差異位點(diǎn)數(shù)。遺傳距離的計(jì)算未校正的遺傳距離(p-distance)47因?yàn)樵谛蛄械耐晃稽c(diǎn)可能發(fā)生過(guò)不止一次的變化,大多數(shù)觀察到的替換數(shù)都會(huì)顯著低估真正替換的數(shù)目如在第7位點(diǎn),一條序列觀察到G,另一條為A,實(shí)際上存在多種變化的可能GA(單一替換)GCA(多重替換)CG,CA(并發(fā)替換)……因?yàn)樵谛蛄械耐晃稽c(diǎn)可能發(fā)生過(guò)不止一次的變化,大多數(shù)觀察到的48第五章分子進(jìn)化和系統(tǒng)發(fā)生ppt課件49模型校正的遺傳距離:利用數(shù)學(xué)模型將多重替換、回復(fù)突變、平行突變等因素考慮進(jìn)去,能夠更準(zhǔn)確地估算遺傳距離。模型校正的遺傳距離:利用數(shù)學(xué)模型將多重替換、回復(fù)突變、平行突50Kimura雙參數(shù)模型:假設(shè)轉(zhuǎn)換和顛換的幾率不同Kimura雙參數(shù)模型:假設(shè)轉(zhuǎn)換和顛換的幾率不同51假設(shè)轉(zhuǎn)換和顛換的幾率不同,4種堿基出現(xiàn)的頻率不同
假設(shè)每種替換的幾率都不同,4種堿基出現(xiàn)的頻率不同
假設(shè)轉(zhuǎn)換和顛換的幾率不同,4種堿基出現(xiàn)的頻率不同假設(shè)每種替52鄰接法(Neighbor-JoiningMethod,NJ)通過(guò)確定距離最近(或相鄰)的成對(duì)分類單元來(lái)構(gòu)建系統(tǒng)樹的方法,最優(yōu)樹的標(biāo)準(zhǔn)是其分支長(zhǎng)度總和(S,即總的距離)最小最優(yōu)樹標(biāo)準(zhǔn)如圖A和B是相鄰的,A和C則不是;A和B組成一個(gè)新的分類單元(AB)后,(AB)與C又成為相鄰的鄰接法(Neighbor-JoiningMethod,NJ53123456623235456312456521456126241313624513451364521364136425123456623235456312456...54優(yōu)點(diǎn):算法簡(jiǎn)單,速度快缺點(diǎn):將序列數(shù)據(jù)轉(zhuǎn)化成距離數(shù)據(jù)的過(guò)程中不可避免地會(huì)丟失部分進(jìn)化信息優(yōu)點(diǎn):算法簡(jiǎn)單,速度快55最大簡(jiǎn)約法(maximumparsimony,MP)根據(jù)信息位點(diǎn)提供的各序列間的替換情況,在所有可能的拓?fù)浣Y(jié)構(gòu)中篩選替換數(shù)最小的那個(gè)拓?fù)浣Y(jié)構(gòu),作為最優(yōu)樹的方法。理論基礎(chǔ):奧卡姆哲學(xué)原則,即解釋一個(gè)過(guò)程的最好理論是所需假設(shè)數(shù)目最少的那一個(gè)。最大簡(jiǎn)約法(maximumparsimony,MP)根據(jù)信56S1:ACTS2:ACAS3:GTTS4:GTAACTGTTGTTGTAACAGTA22MPscore=51ACAACTGTAGTTACAACT313MPscore=7ACTACAGTTGTAACAGTA121MPscore=4OptimalMPtreeS1:ACTACTGTTGTTGTAACAGTA22MPs57在MP法中對(duì)構(gòu)建系統(tǒng)發(fā)生樹提供了有用信息的位點(diǎn)稱為信息位點(diǎn)信息位點(diǎn)至少存在2種不同的堿基(或氨基),并且每種堿基(或氨基)至少出現(xiàn)兩次在MP法中對(duì)構(gòu)建系統(tǒng)發(fā)生樹提供了有用信息的位點(diǎn)稱為信息位點(diǎn)58優(yōu)點(diǎn):不需要引入假設(shè)(替代模型)。當(dāng)分析的序列較長(zhǎng),相似度較高的時(shí)候,最大簡(jiǎn)約法能夠推導(dǎo)獲得一個(gè)很好的進(jìn)化樹。缺點(diǎn):在分析序列上存在較多的回復(fù)突變或平行突變,而被檢驗(yàn)的序列位點(diǎn)數(shù)又比較少的時(shí)候,最大簡(jiǎn)約法可能會(huì)給出一個(gè)不合理的或者錯(cuò)誤的進(jìn)化樹推導(dǎo)結(jié)果。優(yōu)點(diǎn):不需要引入假設(shè)(替代模型)。當(dāng)分析的序列較長(zhǎng),相似度較59最大似然法(maximumlikelihood,ML)基于統(tǒng)計(jì)學(xué)算法的構(gòu)樹方法原理:以一個(gè)特定的核苷酸替代模型(需要明確選擇一個(gè)核苷酸替代模型)分析一組既定的序列數(shù)據(jù),使獲得的每一個(gè)拓?fù)浣Y(jié)構(gòu)的似然率均為最大,再挑出似然率值最大的拓?fù)浣Y(jié)構(gòu)作為最終樹。最大似然法假設(shè)每個(gè)核苷酸位點(diǎn)都是獨(dú)立進(jìn)化的,并分別計(jì)算每個(gè)位點(diǎn)的對(duì)數(shù)似然值,所有位點(diǎn)似然值相乘就得到進(jìn)化樹的對(duì)數(shù)似然值。最大似然法(maximumlikelihood,ML)基601.
計(jì)算特定進(jìn)化樹上每個(gè)位點(diǎn)的似然值2.
計(jì)算該樹的似然值(每個(gè)位點(diǎn)的似然值的乘積)3.
比較所有可能進(jìn)化樹的似然值4.
似然值最高的進(jìn)化樹即為最優(yōu)樹1.計(jì)算特定進(jìn)化樹上每個(gè)位點(diǎn)的似然值61系統(tǒng)發(fā)生樹的可靠性評(píng)估自展法(Bootstrap):放回式抽樣統(tǒng)計(jì)法。即通過(guò)對(duì)初始數(shù)據(jù)集多次重復(fù)有放回抽樣形成一系列新的數(shù)據(jù)集,然后利用新的數(shù)據(jù)集構(gòu)建多個(gè)進(jìn)化樹,用來(lái)檢查給定樹的分枝可信度。
系統(tǒng)發(fā)生樹的可靠性評(píng)估自展法(Bootstrap):放回式抽62OriginaldatasetReplicate1Replicate2Replicate3Etc…Step1:Re-samplethesequencewithreplacement新的序列和原序列等長(zhǎng)有些“列”可能被多次使用,有些可能沒有被使用OriginaldatasetReplicate1Rep63Replicate1Replicate2Replicate3Etc…Step2:BuildtreesReplicate1Replicate2Replicat64Step3:BuildconsensustreewithbootstrappingvalueStep3:65貝葉斯推斷法(
Bayesianinference,BI)也是基于統(tǒng)計(jì)學(xué)算法的構(gòu)樹方法,與最大似然法(指定樹的結(jié)構(gòu)和進(jìn)化模型,計(jì)算序列數(shù)據(jù)的概率,從而推斷出對(duì)應(yīng)的進(jìn)化樹)正好相反,是由給定的序列數(shù)據(jù),計(jì)算進(jìn)化樹和進(jìn)化模型的概率。貝葉斯推斷法首先涉及兩個(gè)基本概念:樹的先驗(yàn)概率和后驗(yàn)概率。貝葉斯推斷法(Bayesianinference,BI)66樹的先驗(yàn)概率:是指對(duì)系統(tǒng)樹未進(jìn)行任何觀測(cè)時(shí)的概率,具體來(lái)說(shuō)就是認(rèn)為所有系統(tǒng)樹都相同的可能性樹的后驗(yàn)概率:是指通過(guò)觀測(cè),系統(tǒng)樹的條件概率,即在給定的序列數(shù)據(jù)條件下,某進(jìn)化樹正確的概率,因而后驗(yàn)概率最大的系統(tǒng)樹為最優(yōu)樹樹的先驗(yàn)概率:是指對(duì)系統(tǒng)樹未進(jìn)行任何觀測(cè)時(shí)的概率,具體來(lái)說(shuō)就67貝葉斯推斷法同樣需要預(yù)先確定核苷酸替代模型參數(shù)不需要利用自引導(dǎo)法進(jìn)行檢驗(yàn),其后驗(yàn)概率直觀地反映了系統(tǒng)進(jìn)化樹的可信程度貝葉斯推斷法同樣需要預(yù)先確定核苷酸替代模型參數(shù)68利用MEGA6.0構(gòu)建系統(tǒng)發(fā)生樹數(shù)據(jù)輸入格式——FASTA格式利用MEGA6.0構(gòu)建系統(tǒng)發(fā)生樹數(shù)據(jù)輸入格式——FASTA格69第五章分子進(jìn)化和系統(tǒng)發(fā)生ppt課件70第五章分子進(jìn)化和系統(tǒng)發(fā)生ppt課件71第五章分子進(jìn)化和系統(tǒng)發(fā)生ppt課件72第五章分子進(jìn)化和系統(tǒng)發(fā)生ppt課件73系統(tǒng)發(fā)生學(xué)的應(yīng)用系統(tǒng)分類學(xué)生物的起源和擴(kuò)散保護(hù)生物學(xué)確定病原體的傳播途徑……系統(tǒng)發(fā)生學(xué)的應(yīng)用系統(tǒng)分類學(xué)74Species:PantherapardusGenus:PantheraFamily:FelidaeOrder:CarnivoraClass:MammaliaPhylum:ChordataKingdom:AnimaliaArchaea
EukaryaBacteria系統(tǒng)分類學(xué)分類系統(tǒng)按等級(jí)劃分為界、門、綱、目、科、屬、種7個(gè)階元達(dá)爾文:每個(gè)階元中分類單元的劃分要能夠反映出它的進(jìn)化歷史,各個(gè)分類單元可以通過(guò)進(jìn)化關(guān)系互相聯(lián)系在一起Species:Genus:PantheraFamily:75系統(tǒng)發(fā)生分類學(xué)(支序分類學(xué))認(rèn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 江西師范高等專科學(xué)校《數(shù)學(xué)課程標(biāo)準(zhǔn)分析》2023-2024學(xué)年第二學(xué)期期末試卷
- 江蘇省泰興市濟(jì)川實(shí)驗(yàn)中學(xué)2024-2025學(xué)年中考化學(xué)試題模擬題及解析(全國(guó)卷Ⅲ:)含解析
- 遼寧科技學(xué)院《現(xiàn)代辦公技術(shù)應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 西安城市建設(shè)職業(yè)學(xué)院《植物生物技術(shù)概論》2023-2024學(xué)年第二學(xué)期期末試卷
- 內(nèi)蒙古經(jīng)貿(mào)外語(yǔ)職業(yè)學(xué)院《國(guó)際經(jīng)濟(jì)地理》2023-2024學(xué)年第二學(xué)期期末試卷
- 山大附屬中學(xué)2024-2025學(xué)年高三一診練習(xí)四化學(xué)試題含解析
- 模特聘用合同書
- 二零二五版按提成收入的協(xié)議書
- 電商運(yùn)營(yíng)分成合同二零二五年
- 委托獨(dú)家中介房屋買賣服務(wù)合同書二零二五年
- 非心臟手術(shù)患者圍術(shù)期低血壓的管理策略
- 新版2025心肺復(fù)蘇術(shù)指南
- 小學(xué)生戰(zhàn)斗機(jī)知識(shí)
- 2025年深圳二模考試試題及答案
- 網(wǎng)絡(luò)借貸信用評(píng)級(jí)模型-深度研究
- (一模)臨沂市2025屆高三高考第一次模擬考試生物試卷(含標(biāo)準(zhǔn)答案)
- 眼科檢查法課件
- 2025年濟(jì)源職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)學(xué)生專用
- 微訓(xùn)練 一文多考 備考高效之詩(shī)歌《臨安春雨初霽》陸游 - 教師版
- 危重孕產(chǎn)婦(MNM)轉(zhuǎn)診中國(guó)專家共識(shí):規(guī)范流程與安全保障(2025版)解讀課件
- 課件:《科學(xué)社會(huì)主義概論(第二版)》第一章
評(píng)論
0/150
提交評(píng)論