




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第七章 分子進化分析(Molecular
Evolution
Analysis)內容+
分子進化分析介紹+
系統發育樹重建方法+
常用分子進化與系統發育分析的軟件第一節 分子進化分析介紹進化:是一種不斷改進的過程。“每個生物每時每刻都在為生存進行反復的斗爭,如果在復雜多變的生存條件下該生物仍然能夠不斷改進自己,那么其將有較大的生存可能性,并被自然選擇所保留。被自然選擇保留下來的物種都傾向于繁殖其已經被改進的新的生命形式”-----《特種起源》18世紀之前,神創論和物種不變論。18世紀,相信物種是變化的。拉馬克用環境作用的影響、器官的用進廢退和獲得性的遺傳等原理解釋生物進化過程,創立了第一個比較嚴整的進化理論。1859年達爾文發表《物種起源》,論證了地球上現存的生物都由共同祖先發展而來,并提出自然選擇學說以說明進化的原因,從而創立了科學的進化理論。20世紀30年代,綜合進化論,綜合了細胞遺傳學、群體遺傳學以及古生物學等學科的成就,進一步發
展了進化理論。20世紀60年代末,分子進化中性學說,認為種內和種間大多數可見差異是適合度很小的隨機突變的固定所決定的。生物學家:WE
HAVE
A
DREAM…+
Tree
of
Life:重建所有生物的進化歷史并以系統樹的形式加以描述夢想走進現實:HOW?比較形態學和比較生理學:確定大致的進化框架
——
細節存很多的爭議最理想的方法:化石!——
零散、不完整夢想走進現實:HOW?+
第三種方案:分子進化1964年,Pauling等提出分子進化理論:生命起源:有機分子由簡單向復雜演變生物進化:構成生物體的生物大分子如蛋白質、核酸的演變。基本假設:核苷酸和氨基酸序列中含有生物進化歷史的全部信息意義:分子進化的研究可以為生物進化過程提供佐證,為深入研究進化機制提供重要依據從物種的一些分子特性出發,構建系統發育樹,進而了解物種之間的生物系統發生的關系
——
tree
of
life,物種分類大分子功能與結構的分析:同一家族的大分子,具有相似的三級結構及生化功能,通過序列同源性分析,進行大分子功能預測進化速率分析:例如,HIV的高突變性,哪些位點易發生突變?分子進化研究的目的TREE
OF
LIFE:
16SRRNA真細菌真核生物古生菌OUT
OF
AFRICA53個人的線粒體基因組(16,587bp)非洲人相對其他大陸上的人類在基因上極為多樣化人類遷移的路線隨著距非洲距離越來越長,遺傳多樣性的衰退程度,
正好沿著人類早期遷徙的
路線慢慢增大。+
系統發育樹:描述一組對象進化歷史的一種圖表。+
分類單元:用來構建系統發育樹的對象。可以是基因、蛋白序列,或者是序列之外的數據(形態特征、酶切位點等)+
系統發育樹是一種二叉樹。由一系列節點(nodes)和分支(branches
)組成,其中每個節點代表一個分類單元(物種或序列),而節點之間的連線代表物種之間的進化關系。一、系統發育樹(Phylogenetic
tree)+
樹的節點又分為外部節點(terminal
node)和內部節點(internal
node)。+外部節點:代表實際觀察到的分類單元。+內部節點:又稱為分支點,代表分類單元進化歷程中的祖先。ABCD分支/世系E節點1.
系統發育樹的分類依據樹是否有根可分為:+有根樹:從最早共同祖先(即根)開始,隨著時間的連續分歧事件引起的一組相關對象的分歧每個分支的進化方向是確定的+無根樹:只表示分類單元之間的關系,不鑒別最早共同祖先不清楚內部分支的祖先物種是從哪里來的,進化方向不清楚archaeaarchaeaarchaeaeukaryoteeukaryoterooteukaryoteeukaryoteeukaryoteeukaryote無根樹eukaryoteeukaryotebacteria
outgrouparchaeaarchaeaarchaeaMonophyletic
group(單源支)Monophyleticgroup有根樹系統發育樹的種類: 有根樹、無根樹如何確定樹根?引入外圍支(Outgroup)輔助定位樹根。選擇外圍支:外圍支條件:序列必須與剩余序列關系較近,但外圍支序列與其他序列間的差異必須比其他序列之間的差異更顯著eukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaMonophyletic
group(單源支)Monophyleticgroupbacteria
outgroup
外圍支archaeaRootedbyoutgroup1.2依據進化關系可分為:基因樹:用于確定大基因家族內基因或蛋白進化關系的樹。物種樹:代表一個物種或群體進化歷史的系統發育樹–
當不同物種的直系同源基因序列被用來確定物種之間
的關系時,會用物種名標記分類單元,樹稱為物種數。2.
系統發育樹的表示方法+
有三種基本的表示方法:+
進化分支樹(Cladogram):展示了分類單元之間的家系關系,但沒有任何時間和分歧程度。即無支長信息。+
加性樹(additive
tree):除了展示家系關系,用分支長度度量進化分歧。–分支長度的單位是任意的,與位點變異數成比例。+
等距離樹:除了加性樹的屬性外,它假設所有分支有同樣的變異速率(分子鐘)。二、系統發育樹性質+如果是一棵有根樹,則樹根代表在進化歷史上是最早的、并且與其它所有分類單元都有聯系的分類單元。+如果找不到可以作為樹根的單元,則系統發生樹是無根樹。+從根節點出發到任何一個節點的路徑指明進化時間或者進化距離。+
對于給定的分類單元數,有很多棵可能的系統發生樹,但是只有一棵樹是正確的。系統發育分析的目標——尋找這棵正確的樹第二節
系統發育樹的構建+
分子進化分析介紹+
系統發育樹重建方法+
常用分子進化與系統發育分析的軟件—
、系統發育樹重建分析步驟選擇數據(核酸/蛋白質,外圍支)多序列比對(自動比對,手工比對)選擇建樹方法及取代模型建立進化樹進化樹評估二、系統發育樹的構建+從多重序列比對到構建進化樹有多種算法,可分兩大類:+基于距離的方法首先通過各個序列之間的比較,根據一定的假設(進化距離模型)推導出分類群之間的進化距離,構建一個進化距離矩陣。進化樹的構建則是基于這個矩陣中的進化距離。+基于特征的方法不計算序列之間的距離,而是將序列中有差異的位點作為單獨的特征,并依據這些特征來建+
基于距離的方法非加權分組平均法(UPGMA)最小近乎距離(ME)鄰近法(NJ)+
基于特征的方法最大簡約法(MP)最大似然法(ML)Bayesian+
計算速度1.
最大簡約(MP)最大簡約法(maximumparsimony)最
源于形態性狀研究,現在已經推廣到分子序列的進化分析中。最大簡約法的理論基礎是奧卡姆(Ockham)原則,這個原則認為:解釋一個過程的最好理論是所需假設數目最少的那一個。對所有可能的拓撲結構進行計算,計算出所需替代數最小的那個拓撲結構,作為最信息位點(Sites
areinformative)能將所有可能的樹區別出來的位點指那些至少存在2個不同堿基/氨基酸,且每個不同堿基/氨基酸至少出現兩次的位點例:
1,2,3,4四條序列代表4個分類單元上例+
Position
5,7,9為信息位點+
基于position 5的三個MP:Tree 1長4,Tree
2& 3長2+
同理,綜合所有信息位點:Tree 1長4,Tree 2長5,Tree 3長6+
計算結果:MP tree的最優結果為Tree
11.
距離法+
又稱距離矩陣法,首先通過各個物種之間的比較,根據一定的假設(進化距離模型)推導
得出分類群之間的進化距離,構建一個進化
距離矩陣。進化樹的構建則是基于這個矩陣中的進化計距算離序關列系的距離,建立距離矩陣通過距離矩陣建進化樹簡單的距離矩陣由進化距離構建進化樹的方法有很多,常見有:Fitch-Margoliash
Method(FM法):對短支長非常有效
Neighbor-JoiningMethod
(NJ法/鄰接法): 求最短支長,最通用的距離方法Unweighted Pair
Group
Method
(UPGMA法)通過矩陣建樹的方法示例:FM法+
分成三組:D,E及ABC。計算距離矩陣+
將DE合并,ABC單列,計算距離矩陣分成三組:C,DE及AB。計算距離矩陣3.
最大似然法(ML)+選取一個特定的替代模型來分析給定的一組序列數據,使得獲得的每一個拓撲結構的似然率都為最大值,然后再挑出其中似然率最大的拓撲結構作為最優樹。位置1位置2位置3…SUM拓撲樹AL(A1)L(A2)L(A3)…Asum拓撲樹BL(B1)L(B2)L(B3)…Bsum拓撲樹CL(C2)L(C3)L(C3)…Csum………………似然值最大,即SUM最大的拓撲樹則為最優樹。三、構建進化樹的一般原則可靠的待分析數據準確的多序列比對選擇合適的建樹方法:A.序列相似程度高,MP(最大簡約法)B.序列相似程度較低,ML(最大似然法)C.序列相似程度太低,無意義
一般采用兩種及以上方法構建進化樹,無顯著區別可接受構建進化樹的一般原則進化樹的可靠性分析進化樹的可靠性分析:自展法(BootstrapMethod)(統計方法)。從排列的多序列中隨機有放回的抽取某一列,構成相同長度的新的排列序列重復上面的過程,得到多組新的序列對這些新的序列進行建樹,再觀察這些樹與原始樹是否有差異,以此評價建樹第三節 常用分子進化與系統發育分析的軟件一、常見的分子進化分析程序Phylip由華盛頓大學遺傳學系開發,是一個免費的系統發育分析軟件包(版本3.69),可以通過以下地址下載。/phylip.ht
mlPAUP*最早是在蘋果機上開發的具有菜單界面的進化分析軟件,早先版本只有MP法,后續版本已經包括距離法和ML法,現今有mac,win,linux等多種版本,該軟件不是免費軟件。軟件名稱網址說明PHYLIPhttp://evolution.gs.washingt/phylip.htmlIt
includes
programs
to
carry
outparsimony,distance
matrix
methods,
maximumlikelihood,
and
other
methods
on
a
variety
oftypes
of
data,
including
DNA
and
RNAsequences,
protein
sequences,
restrictionsites,
0/1
discrete
characters
data,genefrequencies,
continuous
charactersanddistance
matrices.PAUP/It
includes
parsimony,
distance
matrix,invariants,
and
maximum
likelihood
methodsand
many
indices
and
statistical
tests.Tree
of
Lifehttp://phylogeny.arizona.edu/tree/program/program.htmlArizona大學開發的軟件MEGAhttp://www.megasoftware.n
et美國賓州州立大學Masatoshi
Nei開發
(It
carries
out
parsimony,
distance
matrixand
likelihood
methods
formoleculardata.)軟件名稱網址說明MOLPHYhttp://www.ism.ac.jp/software/ismlib/softother.e.html#molphy日本國立統計數理研究所開發。(Carryingoutmaximum
likelihood
inference
of
phylogenies
foreither
nucleotide
sequences
or
protein
sequences.)PAMLhttp://abacus.gene.ucl.ac.uk/software/paml.html英國倫敦學院Z.H.YANG開發。(Apackage
ofprograms
for
the
ML
analysis
of
nucleotide
orprotein
sequences.)PUZZLEftp://fx.zi.biologie.uni-muenchen.de/pub/puzzle應用Quarter
puzzling方法(一種最大簡約法)構建系統發育樹TreeViewhttp://taxonomy.zoology.gla.ac.uk/rod/treeview.htmlA
program
for
displaying
trees
on
AppleMacs
and
Windows
PCs.
It
can
drawrootedand
unrooted
trees,
display
bootstrap
values,and
supports
the
native
font
andgraphicsfile
formats
of
both
Macs
and
PCs.phylogenyhttp://www.ebi.ac.uk/phylogeny.htmlEBI的系統發育樹分析軟件二、PHYLIP軟件包介
紹+Phylip包含了35個獨立的程序,這些獨立的程序都實現特定的功能,這些程序基本上包括了系統發生分析的所有方面。+Phylip有多種不同平臺的版本包括Windows,Macintosh,DOS,Linux,Unix和OpenVMX)。+
Phylip是目前最廣泛使用的系統發生分析程序,主要包括以下幾個程序組:分子序列組,距離矩陣組,基因頻率組,離散字符組,進化樹繪制組。分子序列組:蛋白質序列:protpars,proml,promlk,protdist核酸序列:dnapenny,dnapars, dnamove,dnaml,dnamlk, dnainvar,dnadist,dnacomp+
距離矩陣組:Fitch,kitsch,neighbor+
基因頻率組:Gendist,contml+
離散字符組:
Pars,mix,move,penny,dollop,dolmove,dolpenny,clique,factor+
進化樹繪制組:drawtree,drawgram+
其他:restdist,restml,seqboot,contrastPhylip安裝分析程序幫助文件Exe文件夾內容三、PHYLIP軟件包的應用1.
根據分析數據,選擇適當的程序如果分析的是DNA數據,就在核酸序列分析類中選擇程序(dnapenny,dnapars,dnamove,dnaml,dnamlk,dnainvar,dnadist,dnacomp
)如果分析的是離散數據,如突變位點數據,就在離散字符組里面選擇程序。選擇適當的分析方法如分析的是DNA數據,可以選擇簡約法(dnapars),似然法(dnaml,dnamlk),距離法等(dnadist)。。。進行分析選擇好程序后,執行,讀入分析數據,選擇適當的參數,進行分析,結果自動保存為
outfile,outtree。Outfile是一個記錄文件,記錄了分析的過程和結果,可以直接用文本編輯器(如寫字板)打開。outtree是分析結果的樹文件,可以用
phylip提供的繪樹程序打開查看,也可以用其他的程序來打開,如treeview。構建核酸樹的過程Alignment.phykitsch.exefitch.exeneighbor.exeDistdnadist.exednapars.exeMPdnamlk.exeMLdnaml.exeouttreeoutfileTreeviewconsen-se.exeouttree
outfile構建蛋白質樹的過程Alignment.phykitsch.exefitch.exeneighbor.exeDistprodist.exeprotpars.exeMPpromlk.exeMLproml.exeouttreeoutfileTreeviewconsen-se.exeouttree
outfile進化樹的可靠性分析:
自展法(BootstrapMethod)四、實例:用PHYLIP
軟件推導進化樹(1).進入EXE文件夾,點擊SEQBOOT軟件,輸入DNA8.phy文件名,回車后,輸Y確認參數。并在Random
numberseed
(must
be
odd)
?的下面輸入一個4N+1的數字如5,
程序開始運行,并在EXE文件夾中產生文件outfile.(2).
得到一個文件outfile,把文件outfile改名為infile,
infile可用記事本打開,內容如下:(3).
點擊DNADIST(PRODIST
for
蛋白序列)程序。輸入M更改參數,輸入D選擇data
sets,輸入100。輸Y確認參數,程序開始運行,并在EXE文件夾中產生outfile。建樹方法:距
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 1-2數制-三要素電子課件教學版
- 稀土金屬提煉過程中的環境保護與產業轉型升級路徑探索研究考核試卷
- 目視化管理與危機管理考核試卷
- 海洋能資源勘查技術考核試卷
- 以錯過為話題的高考語文800字作文賞析
- 廈門高三市質檢語文作文
- 橡膠制品行業市場營銷推廣案例考核試卷
- 煉油廠能源管理與節能措施考核試卷
- 電聲器件在智能家居系統中的應用考核試卷
- 糕點制作工藝與模具應用考核試卷
- VL3000系列高性能矢量型變頻器用戶手冊上海沃陸電氣有限公司
- 極端天氣應急
- 家具采購安裝方案、家具采購服務方案和計劃
- 2023年中國計量科學研究院招聘筆試真題
- 影視產業人才培養-洞察分析
- 兒童系統性紅斑狼瘡診斷與治療評析
- 度假酒店的規劃與開發
- 《中國文化遺產》課件
- 酒店管理授權委托協議
- 南京信息工程大學《數理統計》2021-2022學年第一學期期末試卷
- 機場跑道瀝青混凝土施工工藝及方案
評論
0/150
提交評論