




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、Biological Sequence Analysis 周杰 王莉Contents DB Searching the Blast family, pattern hunter, blat, etc. Sequence Alignment Clustalx, Tcoffee, mafft, ProsCons, etc. Sequence Pattern Analysis Sequence Logo, Codon Usage, etc. Protein Sequence Analysis ORF,funcntion,regulato
2、ry,strucuture,interaction,etc Phylogenetic analysis MEGA, PAUP, Phylip, Mrbayes, etc.Google ScholarEntrezBLASTSeedingMegaBlast 快速尋找高度相似的序列 主要特點: 比BLAST快數百倍 Large Word size Greedy algorithm輸入輸出格式 所有類blast程序都接受fasta格式序列文件 所有類blast程序都輸出類似blast的結果文件。Fasta格式 seq1 CGGCGCTAGCATCGTACACGATCGACACACTGACATCGACA
3、CTAGCTAGCGATCGATCGATCGATGCTACTGACTGACTGATGCTGAC seq2 GATCGATCAGCACGAGCAGCAGCACGACTACTATGCAGTCGATCGTAGCTGACGTACTGATGCAGTCTGACTGATCGTAGCTACGACTACACTACGATC各種序列格式及轉換READSEQREADSEQ!Sequence Alignment Software ClustalX (Windows) Tcoffee Mafft Proscons MUSCLE MAUVE, LAGAN, etc (Genome alignment) Progressiv
4、e AlignmentComparison CLUSTAL WIN/UNIX下圖形界面,使用最廣泛,適合短和不太多的序列。 Tcoffee 比CLUSTAL略精確一些,慢,不常用 Mafft 精度可調,較多500-10000條或較長序列5k-5000k aa/nt都可使用,UNIX下命令行界面。 Porscons 目前為止最為精確的對位軟件,慢,UNIX下命令行界面。 MUSCLE 快,可對較長或較多的序列,WIM/UNIX下命令行界面。Why CLUSTALW?輸入輸出格式 所有序列對位程序都接受fasta格式序列文件 所有序列對位程序都輸出fasta格式結果文件或者類似clustalw格式
5、的結果文件。Genome Alignment Tools MUMmer (2019) LAGAN, M-LAGAN (2019) MAUVE (2019) Rearrangement and InversionMAUVE序列模式分析 Sequence Logo Many othersProtein Sequence Analysis ORF Function Prediction 2nd, 3rd structural prediction、comparison Protein interaction predicion ORFORF Finder (demo)功能預測 第一步: databa
6、se search Blast然后嘗試搜索各個數據庫 找到最接近的蛋白,尋找它的注釋和功能信息MPSS/mpss/Structure Prediction二級結構預測Tertiary Structure Predictionrussell.embl-heidelberg.de/gtsp/flowchart2.htmlProtein Structural ComparisonProtein Interaction Prediction 用蛋白序列搜索各大相互作用數據庫 BIND, STRING, DIPPhylogenetic Analysis PHYLIP MEGA Tree
7、View PAUP* MrBayes PAML PHYML /phylip/software.htmlPhylipJoe Felsenstein “No Thanks to”特點 發布早,使用非常廣泛 命令行driven 能夠處理各種類型的數據 包括除Bayesian之外的幾乎所有方法 模塊化 可批量處理Flowchart文件格式 輸入均為PHYLIP格式 輸出進化樹文件為newick格式(1,2),3),4);(1:1.0,2:2.0):1.0,3:2.0):1.0,4:1.0);MEGADemo timeTreeViewPA
8、UP* By David Swoffold 特點 包括幾乎所有構樹方法 Bayes方法,蛋白序列的ML方法除外 在Mac上有良好的圖形界面 MP方法有非常完善的參數設定及選項,MP樹的最佳選擇 ML方法也比較完善結合Modeltest) 靈活的分析流程及參數設定,適合各種要求 100$文件格式 輸入文件 NEXUS 輸出文件 NEXUS, newickNEXUS format#NEXUSBEGIN DATA;dimensions ntax=5 nchar=664;format missing=?symbols=ABCDEFGHIKLMNPQRSTUVWXYZinterleave datatyp
9、e=DNA gap= -;matrixO.lichuanensis TGAAACTTTGGCTCTTTTTTAGGCATCTGCTTGGTCGCCCAO.rhodostigmatus TGAAACTTTGGCTCTCTTCTAGGCATCTGCCTAATTACCCAO.popei TGAAATTTTGGTTCTCTTCTTGGCATCTGCTTAGCCACCCAS.chintingenis TGAAATTTCGGCTCATTATTAGGGGTATGTTTGGTAGCCCAS.boulengeri TGAAATTTCGGCTCATTATTAGGGGTATGTTTGGTAGCCCA;End;PAU
10、P*批處理腳本示例#nexusbegin PAUP;log file=hsearchl.log;set autoclose=yes;hsearch start=stepwise addseq=randomn reps=100 savereps=yes randomize=addseq rstatus=yes hold=1 swap=tbr multrees=yes;savetrees file=hsearch1.all.tre;filter best=yes permdel=yes;savetrees file=hsearch1.best.tre;log stop;end; MacClade
11、By the Maddison brothersMrbayes By John Huelsenbeck & Fredrik RonquistFeatures of Bayesian Method Handles complex models with many parameters Based on likelihood, statistically consistent Faster than ML method,can handle 50 taxon phylogeny Combine multiple types of data (DNA, protein,morphology, etc)文件格式 只接受NEXUS格式 只輸出NEXUS格式用處 用來輸入和編輯數據,生成NEXUS格式文件,供PAUP,MrBayes等程序使用 圖形化顯示和編輯進化樹 性狀進化分析 祖先性狀重建PA
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 文學批評與理論研究試題及答案
- 消防設施性能標準試題及答案
- 2025年度餐飲業中央廚房租賃與供應鏈服務合同
- 2025年度車庫抵押權抵押權合同
- 二零二五年度手房屋買賣補充協議-針對房屋漏水處理條款
- 2025年度電商聯盟返利合作框架
- 2024年托業模擬試題
- 二零二五年度企業掛名法人實際控制人合作協議及退出機制書
- 《GBT 40509-2021汽車轉向中心區操縱性過渡特性試驗方法》全新解讀
- CPSM全科目學習的平衡試題及答案
- 黑馬王子老師1量學3121法則
- 骨痿中醫診療方案
- 集成電路封裝可靠性定義和應用
- 燒烤場地租賃合同Word版參考
- 史上最全PCBA外觀檢驗標準
- 繁星春水片段摘抄賞析
- 國際標準智商測試39題詳細答案
- 碎石技術交底
- 汽車理論課后作業matlab編程詳解帶注釋
- 國家開放大學《水利水電工程造價管理》章節測試參考答案
- 神探夏洛克劇本(共13頁)
評論
0/150
提交評論