如何做序列的分析(與“序列”有關的文檔共22張)_第1頁
如何做序列的分析(與“序列”有關的文檔共22張)_第2頁
如何做序列的分析(與“序列”有關的文檔共22張)_第3頁
如何做序列的分析(與“序列”有關的文檔共22張)_第4頁
如何做序列的分析(與“序列”有關的文檔共22張)_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

如何做序列的分析第一頁,共22頁。內(nèi)容提要

Blast簡介

Blast相關問題

Blast的應用

示例2第二頁,共22頁。Blast簡介BLAST是NCBI中用來將一個蛋白質(zhì)或DNA序列和各種數(shù)據(jù)庫中的其他序列進行比對的主要工具。BLAST搜索是研究一個蛋白質(zhì)和基因的最基本的方法之一。Blast具有非常廣泛的運用確定特定的蛋白質(zhì)或核酸序列有哪些已知的直系同源或旁系同源序列確定哪些蛋白質(zhì)和基因在特定的物種中出現(xiàn)確定一個DNA或蛋白質(zhì)序列身份發(fā)現(xiàn)新基因

確定一個特定基因或蛋白質(zhì)有哪些已經(jīng)發(fā)現(xiàn)了的變種研究可能存在多種剪切方式的表達序列標簽尋找對于一個蛋白質(zhì)的功能和/或結構起關鍵作用的氨基酸殘基

3第三頁,共22頁。主要的blast程序4第四頁,共22頁。主要的blast程序程序名查詢序列數(shù)據(jù)庫搜索方法Blastn核酸核酸核酸序列搜索逐一核酸數(shù)據(jù)庫中的序列Blastp蛋白質(zhì)蛋白質(zhì)蛋白質(zhì)序列搜索逐一蛋白質(zhì)數(shù)據(jù)庫中的序列Blastx核酸蛋白質(zhì)核酸序列6框翻譯成蛋白質(zhì)序列后和蛋白質(zhì)數(shù)據(jù)庫中的序列逐一搜索。Tblastn蛋白質(zhì)核酸蛋白質(zhì)序列和核酸數(shù)據(jù)庫中的核酸序列6框翻譯后的蛋白質(zhì)序列逐一比對。TBlastx核酸核酸核酸序列6框翻譯成蛋白質(zhì)序列,再和核酸數(shù)據(jù)庫中的核酸序列6框翻譯成的蛋白質(zhì)序列逐一進行比對。5第五頁,共22頁。具體步驟1.登陸blast主頁:///Blast.cgi2.根據(jù)已有序列類型和搜索目標,選擇合適的blast程序Blastn,Blastp,Blastx等3.填寫表單信息選擇要搜索的數(shù)據(jù)庫,并修改一些可選參數(shù)等4.提交任務5.查看和分析結果6第六頁,共22頁。具體步驟

輸入要分析的序列NP_006735三種主要的輸入方式

剪切然后粘貼DNA或蛋白質(zhì)序列使用FASTA格式的序列簡單地使用索引號碼(如一個RefSeq

或GenBank(GI)的序號)7第七頁,共22頁。具體步驟

選擇要搜索的數(shù)據(jù)庫(blastp)去冗余GenBank編碼序列PDB+SwissProt+PIR+PRFNr數(shù)據(jù)庫合并了若干個主要的蛋白質(zhì)

或DNA數(shù)據(jù)庫數(shù)據(jù)庫有相同的序列,但nr

數(shù)據(jù)庫只收錄一個典型和常用的數(shù)據(jù)庫8第八頁,共22頁。具體步驟

選擇要搜索的數(shù)據(jù)庫(blastn)9第九頁,共22頁。具體步驟

調(diào)整可選參數(shù)1.LimitbyEntrezQuery可以用任何一種范圍限定詞來限定NCBIBLAST搜索的范圍10第十頁,共22頁。具體步驟

調(diào)整可選參數(shù)2.

Maxtargetsequences:比對之后顯示的最大的比對序列的數(shù)目11第十一頁,共22頁。具體步驟

調(diào)整可選參數(shù)3.

Expectthreshold:期望值E是得分大于或等于某個分值S的不同的比對的數(shù)目在隨機的數(shù)據(jù)庫搜索中發(fā)生的可能性。默認值是10,表示隨機出現(xiàn)得分等于或高于比對得分S的期望數(shù)為10個。

當將期望選項值調(diào)小時,返回的數(shù)據(jù)

庫搜索結果將變少,匹配被搜索到的

概率也會變小。

增大E值將返回更多的結果。12第十二頁,共22頁。具體步驟

調(diào)整可選參數(shù)4.

Wordsize(字段長度)蛋白質(zhì)搜索,默認值是3核酸序列搜索,默認值是11

改變字段長度可以影響搜索

精度和速度13第十三頁,共22頁。具體步驟

調(diào)整可選參數(shù)5.

Matrix(打分矩陣)在一次BLAST搜索中,可以嘗試使用幾種不同的打分矩陣高PAM值取代矩陣適合于差異較大的序列

低BLOSUM62值的取代矩陣適合于差異較大的序列14第十四頁,共22頁。具體步驟

調(diào)整可選參數(shù)6.Compositionaladjustments,默認選擇,一般來說可改善E值的統(tǒng)計計算和提高靈敏度(減少返回的假陽性結果的數(shù)目)15第十五頁,共22頁。具體步驟

調(diào)整可選參數(shù)7.Filter(選擇性過濾條件),

過濾器將鎖定諸如組成低復雜序列區(qū)(如Alu序列),用一系列N(任意堿基)替代這些程序過濾對絕大多數(shù)序列是有利的,

可以幫助避免那些假的數(shù)據(jù)庫匹配但某些情況下可信的匹配也會過濾掉16第十六頁,共22頁。具體步驟

Blast輸出結果上部BLAST搜索的類型、關于查詢內(nèi)容和所搜索的數(shù)據(jù)庫的描述以及一個分類連接可以將結果按照物種進行分類中部數(shù)據(jù)庫中序列與查詢序列相匹配的項的列表,分為圖像和列表兩種描述方式下部一系列的兩兩序列比對,4種衡量的分數(shù):比特分數(shù)、期望分數(shù)、一致性百分比、正性(相似性百分比)17第十七頁,共22頁。具體步驟

Blast輸出結果databaseprogramquerytaxonomy18第十八頁,共22頁。具體步驟

Blast輸出結果每一個條帶表示數(shù)據(jù)庫中的一個與查詢序列相匹配的蛋白質(zhì)或核酸序列,被標以不同顏色表示親緣關系的遠近(根據(jù)比對的分),最接近匹配用紅色表示。Highscoreslowevalues19第十九頁,共22頁。具體步驟Blast輸出結果Score使用打分矩陣對匹配的片段進行打分,這是對各對氨基酸殘基(或堿基)打分求和的結果,一般來說,匹配片段越長、相似性越高則Score值越大。Evalue在相同長度的情況下,兩個氨基酸殘基(或堿基)隨機排列的序列進

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論