




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
實習一
基因組數據注釋和功能分析越努力越幸運實習一
基因組數據注釋和功能分析越努力越幸運課程內容基因組學轉錄物組學蛋白質組學系統生物學越努力越幸運課程內容基因組學轉錄物組學蛋白質組學系統生物學越努力越幸運通過序列比對工具BLAST學習,了解蛋白編碼基因的功能注釋原理介紹多序列聯配工具ClustalX分子進化分析軟件MEGA4的基本知識,掌握系統發生樹繪制的基本方法越努力越幸運通過序列比對工具BLAST學習,了解蛋白編碼基因的功能注釋原序列比對的進化基礎什么是序列比對:將兩個或多個序列按照最佳匹配方式排列在一起。對應的相同或相似的符號排列在同一列上。錯配與突變相應,空位與插入或缺失對應。序列比對的目的:從核酸以及氨基酸的層次去分析序列的相同點和不同點,以推測他們的結構、功能以及進化上的聯系通過判斷兩個序列之間的相似性來判定兩者是否具有同源性相似性:可以被數量化,如:序列之間相似部分的百分比同源性:質的判斷,兩個基因在進化上是否曾有共同祖先的推斷越努力越幸運序列比對的進化基礎什么是序列比對:越努力越幸運BLAST基本局部比對搜索工具(BasicLocalAlignmentSearchTool)NCBI上BLAST服務的網址:/blast/NCBI上blast程序的下載:/blast/executables/release/NCBI的BLAST數據庫下載網址:/blast/越努力越幸運BLAST基本局部比對搜索工具(BasicLocalAl選擇物種選擇blast程序越努力越幸運選擇物種選擇blast程序越努力越幸運QuerySequenceAminoacidSequenceDNASequencetBLASTxBLASTxBLASTntBLASTnBLASTpNucleotideDatabaseProteinDatabaseNucleotideDatabaseNucleotideDatabaseProteinDatabaseTranslatedTranslatedTranslated越努力越幸運QuerySequenceAminoacidSequence越努力越幸運越努力越幸運以Blastx為例:
目標序列為ATGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC6個讀碼框翻譯5’端到3’端第一位起始:ATGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC第二位起始:TGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC第三位起始:GAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC3’端到5’端第一位起始:GCGGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT第二位起始:CGGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT第三位起始:GGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT越努力越幸運以Blastx為例:
目標序列為ATGAGTACCG越努力越幸運越努力越幸運與核酸相關的數據庫與蛋白質相關的數據庫越努力越幸運與核酸相關的數據庫與蛋白質相關的數據庫越努力越幸運選擇數據庫序列或目標序列的GI號以文件格式上傳BlastN越努力越幸運選擇數據庫序列或目標序列的GI號以文件格式上傳BlastN越配對與錯配空位罰分越努力越幸運配對與錯配空位罰分越努力越幸運BlastP越努力越幸運BlastP越努力越幸運打分矩陣:PAM30PAM70BLOSUM80BLOSUM62BLOSUM45PAM模型可用于尋找蛋白質的進化起源,而BLOSUM模型則用于發現蛋白質的保守域。越努力越幸運打分矩陣:PAM模型可用于尋找蛋白質的進化起源,而BLOSU選擇打分矩陣(scoringmatrix) ThePAMfamilyBasedonglobalalignmentsThePAM1isthematrixcalculatedfromcomparisonsofsequenceswithnomorethan1%divergence.OtherPAMmatricesareextrapolatedfromPAM1.
TheBLOSUMfamilyBasedonlocalalignments.BLOSUM62isamatrixcalculatedfromcomparisonsofsequenceswithnolessthan62%divergence.AllBLOSUMmatricesarebasedonobservedalignments;theyarenotextrapolatedfromcomparisonsofcloselyrelatedproteins.越努力越幸運選擇打分矩陣(scoringmatrix) ThePAM進行比對的數據庫圖形化結果越努力越幸運進行比對的數據庫圖形化結果越努力越幸運E值(E-value)表示僅僅因為隨機性造成獲得這一比對結果的可能性。這一數值越接近零,發生這一事件的可能性越小。越努力越幸運E值(E-value)表示僅僅因為隨機性造成獲得這一比對結越努力越幸運越努力越幸運上機實習1:網上運行blastx和blastn
(NCBIblast網址:/BLAST/)>lesson.seq.screen.Contig34TTTTTTTTTTTTTTTTTAGTGCCAGTTTTTTTTTTTATTTGTAAAGCTCTGCCATAAACTTCTAGCGTGTGCCAATGGTCACCTGCCACACTCGCACCAGGTTGTCCGTGTAGCCAGCAAACAGAGTCTGGCCATCAGCAGACCAGGCCAGGGAGGTGCACTGGGGTGGTTCTGCCTTGCTGCTGGTACTGATAACTTCTTGCTTCAGTTCATCTACAATGATCTTTCCCTCTAAATCCCAGATCTTGATGCTGGGGCCTGTGGAGCACACAGCCAGTAGCGGTTAGGGCTGAAGCACAGGGCGTTGATGATGTCCCCACCATCTAGCGTGTAAAGGTGTTTGCCTTCGTTGAGATCCCATAACATGGCCTGGCCATCCTTGCCTCCAGAAGCACAGAGGGATCCATCTGGAGAGACAGTCACCGTGTTCAGATAGCCTGTGTGGCCAATGTGGTTGGTCTTCAGCTTGCAGTTAGCCAGGTTCCATACCTTGACCAGCTTGTCCCAGCCACAGGAGACGATGATAGGGTTGCTGCTGTTGGGCGAGAAGCGGACACAAGACACCCACTCTGAGTGGCTCTCATCCTGGACAGTGTATTTGCACACACCCAGGGTATTCCATAGCTTGATGGTTTTATCTCGAGATCCAGAGACAATCTGCCGGTTGTCAGAGGAGAAGGCCACACTCAGCACATCCTTGGTATGGCCCACAAATCGCCTCGTGGTGGTGCCCGTTGTGAGATCCCAGAAGGCGCAGGGTTCCATCCCAGGAGCCTGAGAGGGCAAACTGGCCATCTGAGGAGATAACCACATCACTAACAAAGTGGGAGTGACCCCGCAGAGCACGCTGTGGAATTCCATAGTTGGTCTCATCCCTGGTCAGTTTCCACATGATGATGGTCTTATCTCGAGAGGCGGAGAGGATCATGTCCGGGAACTGCGGGGTAGTAGCGATCTGGGTTACCCAGCCGTTGTGGCCCTTGAGGGTGCCACGAAGGGTCATCTGCTCAGTCATGGCGGCGGCGAGAGCGTGTTCGCTGCAGCGACGAGGATGGCACTGGATGGCTTAGAGAAACTAGCACCACAGTCGACC對contig34進行網上blastn(演示),blastx(自行操作)比對*由于時間關系,請參見預存結果。越努力越幸運上機實習1:網上運行blastx和blastn (NCBIb本地運行BLAST下載NCBI上blast程序:/blast/executables/release/安裝(安裝到C:\)數據庫的格式化(formatdb)程序運行(blastall)越努力越幸運本地運行BLAST下載NCBI上blast程序:越努力越幸運登陸NCBI的FTP下載blast程序越努力越幸運登陸NCBI的FTP下載blast程序越努力越幸運雙擊安裝到C盤產生三個文件夾bindatadoc將數據庫文件(db)及目標序列文件(in)保存在Blast/bin文件夾下bin含可執行程序(將數據庫及需要比對操作的數據放入該文件);data文件夾含打分矩陣及演示例子的序列數據信息;doc文件夾含關于各子程序的說明文檔。越努力越幸運雙擊安裝到C盤將數據庫文件(db)及目標序列文件(in)保存本地數據庫的構建查看db文件由fasta格式的序列組成越努力越幸運本地數據庫的構建查看db文件由fasta格式的序列組成越努力數據庫的格式化formatdb命令用于數據庫的格式化:formatdb[option1][option2][option3]…formatdb常用參數-idatabase_name需要格式化的數據庫名稱-pT\F待格式化數據庫的序列類型(核苷酸選F;蛋白質選T;默認值為T)例:formatdb-idb-pT對蛋白質數據庫“db”進行格式化越努力越幸運數據庫的格式化formatdb命令用于數據庫的格式化:對蛋白程序運行 blastall命令用于運行五個blast子程序: blastall[option1][option2][option3] *可在dos下輸入blastall查看各個參數的意義及使用blastall常用參數四個必需參數-pprogram_name,程序名,根據數據庫及搜索文件序列性質進行選擇;-ddatabase_name,數據庫名稱,比對完成格式化的數據庫;-iinput_file,搜索文件名稱;-ooutput_file,BLAST結果文件名稱;兩個常用參數-eexpectation,期待值,默認值為10.0,可采用科學計數法來表示,如2e-5;-malignmentviewoptions:比對顯示選項,其具體的說明可以用以下的比對實例說明
例:blastall-pblastx-ddb-iin-oout-e2e-5-m9(表格顯示比對結果)采用blastx程序,將in中的序列到數據庫bd中進行比對,結果以表格形式輸入到out文件越努力越幸運程序運行 blastall命令用于運行五個blast子程序:上機實習2:本地運行blastx進入DOS命令行提示符狀態(“運行”cmd)進入C盤“cd\”
進入包含序列數據的bin目錄下“cdBlast\bin”察看目錄下內容“dir”
格式化數據庫db“formatdb-idb-pT”運行blastx“blastall-pblastx-iin-ddb-oout-e2e-5-m9”察看結果“moreout”或在windows下雙擊打開輸入數據庫類型:F/TBlast程序序列輸入數據庫結果輸出越努力越幸運上機實習2:本地運行blastx進入DOS命令行提示符狀態(越努力越幸運越努力越幸運輸入“cd\”-〉回車回到安裝目錄C盤輸入“cdblast\bin”-〉回車到達blast程序下bin文件夾越努力越幸運輸入“cd\”-〉回車輸入“cdblast\bin”-〉回輸入“dir”-〉回車察看bin文件夾下內容bin文件夾下包含以.exe為后綴的程序文件以及這次實習需要用到的數據可文件“bd”和目標序列文件“in”越努力越幸運輸入“dir”-〉回車bin文件夾下包含以.exe為后綴的程輸入“moredb”-〉回車察看db文件內容空格鍵翻頁輸入“q”跳出越努力越幸運輸入“moredb”-〉回車察看db文件內容空格鍵翻頁越努輸入“formatdb–idb–pT”-〉回車對db數據庫進行格式化越努力越幸運輸入“formatdb–idb–pT”-〉回車越努力輸入“dir”-〉回車察看bin文件夾下內容格式化以后產生的文件越努力越幸運輸入“dir”-〉回車格式化以后產生的文件越努力越幸運輸入“blastall-pblastx-iin-ddb-oout-e2e-5-m9”-〉回車運行blastx程序越努力越幸運輸入“blastall-pblastx-iin-d產生的結果文件“out”越努力越幸運產生的結果文件“out”越努力越幸運用”moreout”察看結果文件越努力越幸運用”moreout”越努力越幸運不使用–m參數時比對結果顯示序列兩兩比對越努力越幸運不使用–m參數時越努力越幸運用”moreout”察看結果文件越努力越幸運用”moreout”越努力越幸運多序列比對的目的從物種的一些分子特性出發,從而了解物種之間的生物系統發生的關系。通過序列同源性的比較進而了解基因的進化以及生物系統發生的內在規律。 越努力越幸運多序列比對的目的越努力越幸運多序列比對的應用:系統發育分析(phylogeneticanalysis)結構預測(structureprediction)序列基序鑒定(sequencemotifidentification)功能預測(functionprediction)ClustalW/ClustalX:一種全局的多序列比對程序,可以用來繪制親緣樹,分析進化關系。MEGA4越努力越幸運多序列比對的應用:越努力越幸運ClustalW/X的運行本地運行 命令行操作的ClustalW(linux&windows)窗口化操作的ClustalX(windows) 下載頁面:ftp://ftp.ebi.ac.uk/pub/software/歐洲生物學中心(EBI)還提供了ClustalW的網上運行服務(http://www.ebi.ac.uk/clustalw)越努力越幸運ClustalW/X的運行越努力越幸運·目標序列各種參數設定下載ClustalX越努力越幸運·目標序列各種參數設定下載ClustalX越努力越幸運Jalview結果下載越努力越幸運Jalview結果下載越努力越幸運越努力越幸運越努力越幸運上機實習3:本地運行ClustalX
17-RNASE1.fasta多序列比對(MultipleAlignment)越努力越幸運上機實習3:本地運行ClustalX
17-RNASE1.f在C:\zcni\shiyan1\clustalx1.83文件夾下,找到clustalx.exe雙擊打開越努力越幸運在越努力越幸運Clustalx窗口越努力越幸運Clustalx窗口越努力越幸運點擊File下拉菜單中Loadsequences選項,打開序列文件17-RNASE1.fasta.txt越努力越幸運點擊File下拉菜單中越努力越幸運打開后的界面越努力越幸運打開后的界面越努力越幸運點擊進行多序列比對越努力越幸運點擊進行多序列比對越努力越幸運可在Alignment下拉菜單中的AlignmentParameters中設定各個參數越努力越幸運可在Alignment下拉菜單中的AlignmentPar點擊Alignment下拉菜單中的DoCompleteAlignment進行比對越努力越幸運點擊Alignment下拉菜單中的DoCompleteA比對結果“*”、“:”、“.”和空格依次代表改位點的序列一致性由高到低越努力越幸運比對結果越努力越幸運MEGA4一個關于序列分析及比較統計的工具包包含距離建樹,MP等建
樹法自動或手動進行序列比對;推斷進化樹;估算分子進化率,進行進化假設測驗;聯機進行數據庫搜索;…越努力越幸運MEGA4一個關于序列分析及比較越努力越幸運MEGA4可以識別fasta格式文件將17-RNASE1.fasta.txt重命名為17-RNASE1.fasta越努力越幸運MEGA4可以識別fasta格式文件越努力越幸運選擇打開方式為MEGA4,打開17-RNASE1.fasta,自動跳出序列窗口用ClustalW做多序列聯配越努力越幸運選擇打開方式為MEGA4,打開17-RNASE1.fastaClustalW參數設置越努力越幸運ClustalW參數設置越努力越幸運越努力越幸運越努力越幸運以.meg格式保存結果越努力越幸運以.meg格式保存結果越努力越幸運回到MEGA主窗口激活所保存的文件(.meg)越努力越幸運回到MEGA主窗口越努力越幸運編輯標注保守區域標注不匹配的區域越努力越幸運編輯標注保守區域標注不匹配的區域越努力越幸運回到MEGA4主窗口構建進化樹已被激活的文件越努力越幸運回到MEGA4主窗口構建進化樹已被激活的文件越努力越幸運選擇Bootstrap重復次數,至少為100次越努力越幸運選擇Bootstrap重復次數,至少為100次越努力越幸運四種系統進化樹構建方法分化程度較大的遠緣序列:鄰位相連法(neighbor-joining,NJ)最小進化法(ME)分化程度較小的近緣序列:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 車輛盜搶險維修合同
- 臺州市永碩汽車部件有限公司年產2000萬套汽車零部件技改項目環評報告
- 沂南縣農戶綠色農資購買行為的影響因素研究
- 合同條款解讀
- 環境監測與治理服務合同
- 2025-2030年全球及中國競技場小游戲行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年健康保險行業發展分析及投資戰略研究報告
- 高科技設備進口與清關代理合同
- 年終績效領取協議書
- 廣告解除合同協議書
- 學校心理健康教育與家校合作的實踐研究
- T-GXAS 689-2024 重大基礎設施項目涉及風景名勝區選址論證報告編制技術規范
- GB/T 44971-2024土壤硒含量等級
- 中職心理健康第五課認識情緒管理情緒
- 足浴技師押金合同范例
- 2024下半年四川省中江縣事業單位招聘30人歷年管理單位遴選500模擬題附帶答案詳解
- 【MOOC】動物學-華中農業大學 中國大學慕課MOOC答案
- 大學本科生入學登記表(系統版)
- 足球鞋相關項目實施方案
- 信貸準入資格考試練習測試題附答案
- 名著閱讀:簡答、閱讀題(解析版)-2025年中考語文復習專練
評論
0/150
提交評論