




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
實驗三基因組序列分析第一頁,共四十七頁,2022年,8月28日實驗項目三:基因序列分析
一、實驗目的和要求:掌握基因可讀框的識別;掌握啟動子區域的預測掌握CpG島的預測掌握轉錄終止信號的預測采用mRNA序列預測基因:Spidey的使用掌握各預測服務器結果的分析第二頁,共四十七頁,2022年,8月28日原核生物基因結構1長開放閱讀框2高基因密度3簡單的基因結構4基因組中GC含量變化非常大特點:第三頁,共四十七頁,2022年,8月28日真核生物基因結構特點:1基因結構復雜2具有復雜的基因轉錄調控方式3具有豐富的可變剪接4有明顯的CpG島、密碼子使用具有偏好性第四頁,共四十七頁,2022年,8月28日基因組序列分析第五頁,共四十七頁,2022年,8月28日
例:WhatisGenePrediction?
GivenanuncharacterizedDNAsequence,findout:
1.Wheredoesthegenestartsandends?
2.Whichregionscodeforaprotein?
AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCgene1gene2gene3exonintergenicregionintron第六頁,共四十七頁,2022年,8月28日第七頁,共四十七頁,2022年,8月28日一開放讀碼框的識別開放讀碼框(openreadingframe,ORF)
是一段起始密碼子和終止密碼子之間的堿基序列ORF是潛在的蛋白質編碼區基因預測第八頁,共四十七頁,2022年,8月28日基因開放閱讀框/基因結構分析識別工具Getorfhttp://bioweb.pasteur.fr/seqanal/interfaces/getorf.htmlEMBOSS通用Plotorfhttp://bioweb.pasteur.fr/seqanal/interfaces/plotorf.htmlEMBOSS通用ORFFinder/gorf/gorf.htmlNCBI通用BestORF/all.htmSoftberry真核GENSCAN/GENSCAN.htmlMIT脊椎、擬南芥、玉米GeneFinder/tools/genefinder/Zhanglab人、小鼠、擬南芥、酵母FGENESH/all.htmSoftberry真核GeneMark/GeneMark/GIT原核GLIMMER/genomes/MICROBES/glimmer_3.cgi/software/glimmer
Maryland原核FgeneSB/all.htmSoftberry細菌FgeneSV/all.htmSoftberry病毒Generation/generation/ORNL原核FGENESH+/all.htmSoftberry原核GenomeScan
/genomescan.html
MIT脊椎、擬南芥、玉米GeneWise
http://www.ebi.ac.uk/Wise2/EBI人、蠕蟲GRAIL/grailexp/ORNL人、小鼠、擬南芥、果蠅第九頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結果分析第十頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結果分析第十一頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結果分析第十二頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結果分析第十三頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結果分析第十四頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結果分析Blast比對結果搜索到多個顯著相似的序列,故所預測的ORF的可信度較高。如果要獲取該ORF所編碼的蛋白質序列,可以點擊“Accept”按鈕后,在“1GenBank”的下拉框中選擇“3Fasta”,并點擊“view”,即可獲取該ORF所編碼的蛋白質序列。第十五頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結果分析第十六頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結果分析第十七頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結果分析第十八頁,共四十七頁,2022年,8月28日1.ORFFinder的使用及結果分析第十九頁,共四十七頁,2022年,8月28日提交序列提交序列文件運行GENSCAN選擇物種顯示氨基酸或CDS序列序列名稱(可選)是否顯示非最優外顯子2.Genscan的使用及結果分析第二十頁,共四十七頁,2022年,8月28日基因、外顯子及類型正鏈、負鏈預測單元起始、終止及長度相位編碼區打分值可信概率、得分值2.Genscan的結果分析第二十一頁,共四十七頁,2022年,8月28日3.FGENESH的使用及結果分析輸入序列的Fasta文件第二十二頁,共四十七頁,2022年,8月28日3.FGENESH的使用及結果分析起始外顯子中間及末端外顯子PolyA位點起始堿基終止堿基打分長度第二十三頁,共四十七頁,2022年,8月28日3.FGENESH的使用及結果分析第二十四頁,共四十七頁,2022年,8月28日3.FGENESH的使用及結果分析第二十五頁,共四十七頁,2022年,8月28日二.原核和真核生物基因轉錄起始位點上游區結構
原核生物真核生物TTGACATATAATAmRNA+1-10-35PyAPyTATAATGC區CAAT區mRNA+1-40-25-110增強子上游啟動子元件,UPE核心啟動子元件轉錄起始位點第二十六頁,共四十七頁,2022年,8月28日原核生物真核生物第二十七頁,共四十七頁,2022年,8月28日二.啟動子預測輸入序列的Fasta文件第二十八頁,共四十七頁,2022年,8月28日啟動子預測結果從預測結果可知,預測的啟動子區在32564至32783之間,啟動子閾值系統默認為53.00,預測的啟動子分值為84.69,高于閾值,分值越高,說明預測的準確性大。與該啟動子可能結合的轉錄因子如下所示第二十九頁,共四十七頁,2022年,8月28日三CpG島預測CpG島CpG島又稱為HTF島,是DNA上的一個區域,此區域富含GC,二者以磷酸酯鍵相連。位于真核生物基因轉錄起始位點上游,GC含>50%,長度>200bpCpG島常出現在管家基因或頻繁表達的基因的啟動子附近,在這些部位,CpG島具有阻止序列甲基化的作用,因此,搜索CpG島可以為基因及其啟動子的預測提供線索。CpGIsland分析CpGIsland/cpgislands2/cpg.aspxWebCpGfinder/berry.phtml?topic=cpgfinder&group=programs&subgroup=promoterWebCpGPlot/CpGReport/Isochorehttp://www.ebi.ac.uk/emboss/cpgplot/index.htmlWeb第三十頁,共四十七頁,2022年,8月28日輸入序列的Fasta文件第三十一頁,共四十七頁,2022年,8月28日從該序列的預測結果來看,找到兩個CpG島,分別位于501-727,長度為227個堿基,54380-54691,長度為312第三十二頁,共四十七頁,2022年,8月28日四轉錄終止信號加polyA信號:AAUAAA轉錄終止信號:GCrich二重對稱區、UUUUUUC-GC-GG-CG-CU-AG-CG-CC-GG-CUUUUUUUUURNA5’3’AAUAAACAAAAAAAAAAAAA成熟mRNA5’3’AAUAAACAGUmRNA前體5’3’第三十三頁,共四十七頁,2022年,8月28日第三十四頁,共四十七頁,2022年,8月28日轉錄終止信號預測Hcpolyar.it/~webgene/wwwHC_polya.htmlWebPOLYAH/berry.phtml?topic=polyah&group=programs&subgroup=promoterWebpolyadq/tools/polyadq/polyadq_form.htmlWeb第三十五頁,共四十七頁,2022年,8月28日POLYAH的使用及結果分析輸入序列的Fasta文件第三十六頁,共四十七頁,2022年,8月28日POLYAH的使用及結果分析預測的POLYA位點,LDF為權重第三十七頁,共四十七頁,2022年,8月28日內含子/外顯子剪切位點識別對基因組序列的讀碼框區域進行預測內含子5’端供體位點(donorsplicesite):GT內含子3’端受體位點(acceptorsplicesite):AG預測工具:GENSCAN,GENEMARKNetGene2,SpliceView第三十八頁,共四十七頁,2022年,8月28日第三十九頁,共四十七頁,2022年,8月28日mRNA剪切位點識別:spideyNCBI開發的在線預測程序用于mRNA序列同基因組序列比對分析第四十頁,共四十七頁,2022年,8月28日第四十一頁,共四十七頁,2022年,8月28日序列在線提交形式:界面中有兩個窗口:上方窗口用于輸入基因組序列(直接粘貼序列或用GenbankID/AC號)下方窗口用于輸入cDNA/mRNA序列(直接粘貼序列或用GenbankID/AC號)可同時輸入多條cDNA/mRNA序列與同一條基因組序列進行分析Spidey序列提交頁面輸入基因組序列或序列數據庫號AC002390.1第四十二頁,共四十七頁,2022年,8月28日輸入相似mRNA序列判斷用于分析的序列間的差異,并調整比對參數不受默認內含子長度限制,默認長度:內部內含子為35kb,末端內含子為100kb輸出格式比對閾值選擇物種第四十三頁,共四十七頁,2022年,8月28日第一條藍色序列為基因組序列,橘黃色為外顯子第四十四頁,共四十七頁,2022年,8月28日外顯子對應于基因組上的起始/結束位置外顯子對應于mRNA/cDNA上的起始/結束位置供體、受體位點外顯子序號外顯子長度一致性百分比錯配和gap第四十五頁,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 童車類產品安全性能提升技術考核試卷
- 生活初三語文作文600字
- 硅冶煉廠的工藝流程設計考核試卷
- 橡膠制品的品牌形象與品牌推廣策略研究考核試卷
- 玻璃纖維增強塑料的機械性能優化設計考核試卷
- 家電配件的精密加工與測量技術考核試卷
- 小學一年級數學20以內進位、退位加減法口算
- 造口并發癥及處理 2
- 四川成都實驗外國語2023-2024學年高一下學期期中考試數學試題【含答案】
- 血液透析及并發癥護理 2
- 銀行承兌匯票培訓-課件
- AB 753變頻器簡單操作培訓(參數拷貝)
- JGJ59-2011建筑施工安全檢查評分表-(完整版)
- 梁思成《千篇一律與千變萬化》(課件)
- 《分子生物學》復習考試題庫(帶答案)
- 阿育吠陀體質測試
- 智能汽車傳感器技術-激光雷達
- 2023年四年級奧林匹克英語競賽試題
- 專利挖掘與技術交底書撰寫
- 輸液泵、微量泵的使用
- 35kv電纜敷設施工方案正式版
評論
0/150
提交評論