




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一部分 理論講解(第一次課 及第二次課第一節(jié))第二部分 上機(jī)實(shí)習(xí)(第二次課 第二、三節(jié))第一部分 理論講解What is bioinformatics?What is bioinformatics? 生物信息學(xué)(Bioinformatics)是一門(mén)新興的交叉學(xué)科,是一個(gè)涉獵內(nèi)容十分廣泛的學(xué)科領(lǐng)域。沒(méi)有生物學(xué)、物理學(xué)、數(shù)學(xué)、計(jì)算機(jī)學(xué)等學(xué)科就不可能有生物信息學(xué)。生物信息學(xué)是研究相關(guān)生物信息的獲取、加工、儲(chǔ)存、分配、分析和注釋的科學(xué)。Bioinformatics is:driven by the generation of data, moderated by hardware and analy
2、sis methodsComputing powerData generation platformsAnalysis methods生物信息的開(kāi)發(fā)和應(yīng)用以核酸蛋白質(zhì)等生物大分子為主要研究對(duì)象以信息、數(shù)理、計(jì)算機(jī)科學(xué)為主要研究手段以計(jì)算機(jī)網(wǎng)絡(luò)為主要研究環(huán)境以計(jì)算機(jī)軟件為主要研究工具對(duì)序列數(shù)據(jù)進(jìn)行存儲(chǔ)、管理、注釋、加工對(duì)各種數(shù)據(jù)庫(kù)進(jìn)行查詢、搜索、比較、分析構(gòu)建各種類型的專用數(shù)據(jù)庫(kù)信息系統(tǒng)研究開(kāi)發(fā)面向生物學(xué)家的新一代計(jì)算機(jī)軟件Examples of BioinformaticsDatabase interfacesGenbank/EMBL/DDBJ, Medline, SwissProt, PDB
3、, Sequence alignmentBLAST, FASTAMultiple sequence alignmentClustal, MultAlin, DiAlignGene findingGenscan, GenomeScan, GeneMark, GRAILProtein Domain analysis and identificationpfam, BLOCKS, ProDom, Pattern Identification/CharacterizationGibbs Sampler, AlignACE, MEMEProtein Folding predictionPredictPr
4、otein, SwissModelerFive websites that all biologists should knowNCBI (The National Center for Biotechnology Information;/EBI (The European Bioinformatics Institute)http:/www.ebi.ac.uk/The Canadian Bioinformatics Resourcehttp:/www.cbr.nrc.ca/SwissProt/ExPASy (Swiss Bioinformatics Resource)http:/expas
5、y.cbr.nrc.ca/sprot/PDB (The Protein Databank)/PDB/Half day on the web,half month in the lab.saves you- Alan BleasbyDNA結(jié)構(gòu)的發(fā)現(xiàn)與“人類基因組計(jì)劃”的完成使“基因組時(shí)代” 成為現(xiàn)實(shí)“The genomic era is now a reality”! F. Collins 元素周期表的發(fā)現(xiàn)奠定了二十世紀(jì)物理、化學(xué)研究和發(fā)展的基礎(chǔ)元素周期表“基因組序列圖”將奠定二十一世紀(jì)生命科學(xué)研究和生物產(chǎn)業(yè)發(fā)展的基礎(chǔ)! “基因組”生命科學(xué)的“元素周期表”人體解剖圖奠定了現(xiàn)代醫(yī)學(xué)發(fā)展的基礎(chǔ)生命的
6、奧秘蘊(yùn)藏于 “四字天書(shū)”之中GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCA TCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCT CCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTC GCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT 基因(決定某種性狀的DNA片斷)基因轉(zhuǎn)移技術(shù)現(xiàn)代生物技術(shù)“找”基因 “玩”基因“用”基因(健康、農(nóng)業(yè)、工業(yè)、 環(huán)境、安全) “知”基因產(chǎn)品發(fā)現(xiàn)基因的一般過(guò)程 從序列中發(fā)現(xiàn)基因可以理解為基因區(qū)域預(yù)測(cè)和基因功能預(yù)測(cè)2個(gè)層次第一步
7、:獲取DNA目標(biāo)序列 如果你已有目標(biāo)序列,可直接進(jìn)入第2步; 可通過(guò)PubMed查找你感興趣的資料;通過(guò) GenBank或EMBL等數(shù)據(jù)庫(kù)查找目標(biāo)序列第二步:查找ORF并將目標(biāo)序列翻譯成蛋白質(zhì)序列 利用相應(yīng)工具,如ORF Finder、Gene feature(Baylor College of Medicine)、GenLang(University of Pennsylvania)等,查找ORF并將DNA序列翻譯成蛋白質(zhì)序列第三步:在數(shù)據(jù)庫(kù)中進(jìn)行序列搜索 可以利用BLAST進(jìn)行ORF核苷酸序列和ORF翻譯的蛋白質(zhì)序列搜索第四步:進(jìn)行目標(biāo)序列與搜索得到的相似序列的整體對(duì)比(global al
8、ignment) 雖然第三步已進(jìn)行局部(序列)對(duì)比(local alignment)分析,但整體對(duì)比有助于進(jìn)一步加深目標(biāo)序列的認(rèn)識(shí) 第五步:查找基因家族 進(jìn)行多序列對(duì)比(multiple sequence alignment)和獲得列線區(qū)段的可視信息。可分別在AMAS(Oxford University)和BOXSHADE(ISREC,Switzerland)等服務(wù)器上進(jìn)行第六步:查找目標(biāo)序列中的特定模序 分別在Procite、BLOCK、Motif數(shù)據(jù)庫(kù)進(jìn)行profile、模塊(block)、模序(motif)檢索; 對(duì)蛋白質(zhì)序列進(jìn)行統(tǒng)計(jì)分析和有關(guān)預(yù)測(cè)第七步:預(yù)測(cè)目標(biāo)序列結(jié)構(gòu) 可以利用Pre
9、dictProtein(EMBL)、NNPREDICT(University of California)等預(yù)測(cè)目標(biāo)序列的蛋白質(zhì)二級(jí)結(jié)構(gòu)第八步:獲取相關(guān)蛋白質(zhì)的功能信息 為了了解目標(biāo)序列的功能,收集與目標(biāo)序列和結(jié)構(gòu)相似蛋白質(zhì)的功能信息非常必要。可利用PubMed進(jìn)行搜索第九步:把目標(biāo)序列輸入“提醒”服務(wù)器 如果有與目標(biāo)序列相似的新序列數(shù)據(jù)輸入數(shù)據(jù)庫(kù),提醒(alert)服務(wù)會(huì)向你發(fā)出通知。可選用Sequence Alerting(EMBL)、Swiss-Shop(Switzerland)等服務(wù)器核苷酸序列分析基因編碼區(qū)組分分析GC含量/Codon bias引物設(shè)計(jì)限制性核酸內(nèi)切酶位點(diǎn)預(yù)測(cè)基因編碼
10、區(qū)結(jié)構(gòu)分析基因結(jié)構(gòu)分析選擇性剪切分析/SNP分析基因調(diào)控區(qū)域分析蛋白質(zhì)序列分析蛋白質(zhì)一級(jí)序列蛋白質(zhì)理化性質(zhì)分析蛋白質(zhì)二級(jí)結(jié)構(gòu)蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)序列信號(hào)位點(diǎn)分析蛋白質(zhì)超二級(jí)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)域分析蛋白質(zhì)三級(jí)結(jié)構(gòu)蛋白質(zhì)三維結(jié)構(gòu)模擬序列比對(duì)序列比對(duì)注釋多序列比對(duì)系統(tǒng)發(fā)育分析系統(tǒng)發(fā)育分析DNAstar ProductsLasergene - Sequence Analysis (1982) GenVision - Publication Quality Graphics (2000)ArrayStar - Microarray Gene Expression Analysis (2005)Overv
11、iew DNASTAR products are used by researchers in more than 65 countries and in every state in the United States. Their products are used by scientists in every major pharmaceutical company, the top biotech companies and most major research academic institutes. Founded 1982DNASTAR was founded by Profe
12、ssor of Genetics Frederick Blattner and his Computer Scientist colleague John Schroeder 26 years ago. DNASTARs mission then was the same as it is today: to provide life scientists with the computing tools they need for sequence analysis. In the early years, the product was written for the CPM operat
13、ing system. When the IBM personal computer appeared, a DOS version of our software soon followed. With the advent of Compact Discs, DNASTAR was the first to offer the GenBank database on CD; hence the name Lasergene. FunctionLasergene is a comprehensive suite of easy-to-use sequence analysis softwar
14、e for Windows and Macintosh. Lasergenes analysis tools include alignments, contig assembly, gene discovery, primer design, restriction mapping, protein structure predictionTechnical Requirements Lasergene 7.2 for Windows Windows Vista, XP SP2 or 2000 Intel compatible Pentium class processor 128 MB R
15、AM* 90 MB of available hard-disk space CD-ROM drive (unless downloaded) Internet access (required to authorize) DNASTAR軟件包版本5.03版本(適合win98/Me)EditSeq、GeneQuest、MapDraw、MegAlign、PrimerSelect、Protean、SeqMan5.08版本(適合各個(gè)系統(tǒng))EditSeq、GeneQuest、MapDraw、MegAlign、PrimerSelect、Protean、SeqMan6.*版本(適合WinXP/Win200
16、0)(含6.00/6.13版本)EditSeq、GeneQuest、SeqBuilder、MegAlign、PrimerSelect、Protean、SeqMan7.*版本(適合WinXP及以上版本)(含7.0/7.1/7.2版本)EditSeq、GeneQuest、SeqBuilder、MegAlign、PrimerSelect、Protean、SeqMan pro8.0版本(適合Windows Vista and XP )EditSeq、GeneQuest、SeqBuilder、MegAlign、PrimerSelect、Protean、SeqMan proEditSeqEdit and
17、import sequences and annotations Translate, back-translate and reverse complement sequences Locate ORFs and create annotations Cut/paste sequence with inclusive annotations EditSeq included with all systemsGeneQuest Discover and annotate genes Predict coding regions and splice sites Locate repeats,
18、patterns, or areas matching known sequence data Simulate agarose gel electrophoresisMapDrawLocate restriction sites Create six types of linear and circular maps View all six reading frames with sites and featuresMegAlign Align DNA and protein sequences Perform pairwise, multiple and dotplot alignmen
19、ts Create phylogenetic trees Generate subalignments Customize alignment displaysPrimerSelect Design primers or compare your own primers against a sequence template Analyze primers for hairpins and dimers View the consequences of primer mutationsProtean Predict protein structures View PAGE simulation
20、s Analyze physico-chemical properties Display results graphicallySeqManAssemble sequences Trim poor data and remove vector Manage and order contigs Locate potential SNPs Visualize traces and compare two consensus callsDNASTAR Lasergene software(7.*版本)consists of an integrated suite of seven modules
21、that can be purchased in any combination. The modules of Lasergene are: SeqBuilder - visualization and sequence editing SeqMan Pro - sequence assembly and SNP discovery MegAlign - sequence alignment PrimerSelect - oligo primer design Protean - protein structure analysis & prediction GeneQuest - gene
22、 finding EditSeq - utility for importing unusual file typesDNASTAR軟件包(5.*版本)EditSeq GeneQuest MapDraw PrimerSelect MegAlign Protean SeqMan一、EditSeq EditSeq是能夠迅速、正確地輸入,并且修改DNA 或蛋白質(zhì)序列工具。每個(gè)EditSeq 文件都可以分為三個(gè)可編輯的部分,上邊的一部分為序列文件,中間的一部分里是評(píng)論,底部是序列的注釋。Sequence EntryEditSeq能讀取大部分的序列格式包括FASTA,GenBank,ABI、GCG 和A
23、SCII 格式。可以使用菜單命令或拖拽方式輸入序列文件。另外,序列也許通過(guò)使用鍵盤(pán)輸入,或者從其他地方復(fù)制、粘貼得到。Editing and Analysis 序列被打開(kāi)后,EditSeq 能使用標(biāo)準(zhǔn)或者指定的遺傳密碼進(jìn)行翻譯,或者反翻譯,尋找開(kāi)放讀框,還可以進(jìn)行閱讀校對(duì)。另外,EditSeq能以GenBank,F(xiàn)ASTA 和GCG格式輸出序列。1.打開(kāi)已有序列在Windows里打開(kāi)“contig3.seq”。從文件菜單(FILE MENU),選擇Open。打開(kāi)文件夾單擊選定序列“contig3.seq”。 當(dāng)EditSeq窗口打開(kāi)時(shí),序列長(zhǎng)度顯示在右上角。Open序列長(zhǎng)度2.序列的堿基組成分
24、析File下拉菜單的import選項(xiàng)導(dǎo)入,open選項(xiàng)打開(kāi)。Edit下拉菜單的select all選項(xiàng)選中全部堿基goodies下拉菜單的dna statistics選中出結(jié)果dna statisticsselect allG+C3.尋找開(kāi)放讀框 在這一部分中,我們將確定序列中的ORF開(kāi)放閱讀框(open reading frame, ORF)。從SEARCH MENU 找到ORF,點(diǎn)擊打開(kāi)會(huì)出現(xiàn)下邊的對(duì)話框。單擊Find Next 尋找第一個(gè)ORF 的位置。繼續(xù)點(diǎn)擊Find Next 直到你把ORF的位置選定在某一位置,ORF的坐標(biāo)會(huì)出現(xiàn)在EditSeq 窗口的頂端附近。Orf菜單ORF附:
25、開(kāi)放閱讀框的鑒定開(kāi)放閱讀框(open reading frame, ORF)的鑒定是基因組注釋中一項(xiàng)非常重要且必不可少的工作。 完成這一工作可以有多種現(xiàn)成軟件可供借助,例如NCBI網(wǎng)站中的ORF finder就是其中之一(/gorf/gorf.html)。 ORF的鑒定是根據(jù)起始密碼和終止密碼來(lái)進(jìn)行的。在輸入分析序列之后,有幾個(gè)分析參數(shù)需要選擇: 一是根據(jù)序列的物種來(lái)源選擇遺傳密碼,數(shù)據(jù)庫(kù)中共有22套不同物種的遺傳密碼可供選擇。比如標(biāo)準(zhǔn)碼選“1”,細(xì)菌碼選“11”。二是限定最短O(píng)RF的長(zhǎng)度。默認(rèn)值是100,這時(shí)給出的結(jié)果中都是大于100個(gè)核苷酸的ORFs。這就是說(shuō)作為基因的ORF很少是小于10
26、0個(gè)核苷酸的,但在實(shí)際中可能會(huì)有例外,特別是編碼一些小肽的基因。輸入序列選擇編碼ORFs分析結(jié)果的報(bào)告表Frame from to lenth -3 25457 28627 3171 -1 38575 40692 2118 +1 13465 15174 1710 +2 5270 6394 1125 -2 32736 34277 1542 +3 19032 19592 561 在分析結(jié)果的報(bào)告中,將會(huì)給出6框(six frame)分析結(jié)果。 由此可見(jiàn),從報(bào)告結(jié)果中,可以知道各ORF的起、止點(diǎn)和它們位于哪一條鏈上以及是第幾框分析的結(jié)果。值得注意的是,不同軟件中如果使用不同檢索參數(shù),如使用的起始密碼
27、子(ATG, GTG, TTG)或終止密碼子(TGA, TAA, TAG)不同,輸出的結(jié)果將有一定差異。基因開(kāi)放閱讀框/基因結(jié)構(gòu)分析識(shí)別工具Getorfhttp:/bioweb.pasteur.fr/seqanal/interfaces/getorf.htmlWeb/LinuxPlotorfhttp:/bioweb.pasteur.fr/seqanal/interfaces/plotorf.htmlWeb/LinuxORF Finder /gorf/gorf.html WebBestORF/all.htmWebGENSCAN/GENSCAN.htmlWeb/LinuxGeneMarkhttp:
28、/www.ebi.ac.uk/genemark/ /GeneMark/WebGene Finder/tools/genefinder/(Dr. Michael Zhang )WebFGENESH/all.htmWeb/LinuxGlimmerM/tdb/glimmerm/glmr_form.html LinuxFgeneSB/ FgeneSV/all.htmWebGeneration /generation/WebGeneBuilder r.it/webgene/genebuilder.html WebFGENESH+ /+/all.htm Web/LinuxGenomeScan /genom
29、escan.html WebGeneWise http:/www.sanger.ac.uk/Software/Wise2/ WebGRAIL/grailexp/Web/Linux/WindowsBCM Gene Finder/seq-search/gene-search.htmlWeb基因開(kāi)放閱讀框/基因結(jié)構(gòu)分析工具對(duì)基因組序列的讀碼框區(qū)域進(jìn)行預(yù)測(cè)NNSplice/seq_tools/splice.htmlWeb Splice Viewr.it/webgene/wwwspliceview.htmlWeb NetGene2http:/www.cbs.dtu.dk/services/NetGene
30、2/WebSPL/SPLM/RNASPL/FSPLICE/all.htmWebGeneSplicer/tdb/GeneSplicer/gene_spl.htmlWeb/LinuxMZEFSpliceProximalCheckhttp:/www.ebi.ac.uk/thanaraj/MZEF-SPC.htmlhttp:/corba.ebi.ac.uk/cgi-bin/sp/wrapper.cgiWebSplicePredictor/cgi-bin/sp.cgiWeb分析mRNA/cDNA的外顯子組成GeneSeqer/cgi-bin/gs.cgi Web/LinuxSpidey/spideyWe
31、bPROT_MAP/berry.phtml?topic=prot_map&group=programs&subgroup=xmapWeb Sim4http:/gamay.univ-perp.fr/analyse_seq/sim4/Web/LinuxBLAT/kent/src/unzipped/blat/LinuxBLAST/BLAST/ExecutablesWeb/Windows/LinuxFASTA/pub/fasta/win32_fasta/fasta34t21b5d.zipWeb/Windows/Linux核苷酸序列綜合分析軟件GeneBuilderr.it/webgene/genebu
32、ilder.htmlDNA Toolhttp:/www.crc.dk/dnatools/downloads/setup/dt6_setup.exeSEQtoolshttp:/www.seqtools.dk/DNAssist/dnassist20.zipGeneTool / DNAman/pc/framepc.htmlDNA Strider/downloads/dnastrider1_1_sit.bin pDRAW32/GCG/products/gcg/基因探索者/DNASTAR/Vector NTI Sequence assembly Sequence manipulation Homolog
33、y comparison Multiple alignmentGene structure analysis Primer/Oligo analysis Restriction analysis Codons analysis4.DNA序列翻譯 對(duì)ORF 進(jìn)行翻譯,當(dāng)然任何序列中的讀框內(nèi)部分(三聯(lián))都可以用下面的方法進(jìn)行翻譯。選定ORF,從GOODIES MENU 菜單中選擇翻譯(Translate)。翻譯的蛋白質(zhì)序列出現(xiàn)在一個(gè)新的未命名窗口中(如下圖)。它是使用標(biāo)準(zhǔn)的遺傳密碼翻譯的。Translate分子量等電點(diǎn)5. 密碼子使用偏嗜性分析20種氨基酸各有其特定的密碼子,許多氨基酸具有多個(gè)密碼
34、子,這種現(xiàn)象稱為簡(jiǎn)并密碼。 對(duì)于存在于不同物種體內(nèi)的同一個(gè)蛋白質(zhì),盡管它們氨基酸序列相同,但在基因水平上,核苷酸序列可能不一樣。 對(duì)密碼子使用的偏嗜性是物種的特征。對(duì)基因組中某些基因的密碼子偏嗜性進(jìn)行統(tǒng)計(jì)分析,有可能揭示微生物基因組中通過(guò)水平轉(zhuǎn)移而獲得的基因。 導(dǎo)入基因(ORFs)序列Edit下拉菜單的select all選項(xiàng)選中全部堿基goodies下拉菜單的Translate DNA選中出結(jié)果6.序列的反向互補(bǔ)及反向轉(zhuǎn)換 下面的步驟可以用于反向測(cè)定的序列的正確輸入。選定序列。從GOODIES MENU 菜單,選反向互補(bǔ)序列(Reverse Complement),或者把序列顛倒過(guò)來(lái)(Rev
35、erse Sequence)命令,則被選定的序列就被翻轉(zhuǎn)互補(bǔ)或翻轉(zhuǎn)過(guò)來(lái)了。原序列反向互補(bǔ)序列反向轉(zhuǎn)換序列7.序列的保存與輸出首先創(chuàng)建一個(gè)用于保存的序列。從文件菜單,選New中的New DNA,或者New Protein。將序列寫(xiě)入出現(xiàn)的窗口。如果你輸入非法字符,計(jì)算機(jī)會(huì)發(fā)出警告。然后,我們將序列保存為EditSeq文件:從文件菜單,選Save。選定保存位置。給序列命名。單擊保存則可。以GenBank或GCG格式保存序列:從文件菜單,選Export。選定保存位置。為sequence(s)選格式。給sequence(s)命名。單擊保存則可。以FASTA格式保存序列:從文件菜單,選Export(1個(gè)
36、序列),或者Export All As One(多個(gè)序列)。當(dāng)使用Export All As One的時(shí)候,如果DNA和蛋白質(zhì)文件同時(shí)存在,激活窗口的序列類型與你保存的類型是一致的。EditSeq僅僅將寫(xiě)入的序列保存為FASTA格式。選定保存位置。選FASTA格式。給sequence(s)命名。單擊保存則可。二、GeneQuest GeneQuest可以發(fā)現(xiàn)和注釋DNA序列中的基因,并幫助操作生物學(xué)所關(guān)心的DNA的其他feature:包括ORFS、拼接點(diǎn)連接,轉(zhuǎn)錄因子結(jié)合位點(diǎn)、重復(fù)序列、限制性內(nèi)切酶酶切位點(diǎn)等。通過(guò)應(yīng)用 “methods” 到序列,序列的 feature 可以以圖形的形式展示出
37、來(lái)。你可以在序列上注釋任何你發(fā)現(xiàn)的feature 。Sequence Entry GeneQuest能直接打開(kāi)DNASTAR,ABI和GenBank文件。其他格式的序列文件也可以使用EditSeq改為DNASTAR格式。如果你知道Genbank序列的登錄號(hào)或名稱,你可以直接打開(kāi)序列。GeneQuest的DNA分析方法 打開(kāi) GeneQuest文件后,下一步是選擇應(yīng)用方法。應(yīng)用方法后,結(jié)果的圖形顯示可以幫助你了解序列上感興趣的features。打開(kāi)序列后,你會(huì)發(fā)現(xiàn)只有幾種方法應(yīng)用后的結(jié)果展示在窗口內(nèi)。在這一部分中,我們將學(xué)習(xí)如何把其它方法用于我們序列的分析。Title給文件取名。Ruler在文件
38、中加入標(biāo)尺。Sequence顯示文件中的序列。Patterns-Matrix方法的運(yùn)算參數(shù)。Patterns-Signal轉(zhuǎn)錄因子結(jié)合位點(diǎn)數(shù)據(jù)庫(kù)。Patterns-Type-In Patterns使用鍵盤(pán)輸入運(yùn)算所需的Pattern參數(shù)。Repeats-Inverted Repeats尋找反向重復(fù)序列。Repeats-Dyad Repeats尋找Dyad重復(fù)和palindromes。Repeats-Direct Repeats尋找正向重復(fù)序列。Gene Finding - DNA Finder在打開(kāi)的DNA序列中尋找指定DNA序列。分別顯示正義鏈和反義鏈的尋找結(jié)果。Gene Finding -
39、 Protein Finder在打開(kāi)的蛋白質(zhì)序列中尋找指定DNA序列的翻譯序列。顯示結(jié)果為全部6個(gè)讀框。Enzymes-Restriction Map用DNASTAR酶目錄中的酶分析打開(kāi)的序列,并以圖形方式展示。Coding Prediction - Borodovsky用Borodovskys Markov方法來(lái)識(shí)別潛在的基因編碼區(qū),并以圖形方式展示。Coding Prediction - Starts Stops ORFs根據(jù)指定的ORFs的最小長(zhǎng)度,尋找可能的開(kāi)放讀框,可以選擇是否需要起始密碼子。讀框的起始和中止點(diǎn)分別展示。Coding PredictionLocal Compositi
40、onal Complexity根據(jù)Shannon信息學(xué)原理尋找有基因編碼提示信息的區(qū)域。Base Contents-Base Distribution序列上4種堿基、A+T和G+C的頻率、分布,以及AT和gc分布區(qū)域。Bent DNA - Bending IndexDNA折疊預(yù)測(cè)。1.用分析方法操作調(diào)用新的GeneQuest方法的步驟是:從More Methods中選擇方法,加入方法簾(method curtain),待方法運(yùn)行完畢后,選擇性的拖取結(jié)果放入分析界面(assay surface)即可(見(jiàn)下頁(yè))。我們使用Bent DNA -Bending Index方法進(jìn)行分析。從ANALYSIS
41、 MENU選擇Show Available Methods可以打開(kāi)方法簾,也可以通過(guò)拖動(dòng)分析界面左上角的小環(huán)打開(kāi)方法簾。方法簾中包括已經(jīng)用于分析的全部方法。拖動(dòng)小環(huán)下拉菜單你將注意到方法簾沒(méi)有Bent DNA - Bending Index method。在方法簾的頂端,點(diǎn)擊More Methods打開(kāi)一個(gè)下拉菜單,其中有可以用于分析的所有方法,點(diǎn)擊Bent DNA - Bending Index method,該方法就進(jìn)入了方法簾。若查看方法簾中的方法是否已經(jīng)被應(yīng)用,點(diǎn)擊其右邊的三角形。如果圖標(biāo)前有數(shù)字表明該方法已經(jīng)使用,數(shù)字表示應(yīng)用的次數(shù)。因?yàn)槲覀冞€沒(méi)有應(yīng)用Bent DNA - Bendi
42、ng Index,所以點(diǎn)擊三角形,會(huì)發(fā)現(xiàn)圖標(biāo)前沒(méi)有數(shù)字。點(diǎn)擊白顏色的位置去除對(duì)圖標(biāo)的選擇。單擊選定“Bend Region,”,將其拖到分析界面,釋放鼠標(biāo)。序列中可能會(huì)折疊的區(qū)域就會(huì)以小盒子的形式顯示出來(lái)。2.以RNA折疊形式查看序列的一部分選定目的序列,在ANALYSIS MENURNA菜單中選擇Fold as RNA命令。Fold as RNA附:tRNA基因檢索 tRNA有特殊的“三葉草”結(jié)構(gòu)特征,通常具有“四環(huán)”(二氫尿嘧啶核苷環(huán)即DHU環(huán),反密碼子環(huán),額外環(huán)及TC環(huán)),三柄(DHU柄,反密碼子柄,TC柄),兩臂(可變臂及氨基酸臂),且氨基酸臂的端均為“-C-C-A-OH”結(jié)構(gòu)。 有眾
43、多分析軟件可以完成,在法國(guó)Pasteur 實(shí)驗(yàn)室網(wǎng)站(http:/bioweb.pasteur.fr/seqanal/),選擇Fast tRNA analysis method 可以完成這一工作。 利用DNAStar軟件中的GeneQuest還可進(jìn)行tRNA的二級(jí)結(jié)構(gòu)折疊模擬。 輸入序列再附:tRNA基因檢索Lowe LabtRNAscan-SE Search ServerSearch for tRNA genes in genomic sequence網(wǎng)站:(/tRNAscan-SE/)輸入序列運(yùn)行3.序列酶切,模仿agarose凝膠電泳判定大小打開(kāi)方法簾(method curtain)。從
44、More Methods中選擇Enzymes - Restriction Map 加入方法簾。單擊圖標(biāo)左邊的藍(lán)色三角形,打開(kāi)內(nèi)切酶一覽表。注意方法簾僅僅顯示那些最少切割一次DNA序列的酶。剛打開(kāi)酶一覽表時(shí),所有的酶都被選中了,在空白處單擊一下去除選定。拖入右側(cè)選定特定的酶,拖入分析界面,即可以看見(jiàn)該酶的酶切位點(diǎn)在序列上的位置。從SITES & FEATURES MENU菜單選擇Agarose Gel Simulation。新窗口即顯示酶切片段在electrophoretic的分離情況(如圖)。ESS(始點(diǎn))E(終點(diǎn))單切點(diǎn)限制性內(nèi)切酶X將環(huán)狀基因組切成1個(gè)片段 單切點(diǎn)限制性內(nèi)切酶X將 線性基因
45、組切成2個(gè)片段 噬菌體線性基因組的確定限制性內(nèi)切酶 Aat酶切噬菌體基因組的電子與實(shí)際圖譜MPaP25100bp43783bpA38626bp5157bpB4.保存分析文件從文件菜單,選保存。選定文件的保存位置,給文件命名。單擊保存。你所應(yīng)用和展示的所有信息都會(huì)被保存。三、MapDraw根據(jù)實(shí)驗(yàn)設(shè)計(jì),分析和實(shí)驗(yàn)結(jié)果的展示需要的不同,MapDraw可以制作6種類的酶切圖。從簡(jiǎn)單的線性圖到有注釋的環(huán)形圖,在展示限制性酶切位點(diǎn)的同時(shí),還可以同時(shí)展示序列的feature ,六個(gè)讀框及其翻譯結(jié)果。 你可以按照位置、酶切頻率等來(lái)排列你的酶切位點(diǎn)。另外,你可以用手工選任何酶切位點(diǎn)的結(jié)合。酶切位點(diǎn)過(guò)濾器(fi
46、lters)也可以聯(lián)合使用。MapDraw工具能使你規(guī)劃酶切位點(diǎn)和克隆實(shí)驗(yàn),產(chǎn)生詳細(xì),充分地結(jié)果概括。1.新酶切圖制作 我們以一段DNA序列Demo Sequences 文件夾下的“tethis21.seq”為例。首先我們尋找能夠切割其序列的酶切位點(diǎn)。從文件菜單選擇New打開(kāi)右邊的對(duì)話框。打開(kāi)“Demo Sequences”文件夾。雙擊打開(kāi)TETHIS21.seq(見(jiàn)下)。2.過(guò)濾器類型 過(guò)濾器(filter)是你定義的可以使用的酶切位點(diǎn)的集合。在你自定義過(guò)濾器之前,所有酶切位點(diǎn)都會(huì)用于序列分析。你可以用和或來(lái)組合過(guò)濾器。MapDraw內(nèi)置的過(guò)濾器如下:Overhang過(guò)濾器是根據(jù)一套你定義的
47、 Overhang準(zhǔn)則歸類的酶切位點(diǎn)。這些準(zhǔn)則包括3和5端突出,與別的酶切位點(diǎn)互補(bǔ)以及兼并的末端突出。在克隆試驗(yàn)中,可以使用這個(gè)過(guò)濾器尋找互補(bǔ)末端。頻率(Frequency)過(guò)濾器是指根據(jù)出現(xiàn)于指定的范圍序列上的頻率歸類的酶切位點(diǎn)。我們下面將使用這個(gè)過(guò)濾器型。種類和復(fù)雜性過(guò)濾器(Class & Complexity)是根據(jù)酶切位點(diǎn)種類歸類的酶切位點(diǎn)。這些種類包括:I型(隨機(jī))或II型(明確),或者I型+II型。這過(guò)濾器也可以根據(jù)位點(diǎn)復(fù)雜性、價(jià)錢(qián)和來(lái)源進(jìn)行歸類。手動(dòng)選擇過(guò)濾器(Manual Pick)允許你按需要選定酶切位點(diǎn)。在隨后的一部分中,我們學(xué)習(xí)使用手動(dòng)選擇過(guò)濾器的方法。3.頻率過(guò)濾器應(yīng)用 首先讓我們用頻率過(guò)濾器來(lái)刪除任何大于兩次切割我們序列的酶。從ENZYME MENU,選New Filter,然后Frequency打開(kāi)參數(shù)對(duì)話框。在Min和Max對(duì)應(yīng)的框中輸入數(shù)字1和2,其他的參數(shù)不變。這個(gè)設(shè)定將我們序列中切割多于兩次的位點(diǎn)自動(dòng)刪除。在過(guò)濾器名字框中,輸入“Two-cuts-max.”。單擊Apply將過(guò)濾器用于序列分析然后OK退出參數(shù)對(duì)話框。你將注意到在圖上酶切位點(diǎn)的數(shù)目現(xiàn)在大大地減少了。4.應(yīng)用手動(dòng)過(guò)濾器 應(yīng)用手動(dòng)過(guò)濾器,還可以挑
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年科學(xué)教育與科技創(chuàng)新考核試題及答案
- 2025年跨境電商從業(yè)資格考試試卷及答案
- 快遞轉(zhuǎn)租合同協(xié)議書(shū)模板
- 快餐合作經(jīng)營(yíng)協(xié)議書(shū)范本
- 商會(huì)水泥銷售合同協(xié)議
- 總代理合作合同協(xié)議
- 2025年中華人民共和國(guó)國(guó)家房屋租賃合同標(biāo)準(zhǔn)文本
- 德邦物流聘用合同協(xié)議
- 品牌合作協(xié)議書(shū)合同協(xié)議
- 民宿分割銷售合同協(xié)議
- 2024年江蘇省高考政治試卷(含答案逐題解析)
- 配電箱巡檢表
- 培訓(xùn)調(diào)查問(wèn)卷分析報(bào)告
- 肝癌肝移植中國(guó)指南解讀
- DB11-T 1894-2021 10kV及以下配電網(wǎng)設(shè)施配置技術(shù)規(guī)范
- 2024版年度中華人民共和國(guó)傳染病防治法
- 后廚崗位招聘筆試題及解答(某大型央企)2025年
- 2024人教版初中九年級(jí)數(shù)學(xué)上冊(cè)第二十二章二次函數(shù)大單元整體課時(shí)教學(xué)設(shè)計(jì)
- 高血鈣癥的遺傳易感性研究
- 2023年版成人機(jī)械通氣患者俯臥位護(hù)理解讀
- GB 44495-2024汽車整車信息安全技術(shù)要求
評(píng)論
0/150
提交評(píng)論