




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
.生物信息學(xué)實(shí)驗(yàn)報(bào)告班級::學(xué)號:日期:.
.實(shí)驗(yàn)一核酸和蛋白質(zhì)序列數(shù)據(jù)的使用實(shí)驗(yàn)?zāi)康牧私獬S玫男蛄袛?shù)據(jù)庫,掌握基本的序列數(shù)據(jù)信息的查詢方法。教學(xué)基本要求了解和熟悉NCBI核酸和蛋白質(zhì)序列數(shù)據(jù)庫,可以使用BLAST進(jìn)行序列搜索,解讀BLAST搜索結(jié)果,可以利用PHI-BLAST等工具進(jìn)行蛋白質(zhì)序列的結(jié)構(gòu)域搜索,解讀蛋白質(zhì)序列信息,可以在蛋白質(zhì)三維數(shù)據(jù)庫中查詢相關(guān)結(jié)構(gòu)信息并進(jìn)行顯示。實(shí)驗(yàn)容提要在序列數(shù)據(jù)庫中查找某條基因序列(BRCA1),通過相關(guān)一系列數(shù)據(jù)庫的搜索、比對與結(jié)果解釋,回答以下問題:1.該基因的基本功能?2.編碼的蛋白質(zhì)序列是怎樣的?3.該蛋白質(zhì)有沒有保守的功能結(jié)構(gòu)域(NCBICD-search)?4.該蛋白質(zhì)的功能是怎樣的?5.該蛋白質(zhì)的三級結(jié)構(gòu)是什么?如果沒有的話,和它最相似的同源物的結(jié)構(gòu)是什么樣子的?給出示意圖。實(shí)驗(yàn)結(jié)果及結(jié)論1.該基因的基本功能?Thisgeneencodesanuclearphosphoproteinthatplaysaroleinmaintaininggenomicstability,anditalsoactsasatumorsuppressor.Theencodedproteincombineswithothertumorsuppressors,DNAdamage..sensors,andsignaltransducerstoformalargemulti-subunitproteincomplexknownastheBRCA1-associatedgenomesurveillancecomplex(BASC).ThisgeneproductassociateswithRNApolymeraseII,andthroughtheC-terminaldomain,alsointeractswithhistonedeacetylasecomplexes.Thisproteinthusplaysaroleintranscription,DNArepairofdouble-strandedbreaks,andrecombination.Mutationsinthisgeneareresponsibleforapproximately40%ofinheritedbreastcancersandmorethan80%ofinheritedbreastandovariancancers.Alternativesplicingplaysaroleinmodulatingthesubcellularlocalizationandphysiologicalfunctionofthisgene.Manyalternativelysplicedtranscriptvariants,someofwhicharedisease-associatedmutations,havebeendescribedforthisgene,butthefull-lengthnaturesofonlysomeofthesevariantshasbeendescribed.Arelatedpseudogene,whichisalsolocatedonchromosome17,hasbeenidentified.[providedbyRefSeq,May2009]2.編碼的蛋白質(zhì)序列是怎樣的?[Homosapiens]1mdlsalrveevqnvinamqkilecpiclelikepvstkcdhifckfcmlkllnqkkgpsq61cplcknditkrslqestrfsqlveellkiicafqldtgleyansynfakkennspehlkd121evsiiqsmgyrnrakrllqsepenpslqetslsvqlsnlgtvrtlrtkqriqpqktsvyi181elgsdssedtvnkatycsvgdqellqitpqgtrdeisldsakkaacefsetdvtntehhq241psnndlnttekraaerhpekyqgssvsnlhvepcgtnthasslqhenssllltkdrmnve301kaefcnkskqpglarsqhnrwagsketcndrrtpstekkvdlnadplcerkewnkqklpc361senprdtedvpwitlnssiqkvnewfsrsdellgsddshdgesesnakvadvldvlnevd421eysgssekidllasdphealickservhsksvesniedkifgktyrkkaslpnlshvten481liigafvtepqiiqerpltnklkrkrrptsglhpedfikkadlavqktpeminqgtnqte541qngqvmnitnsghenktkgdsiqneknpnpieslekesafktkaepisssisnmelelni601hnskapkknrlrrksstrhihalelvvsrnlsppnctelqidscssseeikkkkynqmpv661rhsrnlqlmegkepatgakksnkpneqtskrhdsdtfpelkltnapgsftkcsntselke721fvnpslpreekeekletvkvsnnaedpkdlmlsgervlqtersvesssislvpgtdygtq..781esisllevstlgkaktepnkcvsqcaafenpkglihgcskdnrndtegfkyplghevnhs841retsiemeeseldaqylqntfkvskrqsfapfsnpgnaeeecatfsahsgslkkqspkvt901feceqkeenqgknesnikpvqtvnitagfpvvgqkdkpvdnakcsikggsrfclssqfrg961netglitpnkhgllqnpyripplfpiksfvktkckknlleenfeehsmsperemgnenip1021stvstisrnnirenvfkeasssninevgsstnevgssineigssdeniqaelgrnrgpkl1081namlrlgvlqpevykqslpgsnckhpeikkqeyeevvqtvntdfspylisdnleqpmgss1141hasqvcsetpddllddgeikedtsfaendikessavfsksvqkgelsrspspfththlaq1201gyrrgakklesseenlssedeelpcfqhllfgkvnnipsqstrhstvateclsknteenl1261lslknslndcsnqvilakasqehhlseetkcsaslfssqcseledltantntqdpfligs1321skqmrhqsesqgvglsdkelvsddeergtgleennqeeqsmdsnlgeaasgcesetsvse1381dcsglssqsdilttqqrdtmqhnliklqqemaeleavleqhgsqpsnsypsiisdssale1441dlrnpeqstsekavltsqksseypisqnpeglsadkfevsadsstsknkepgversspsk1501cpslddrwymhscsgslqnrnypsqeelikvvdveeqqleesgphdltetsylprqdleg1561tpylesgislfsddpesdpsedrapesarvgnipsstsalkvpqlkvaesaqspaaahtt1621dtagynameesvsrekpeltastervnkrmsmvvsgltpeefmlvykfarkhhitltnli1681teetthvvmktdaefvcertlkyflgiaggkwvvsyfwvtqsikerkmlnehdfevrgdv1741vngrnhqgpkraresqdrkifrgleiccygpftnmptdqlewmvqlcgasvvkelssftl1801gtgvhpivvvqpdawtedngfhaigqmceapvvtrewvldsvalyqcqeldtylipqiph1861shy3.該蛋白質(zhì)有沒有保守的功能結(jié)構(gòu)域(NCBICD-search)?有保守的供能結(jié)構(gòu)域。Mov34/MPN/PAD-1family:BRCC36,asubunitofBRCA1-Acomplex..4.該蛋白質(zhì)的功能是怎樣的?同第一題答案。5.該蛋白質(zhì)的三級結(jié)構(gòu)是什么?如果沒有的話,和它最相似的同源物的結(jié)構(gòu)是什么樣子的?給出示意圖。..實(shí)驗(yàn)二雙序列比對實(shí)驗(yàn)?zāi)康木毩?xí)使用動(dòng)態(tài)規(guī)劃算法進(jìn)行雙序列比對;理解打分矩陣和參數(shù)對雙序列比對結(jié)果的影響;理解動(dòng)態(tài)規(guī)劃算法的原理。教學(xué)基本要求動(dòng)態(tài)規(guī)劃算法是序列比對最基本的算法,可以確保找到最優(yōu)比對。分為全局比對(Needleman-Wunchalgorithm)和局部比對算法(Smith-Watermanalgorithm)。通過本實(shí)驗(yàn)的練習(xí),更好的理解動(dòng)態(tài)規(guī)劃算法。實(shí)驗(yàn)容提要對如下的兩條序列進(jìn)行雙序列比對分析:>DrosophilaSex-lethalproteinASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYGYAFVDFTSEMDSQRAIKVLNG>MouseHucRBDMDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDKITGQSLGYGFVNYSDPNDADKAINTLNGL這些蛋白質(zhì)包含一個(gè)RNA識別模體(RNARecognitionMotif,RRM)。該模體..包含兩個(gè)高度保守的兩個(gè)功能區(qū)RNP1和RNP2(已用紅色標(biāo)記)。1.RNP1和RNP2是否得到比對?選擇至少三個(gè)(差別大的)空位罰分和延伸值來進(jìn)行比對,2a.算法是否找到RNP1和RNP2的正確比對?b.當(dāng)空位開啟罰分高時(shí),結(jié)果發(fā)生什么變化?c.當(dāng)空位延伸罰分高時(shí),結(jié)果發(fā)生什么變化?d.為什么k個(gè)連續(xù)的空位罰分要小于k個(gè)間隔的空位罰分?使用PAM250矩陣重復(fù)上述過程。3.比對結(jié)果是否發(fā)生變化?繼續(xù)進(jìn)行這兩條序列的局部比對,通過ebi的在線工具完成練習(xí),網(wǎng)址:(.ebi.ac.uk/Tools/psa/emboss_water/)4a.RNP1和RNP2是否在局部比對中得到比對?b.局部比對的生物學(xué)意義是什么?c.為什么在這種比對中我們選擇局部比對而不是全局比對?采用不同的打分參數(shù)和其它打分矩陣。5.比對結(jié)果發(fā)生了什么變化?實(shí)驗(yàn)結(jié)果及結(jié)論1.RNP1和RNP2是否得到比對?RNP1和RNP2得到了比對。.
.Gapopen10Gapextender0.5Gapopen20Gapextender1Gapopen1Gapextender5..Gapopen100Gapextender5Gapopen1Gapextender0.4Gapopen20Gapextender0.42.a.算法是否找到RNP1和RNP2的正確比對?算法找到了RNP1和RNP2的正確比對。b.當(dāng)空位開啟罰分高時(shí),結(jié)果發(fā)生什么變化?比對結(jié)果中空位變少。c.當(dāng)空位延伸罰分高時(shí),結(jié)果發(fā)生什么變化?幾乎沒有變化。..d.為什么k個(gè)連續(xù)的空位罰分要小于k個(gè)間隔的空位罰分?因?yàn)殚g隔的空位每個(gè)都是一次改變,連續(xù)的空位只是一次改變。3.比對結(jié)果是否發(fā)生變化?繼續(xù)進(jìn)行這兩條序列的局部比對,通過ebi的在線工具完成練習(xí),網(wǎng)址:(.ebi.ac.uk/Tools/psa/emboss_water/)比對結(jié)果沒有發(fā)生變化。Gapopen10Gapextender0.5Gapopen100Gapextender0.5Gapopen1Gapextender0.5..Gapopen1Gapextender0.0005Gapopen1Gapextender10..4.a(chǎn).RNP1和RNP2是否在局部比對中得到比對?RNP1和RNP2在局部比對中得到了比對。b.局部比對的生物學(xué)意義是什么?更有可能得到序列保守域的比對。c.為什么在這種比對中我們選擇局部比對而不是全局比對?盡可能的減少誤差。........5.比對結(jié)果發(fā)生了什么變化?打分矩陣不同,得分不同,blosum數(shù)值越小,結(jié)果相似度越高,pam矩陣則相反。..實(shí)驗(yàn)三序列的點(diǎn)陣分析實(shí)驗(yàn)?zāi)康狞c(diǎn)陣分析是雙序列分析最直觀的工具,通過本實(shí)驗(yàn)了解點(diǎn)陣分析的原理和方法。教學(xué)基本要求了解和熟悉點(diǎn)陣分析的原理和參數(shù)對分析結(jié)果的影響,可以對結(jié)果進(jìn)行解讀和解釋。實(shí)驗(yàn)容提要本實(shí)驗(yàn)在如下網(wǎng)址完成:myhits.isb‐sib.ch/cgi‐bin/dotlet首先學(xué)習(xí)根據(jù)dotlet的在線教程,快速學(xué)習(xí)其基本使用方法和參數(shù)設(shè)置。然后進(jìn)行如下的序列分析?;卮饐栴}:點(diǎn)陣分析的基本原理是什么?1.重復(fù)序列通過點(diǎn)陣分析可以很容易的發(fā)現(xiàn)序列中的重復(fù),果蠅的一個(gè)蛋白質(zhì)(索引號碼:P24014)中具有幾個(gè)重復(fù)片段,請通過dotlet分析,找到這些序列重復(fù)的片段。SLIT_DROME(P24014):MAAPSRTTLMPPPFRLQLRLLILPILLLLRHDAVHAEPYSGGFGSSAVSSGGLGSVGIHIPGGGVGVITEARCPRVCSCTGLNVDCSHRGLTSVPRKISADVERLELQGNNLTVIYETDFQRLTKLRMLQLTDNQIHTIERNSFQDLVSLERLDISNNVITTVGRRVFKGAQSLRSLQLDNNQITCLDEHAFKGLVELEILTLNNNNLTSLPHNIFGGLGRLRALRLSDNPFACDCHLSW.
.LSRFLRSATRLAPYTRCQSPSQLKGQNVADLHDQEFKCSGLTEHAPMECGAENSCPHPCRCADGIVDCREKSLTSVPVTLPDDTTDVRLEQNFITELPPKSFSSFRRLRRIDLSNNNISRIAHDALSGLKQLTTLVLYGNKIKDLPSGVFKGLGSLRLLLLNANEISCIRKDAFRDLHSLSLLSLYDNNIQSLANGTFDAMKSMKTVHLAKNPFICDCNLRWLADYLHKNPIETSGARCESPKRMHRRRIESLREEKFKCSWGELRMKLSGECRMDSDCPAMCHCEGTTVDCTGRRLKEIPRDIPLHTTELLLNDNELGRISSDGLFGRLPHLVKLELKRNQLTGIEPNAFEGASHIQELQLGENKIKEISNKMFLGLHQLKTLNLYDNQISCVMPGSFEHLNSLTSLNLASNPFNCNCHLAWFAECVRKKSLNGGAARCGAPSKVRDVQIKDLPHSEFKCSSENSEGCLGDGYCPPSCTCTGTVVACSRNQLKEIPRGIPAETSELYLESNEIEQIHYERIRHLRSLTRLDLSNNQITILSNYTFANLTKLSTLIISYNKLQCLQRHALSGLNNLRVVSLHGNRISMLPEGSFEDLKSLTHIALGSNPLYCDCGLKWFSDWIKLDYVEPGIARCAEPEQMKDKLILSTPSSSFVCRGRVRNDILAKCNACFEQPCQNQAQCVALPQREYQCLCQPGYHGKHCEFMIDACYGNPCRNNATCTVLEEGRFSCQCAPGYTGARCETNIDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFCSPEFNPCANGAKCMDHFTHYSCDCQAGFHGTNCTDNIDDCQNHMCQNGGTCVDGINDYQCRCPDDYTGKYCEGHNMISMMYPQTSPCQNHECKHGVCFQPNAQGSDYLCRCHPGYTGKWCEYLTSISFVHNNSFVELEPLRTRPEANVTIVFSSAEQNGILMYDGQDAHLAVELFNGRIRVSYDVGNHPVSTMYSFEMVADGKYHAVELLAIKKNFTLRVDRGLARSIINEGSNDYLKLTTPMFLGGLPVDPAQQAYKNWQIRNLTSFKGCMKEVWINHKLVDFGNAQRQQKITPGCALLEGEQQEEEDDEQDFMDETPHIKEEPVDPCLENKCRRGSRCVPNSNARDGYQCKCKHGQRGRYCDQGEGSTEPPTVTAASTCRKEQVREYYTENDCRSRQPLKYAKCVGGCGNQCCAAKIVRRRKVRMVCSNNRKYIKNLDIVRKCGCTKKCY從uniprot或者genbank數(shù)據(jù)庫中的注釋信息進(jìn)行進(jìn)一步確認(rèn)你所發(fā)現(xiàn)的結(jié)果。2.低復(fù)雜度區(qū)域惡性瘧原蟲抗原蛋白前體(索引:P69192)具有一段低復(fù)雜度區(qū)域的序列,通過點(diǎn)陣分析找到這個(gè)特點(diǎn)。SERA_PLAFG(P69192):MKSYISLFFILCVIFNKNVIKCTGESQTGNTGGGQAGNTVGDQAGSTGGSPQGSTGASQPGSSEPSNPVSSGHSVSTVSVSQTSTSSEKQDTIQVKSALLKDYMGLKVTGPCNENFIMFLVPHIYIDVDTEDTNIELRTTLKETNNAISFESNSGSLEKKKYVKLPSNGTTGEQGSSTGTVRGDTEPISDSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSESLPANGPDSPTVKPPRNLQNICETGKNFKLVVYIKENTLIIKWKVYGETKDTTENNKVDVRKYLINEKETPFTSILIHAYKEHNGTNLIESKNYALGSDIPEKCDTLASNCFLSGNFNIEKCFQCALLVEKENKNDVCYKYLSEDIVSNFKEIKAETEDDDEDDYTEYKLTESIDNILVKMFKTNENNDKSELIKLEEVDDSLKLELMNYCSLLKDVDTTGTLDNYGMGNEMDIFNNLKRLLIYHSEENINTLKNKFRNAAVCLKNVDDWIVNKRGLVLPELNYDLEYFNEHLYNDKNSPEDKDNKGKGVVHVDTTLEKEDTLSYDNSDNMFCNKEYCNRLKDENNCISNLQVEDQGNCDTSWIFASKYHLETIRCMKGYEPTKISALYVANCYKGEHKDRCDEGSSPMEFLQIIEDYGFLPAESNYPYNYVKVGEQCPKVEDHWMNLWDNGKILHNKNEPNSLDGKGYTAYESERFHDNMDAFVKIIKTEVMNKGSVIAYIKAENVMGYEFSGKKVQNLCGDDTADHAVNIVGYGNYVNSEGEKKSYWIVRNSWGPYWGDEGYFKVDMYGPTHCHFNFIHSVVIFNVDLPMNNKTTKKESKIYDYYLKASPEFYHNLYFKNFNVGKKNLFSEKEDNENNKKLGNNYIIFGQDTAGSGQSGKESNTALESAGTSNEVSERVHVYHILKHIKDGKIRMGMRKYIDTQDVNKKHSCTRSYAFNPENYEKCVNLCNVNWKTCEEKTSPGLCLSKLDTNNECYFCYV實(shí)驗(yàn)結(jié)果及結(jié)論1.重復(fù)序列.
.通過點(diǎn)陣分析可以很容易的發(fā)現(xiàn)序列中的重復(fù),果蠅的一個(gè)蛋白質(zhì)(索引號碼:P24014)中具有幾個(gè)重復(fù)片段,請通過dotlet分析,找到這些序列重復(fù)的片段。....2.低復(fù)雜度區(qū)域惡性瘧原蟲抗原蛋白前體(索引:P69192)具有一段低復(fù)雜度區(qū)域的序列,通過點(diǎn)陣分析找到這個(gè)特點(diǎn)。....實(shí)驗(yàn)四多序列比對實(shí)驗(yàn)?zāi)康脑谛蛄蟹治鲋?,多序列比對具有廣泛的應(yīng)用,是許多其他分析的基礎(chǔ)和前提,比如進(jìn)化發(fā)生分析、構(gòu)建位置特異性打分矩陣、找到一致序列等,本實(shí)驗(yàn)的目的是熟悉多序列比對相關(guān)的操作和編輯方法。教學(xué)基本要求了解和熟悉多序列比對的原理和基本方法。實(shí)驗(yàn)容提要1.使用CLUSTALW算法,比對一組蛋白質(zhì)序列,該序列屬于RAD51‐RECA,在DNA的復(fù)制階段起重要作用,這些序列可以從NCBIgenbank、Uniprot等序列服務(wù)器獲取,序列的索引為:P25454,P25453,P0A7G6,P48295。將這些.
.序列保存在一個(gè)文本文件。如果查詢到的序列不止一個(gè)的話,選擇第一個(gè)。>P25454.1Full=DNArepairproteinRAD51MSQVQEQHISESQLQYGNGSLMSTVPADLSQSVVDGNGNGSSEDIEATNGSGDGGGLQEQAEAQGEMEDEAYDEAALGSFVPIEKLQVNGITMADVKKLRESGLHTAEAVAYAPRKDLLEIKGISEAKADKLLNEAARLVPMGFVTAADFHMRRSELICLTTGSKNLDTLLGGGVETGSITELFGEFRTGKSQLCHTLAVTCQIPLDIGGGEGKCLYIDTEGTFRPVRLVSIAQRFGLDPDDALNNVAYARAYNADHQLRLLDAAAQMMSESRFSLIVVDSVMALYRTDFSGRGELSARQMHLAKFMRALQRLADQFGVAVVVTNQVVAQVDGGMAFNPDPKKPIGGNIMAHSSTTRLGFKKGKGCQRLCKVVDSPCLPEAECVFAIYEDGVGDPREEDE>P25453.1Full=MeioticrecombinationproteinDMC1MSVTGTEIDSDTAKNILSVDELQNYGINASDLQKLKSGGIYTVNTVLSTTRRHLCKIKGLSEVKVEKIKEAAGKIIQVGFIPATVQLDIRQRVYSLSTGSKQLDSILGGGIMTMSITEVFGEFRCGKTQMSHTLCVTTQLPREMGGGEGKVAYIDTEGTFRPERIKQIAEGYELDPESCLANVSYARALNSEHQMELVEQLGEELSSGDYRLIVVDSIMANFRVDYCGRGELSERQQKLNQHLFKLNRLAEEFNVAVFLTNQVQSDPGASALFASADGRKPIGGHVLAHASATRILLRKGRGDERVAKLQDSPDMPEKECVYVIGEKGITDSSD>P0A7G6.2Full=ProteinRecA;AltName:Full=RecombinaseAMAIDENKQKALAAALGQIEKQFGKGSIMRLGEDRSMDVETISTGSLSLDIALGAGGLPMGRIVEIYGPESSGKTTLTLQVIAAAQREGKTCAFIDAEHALDPIYARKLGVDIDNLLCSQPDTGEQALEICDALARSGAVDVIVVDSVAALTPKAEIEGEIGDSHMGLAARMMSQAMRKLAGNLKQSNTLLIFINQIRMKIGVMFGNPETTTGGNALKFYASVRLDIRRIGAVKEGENVVGSETRVKVVKNKIAAPFKQAEFQILYGEGINFYGELVDLGVKEKLIEKAGAWYSYKGEKIGQGKANATAWLKDNPETAKEIEKKVRELLLSNPNSTPDFSVDDSEGVAETNEDF>P48295.2Full=ProteinRecA;AltName:Full=RecombinaseAMAGTDREKALDAALAQIERQFGKGAVMRMGDRTQEPIEVISTGSTALDIALGVGGLPRGRVVEIYGPESSGKTTLTLHAVANAQKAGGQVAFVDAEHALDPEYAKKLGVDIDNLILSQPDNGEQALEIVDMLVRSGALDLIVIDSVAALVPRAEIEGEMGDSHVGLQARLMSQALRKITSALNQSKTTAIFINQLREKIGVMFGSPETTTGGRALKFYASVRLDIRRIETLKDGTDAVGNRTRVKVVKNKVAPPFKQAEFDILYGQGISREGGLIDMGVEHGFVRKAGAWYTYEGDQLGQGKENARNFLKDNPDLADEIERKIKEKLGVGVRPDAAKAEAATDAAAAADTAGTDDAAKSVPAPASKTAKATKATAVKSa.練習(xí)使用EBICLUSTALW(.ebi.ac.uk/Tools/msa/clustalw2/);b.將序列數(shù)據(jù)拷貝復(fù)制到窗口中;c.采用默認(rèn)參數(shù)進(jìn)行比對;回答:clustalw算法的基本原理?2.在BAliBASE查找一組蛋白質(zhì):1csy。這些蛋白質(zhì)的一致性為20‐40%,屬于BAliBASE參考序列1。正確的比對結(jié)果網(wǎng)址如下:bips.u‐strasbg.fr/en/Products/Databases/BAliBASE/ref1/test1/1csy_ref1.html.
.主要的比對信息截圖如下所示:注意:這里的比對是基于結(jié)構(gòu)信息的,所以是正確的。是序列的部分比對,為什么?這五條序列的名稱和索引如下:SequenceNameSWISSPROTAccession1csyP434051griP293541ayaP352352pnaP237271bfiP27986從序列數(shù)據(jù)庫獲取這五條序列的fasta格式,放在一個(gè)文本文件中,選擇ebi上(.ebi.ac.uk/Tools/msa/)的至少四個(gè)多序列比對工具(如MAFFT、MUSCLE、CLUSTALW、ClustalOmega、T‐Coffee、DbClustal)進(jìn)行分析,將結(jié)果保存(DownloadAlignmentFile)。擴(kuò)展名為.fasta?,F(xiàn)在用一個(gè)多序列比對軟件,比如bioedit、seaview或者jalview(下載安裝windows版本的比較快速)導(dǎo)入剛才保存的多序列比對結(jié)果文件(擴(kuò)展名為.fasta的)。比較各個(gè)算法的比對結(jié)果(BAliBASE數(shù)據(jù)只是這些多序列比對的一部分,而我們得到的是這幾條序列全長上的比對),所以需要將不相關(guān)的列刪除掉或者用其它符號替代,或者也可以不作處理,找到相關(guān)部分就可以了。比較多序列比對的結(jié)果,B與AliBASE上的相比,那個(gè)的結(jié)果更好些?你是如何評價(jià)結(jié)果的?.
.3.序列徽標(biāo)序列徽標(biāo)(sequencelogo)是一個(gè)常用的直觀的多序列比對的圖示工具,對如下的一些序列,創(chuàng)建其序列徽標(biāo)。網(wǎng)址:/。將結(jié)果保存,簡單的解釋一下。sequencelogo圖中包含的意義有什么?實(shí)驗(yàn)結(jié)果及結(jié)論1.clustalw算法的基本原理?Inordertoalignjusttwosequences,itisstandardpracticetousedynamicprogramming(2).Thisguaranteesamathematicallyoptimalalignment,givenatableofscoresformatchesandmismatchesbetweenallaminoacidsornucleotides(e.g.thePAM250matrix(3)orBLOSUM62matrix(4))andpenaltiesforinsertionsordeletionsofdifferentlengths.Attemptsatgeneralisingdynamicprogrammingtomultiplealignmentsarelimitedtosmallnumbersofshortsequences(5).Formuchmorethaneightorsoproteinsofaveragelength,theproblemisuncomputablegivencurrentcomputerpower.Therefore,allofthemethodscapableofhandlinglargerproblemsinpracticaltimescales,makeuseofheuristics.Currently,themostwidelyusedapproachistoexploitthefactthathomologoussequencesareevolutionarilyrelated.Onecanbuildupamultiplealignmentprogressivelybyaseriesofpairwisealignments,followingthebranchingorderinaphylogenetictree(1).Onefirstalignsthemostcloselyrelatedsequences,graduallyaddinginthemoredistantones.Thisapproachissufficientlyfasttoallowalignmentsofvirtually..anysize.Further,insimplecases,thequalityofthealignmentsisexcellent,asjudgedbytheabilitytocorrectlyaligncorrespondingdomainsfromsequencesofknownsecondaryortertiarystructure(6).Inmoredifficultcases,thealignmentsgivegoodstartingpointsforfurtherautomaticormanualrefinement.2.注意:這里的比對是基于結(jié)構(gòu)信息的,所以是正確的。是序列的部分比對,為什么?比較多序列比對的結(jié)果,與BAliBASE上的相比,那個(gè)的結(jié)果更好些?你是如何評價(jià)結(jié)果的?①是為了方便找到保守域②clustalo更好。因?yàn)樗鼘ΡJ赜虻谋葘εcBAliBASE最為接近,效果最好。因?yàn)閎alibase的原理是:Alignmentscomparedonlyinreliable‘coreblocks’,excludingnon-superposableregions(非重合區(qū))ClustalOmega的結(jié)果更好些。MAFFT的比對相對來說最差,MUSCLE、CLUSTALW的結(jié)果差不多;因?yàn)镃lustalOmega幾乎把balibase上比對給出的保守區(qū)域都比對出來了,MUSCLE、CLUSTALW都有兩個(gè)沒比對出來,MAFFT有三個(gè)沒比對出來。3.sequencelogo圖中包含的意義有什么?sequencelogos方法利用每個(gè)位置的高度來表示其保守程度,這樣就可以通過特征高度直觀的反映了相對的變化頻率。豎向高度越高,表示保守程度越大。..實(shí)驗(yàn)五序列數(shù)據(jù)庫的搜索比對實(shí)驗(yàn)?zāi)康耐ㄟ^該實(shí)驗(yàn)理解BLAST和PSI-BLAST的基本原理。教學(xué)基本要求可通過BLAST和PSI-BLAST進(jìn)行數(shù)據(jù)庫的搜索比對,對結(jié)果進(jìn)行恰當(dāng)?shù)慕忉???衫肂LAST進(jìn)行相關(guān)序列的檢索,利用PSI-BLAST進(jìn)行遠(yuǎn)相關(guān)序列的檢索。理解兩個(gè)工具的原理。實(shí)驗(yàn)容提要本實(shí)驗(yàn)中,查詢下面這條序列在細(xì)菌(bacterial)中的同源序列。>gi|76828014|gb|BC107078.1|HomosapiensGprotein-coupledreceptor,familyC,group5,memberD,mRNA(cDNAcloneMGC:129714IMAGE:40027066),completecdsATGTACAAGGACTGCATCGAGTCCACTGGAGACTATTTTCTTCTCTGTGACGCCGAGGGGCCATGGGGCATCATTCTGGAGTCCCTGGCCATACTTGGCATCGTGGTCACAATTCTGCTACTCTTAGCATTTCTCTTCCTCATGCGAAAGATCCAAGACTGCAGCCAGTGGAATGTCCTCCCCACCCAGCTCCTCTTCCTCCTGAGTGTCCTGGGGCTCTTCGGACTCGCTTTTGCCTTCATCATCGAGCTCAATCAACAAACTGCCCCCGTACGCTACTTTCTCTTTGGGGTTCTCTTTGCTCTCTGTTTCTCATGCCTCTTAGCTCATGCCTCCAATCTAGTGAAGCT.
.GGTTCGGGGTTGTGTCTCCTTCTCCTGGACGACAATTCTGTGCATTGCTATTGGTTGCAGTCTGTTGCAAATCATTATTGCCACTGAGTATGTGACTCTCATCATGACCAGAGGTATGATGTTTGTGAATATGACACCCTGCCAGCTCAATGTGGACTTTGTTGTACTCCTGGTCTATGTCCTCTTCCTGATGGCCCTCACATTCTTCGTCTCCAAAGCCACCTTCTGTGGCCCGTGTGAGAACTGGAAGCAGCATGGAAGGCTCATCTTTATCACTGTGCTCTTCTCCATCATCATCTGGGTGGTGTGGATCTCCATGCTCCTGAGAGGCAACCCGCAGTTCCAGCGACAGCCCCAGTGGGACGACCCGGTCGTCTGCATTGCTCTGGTCACCAACGCATGGGTTTTCCTGCTGCTGTACATCGTCCCTGAGCTCTGCATTCTCTACAGATCGTGTAGACAGGAGTGCCCTTTACAAGGCAATGCCTGCCCCGTCACAGCCTACCAACACAGCTTCCAAGTGGAGAACCAGGAGCTCTCCAGAGCCCGAGACAGTGATGGAGCTGAGGAGGATGTAGCATTAACTTCATATGGTACTCCCATTCAGCCGCAGACTGTTGATCCCACACAAGAGTGTTTCATCCCACAGGCTAAACTAAGCCCCCAGCAAGATGCAGGAGGAGTATAA1a.在NCBI中采用blastn程序,搜索上述序列,將物種限制在“Bacteria”,其它參數(shù)默認(rèn),得到幾個(gè)結(jié)果命中?E值小于0.1的有幾條?1b.為了擴(kuò)大搜索,可以對參數(shù)進(jìn)行調(diào)整,將BLASTN的wordsize換為7,其它同上次,得到幾個(gè)命中?E值小于0.1的有幾條?1c.選擇BLASTX,將物種限制在“Bacteria”,其它參數(shù)默認(rèn),得到幾個(gè)結(jié)果命中?E值小于0.1的有幾條?1d.在BLASTX中,將wordsize調(diào)整為2,選擇BLOSUM45打分矩陣,GapExistence10,GapExtension3,將物種限制在“Bacteria”,其它參數(shù)默認(rèn),得到幾個(gè)結(jié)果命中?E值小于0.1的有幾條?2.如下序列是剛才所檢索的核酸序列對應(yīng)的蛋白質(zhì)序列:>gi|76828015|gb|AAI07079.1|Gprotein-coupledreceptor,familyC,group5,memberD[Homosapiens].
.MYKDCIESTGDYFLLCDAEGPWGIILESLAILGIVVTILLLLAFLFLMRKIQDCSQWNVLPTQLLFLLSVLGLFGLAFAFIIELNQQTAPVRYFLFGVLFALCFSCLLAHASNLVKLVRGCVSFSWTTILCIAIGCSLLQIIIATEYVTLIMTRGMMFVNMTPCQLNVDFVVLLVYVLFLMALTFFVSKATFCGPCENWKQHGRLIFITVLFSIIIWVVWISMLLRGNPQFQRQPQWDDPVVCIALVTNAWVFLLLYIVPELCILYRSCRQECPLQGNACPVTAYQHSFQVENQELSRARDSDGAEEDVALTSYGTPIQPQTVDPTQECFIPQAKLSPQQDAGGV2a.利用著條序列進(jìn)行PSI‐BLAST檢索,第一輪PSI‐BLAST的參數(shù)與上述最后一次的BLASTX參數(shù)一致,即wordsize調(diào)整為2,選擇BLOSUM45打分矩陣,GapExistence10,GapExtension3,將物種限制在“Bacteria”,得到幾個(gè)匹配?E值小于0.1的有幾條?2b.選擇E值小于2的序列進(jìn)行下一步的PSI‐BLAST迭代。得到幾個(gè)匹配?E值小于0.1的有幾條?2c.大多數(shù)你所發(fā)現(xiàn)的蛋白質(zhì)都具有相同的功能,是什么功能?如何進(jìn)一步確定你的查詢序列與結(jié)果中的序列相關(guān)?實(shí)驗(yàn)結(jié)果及結(jié)論1.a.在NCBI中采用blastn程序,搜索上述序列,將物種限制在“Bacteria”,其它參數(shù)默認(rèn),得到幾個(gè)結(jié)果命中?E值小于0.1的有幾條?有5個(gè)結(jié)果命中,E值小于0.1的有0條。b.為了擴(kuò)大搜索,可以對參數(shù)進(jìn)行調(diào)整,將BLASTN的wordsize換為7,其它同上次,得到幾個(gè)命中?E值小于0.1的有幾條?有10個(gè)結(jié)果命中,E值小于0.1的有1條。c.選擇BLASTX,將物種限制在“Bacteria”,其它參數(shù)默認(rèn),得到幾個(gè)結(jié)果命中?E值小于0.1的有幾條?得到6個(gè)結(jié)果命中,E值都小于0.1。d.在BLASTX中,將wordsize調(diào)整為2,選擇BLOSUM45打分矩陣,GapExistence10,GapExtension3,將物種限制在“Bacteria”,其它參數(shù)默認(rèn),.
.得到幾個(gè)結(jié)果命中?E值小于0.1的有幾條?得到5個(gè)結(jié)果命中,E值都小于0.1。2.a.利用著條序列進(jìn)行PSI‐BLAST檢索,第一輪PSI‐BLAST的參數(shù)與上述最后一次的BLASTX參數(shù)一致,即wordsize調(diào)整為2,選擇BLOSUM45打分矩陣,GapExistence10,GapExtension3,將物種限制在“Bacteria”,得到幾個(gè)匹配?E值小于0.1的有幾條?得到11個(gè)匹配,E值小于0.1的有11條,即均小于0.1。b.選擇E值小于2的序列進(jìn)行下一步的PSI‐BLAST迭代。得到幾個(gè)匹配?E值小于0.1的有幾條?實(shí)驗(yàn)六HIV病毒的進(jìn)化分析實(shí)驗(yàn)?zāi)康牧私夂蛯W(xué)習(xí)系統(tǒng)發(fā)生分析的步驟和基本方法。教學(xué)基本要求從NCBI網(wǎng)絡(luò)數(shù)據(jù)庫獲取相關(guān)的HIV、SIV病毒序列,提取相關(guān)的特征片段,進(jìn)行進(jìn)化樹構(gòu)建,對進(jìn)化樹進(jìn)行解析。實(shí)驗(yàn)容提要本實(shí)驗(yàn)選擇來自于人類和猴的16條HIV和SIV病毒進(jìn)行分析,物種名稱和序列索引如下。1.'HIV-1(Zaire)''K03454';..2.'HIV1-NDK(Zaire)''M27323';3.'HIV-2(Senegal)''M15390';4.'HIV2-MCN13''AY509259';5.'HIV-2UC1(IvoryCoast)''L07625';6.'SIVMM251Macaque''M19499';7.'SIVAGM677AGreenmonkey''M58410';8.'SIVlhoestL''Hoestmonkeys''AF075269';9.'SIVcpzChimpanzeesCameroon''AF115393';10.'SIVmnd5440Mandrillussphinx''AY159322';11.'SIVAGM3Greenmonkeys''M30931';12.'SIVMM239Simianmacaque''M33262';13.'CIVcpzUSChimpanzee''AF103818';14.'SIVmonCercopithecusMonkeys''A
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- led燈貼牌合作協(xié)議合同協(xié)議
- 三樓露臺裝修協(xié)議合同
- 三方協(xié)議面粉購銷合同
- 專業(yè)版酒店裝修合同協(xié)議
- 建筑裝修人工合同協(xié)議
- 專票勞務(wù)費(fèi)合同協(xié)議
- 建筑碎石采購合同協(xié)議
- 工程監(jiān)理勞務(wù)合同協(xié)議
- 三方協(xié)議維修合同協(xié)議
- 廢棄礦山轉(zhuǎn)讓合同協(xié)議
- (三診)綿陽市高中2022級高三第三次診斷性考試 歷史試卷A卷(含答案)
- 麻醉專業(yè)考試試題及答案
- 湖南省長沙市長郡教育集團(tuán)2024-2025學(xué)年七年級下學(xué)期期中生物試題
- JJF 2221-2025導(dǎo)熱系數(shù)瞬態(tài)測定儀校準(zhǔn)規(guī)范
- 華為手機(jī)協(xié)議合同
- 山東省高中名校2025屆高三4月校際聯(lián)合檢測大聯(lián)考生物試題及答案
- 公司兩班倒管理制度
- 汽車漆面保護(hù)膜安裝協(xié)議
- 直腸癌護(hù)理新進(jìn)展
- 2024北京八中高一(下)期中英語試題及答案
- 2024-2025學(xué)年接力版小學(xué)英語五年級下冊(全冊)知識點(diǎn)歸納
評論
0/150
提交評論