基因組學(xué)理論課 蛋白質(zhì)數(shù)據(jù)庫_第1頁
基因組學(xué)理論課 蛋白質(zhì)數(shù)據(jù)庫_第2頁
基因組學(xué)理論課 蛋白質(zhì)數(shù)據(jù)庫_第3頁
基因組學(xué)理論課 蛋白質(zhì)數(shù)據(jù)庫_第4頁
基因組學(xué)理論課 蛋白質(zhì)數(shù)據(jù)庫_第5頁
已閱讀5頁,還剩114頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

蛋白質(zhì)數(shù)據(jù)庫、原核及真核生物基因組分析第五節(jié)蛋白質(zhì)數(shù)據(jù)庫基本定義:存放蛋白質(zhì)相關(guān)信息的功能性數(shù)據(jù)集,包括蛋白質(zhì)的名稱,物種來源,所具有的各種生物學(xué)功能,以及序列本身等等。有些數(shù)據(jù)庫提供序列比對(duì)、序列下載等服務(wù),不同的數(shù)據(jù)庫特點(diǎn)不同。國(guó)際上大型的公共蛋白質(zhì)數(shù)據(jù)庫包括UniProt,PIR-PSD(已整合入U(xiǎn)niProt),PDB,OMIM,GeneCards等。UniProtUniProt

KnowledgeBase(UniProtKB)Swiss-ProttrEMBLREM-trEMBLSP-trEMBLUniRefUniParcTheUniProtArchive(UniParc)isacomprehensiveandnon-redundantdatabasethatcontainsmostofthepubliclyavailableproteinsequencesintheworld.TheUniProtReferenceClusters(UniRef)provideclusteredsetsofsequencesfromtheUniProtKnowledgebaseandselectedUniParcrecordsinordertoobtaincompletecoverageofthesequencespaceatseveralresolutionswhilehidingredundantsequencesfromview.UniProt(Universal

ProteinResource)蛋白質(zhì)數(shù)據(jù)庫UniProtKB/Swiss-Protproteinknowledgebasestatistics

1INTRODUCTIONRelease2011_03of08-Mar-11ofUniProtKB/Swiss-Protcontains525997sequenceentries,comprising185874894aminoacidsabstractedfrom196176references.

2013_12of11-Dec-13contains541954sequenceentries2.Taxonomicdistributionofthesequences

WithinEukaryota:

Legend:

gray=aliphatic,red=acidic,green=smallhydroxy,blue=basic,black=aromatic,white=amide,yellow=sulfur

2Swiss-ProtSWISS-PROT由瑞士日內(nèi)瓦大學(xué)醫(yī)學(xué)生化系于1986年創(chuàng)建,后來與歐洲分子生物學(xué)實(shí)驗(yàn)(EuropeanMolecularBiologylaboratory,EMBL)室合作,由瑞士生物信息學(xué)研究所(SwissInstituteofBioinformatics,SIB)和歐洲生物信息學(xué)研究所(EBI)共同維護(hù)和管理,現(xiàn)已整合稱為全新的UniProtKB/Swiss-Prot。a.所有序列條目都經(jīng)過有經(jīng)驗(yàn)的分子生物學(xué)家和蛋白質(zhì)化學(xué)家借助計(jì)算機(jī)工具并查閱有關(guān)文獻(xiàn)資料仔細(xì)核實(shí)。Swiss-Prot的特點(diǎn)b.每個(gè)條目包含蛋白質(zhì)的基本信息、來源信息(描述蛋白質(zhì)的物種來源)、引用文獻(xiàn)信息、功能信息(功能注釋)、突變體信息、以及蛋白質(zhì)序列本身等。c.蛋白質(zhì)注釋

包括蛋白質(zhì)的功能、翻譯后修飾(如糖基化和磷酸化)、結(jié)構(gòu)域和結(jié)合位點(diǎn)、二級(jí)結(jié)構(gòu)(如α-螺旋和β-片層)、四級(jí)結(jié)構(gòu)(如同聚體和異聚體)、與其它蛋白質(zhì)序列的相似性、蛋白質(zhì)序列殘缺與疾病的關(guān)系、序列沖突和變異體等信息。d.Swiss-Prot中是一個(gè)去除冗余序列后的數(shù)據(jù)集e.

與其它30多個(gè)數(shù)據(jù)庫建立了交叉引用,其中包括核酸序列數(shù)據(jù)庫、蛋白質(zhì)序列數(shù)據(jù)庫和蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫等。f.利用序列檢索系統(tǒng)(SRS,SequenceRetrievalSystem)可以方便地檢索UniProtKB/Swiss-Prot數(shù)據(jù)庫。3TrEMBLTrEMBL數(shù)據(jù)庫建于1995年,意為“TranslationfromEMBL”。該數(shù)據(jù)庫采用SwissProt數(shù)據(jù)庫格式,其數(shù)據(jù)來源于:EMBL核酸序列數(shù)據(jù)庫(包括GenBank、DDBJ)中所有編碼序列經(jīng)計(jì)算機(jī)程序自動(dòng)翻譯的蛋白質(zhì)從文獻(xiàn)中查到的或向SWISS-PROT遞交的并未整合到SWISS-PROT的蛋白質(zhì)序列TrEMBL數(shù)據(jù)庫分兩部分:SP-TrEMBL(Swiss-ProtTREMBL)和

Rem-TrEMBL(REMainingTREMBL)SP-TrEMBL中的條目將最終被歸并到SwissProt數(shù)據(jù)庫中Rem-TrEMBL(REMainingTREMBL)包含目前不打算并入SWISS-PROT的蛋白質(zhì)序列

包括免疫球蛋白、T細(xì)胞受體、人工設(shè)計(jì)合成蛋白質(zhì)序列、小肽、專利序列、假基因和截?cái)嗔说牡鞍踪|(zhì)等。4PIR-PSD蛋白質(zhì)信息資源-國(guó)際蛋白質(zhì)序列數(shù)據(jù)庫(theProteinInformationResource-InternationalProteinSequenceDatabase,

PIR-PSD)由蛋白質(zhì)信息資源(PIR,GeorgetownUniversityMedicalCenter)、慕尼黑蛋白質(zhì)序列信息中心(MIPS)和日本國(guó)際蛋白質(zhì)序列數(shù)據(jù)庫(JIPID)共同維護(hù),PIR是國(guó)際上最早的數(shù)據(jù)庫,始建于1965年,2002年并入U(xiǎn)niProt/Swiss-Prot數(shù)據(jù)庫中。是一個(gè)全面的、非冗余的、經(jīng)過專家校對(duì)過的公共蛋白質(zhì)序列數(shù)據(jù)庫。PIR-PSD收集已發(fā)表的蛋白質(zhì)序列、來源、參考文獻(xiàn)和注釋信息等,她的注釋中還包括一些原始遞交記錄中沒有的相關(guān)信息,如在遺傳圖譜的位置、內(nèi)含子位置等。PIR-PSD的另一個(gè)重要特征是其對(duì)蛋白質(zhì)超家族的分類,提供序列的等級(jí)聚類信息,揭示序列間的進(jìn)化關(guān)系。5UniProt蛋白質(zhì)信息資源(PIR)、歐洲生物信息學(xué)研究所(EBI)和瑞士生物信息學(xué)研究所(SIB)合作,于2002年共同組建世界蛋白質(zhì)資源(theUniversalProteinResource,UniProt)。UniProt把Swiss-Prot、TrEMBL和PIR-PSD等蛋白質(zhì)數(shù)據(jù)庫整合在一起,是目前國(guó)際上最全面的蛋白質(zhì)信息庫。最終形成了現(xiàn)在的UniProtKB/Swiss-Prot和UniProtKB/TrEMBL。UniProtArchive(UniParc)ispartof

UniProt

project.Itisanon-redundantarchiveofproteinsequencesextractedfrompublicdatabasesUniProtKB/Swiss-Prot,UniProtKB/TrEMBL,PIR-PSD,EMBL,EMBLWGS,Ensembl,IPI,PDB,RefSeq,FlyBase,WormBase,H-InvitationalDatabase,TROMEdatabase,EuropeanPatentOfficeproteins,UnitedStatesPatentandTrademarkOfficeproteins(USPTO)andJapanPatentOfficeproteins.TheUniProtKnowledgebase(UniProtKB)TheUniProtKnowledgebasecontinuestheworkofSwiss-Prot,TrEMBLandPIR-PSDbyprovidinganexpertly(professionally)andrichlycuratedproteindatabaseConsistingoftwosections.

UniProtKB/Swiss-Prot

UniProtKB/TrEMBL.UniProtReferenceClusters(UniRef)TheUniProtReferenceClusters(UniRef)

provideclusteredsetsofsequencesfromUniProtKBandselectedUniParcrecords.Itprovidecompletecoverageofsequencespaceatseveralresolutionsandspeedsimilaritysearchesviasequencespacecompressionbymergingsequencesthatare100%(UniRef100),90%(UniRef90)or50%(UniRef50)identical.UniRef90andUniRef50yieldadatabasesizereductionofapproximately40%and65%,respectively,providingsignificantlyfastersequencesearches.UniProtArchive(UniParc)UniProtArchive(UniParc)ispartof

UniProt

project.Itisanon-redundantarchiveofproteinCaptureallpubliclyavailableproteinsequencedataandcontainsalltheproteinsequencesfromthemainpubliclyavailableproteinsequencedatabases.

UniParcisthemostcomprehensivepubliclyaccessiblenon-redundantproteinsequencedatabase.sequencesextractedfrompublicdatabasesincluding:UniProtKB/Swiss-Prot,UniProtKB/TrEMBL,EMBL,EMBLWGS,Ensembl,IPI,PDB,RefSeq,FlyBase,WormBase,H-InvitationalDatabase,TROMEdatabase,EuropeanPatentOfficeproteins,UnitedStatesPatentandTrademarkOfficeproteins(USPTO)andJapanPatentOfficeproteins.UniParc

recordsareautomaticannotatedUniProt

MetagenomicandEnvironmentalSequences(UniMES)

Arepositoryspecificallyformetagenomicandenvironmentaldata.Tostoresequenceswhicharerecovereddirectlyfromenvironmentalsamples.ThepredictedproteinsfromthisdatasetarecombinedwithautomaticclassificationbyInterPro,anintegratedresourceforproteinfamilies,domainsandfunctionalsites,toenhancetheoriginalinformationwithfurtheranalysis.RetrievingdatafromUniProtdatabasesBrowsing.Onecanperformbothsimpleandcomplextext-basedqueries,runsequence-basedsearchesoftheUniProtdatabases,performmultiplesequencealignments,retrievemultipleentriesandmapidentifiersfromanexternaldatabasetoUniProtKBorviceversa.Downloading.Ifyouneedtodownloadentiredatabases,theUniProtKB,UniRefandUniMESdatabasesareavailableat/downloads.CD-ROM.TheUniProtKnowledgebasefullreleasesaredistributedonCD-ROM.Ifyouwouldliketoreceivethem,pleasesendusane-mailusingthequeryformatwww.ebi.ac.uk/support/.6Uni-Prot數(shù)據(jù)檢索二疾病相關(guān)蛋白數(shù)據(jù)庫(1)OMIM:OMIM(OnlineMendelian

InheritanceinMan)是美國(guó)JonhsHopkins大學(xué)Dr.VictorA.McKusick等人建立和編輯的有關(guān)人類基因和遺傳病目錄的電子版。于上世紀(jì)60年代創(chuàng)立,旨在為臨床醫(yī)師和遺傳病研究工作者提供服務(wù)。OMIM包含大量的及時(shí)更新的有關(guān)人類基因及其突變序列數(shù)據(jù)和遺傳病的臨床特征等信息和相關(guān)參考文獻(xiàn)。OMIM數(shù)據(jù)庫提供的基本信息

OMIM----

概述

克隆(從哪里得到的,怎樣得到的)

定位(在人類基因組中哪條染色體上,什么位置)

基因結(jié)構(gòu)(基因的大小及內(nèi)含子外顯子數(shù)量)

基因功能

生化特征

分子遺傳學(xué)(casereport)

動(dòng)物模型

等位突變

參考文獻(xiàn)

編輯史等(2)GeneCardsGeneCards數(shù)據(jù)庫始建于1997年,是由以色列Weizmann科學(xué)研究所(WeizmannInstituteofScience)的Crown人類基因組中心(CrownHumanGenomeCenter)建立和維護(hù)的。她是一個(gè)提供搜索服務(wù)的、全面的、及時(shí)更新的人類基因數(shù)據(jù)數(shù)據(jù)庫。它鏈接、收集了如HUGO,SWISS-PORT,EntrezGene,PubMed,OMIM,HGMD,Unigene等五十多個(gè)數(shù)據(jù)庫,提供有關(guān)人類、果蠅、小鼠等基因的相關(guān)信息,以及多種遺傳性疾病、癌癥、轉(zhuǎn)基因資料它對(duì)所有數(shù)據(jù)庫的信息進(jìn)行了科學(xué)地分類整理,形成了一個(gè)關(guān)于基因及其產(chǎn)物的生物學(xué)和醫(yī)學(xué)信息的電子百科全書它的智能化的導(dǎo)航系統(tǒng),使用戶能方便地查找感興趣的內(nèi)容。它還提供了幾十個(gè)鏡像站,與很多的研究所、醫(yī)院、基因中心等鏈接,便于用戶進(jìn)一步查找相關(guān)信息。三NCBI數(shù)據(jù)庫的數(shù)據(jù)模型數(shù)據(jù)庫模型:

是研究人員輸入序列、查詢序列、進(jìn)行序列比對(duì)的根本,也是數(shù)據(jù)庫管理人員管理數(shù)據(jù)的總則。NCBI數(shù)據(jù)模型包括:

序列數(shù)據(jù)和相關(guān)的注釋。作用:NCBI模型能輕易地從已公布的DNA序列文獻(xiàn)影射到基因所在的染色體--編碼蛋白--蛋白質(zhì)三維結(jié)構(gòu)等。(一)NCBI數(shù)據(jù)模型的文獻(xiàn)1出版物:出版物是連接不同結(jié)構(gòu)和不同內(nèi)容數(shù)據(jù)庫的橋梁;出版物是數(shù)據(jù)庫記錄的基本注釋,也是最好的注釋,發(fā)表文章比數(shù)據(jù)庫中的記錄包含了更完整和更詳細(xì)的信息。2作者數(shù)據(jù)或文章的作者是系統(tǒng)聯(lián)系相關(guān)數(shù)據(jù)和科學(xué)研究的關(guān)鍵因素;PubMed數(shù)據(jù)庫的作者的輸入全稱姓和名的首字母3文章最常見的生物科學(xué)文獻(xiàn)是期刊文獻(xiàn),對(duì)于生物數(shù)據(jù)庫的引用格式缺省是期刊文獻(xiàn)文章也可出現(xiàn)在書、手稿及電子期刊上。期刊名、年份、文章的首頁以及文章作者的姓4.論文標(biāo)題5Medline和PubMed

UIDsPUID和MUID:PubMed唯一識(shí)別器和Medline唯一識(shí)別器(二)NCBI數(shù)據(jù)模型的序列1序列識(shí)別器(SEQIDS):

GenBank、DDBJ和EMBL核酸蛋白數(shù)據(jù)庫共用一套序列號(hào)a.Locus名稱:兼有唯一辨識(shí)器、功能記憶以及序列的組織源等功能;

Locus出現(xiàn)在GenBank中的Locus行以及DDBJ記錄和EMBL的ID行;GenBank中已不再作為有用的名稱,只是為了和老數(shù)據(jù)格式兼容b.序列號(hào)(Accession):GenBank、DDBJ和EMBL具有,以保證序列的相對(duì)穩(wěn)定性和專一性;2個(gè)大寫字母(分配到不同的數(shù)據(jù)庫)+6個(gè)數(shù)字

c.gi號(hào)(GeneInfo,GI)gi:基因信息號(hào),核酸序列和蛋白質(zhì)序列均有g(shù)i號(hào);gi的來源:由源數(shù)據(jù)庫提供;序列僅當(dāng)其完整地被提交公共數(shù)據(jù)庫處理后,才最終達(dá)到一個(gè)序列號(hào)和一個(gè)gi號(hào);位置:在VERSION行中,版本號(hào),gi號(hào)修改記錄時(shí),新記錄與原先記錄不同時(shí)(哪怕是一個(gè)堿基不同),產(chǎn)生新的gi號(hào),但序列號(hào)不變;2生物序列(BIOSEQ)生物序列:一個(gè)簡(jiǎn)單的、連續(xù)的核酸或蛋白質(zhì)分子至少有一個(gè)序列辨識(shí)器包含DNA、RNA或蛋白質(zhì)分子的物理信息、注釋信息(如特定區(qū)域的生物特征)和描述信息(如該分子是從某個(gè)組織中獲得的)第六節(jié)蛋白質(zhì)數(shù)據(jù)分析

由于傳統(tǒng)的用X光晶體衍射和核磁共振技術(shù)測(cè)定蛋白質(zhì)的三維結(jié)構(gòu)、用生化方法研究蛋白質(zhì)功能的效率不高,無法適應(yīng)由基因組測(cè)序所帶來的蛋白質(zhì)序列數(shù)量快速增長(zhǎng)的需要,近年來,許多科學(xué)家致力于用理論計(jì)算的方法預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu),提高蛋白質(zhì)功能研究的效率,并取得了一些的成果,但總體效果并不理想。一、蛋白質(zhì)基本性質(zhì)分析蛋白質(zhì)序列分析的基本方面:包括分析蛋白質(zhì)的氨基酸組成、相對(duì)分子質(zhì)量、等電點(diǎn)、親水性、疏水性、消光系數(shù)、信號(hào)肽等在一些蛋白質(zhì)數(shù)據(jù)庫如UniProt等可查詢到已收錄序列的基本理化特征對(duì)于新得到的蛋白質(zhì)序列,可通過蛋白質(zhì)序列分析專家系統(tǒng)ExPASy(ExpertProteinAnalysisSystem)服務(wù)系統(tǒng)的蛋白組學(xué)工具軟件如ProtParam、ProScale和ComputepI/Mw等軟件進(jìn)行分析(http://www.expasy.ch/tools/)二、蛋白質(zhì)功能預(yù)測(cè)與分類

InterPro數(shù)據(jù)庫與蛋白質(zhì)功能預(yù)測(cè)與分類

COG、GO對(duì)蛋白質(zhì)功能的分類

KEGG對(duì)蛋白質(zhì)的代謝途徑分析

InterPro數(shù)據(jù)庫與蛋白質(zhì)功能的預(yù)測(cè)、分類DatabaseLocationPROSITESwissInstituteofBioinformatics(SIB),Geneva,SwitzerlandHAMAPSwissInstituteofBioinformatics,Geneva,SwitzerlandPfamWellcomeTrustSangerInstitute,Hinxton,UKPRINTSUniversityofManchester,UKSUPERFAMILYUniversityofBristol,UKCATH-Gene3DUniversityCollege,London,UKProDomPRABIVilleurbanne,FranceSMARTHeidelberg,GermanyTIGRFAMsJ.CraigVenterInstitute,Rockville,MD,USAPIRSFGeorgetownUniversityMedicalCentre,WashingtonDC,USAPANTHERUniversityofSouthernCalifornia,CA,USAInterProisaresourcethatprovidesfunctionalanalysisofproteinsequencesbyclassifyingthemintofamiliesandpredictingthepresenceofdomainsandimportantsites.Toclassifyproteinsinthisway,InterProusespredictivemodels,knownassignatures,providedbyseveraldifferentdatabases(referredtoasmemberdatabases)thatmakeuptheInterProconsortium.WhatisInterPro?WhyisInterProuseful?InterProcombinessignaturesfrommultiple,diversedatabasesintoasinglesearchableresource,reducingredundancyandhelpingusersinterprettheirsequenceanalysisresults.Byunitingthememberdatabases,InterPro

capitalisesontheirindividualstrengths,producingapowerfuldiagnostictoolandintegratedresource.WhousesInterPro?InterProisusedbyresearchscientistsinterestedinthelarge-scaleanalysisofwholeproteomes,genomesandmetagenomes,aswellasresearchersseekingtocharacteriseindividualproteinsequences.WithintheEBI,InterProisusedtohelpannotateproteinsequencesinUniProtKB.ItisalsousedbytheGeneOntologyAnnotationgrouptoautomaticallyassignGeneOntologytermstoproteinsequences.InterPro的功能

收集了已知蛋白質(zhì)家族、蛋白質(zhì)功能域和功能位點(diǎn)的信息,通過序列比對(duì),可用于未知蛋白質(zhì)序列的:分類(Superfamily,familyandsubfamilylevels)功能域(Domain)重要位點(diǎn)(Importantsite)GeneOntology(GO)注釋信息不同數(shù)據(jù)庫在數(shù)據(jù)組成上有所不同Pfam包含常見的蛋白質(zhì)功能域和蛋白質(zhì)家族,可瀏覽蛋白質(zhì)家族的多序列比對(duì)結(jié)果、蛋白質(zhì)功能域的立體構(gòu)造、蛋白質(zhì)家族的物種分布等。PANTHER主要包含蛋白質(zhì)家族的功能分類信息,一個(gè)大的蛋白質(zhì)家族按功能上的差異進(jìn)一步被歸納成一些次家族,顯示蛋白質(zhì)家族不同成員的特定功能的差異,使蛋白質(zhì)家族的功能表達(dá)更準(zhǔn)確。文字搜索和序列搜索InterPro提供簡(jiǎn)明的文字和序列搜索界面:可以根據(jù)InterPro,Pfam,PRINTS,Prosite,ProDom,SMART,TIGRFAMs,Uni-Prot的編號(hào)和蛋白命名、數(shù)據(jù)庫名、條目類型、GO號(hào)和GO術(shù)語等描述進(jìn)行文字搜索InterPro在線分析蛋白質(zhì)序列功能1)進(jìn)入InterPro主頁面2)將要分析的序列粘貼在空白框,然后點(diǎn)擊Search按鈕3)按窗口提示讀取結(jié)果,或進(jìn)入相關(guān)鏈接進(jìn)行進(jìn)一步分析2、

蛋白質(zhì)的功能分類

基因分類協(xié)會(huì)(GeneOntologyConsortium,GOC)整合了現(xiàn)有數(shù)據(jù)庫生物信息資源,建立了基因分類數(shù)據(jù)庫(theGeneOntology)GOC基因分類協(xié)會(huì)(GOC)建立了可控的動(dòng)態(tài)詞匯系統(tǒng),它從分子功能(MolecularFunction)、生物過程(BiologicalProcess)和細(xì)胞組分(CellularComponent)3個(gè)不同分類角度,建立了3棵分類樹對(duì)已經(jīng)分類到樹上的同源蛋白質(zhì)序列,賦予其特定的術(shù)語名稱和GO編號(hào)目前GeneBank和SwissProt已有60多萬條蛋白序列具有GO號(hào),即它們已定位于GO的分類樹上。同時(shí)一些綜合的蛋白質(zhì)注釋數(shù)據(jù)庫如酶協(xié)會(huì)(EC)、InterPro等與GO還有相對(duì)應(yīng)的列表,從而使蛋白序列數(shù)據(jù)庫和分類樹建立起聯(lián)系GOC基因分類協(xié)會(huì)成員TheOntologies

GO的組織原則:cellularcomponentbiologicalprocess

molecularfunction.Ageneproductmightbeassociatedwithorlocatedinoneormorecellularcomponents;itisactiveinoneormorebiologicalprocesses,duringwhichitperformsoneormoremolecularfunctions.

如基因產(chǎn)物cytochromec可被描述成:

themolecularfunctionterm:oxidoreductaseactivity

thebiologicalprocessterms:

oxidativephosphorylation

andinductionofcelldeath

thecellularcomponentterms:

cellmatrixandmitochondrialinnermembrane3個(gè)分支:分子功能、生物過程和細(xì)胞組成COG(ClustersofOrthologousGroups)

隨著越來越多物種的基因組完成測(cè)序,根據(jù)同源關(guān)系對(duì)物種間存在的保守蛋白質(zhì)(Ortholog)進(jìn)行分類已經(jīng)成為迫切的需要。COG按照其自定義的功能條目將蛋白質(zhì)四大類,并進(jìn)一步劃分為25個(gè)小類(功能簇),其中有一大類功能未知,具體描述如下:2.InformationStorageandProcessingTranslation,ribosomalstructureandbiogenesisRNAprocessingandmodificationTranscriptionReplication,recombinationandrepairChromatinstructureanddynamics1.PoorlyCharacterizedGeneralfunctionpredictiononlyFunctionunknown

3.CellularProcessesandSignalingCellcyclecontrol,celldivision,chromosomepartitioningNuclearstructureDefensemechanismsSignaltransductionmechanismsCellwall/membrane/envelopebiogenesisCellmotilityCytoskeletonExtracellularstructuresIntracellulartrafficking,secretion,andvesiculartransportPosttranslationalmodification,proteinturnover,chaperones4.MetabolismEnergyproductionandconversionCarbohydratetransportandmetabolismAminoacidtransportandmetabolismNucleotidetransportandmetabolismCoenzymetransportandmetabolismLipidtransportandmetabolismInorganiciontransportandmetabolismSecondarymetabolitesbiosynthesis,transportandcatabolism按照COG分類方法,有些蛋白或酶可以存在兩個(gè)或多個(gè)功能,例如:磷酸核糖焦磷酸合成酶(Phosphoribosylpyrophosphate

synthetase)既可以參與氨基酸的轉(zhuǎn)運(yùn)與代謝(Aminoacidtransportandmetabolism),也可以參與核苷酸的轉(zhuǎn)運(yùn)與代謝(Nucleotidetransportandmetabolism)3蛋白質(zhì)序列的代謝途徑分析

京都基因和基因組百科全書(KyotoEncyclopediaofGenesandGenomes,KEGGhttp://www.genome.ad.jp/kegg/)是日本京都大學(xué)生物信息學(xué)中心建立和維護(hù)的系統(tǒng)分析基因功能的綜合數(shù)據(jù)庫,創(chuàng)建于1995年包含455條代謝途徑和信號(hào)通路的數(shù)據(jù)庫有關(guān)基因目錄(GeneCatalogs)的基因數(shù)據(jù)庫(GENES)有關(guān)功能等級(jí)(FunctionalHierarchies)的BRITE數(shù)據(jù)庫有關(guān)疾病的HumanDisease數(shù)據(jù)庫配體數(shù)據(jù)庫(LIGAND)等等KEGGDatabases

KEGGpathway數(shù)據(jù)的結(jié)構(gòu)怎樣使用KEGG數(shù)據(jù)庫進(jìn)行蛋白質(zhì)在Pathway上進(jìn)行定位三、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)1.蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)二級(jí)結(jié)構(gòu):是指廣泛地存在于球狀蛋白質(zhì)內(nèi)的α-螺旋(α-helix)、β-折疊(β-pleatedsheet)和β-轉(zhuǎn)角(β-turn)等規(guī)則的蛋白質(zhì)局部結(jié)構(gòu)單元。在球狀蛋白質(zhì)中,常見若干相鄰的二級(jí)結(jié)構(gòu)單元組合在一起,形成規(guī)則的、在空間上能辨認(rèn)的充當(dāng)三級(jí)結(jié)構(gòu)構(gòu)件(blockbuilding)的二級(jí)結(jié)構(gòu)組合體(combination),又稱超二級(jí)結(jié)構(gòu)(supersecondarystructure)。蛋白質(zhì)二級(jí)結(jié)構(gòu)的預(yù)測(cè)大多通過與已知蛋白質(zhì)的三維結(jié)構(gòu)和二級(jí)結(jié)構(gòu)相比較,或通過計(jì)算各種結(jié)構(gòu)中氨基酸出現(xiàn)的頻率規(guī)律,結(jié)合人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等技術(shù)構(gòu)建預(yù)測(cè)方法實(shí)現(xiàn)的。目前,二級(jí)結(jié)構(gòu)預(yù)測(cè)對(duì)α-螺旋預(yù)測(cè)精度較好,對(duì)β-折疊的預(yù)測(cè)精度差些。蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的工具用于蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的工具較多,如:PredictProtein

(http:///)ANTHEPROT(http://antheprot-pbil.ibcp.fr/)COILS(http://embnet.vital-it.ch/software/COILS_form.html)其中最常用的是PredictProtein

由歐洲分子生物學(xué)實(shí)驗(yàn)室提供的一個(gè)web服務(wù),可以對(duì)蛋白質(zhì)序列和結(jié)構(gòu)進(jìn)行分析,web服務(wù)網(wǎng)址為:

http://www.embl-hei

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論