華中農業大學生物信息學Bioinf02-2_第1頁
華中農業大學生物信息學Bioinf02-2_第2頁
華中農業大學生物信息學Bioinf02-2_第3頁
華中農業大學生物信息學Bioinf02-2_第4頁
華中農業大學生物信息學Bioinf02-2_第5頁
已閱讀5頁,還剩40頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

章數據庫(III)生物信息學EBI(EuropeanBioinformaticsInstitute)管理與GenBank收集的數據相同序列數據展示方式與GenBank不同(網頁,純文本)數據庫主頁“Textsearch”輸入關鍵詞檢索到的條目每一條目詳細內容(10)ENA(EuropeanNucleotideArchive)(11)DDBJ(DNADataBankofJapan)與GenBank收集的序列數據相同數據庫主頁

提供基于關鍵詞及序列的搜索服務

打開“ARSA”輸入關鍵詞檢索到的條目每一條目詳細內容與GenBank一致發表文章要提供Accessionnumber(在三大核苷酸數據庫中通用)EPD(EukaryoticPromoterDatabase)

由WeizmannInstituteofScienceinRehovot(Israel)開創收集數據的轉錄起始位點(TSS)通過實驗確定包括部分cis-element信息同一個基因可以具有多個啟動子原版(EPD)包含4809條真核生物聚合酶II(eukaryoticPOLII)啟動子序列新版(EPDnew)主要包含人類、小鼠和果蠅的大量啟動子信息,總數超過20萬(12)啟動子數據庫PlantProm(plantpromoterdatabase)植物啟動子數據庫(水稻、擬南芥)部分收集數據的轉錄起始位點(TSS)通過實驗確定,其他的有全長cDNA序列支持包括部分cis-element信息最近更新是2009.02,總共8301條植物啟動子序列可以完整下載(12)啟動子數據庫(13)miRNA數據庫Science309:1522(2005)轉錄RNA折疊形成pri-miRNApre-miRNAmiRNARISC攜帶有活性的miRNAmiRNAgenemicroRNA(miRNA)的形成miRBase

收集了28645條hairpinprecursormiRNA序列(第21版,2014.6)來源于>100個物種可以通過miRNA名稱、關鍵詞、染色體位置等信息檢索數據庫分析一條DNA序列中是否可能包含miRNA(第四章介紹)(13)miRNA數據庫利用miRNA編號或關鍵詞檢索(1)在數據庫主頁點擊“searching”在“SearchmiRBase”網頁的“BymiRNAidentifierorkeyword”欄目輸入miRNA編號,點擊“提交查詢內容”檢索結果目錄查看詳細信息利用染色體位置檢索miRNA(2)在數據庫主頁點擊“searching”在“SearchmiRBase”網頁的“Bygenomiclocation”欄目選擇物種和染色體,輸入染色體上的核苷酸位置范圍(如1000至1000000),點擊“Getsequences”檢索結果目錄查看詳細信息檢索miRNA群(cluster)(3)在數據庫主頁點擊“searching”在“SearchmiRBase”網頁的“Forclusters”欄目選擇物種,輸入希望查詢的miRNA之間的距離(核苷酸數目),點擊“Getclusters”檢索結果目錄批量獲取maturemiRNA序列:在結果目錄網頁的“Fetch”列選擇miRNA,在該網頁的底部選擇“Maturesequence”,點擊“FetchSequences”第二章數據庫(IV)生物信息學2、蛋白質數據庫由PIR、EBI和SIB于2002年創辦,統一了PIR、TrEMBL和Swiss-Prot三個蛋白質數據庫分為兩個部分:來源于實驗的有詳細注釋的序列(SwissProt)和自動注釋序列(TrEMBL)與100多個數據庫相互參照(cross-reference)可用關鍵詞(Textsearch)和序列比對(BLASTsimilaritysearch)進行檢索(1)UniProt

/UniRef100:非冗余的UniProt蛋白質序列UniRef90:聚類UniRef100中一致性超過90%且80%重疊的蛋白質,取最長的一條(序列數壓縮58%)UniRef50:聚類UniRef90中一致性超過50%且80%重疊的蛋白質,取最長的一條(序列數壓縮79%)UniProt蛋白質數據庫的結構在數據庫主頁搜索框選擇“ProteinKnowledgebase”庫,使用關鍵詞檢索結果頁面,reviewed(Swiss-Prot),unreviewed(TrEMBL)Browsebytaxonomy,keyword,geneontology,enzymeclassorpathway條目詳細內容(1)UniPROT(2)PIR(ProteinInformationResource)

由NationalBiomedicalResearchFoundation創辦信息整合的蛋白質序列數據庫(iProClass),內容/編號與UniProtKB相同,但額外提供到超過160個數據庫的鏈接蛋白質序列分類數據庫(PIRSF),提供不同層級的蛋白質家族分類(Superfamily、HomeomorphicFamily和HomeomorphicSubfamily)(2)PIR(ProteinInformationResource)檢索某一蛋白質的注釋信息數據庫主頁“Search/Analysis”菜單“TextSearch”選擇數據庫“iProClass”后輸入關鍵詞或注冊號檢索結果列表查看詳細內容檢索某一蛋白質分類的信息數據庫主頁“Search/Analysis”菜單“TextSearch”選擇數據庫“PIRSF”后輸入關鍵詞或注冊號檢索結果列表查看詳細內容(3)PRF(ProteinResearchFoundation)

由日本的ProteinResearchFoundation創辦已發表在雜志上的蛋白質序列修飾位點、S-S鍵等兩月更新一次(4)PDBSTR(Re-OrganizedProteinDataBank)

蛋白質序列和二級結構碳結構(5)Prosite

蛋白質家族結構域3、結構數據庫(1)PDB(ProteinDataBank)

由BrookhavenNationalLaboratories創辦蛋白質核酸其它117651個結構圖(2016.4.11)可通過關鍵詞或BLAST系統檢索(第四章介紹)TotalYearlyPDBContentGrowth(1)PDB(ProteinDataBank)使用關鍵詞或注冊號檢索PDB數據庫主頁“Search”框輸入關鍵詞或注冊號檢索結果列表查看詳細內容(2)NDB(NucleicAcidDatabase)

包含8,089個核酸分子的結構(2016.3)(3)PDIdb(Protein-DNAInterfaceDatabase)

DNA-蛋白質復合體的X射線衍射結構及分類4、酶和代謝數據庫KEGG(KyotoEncyclopediaofGenesandGenomes)各種代謝、遺傳等路徑圖可檢索參于各種路徑的基因檢索Metabolism(1)KEGG主頁點擊“KEGGPATHWAY”“PATHWAY”網頁點擊任一代謝路徑(Metabolism),如糖酵解/糖原異生途徑(Glycolysis/Gluconeogenesis)檢索GeneticInformationProcessing(2)KEGG主頁點擊“KEGGPATHWAY”“PATHWAY”網頁點擊任何遺傳信息(GeneticInformationProcessing)路徑,如Proteinexport路徑可以查看參加這一路徑蛋白質的信息KEGG數據庫檢索EnvironmentalInformationProcessing(3)KEGG主頁點擊“KEGGPATHWAY”“PATHWAY”網頁點擊任何EnvironmentalInformationProcessing路徑,如MAPKsignalingpathway路徑可以查看與這一路徑相連的其它信號路徑或參加這一路徑的蛋白質信息KEGG數據庫檢索CellularProcesses(4)KEGG主頁點擊“KEGGPATHWAY”“PATHWAY”網頁點擊任何CellularProcesses路徑,如Cellcycle路徑可以查看與這一路徑相連的其它信號路徑或參加這一路徑的蛋白質信息KEGG數據庫(2)PKR(ProteinKinaseResource)多種檢索內容已知蛋白激酶的序列比較蛋白激酶分類蛋白激酶的三維結構與疾病相關的蛋白激酶其它內容5、物種分類數據庫物種分類界(Kingdom)門(Phylum)綱(Class)目(Order)科(Family)屬(Genus)種(Species)每一分類等級下可加設亞級(Sub-),如亞門、亞綱、亞科等。每一分類等級上可加設總級(Super-),如總綱、總目、總科等。動物界(Animal)脊索動物門(Chordata)脊椎動物亞門(Vertebrata)哺乳綱(Mammalia)嚙齒目(Rodentia)鼠科(Muridae)小家鼠屬(Mus)小家鼠種(musculus)Mouse:Musmusculus在Taxonomy主頁輸入物種俗名檢索“pig”Taxonomy數據庫lineage在Taxonomy主頁輸入物種學名檢索“Homosapiens”lineage擬南芥(Arabidopsisthaliana)系譜檢索某一物種的系譜(lineage):6、文獻數據庫(1)

/PubMed/美國國家醫學圖書館的數據庫醫學、分子生物學、基礎生物學5400多種刊物,來源于80多個國家文獻年限:1947年至今提供摘要,全文鏈接免費全文收集在PubMedCentralEuropePubMedCentral(內容相同):(2)其它類型的文獻數據庫Agricola

/

美國農業部農業圖書館的數據庫農業類刊物OMIM(OnlineMendelianInheritanceinMan)/omimNCBI的數據庫,每天更新數據人類基因、遺傳疾病在NCBI主頁選擇OMIM后輸入關鍵詞(疾病、基因名稱等)進行檢索條目(2)其它類型的文獻數據庫GOPubMed/web/gopubmed/基于PubMed,利用GO和MESH詞表對文獻全面分析快速了解相關領域文獻的年度分布、期刊分布、地域分布、合作者可視化網絡等信息可以根據背景知識、雜志、作者、地域和發表時間等選項對于查詢結果進行篩選查詢雜志“NatGenet”有關人類的研究結果(2)其它類型的文獻數據庫GOPubMed檢索使用關鍵詞檢索“ricesnpdatabase”查看統計結果,選擇雜志“NucleicAcidsRes”查看在該雜志中的相關文獻7、更多的數據庫第二章數據庫(V)生物信息學8、向數據庫提交和修改核苷酸和蛋白質序列提交:Submission修改:Update數據庫中的數據由大家無償提供,共同享用Accuracy??(1)向GenBank提交或修改核苷酸序列GenBank主頁菜單“Submit”BankIt功能提交序列網上直接提交,簡單方便提交后立刻得到臨時編號二天內得到Accessionnumber用Update功能修改GenBank中的序列和相關信息Accessionnumber不變,修改一次,version的編號就進一位用Sequin方法提交序列可下載的電子表格自動確定CDS、ORF和查找重復序列BankIt發表文章需要提交序列(2)向UniProtKB提交或修改蛋白質序列使用SPIN網上直接操作,網頁先注冊(Register),然后登陸(Login)填寫電子表格只接收用蛋白質直接測序的序列質譜數據通過email提交到PRIDE由核苷酸序列翻譯得到的蛋白質序列將進入TrEMBLMore…

遞交數據到NCBI/guide/howto/submit-sequence-data/

遞交數據到ENAhttp://www.ebi.ac.uk/ena/about/submit_and_update大規模數據往往需要郵件聯系9、常用序列格式FAS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論