實驗四蛋白質序列、結構的獲取和顯示_第1頁
實驗四蛋白質序列、結構的獲取和顯示_第2頁
實驗四蛋白質序列、結構的獲取和顯示_第3頁
實驗四蛋白質序列、結構的獲取和顯示_第4頁
實驗四蛋白質序列、結構的獲取和顯示_第5頁
已閱讀5頁,還剩52頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、復旦大學 實驗四:蛋白質序列、結構的獲取和顯示實驗四:蛋白質序列、結構的獲取和顯示杜杜 娟娟基因與蛋白質組學數據分析基因與蛋白質組學數據分析實驗項目四:蛋白質序列、結構的獲取和顯示實驗項目四:蛋白質序列、結構的獲取和顯示一、 實驗目的和要求: 掌握蛋白質序列數據庫Uniprot的查詢方法及格式特點 掌握蛋白質結構數據庫PDB的及格式特點 掌握蛋白質結構顯示軟件Pymol的使用2 UniProt:Universal Protein Resource 收錄蛋白質序列目錄最廣泛、功能注釋最全面的數據庫; 包含三個子庫: UniProtKB(UniProt Knowledgebase) UniRef(

2、UniProt Reference Clusters) UniParc(Uniprot Archive)一一 UniProt數據庫數據庫31. 1. 簡介簡介2. 數據來源4European Bioinformatics Institute (EMBL-EBI)SIB Swiss Institute of BioinformaticsProtein Information Resource (PIR)Swiss-Prot and TrEMBLProtein Sequence Database (PIR-PSD)5UniProt的網址:的網址: / 3.

3、數據查詢數據查詢 Uniprot檢索號,包括6個字符串,可由大寫字母AZ和數字09組合而成。 也可以用關鍵詞檢索 檢索演示例例1:查詢:查詢草履蟲草履蟲細胞周期蛋白依賴的蛋白激酶(CDK2)的結構數據的結構數據(1)登陸Uniprot網站 /( 2 ) 在 搜 索 欄 選 中 “ P r o t e i n knowledgebase(UniProtKB)” ,在文本框中輸入“Paramecium tetraurelia CDK2”,單擊Site Search按鈕,出現結果。8910111213與其他數據庫的鏈接與其他數據庫的鏈接144. UniPro

4、t數據格式ID Q9XYV1_PARTE Unreviewed; 301 AA.AC Q9XYV1;DT 01-NOV-1999, integrated into UniProtKB/TrEMBL.DT 01-NOV-1999, sequence version 1.DT 21-MAR-2012, entry version 71.DE SubName: Full=Cyclin-dependent protein kinase Cdk2;GN Name=CDK2;OS Paramecium tetraurelia.OC Eukaryota; Alveolata; Ciliophora; Int

5、ramacronucleata;OC Oligohymenophorea; Peniculida; Parameciidae; Paramecium.OX NCBI_TaxID=5888;頭部區頭部區15序列名稱序列名稱序列編號序列編號序列來源的物種名序列來源的物種名序列來源的物種序列來源的物種學名和分類學位學名和分類學位物種分類號物種分類號序列簡單說明序列簡單說明引文區引文區RN 1RP NUCLEOTIDE SEQUENCE.RC STRAIN=51S;RX MEDLINE=99448661; PubMed=10519216;RX DOI=10.1111/j.1550-7408.1999.

6、tb06065.x;RA Zhang H., Berger J.D.;RT A novel member of the cyclin-dependent kinase family in ParameciumRT tetraurelia.;RL J. Eukaryot. Microbiol. 46:482-491(1999).評論區評論區CC -CC Copyrighted by the UniProt Consortium, see /termsCC Distributed under the Creative Commons Attribution

7、-NoDerivs LicenseCC -16相關文獻編號或遞交序列的注冊信息相關文獻編號或遞交序列的注冊信息序列注釋信息序列注釋信息交叉引用數據庫區交叉引用數據庫區DR EMBL; AF126147; AAD34354.1; -; Genomic_DNA.DR HSSP; P24941; 1OIQ.DR ProteinModelPortal; Q9XYV1; -.DR GO; GO:0005524; F:ATP binding; IEA:UniProtKB-KW.DR GO; GO:0004674; F:protein serine/threonine kinase activity; IE

8、A:InterPro.DR InterPro; IPR011009; Kinase-like_dom.DR InterPro; IPR000719; Prot_kinase_cat_dom.DR InterPro; IPR017441; Protein_kinase_ATP_BS.DR InterPro; IPR002290; Ser/Thr_dual-sp_kinase_dom.DR InterPro; IPR008271; Ser/Thr_kinase_AS.DR Pfam; PF00069; Pkinase; 1.DR SMART; SM00220; S_TKc; 1.DR SUPFAM

9、; SSF56112; Kinase_like; 1.DR PROSITE; PS00107; PROTEIN_KINASE_ATP; 1.DR PROSITE; PS50011; PROTEIN_KINASE_DOM; 1.DR PROSITE; PS00108; PROTEIN_KINASE_ST; 1.17序列區KW ATP-binding; Cyclin; Kinase; Nucleotide-binding; Transferase.SQ SEQUENCE 301 AA; 34675 MW; E839F1A5EA0D5CB5 CRC64; MDLAQSEERY QKLEKIGEGT

10、YGLVYKARDN QTGDIVALKK IRMDHEDEGV PSTAIREISL LKEVQHPNIV PLKDVVYDES RLYLIFDFVD LDLKKYMESV PQLDRMQVKK FINQMIQALN YCHQNRVIHR DLKPQNILVD IKQQNTQIAD FGLARAFGLP LKTYTHEVIT LWYRAPEILL GQRQYSTPVD IWSLGCIFAE MAQKRPLFCG DSEIDQLFKI FKIMGTPKES TWPGVSTLPD FKSTFPRWPT PTNPAATLGK DITNLCPLGL DLLSKMITYD PYARITAEEA LKH

11、AYFDELN N/ 18與序列相關的關鍵詞與序列相關的關鍵詞氨基酸統計數氨基酸統計數DNA代碼1920FASTA文件格式文件格式tr|Q9XYV1|Q9XYV1_PARTE Cyclin-dependent protein kinase Cdk2 OS=Paramecium tetraurelia GN=CDK2 PE=4 SV=1ID 號號名稱,基本性質簡要說明名稱,基本性質簡要說明21在Uniprot中查詢擬南芥的光敏色素phyE編碼蛋白的詳細信息,閱讀序列格式的解釋,列出共包含哪幾個部分?標出頭部區主要字段的含義。在Uniprot中查詢(1)擬南芥油菜素內酯受體gibberellin

12、receptor GID1C 、 (2)水稻獨角金內酯水解酶strigolactone hydrolase D14的蛋白質序列,這兩個蛋白包含多少個氨基酸?寫出它們所對應的mRNA檢索號(類似于這樣的格式N*_*)、GeneID號。作作 業業 PDB Protein DataBank,美國Brookhaven國家實驗室管理生物大分子三維空間結構原子坐標數據庫 /pdb/ NCBI STRUCTURE: MMDB (Molecular Modelling DataBase),包含了從PDB獲取的實驗確定的生物高聚物結構分子模型數據庫 。PDB數據庫(1. 簡介

13、簡介 美國Brookhaven實驗室1971年建立的大分子結構數據庫PDB 蛋白質晶體結構資料數據蛋白質晶體結構資料數據庫庫 (Protein Data Bank)。 PDB數據庫的維護由結構生物信息學研究合作組織(Research Collaboration for Structural Bioinformatics, RCSB)負責。2.數據來源數據來源 通過實驗(X射線晶體衍射,核磁共振,電子顯微鏡方法等)測定的生物大分子的三維結構。 主要是蛋白質的三維結構,還包括核酸、糖類、蛋白質與核酸復合物的三維結構。 3.數據統計數據統計 截止2013年11月,PDB數據庫已含有95644 個結構

14、數據,其中約92.5%是蛋白質的結構。 4.數據查詢數據查詢 PDB中的記錄有唯一的PDB-ID,包括4個字符串,可由大寫字母AZ和數字09組合而成。 PDB和它的鏡像站點提供每個PDB記錄的查詢,可按一些專門的查詢項目(如提交數據、作者姓名、結構表達)進行檢索。 檢索演示例例1:查詢:查詢的結構數據的結構數據(1)登陸PDB網站 /pdb/(2)在上方的搜索欄選中“Everything” ,在文本框中輸入“HUMAN TEAR LIPOCALIN”,單擊Site Search按鈕,出現結果。第一步:第一步: 輸入關鍵字輸入關鍵字“HUMAN HUMAN T

15、EAR LIPOCALIN” TEAR LIPOCALIN” 也可輸入也可輸入IDID號號 第二步:第二步: 選擇人類淚液載脂蛋選擇人類淚液載脂蛋白白1XKI 1XKI 數據查看:(3)分別單擊標簽3D view,Sequence,Annotations,Seq.Similarity, 3D Similarity, Literature, Biol.& Chem., Methods, Geometry觀察數據信息。(4)回到Summary標簽,在右側的Biological Assembly區域可以觀察蛋白的三維結構。(5)單擊右側目錄中的Download Files下載不同格式和內容的

16、文件;或下載FASTA序列文件;也可下載PDB文件(1XKI.pdb)。第三步:觀察數據信息第三步:觀察數據信息 1XKI1XKI第四步:第四步: 1XKI1XKI結構展示圖結構展示圖 下載下載PDB結結構文件構文件5.數據結構PDB中對于每一個結構記錄,包含名稱、參考文獻、序列、一級結構、二級結構和原子坐標等信息。 每條記錄有兩種序列信息,一種是顯式序列信息(explicit sequence),一種是隱式序列信息(implicit sequence)。 在PDB文件中,以關鍵字SEQRES作為顯式序列標記,以該關鍵字打頭的每一行都是關于序列的信息;PDB的隱式序列即為立體化學數據,包括每個

17、原子的名稱和原子的三維坐標。 PDB文本文件,文本文件, 用寫字板打開用寫字板打開標題部分標題部分分子類別分子類別轉運蛋白轉運蛋白 該文件的公該文件的公布日期布日期 該化合物該化合物的的pdb代代碼碼 該化合物的該化合物的來源來源 結構測定者結構測定者名字名字 REMARK是此是此pdb文件的參文件的參考書目、最大分辨率、注解考書目、最大分辨率、注解等等 一級結構一級結構雜因子雜因子二級結構二級結構連接注釋連接注釋晶胞特征及晶胞特征及坐標變換坐標變換連通性部分連通性部分 坐標部分坐標部分1-6 “ATOM 或或 HETATM”7-11 原原子子序序列列號號13-16 原原子子名名稱稱18-20

18、 殘殘基基名名22 鏈鏈標標識識符符23-26 殘殘基基序序列列號號31-38 X坐坐標標39-46 Y坐坐標標47-54 Z坐坐標標55-60 位位置置61-66 溫溫度度因因子子79-80 原原子子帶帶的的電電荷荷77-78 元元素素符符號號 三 結構顯示軟件-PyMOL簡介/All指所有的對象,指所有的對象,3ODU指剛指剛才打開的文件,才打開的文件,(sele)是選擇的是選擇的對象對象按鈕按鈕A:代表對這個對象的各種代表對這個對象的各種action,S:顯示這個對象的某種樣式,:顯示這個對象的某種樣式,H:隱藏某種樣式,:隱藏某種樣式,L:顯示某種

19、:顯示某種label,C:顯示的顏色:顯示的顏色點擊點擊all中的中的H,選擇,選擇everything,隱藏所有,隱藏所有點擊點擊3ODU中的中的S,選擇,選擇cartoon,以,以cartoon形式顯示蛋白質形式顯示蛋白質點擊點擊3ODU 中的中的C , 選擇選擇by ss , 以二級結構分配顏色,以二級結構分配顏色, 選擇選擇點擊右下角的點擊右下角的S,窗口上面出現蛋白質氨基酸序列,找到,窗口上面出現蛋白質氨基酸序列,找到1164位位ITD,是,是配體配體點擊選擇點擊選擇ITD ,此時,此時sele中就包含中就包含ITD這個殘基,點擊(這個殘基,點擊(sele)行的)行的A,選擇,選擇rename selection,窗口中出現,窗口中出現更改更改sele為為IDT,點擊(,點擊(IDT)行的)行的S選擇選擇sticks,點擊,點擊C,選擇,選擇by element,選,選擇,調整窗口使此分子清楚顯示。擇,調整窗口使此分子清楚顯示。IDT行點擊行點擊A 選

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論