第10講 蛋白質二級結構預測_第1頁
第10講 蛋白質二級結構預測_第2頁
第10講 蛋白質二級結構預測_第3頁
第10講 蛋白質二級結構預測_第4頁
第10講 蛋白質二級結構預測_第5頁
已閱讀5頁,還剩71頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第十講蛋白質二級結構預測中心法則(thecentraldogma)蛋白質結構

蛋白質功能轉錄翻譯?翻譯細胞質核糖體氨基酸折疊密碼(foldingcode)又稱“第二遺傳密碼”,蛋白質的氨基酸序列與其三維空間結構間的關系。破譯折疊密碼:從蛋白質的一級結構得到立體結構,即可直接從基因推測其編碼蛋白質所對應的生物學功能。破解折疊密碼被列為“21世紀的生物學”的重要課題。在生物學研究中,分子的結構是最重要的數據它提供很多信息,包括生物分子的功能、作用機制、進化歷史等如何獲得蛋白質結構….-Gly-Ala-Glu-Phe-….?解決方法一

:實驗測定….-Gly-Ala-Glu-Phe-….X-射線晶體衍射核磁共振電鏡技術?20世紀60年代解析一個蛋白質結構可以獲得諾貝爾獎;20世紀70年代解析一個蛋白質結構則可成為轟動世界的新聞;20世紀80年代解析一個蛋白質結構則可申請到教授的職位;20世紀90年代解析一個蛋白質結構通常可以獲得博士學位;蛋白質結構解析的發展YearLaureatePrizeRationale1914MaxvonLauePhysics"ForhisdiscoveryofthediffractionofX-raysbycrystals",[118]animportantstepinthedevelopmentofX-rayspectroscopy.1915WilliamHenryBraggWilliamLawrenceBraggPhysics"FortheirservicesintheanalysisofcrystalstructurebymeansofX-rays",[119]1962MaxF.PerutzJohnC.KendrewChemistry"fortheirstudiesofthestructuresofglobularproteins"[120]1962JamesDeweyWatsonFrancisHarryComptonCrickMauriceHughFrederickWilkinsMedicine"Fortheirdiscoveriesconcerningthemolecularstructureofnucleicacidsanditssignificanceforinformationtransferinlivingmaterial"[121]1964DorothyHodgkinChemistry"ForherdeterminationsbyX-raytechniquesofthestructuresofimportantbiochemicalsubstances"[122]1972StanfordMooreWilliamH.SteinChemistry"Fortheircontributiontotheunderstandingoftheconnectionbetweenchemicalstructureandcatalyticactivityoftheactivecentreoftheribonucleasemolecule"[123]1976WilliamN.LipscombChemistry"Forhisstudiesonthestructureofboranesilluminatingproblemsofchemicalbonding"[124]1985JeromeKarleHerbertA.HauptmanChemistry"Fortheiroutstandingachievementsindevelopingdirectmethodsforthedeterminationofcrystalstructures"[125]1988JohannDeisenhoferHartmutMichelRobertHuberChemistry"Fortheirdeterminationofthethree-dimensionalstructureofaphotosyntheticreactioncentre"[126]1997JohnE.WalkerChemistry"Fortheirelucidationoftheenzymaticmechanismunderlyingthesynthesisofadenosinetriphosphate(ATP)"[127]2003RoderickMacKinnonPeterAgreChemistry"Fordiscoveriesconcerningchannelsincellmembranes[...]forstructuralandmechanisticstudiesofionchannels"[128]2006RogerD.KornbergChemistry"Forhisstudiesofthemolecularbasisofeukaryotictranscription"[129]2009AdaE.YonathThomasA.SteitzVenkatramanRamakrishnanChemistry"Forstudiesofthestructureandfunctionoftheribosome"[130]2012BrianKobilkaRobertLefkowitz

Chemistry"ForstudiesofG-protein-coupledreceptors"[131]X射線晶體學全解析的第一個蛋白質

結構--肌紅蛋白2005年,線粒體膜蛋白復合物2精細結構X射線衍射測定蛋白和核酸精細結構,為新藥設計提供了全新方向中國科學家研制抗癌新藥首獲瑞典愛明諾夫獎2016.03Lastupdate:TuesdayMar01,2016at4PMPST

數量大技術難度高瓶頸實驗測定蛋白質結構三維結構數據與一維序列數據在量上增長速度嚴重不協調解決方法二:結構預測….-Gly-Ala-Glu-Phe-….蛋白質結構預測:指從蛋白質的氨基酸序列預測出其三維空間結構。Levinthal悖論(Levinthal'sParadox)一個100個氨基酸組成的肽鏈的折疊:假設:三種可能構象/氨基酸殘基3100種不同構象;即使:10-13秒(0.1皮秒)/可能構想,(一皮秒:十億分之一秒的千分之一)5x1034秒,or1027年(宇宙年齡1010年)CyrusLevinthal(1996):美國分子生物學家

蛋白質結構預測的理論基礎:Anfinsen理論(Anfinsen'sdogma)ChristianBoehmerAnfinsen,Jr.(1916–1995)美國生物化學家,1972諾貝爾化學獎獲得者蛋白質序列含有蛋白質折疊的全部信息!凡人改變世界?Folding@home:(始于2000年10月)分布式蛋白質折疊計算,它是眾多分布式計算項目之一,也是最出名、普及最廣泛的之一。它所凝聚的志愿者計算能力,比肩世界最快的超級計算機“天河二號”。Intel、Google、NVIDIA、AMD(前ATI)、索尼、蘋果、戴爾等廠商形成了一個支持Folding@home項目發展的同盟。

蛋白質結構的層次與結構預測初級結構(primarystructure)-螺旋(-helix)

-折疊(-pleatedsheet)二級結構(secondarystructure)四級結構(quaternarystructure)三級結構(tertiarystructure)SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)蛋白質的二級結構預測判斷每一段中心的殘基是否處于-螺旋、-折疊(或其它狀態)的二級結構態。1.經驗參數法(Chou-Fasman方法)由Chou和Fasman在70年代提出來。通過統計分析,獲得的每個殘基出現于特定二級結構構象的傾向性因子(P(ɑ-helix)、P(β-sheet)),進而利用這些傾向性因子預測蛋白質的二級結構。理論依據:每種氨基酸出現在各種二級結構中傾向或者頻率是不同的。例如:谷氨酸(Glu,E):-螺旋(√)纈氨酸(Val,V):-折疊(√)脯氨酸(Pro,P):-螺旋(X)氨基酸殘基的構象傾向性因子定義:

Pi=Ai/Ti (i=,β,c,t) i表示構象態:如螺旋、β折疊、轉角、無規卷曲等;Ti是所有被統計殘基處于構象態i的比例;Ai是第A種殘基處于構象態i的比例;Pi大于1.0表示該殘基傾向于形成二級結構構象i,小于1.0則表示傾向于形成其它構象。四個轉角參數,f(i)、f(i+1)、f(i+2)和f(i+3)。這四個參數分別對應于每種殘基出現在轉角第一、第二、第三和第四位的頻率(例如,脯氨酸約有30%出現在轉角的第二位,然而出現在第三位的幾率不足4%)。Chou-Fasman參數基本思想是在序列中尋找規則二級結構的成核位點和終止位點。掃描輸入的氨基酸序列,發現可能成為特定二級結構成核區域的短序列,然后對于成核區域進行擴展,不斷擴大成核區域,直到傾向性因子小于某個閾值(1.0)為止。成核區延伸延伸ɑ-螺旋Chou-Fasman參數法預測二級結構的經驗規則氨基酸殘基(i)α螺旋規則(ii)β折疊規則(iii)轉角規則

(iv)重疊規則經驗規則(i)α螺旋規則沿蛋白質序列尋找α螺旋核相鄰的6個殘基中如果有至少4個殘基傾向于形成α螺旋,則認為是螺旋核。從螺旋核向兩端延伸直至四肽片段的α螺旋傾向性因子的平均值{P}<1.0為止。將螺旋兩端各去掉3個殘基剩余部分若長于6個殘基,而且{P}>1.03,則預測為螺旋。(ii)β折疊規則相鄰6個殘基中若有4個傾向于形成β折疊,則認為是折疊核。折疊核向兩端延伸直至4個殘基的平均折疊傾向性因子{P}<1.0。若延伸后的片段的{P}>1.05,則預測為β折疊。在實際運用中有50-60%的準確率,雖然有文章宣稱能達到更高的準確率(數據集受限)(iii)β-轉角規則轉角的模型為四肽組合模型,要考慮每個位置上殘基的組合概率,即特定殘基在四肽模型中各個位置的概率。在計算過程中,對于從第i個殘基開始的連續4個殘基的片段,將上述概率相乘,根據計算結果判斷是否是轉角。如果f(i)×f(i+1)×f(i+2)×f(i+3)大于7.5×10-5,四肽片段Pt的平均值大于100,并且Pt的均值同時大于P

的均值以及P

的均值,則可以預測這樣連續的4個殘基形成轉角。

2.基于氨基酸疏水性的預測方法α螺旋的兩親特特征:螺旋的一側通常處于蛋白質的疏水核心,另一側則常處于親水表面,因此,α-螺旋中親疏水氨基酸殘基的出現位置也就有一定的規律性,親水殘基多出現在親水側面,而疏水殘基則多出現在疏水側面,反映在序列上就是一些特征的親疏水殘基間隔模式。脂肪族疏水性氨基酸極性或帶負電氨基酸帶正電氨基酸432151432α-螺旋的兩親特特征與結構預測基于氨基酸疏水性的預測α螺旋的形成規律:在一段序列中發現第i、i+3、i+4位(如1、4、5)是疏水殘基時,這一片段就被預測為α螺旋;當發現第i、i+1、i+4位(如7,8,11)為疏水殘基時,這一片段也被預測為α螺旋。基于氨基酸疏水性的預測β折疊的形成規律:對于β折疊,也存在著一些特征的親疏水殘基間隔模式,埋藏的β折疊通常由連續的疏水殘基組成,一側暴露的β折疊則通常具有親水-疏水的兩殘基重復模式。原則上,通過在序列中搜尋特殊的親疏水殘基間隔模式,就可以預測α螺旋和β折疊。將待預測的片段與數據庫中已知二級結構的片段進行相似性比較,根據相似性得分以及數據庫中的構象態,構建出待預測片段的二級結構。該方法對數據庫中同源序列的存在非常敏感,若數據庫中有相似性大于30%的序列,則預測準確率可大大上升。3.基于多重序列比對的方法(同源法)

序列比對:

T=TNGIY

U=TSGVF

將T的構象態賦予U相似序列→相似結構4.綜合方法多個程序同時預測

綜合評判,一致結果雙重預測:首先預測蛋白質的結構類型,然后再預測二級結構經驗參數法基于氨基酸疏水性的預測方法同源分析法蛋白質二級結構預測的意義由蛋白質二級結構統計分析得到的規則可用于全新蛋白質設計或蛋白質突變體的設計。當序列同源性較低時,二級結構的指認有助于確定蛋白質間結構與功能的關系。在基于二級結構片段堆積的三級結構預測中正確的二級結構預測是第一步。二級結構的預測有助于多維核磁共振中二級結構的指認,同時也有助于晶體結構的解析。蛋白質二級結構在線預測PHDsecneuralnetworkforsecondarystructureprediction,accesibility,andtrans-membranehelix.Usesmultiplealignments.Reliability~70%.Jpred

uses2neuralnetworksandincludesevolutiveinformation(PSI-BLAST).Theversion2evaluatestheresultsof4networks(JNet,NSSP,Predator,PHD)toimprovereliability.pbio.dundee.ac.uk/jpred/PROFBasedonmultiplealignmentsandotherresiduepropertiesobtainedfromdatabases.Relaibility~70%.PSIpred

Basedonfilteredpsi-blastprofilesandneuralnetworks(combinesreultsfromdifferentmethods).relaibilityis>76%.

PredictProtein

(PHDsec)

PsiPred

JPred

蛋白質折疊病同源建模法(Homologymodelling)線索化法/折疊識別法/串線法(Threading/Foldrecognition)從頭預測法(Abinitio/Denovomethods)蛋白質三級結構預測蛋白質三級結構預測

1.同源蛋白質結構預測依據:任何一對蛋白質,如果兩者的序列等同部分超過30%(序列比對長度大于80),則它們具有相似的三維結構,即兩個蛋白質的基本折疊相同,只是在非螺旋和非折疊區域的一些細節部分有所不同。主要思想:對于一個未知結構的蛋白質,找到一個已知結構的同源蛋白質,以該蛋白質的結構為模板,為未知結構的蛋白質建立結構模型。搜索結構模型的模板序列比對建立骨架構建目標蛋白質的側鏈、環區、加入氫原子優化模型同源建模的過程將模板結構的坐標拷貝到目標U,僅拷貝匹配殘基的坐標

分子力學分子動力學模擬退火

PDB數據庫SWISS-MODEL:

//SWISS-MODEL.html同源建模方法特點繞過了二級結構預測目前蛋白質結構預測方法中最成功、最準確、使用最多局限是:僅僅是一種技術手段,而非理論應用范圍收已有同源結構的限制Loop區域準確率差又稱蛋白質折疊類型識別依據:蛋白質折疊模式的有限性:一些序列(小于25%,遠程同源)/功能不同的蛋白質采用類似的結構,蛋白質折疊模式的種類是有限的。序列中的殘基的結構信息比殘基本身更加保守。蛋白質三級結構預測

2.線索化方法蛋白質結構分類數據庫SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)CATH的結構層次主要思想:利用氨基酸的結構傾向(如形成二級結構的傾向、疏水性、極性等),評價一個序列所對應的結構是否能夠適配到一個給定的結構環境中。建立序列到結構的線索的過程稱為線索化,線索技術又稱折疊識別技術。具體做法是即將結構轉換為含有這三個結構的字符串,然后對這些字符串進行比較。線索技術的首要任務是建立核心折疊數據庫在預測蛋白質空間結構時將一個待預測結構的蛋白質序列與數據庫中核心折疊進行比對,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論