




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
PAGEPAGE50附錄APPENDIX藥物生物信息學PHARMACEUTICALBIOINFORMATICS治療藥物概述Section1Introductiontotherapeuticdrugs一、疾病和代謝途徑的關系人體內DNA、蛋白質、激素、離子等都在進行新陳代謝,但不同物質的穩態濃度(steady-statelevel)和代謝速度(metabolismrate)差異很大。如腎上腺素作用于肝細胞后很快生成環腺苷酸(cyclicadenosinemononucleotide,cAMP),但cAMP又很快被環核苷酸磷酸二酯酶(cyclicnucleotidephosphodiesterase,PDE)水解失去活性,故胞內cAMP穩態濃度很低。相反,脂肪組織內的脂肪含量高,其脂肪分解和合成代謝的速度變化也小得多。cAMP對細胞生理活動有很強且快速的調節作用,需對其穩態水平進行精確控制;脂肪作為儲備能源物質含量高且其含量不需精確控制。因此,人體生理活動需有效控制各種物質的新陳代謝,其中不同作用的物質其代謝速度和控制精度也不同。體內物質代謝都有對應的代謝途徑(metabolicpathway),且常由物質轉運載體、(系列)酶、所需原料等組成,每條代謝途徑都有關鍵成分控制其進行速度。體內任何物質的完整代謝途徑不可逆,但人體物質代謝可由多組織協同完成,某個組織或細胞可只完成一部分代謝過程。例如,很多細胞都可快速水解cAMP而精確控制胞內cAMP的穩態濃度,但cAMP徹底分解則需血液、肝臟和腎臟等參與。盡管任何物質的合成和分解代謝都對維持其穩態水平有貢獻且大部分酶催化反應可逆,但體內任何物質合成和分解的代謝途徑有區分,否則其穩態水平將由反應的熱力學而不是代謝速度控制。另外,不同器官、組織、細胞功能不同,對不同物質的需求和維持其穩態的貢獻也不同;隨生長發育或生理節律變化,人體整體或局部對物質的需求也有變化,體內物質的局部穩態水平也應呈現對應的變化。因此,討論疾病相關代謝途徑時,既要將體內任何物質的合成和分解代謝途徑、整體和局部對特定物質的需求等分別考慮,又要將它們緊密聯系為整體考慮。所討論物質代謝途徑通常只是其完整代謝途徑的一部分,有時對特殊物質的代謝途徑可簡單到只含一種蛋白質和一種小分子物質。另一方面,在細胞內外都有各種物質通過相互作用傳遞信號調節細胞的生理活動,這些物質及其相互作用組成的系統稱為信號通路(signalingpathway),啟動信號傳遞過程的物質可來自胞外或胞內。信號通路中的物質對細胞生理活動有很強的控制作用,故其含量及活性需精確控制。細胞對不同信號通路響應速度相差很大。作用于細胞后產生效應快的大部分胞外信號可誘導胞內產生新的信號分子,例如腎上腺素作用于肝細胞產生的cAMP等,即第二信使(secondarymessenger)。信號通路中蛋白質等大分子物質的從頭合成受到生物化學機制限制不可能很快,其通常通過化學修飾與其他分子相互作用,如變構效應(allostericeffect)等方式快速調節其活性。作用于細胞后產生效應較慢的信號通路中,小分子物質仍參與對應的代謝途徑但含量控制較精密,而此類信號通路中蛋白質等大分子物質的含量也類似于小分子物質主要通過合成和降解進行調節。信號通路涉及細胞外成分時常需膜受體。信號通路本質上仍屬于代謝途徑,只是其關鍵成分的活性控制方式更精密,且其生物學意義不是控制信號通路中物質自身的含量而是通過信號傳遞控制其他代謝途徑中物質的含量和細胞的生理活動。多數信號通路下游成分較多,對細胞生理活動影響廣泛。也正是因為如此,細胞、組織、器官和個體才需要精確控制信號通路中各種成分的含量和活性,以維持整體的協調性。在疾病發生過程中有的物質啟動或促進疾病發生,有的物質阻斷或抑制疾病發生,人體疾病發生主要是由生命活動過程中重要物質(包括水)的整體或局部代謝失衡(其中,部分疾病是基因表達缺陷造成的對應代謝功能缺失造成),或對應的信號通路調節失衡所引起。例如,各種原因造成炎癥介質(inflammatorymediator)釋放過多而引起疼痛、不同原因引起腫瘤基因活躍表達使細胞生長失控、外部物質供應不足造成營養不良、未知原因造成淀粉樣蛋白質大量聚集而誘發老年性癡呆(AlzheimerDisease,AD)、胰島功能不足導致胰島素分泌降低造成糖尿病(diabetes)等。盡管有些疾病誘因還不明確,但可相信它們直接或間接誘因還是某個或某些特定物質的代謝失衡。因此,干預體內代謝途徑和信號通路以維護體內環境的相對穩定是藥物治療的根本目的。二、代謝途徑與信號通路的干預和藥物作用模式藥物在體內的作用主要是直接或間接地使體內引起病理現象的代謝物或信號傳遞分子恢復到人體健康所需的穩態,或阻斷這些能誘發疾病發生與發展的代謝物或信號傳遞分子的作用。最常見藥物作用模式是其直接調節體內有重要病理或生理作用物質的代謝速度而控制其穩態水平。體內物質局部或整體水平取決于其攝入、合成、生理利用、分解(轉化)與排泄等的綜合效應。從外部攝入物質主要由生理活動控制;一旦物質被轉化成需排泄的形式就會進入緩慢的排泄過程,且通常不能逆轉為所需物質。因此,要用藥物升高體內緩解或防止疾病進程物質的局部或整體水平(活性),最簡單方式是以這類物質作為藥物從外部直接補充,或用其他藥物升高其局部或整體的內源性合成代謝;如該物質為生理功能不必需,則還可用藥物降低其局部或整體分解代謝;如其為生理功能必需而內源性合成代謝不足或缺乏,則其只能作為藥物直接從外界補充,如維生素和營養必需氨基酸等。相反,要用藥物降低體內特定物質的局部或整體水平(活性),最簡單方式是用藥物升高局部或整體分解代謝速度,或加速其代謝轉化后排泄;如該物質合成代謝不是生理活動所必需,則還可用藥物降低其局部或整體合成代謝;如其合成代謝是生理活動所必需且分解代謝不足或缺乏或排泄受限,則只能用其他來源(如微生物)的關鍵成分作為藥物直接從外界補充而輔助完成這類物質的轉化(如尿酸和毒品)。另一類藥物作用模式是其調節信號通路中所需成分的活性。體內信號通路的作用取決于其必需物質間的相互作用及對被調節代謝通路的作用。要增強某個信號通路的作用,可用藥物選擇性增加啟動信號傳遞物質的穩態水平,升高第二信使的穩態濃度,促進蛋白質等關鍵成分的化學修飾調節,或升高其激動物質的穩態水平。要降低某個信號通路的作用,可用藥物選擇性清除信號傳遞啟動物質,加速第二信使的分解失活,阻止蛋白質等關鍵成分的必須化學修飾,或促進其激動物質分解與轉化。信號通路下游成分比較發散,故藥物適宜作用于信號通路的最后環節。另外,人體天生具有免疫系統應對外源或不應暴露的抗原,故疫苗可看作是藥物用于啟動體內免疫應答的信號傳遞通路形成記憶,從而升高對應抗體的水平或效應細胞的活力以快速應對抗原的再刺激。顯然,用藥物控制物質代謝速度可直接調節對應代謝途徑關鍵成分的活性,也可調節對應信號通路而間接調節代謝途徑關鍵成分的活性,但通常直接調節代謝途徑的效應常弱于調節對應信號通路的效應。人體器官、組織及細胞(器)中的特殊代謝途徑或信號通路是這些器官、組織及細胞分化的基礎,藥物干預目的是調節這些代謝途徑或信號通路中關鍵成分的量或活性。藥物主要選擇性作用于特定代謝途徑或信號通路的關鍵成分。這些關鍵成分包括人體蛋白質、核酸、細胞膜或特殊小分子物質(如尿酸、精氨酸)等,也包括病原微生物的特定關鍵成分。藥物與體內特定代謝途徑的某個關鍵成分發生直接的相互作用而產生所需治療作用,則這些關鍵成分稱為藥物作用靶點(target)。基于這種直接相互作用定義的靶點包括大分子物質和特殊小分子物質。用不同定義標準,相同藥物的作用靶點會不同。藥物與靶點之間相互作用的高選擇性是決定藥物安全性的關鍵基礎,這種相互作用的高親和力是決定藥物有效性的重要特征。大多數藥物在體內只有一個(類)作用靶點,部分藥物有多個(類)作用靶點,也有些臨床藥物至今未確定其作用靶點。三、小分子化學藥物和生物技術藥物據藥物生物化學性質可分成大分子藥物和小分子藥物;小分子藥物即傳統化學藥物,分子量多在800Da以內;大分子藥物主要為生物技術藥物,包括蛋白質、核酸和多糖等。大分子藥物又分為人源成分如人胰島素,外源成分如精氨酸脫亞氨酶,及基因治療所用載體。臨床藥物目前主要是小分子化合物,其制備成本較低,基本無免疫原性(immunogenicity),但外源小分子藥物在體內代謝和排泄過程是影響其成藥性的主要環節。蛋白質等大分子藥物代謝分解產物為體內既有物質,其分解和代謝副作用很少,但如何消除其免疫原性和延長體內代謝半衰期是嚴峻的挑戰。哺乳動物可產生針對抗原(antigen)的高選擇性抗體(antibody),針對體內特定靶點的治療性單抗(therapeuticmonoclonalantibody)是當前生物技術藥物發展的重要方向之一。生物大分子靶點有特殊的空間構象,其表面通常有特殊的裂隙狀活性中心,可通過多位點相互作用與特殊的小分子化合物或大分子形狀互補的特定位點結合。可與大分子靶點的特定活性中心通過多位點相互作用結合成復合物的這些物質稱為配體(ligand)。配體類藥物同靶點的作用有很高的特異性和親和力。針對大分子靶點的藥物主要是小分子配體,也有治療性單抗等大分子藥物。小分子靶點相對較少,代表性有內源性物質尿酸、外源性物質如可卡因或重金屬離子等。當小分子靶點有非常特殊的化學反應活性,可與小分子藥物高選擇性直接相互作用而被消除原有活性時,其對應藥物也可以是小分子,如1,3-二巰基丙酸絡合重金屬離子。針對小分子靶點的大分子藥物(酶)更常見,因為這種相互作用容易保障高選擇性。藥物發現是生物醫藥科學的重要任務之一,在此過程中藥物設計和成藥性(pharmaceuticalproperties)預測的關鍵技術來自生物信息學。調節人體代謝途徑的信號通路有復雜網絡結構,需從系統生物學角度更全面理解代謝調控和信號通路的網絡系統。第二節藥物相關信息資源Section2BioinformaticsResourcesofPharmaceuticals一、綜合性藥物信息資源DrugBank(http://www.drugbank.ca/)為免費藥物數據庫,覆蓋大量藥物及其靶標相關信息,有近4800種已上市或在研究中的藥物。其中,FDA批準小分子藥物約1300種、蛋白質和多肽類生物技術藥物123種,營養制品71種,處于實驗研究階段的藥物約3200種。每種藥物提供近100項信息,包括藥物作用靶點及其單核苷酸多態性、藥物副反應和文獻的網上鏈接等。DrugBank的特色是其支持多種搜索模式并提供可視化軟件,便于檢索藥物及其靶標的相關信息,并可按每種生理系統疾病治療藥物進行瀏覽(圖17-1)。圖17-1Drugbank檢索界面治療靶點數據庫(TherapeuticTargetDatabase,TTD).sg/group/cjttd/ttd.asp,也是免費數據庫,覆蓋1894個藥物靶點及靶點相關疾病和信號通路,其中已證實靶點348個,試驗階段靶點292個及研究靶點1254個;TTD包含藥物和配體5028個,FDA批準藥物1514種,臨床試驗階段藥物1212種,實驗研究階段藥物2302種,小分子藥物3382種,反義核酸類藥物649種。通過TTD中的鏈接可以方便地檢索蛋白功能、氨基酸序列、三維結構信息、配體結合特性、藥物結構、治療應用等信息。可見,TTD也是關于藥物的綜合性數據庫。國內剛建成部分基礎條件平臺,其中包含醫藥衛生領域的藥學中心數據庫,也是關于藥物、藥物靶點、藥物作用等的綜合性數據庫(/drugtarget/default.asp)。二、治療靶點信息資源NRDB(nonredundantdatabase)由NCBI建立,數據來自Genpept(GenBankCDS自動翻譯的數據庫)、PDB序列數據庫、SWISS-PROT數據庫等,是較完全且包含最新信息的蛋白質數據庫,也是檢索藥物靶點的主要信息來源。實際上NRDB中仍有一些冗余信息。另外,NRDB數據庫也被作為NCBI提供的BLAST算法搜索服務時檢索的默認數據庫。潛在藥物治療靶點數據庫(potentialdrugtherapeuticdatabase,PDTD)為國內建立的免費藥物靶點數據庫,收集了已知和潛在藥物靶點三維結構數據,是反向對接篩選候選藥物靶點軟件所用數據庫。此數據庫目前包括1207個晶體結構數據,涵蓋841種不同藥物靶點。這些靶點按照治療應用領域和靶點的生物化學性質分成十多類,支持多種檢索方式,并可鏈接到其他數據庫。蛋白質信息學資源(protein-informatics-resource,PIR)/,提供蛋白質序列和功能數據,并鏈接到UniProtKB等多種數據庫;此數據庫的特色是提供詳細全面的蛋白質功能分類數據,其中包含藥物靶點蛋白質的數據。還有很多其他的蛋白質數據庫。三、藥物副反應靶點信息資源藥物副反應靶點(DrugAdverseReactionTargets,DAR).sg/group/drt/dart.asp,也是免費數據庫,包含了已知藥物副反應靶點、功能和性質、文獻鏈接等。這些靶點的鑒定與分類主要用支持向量機的藥物副反應靶點識別程序完成,其使用了759個副反應相關的靶點結構特征和2280個非藥物副反應靶點結構特征進行訓練。治療相關多信號通路數據庫(TherapeuticallyRelevantMultiplePathwaysDatabase,TRMPD)包含來自文獻的藥物作用信號通路及靶點交叉信息(.sg/group/trmp/trmp.asp),也提供對應文獻來源、疾病相關情況、針對通路中靶點的配體藥物等信息。目前該數據庫中包含97個獨立的信號通路及11個多信號通路,對應72種疾病和1220種藥物,可用信號通路名稱或疾病名稱等多種方式檢索,能獲得對應的靶點蛋白序列與基因等各種相關信息,及與其他數據庫的鏈接。細胞色素P450相關代謝數據庫(CytochromeP450-relatedmetabolicinformation)收集藥物代謝干擾的靶點信息(http://sciencelinks.jp/j-east/article/200702/000020070207A0003559.php),并提供相關的軟件用于預測藥物相互作用,是指導聯合用藥和防止藥物相互作用的重要信息來源。四、ADME關聯蛋白信息資源吸收、分布、代謝和排泄(absorption,distribution,metabolismandexcretion,ADME)相關蛋白數據庫(DrugADMEAssociatedProteinDatabase,ADME-AP).sg/group/admeap/admeap.asp,可檢索藥物ADME信息和相關蛋白功能、結構、相似性和組織分布等,同時提供文獻鏈接,目前覆蓋321種相關蛋白。轉運蛋白數據庫(transporterdatabase,TransportDB)/index.html,是轉運相關膜蛋白的數據庫,來自對已測定基因組解析預測所得的細胞質膜蛋白。對具有基因組信息的物種進行了全面的信息加工和收集;對每個物種的轉運載體類型和家族提供概括性描述,對每個轉運載體列出了被轉運的底物類別,并連接蛋白質的序列數據庫。五、藥物-蛋白互作數據資源生物分子互作動力學數據庫(Kineticdataofbio-molecularinteraction,KDBI).sg/group/kdbi/kdbi.asp,收集了來自文獻的實驗測定蛋白質間、蛋白質-RNA間、蛋白質-DNA間、蛋白質-小分子配體間、RNA-配體間、DNA-配體間的結合反應數據。目前,KDBI覆蓋63條信號相關的蛋白,19263項數據記錄,10532個特殊生物分子結合參數和1954項相互作用數據,涉及2635蛋白質-蛋白質復合物、847核酸復合物、1603小分子復合物和超過100條通路信息。蛋白質-配體相互作用數據庫(protein-ligandinteractiondatabase,PLID)3/gnsmmg/databases/plid/,是基于網絡的免費數據庫,其收集了6295配體同從蛋白質結構數據庫中提取的蛋白質的復合物結構,還提供配體物理化學性質、量子力學特征描述和蛋白質活性位點接觸殘基等信息。蛋白質-小分子數據庫(protein-small-moleculedatabase,PSMDB)/psmdb,是來自PDB數據庫的復合物非冗余數據,可自動更新,收集了更多配體和游離靶蛋白數據。另一個免費數據庫CREDO(\o"http://www-cryst.bioc.cam.ac.uk/credo"http://www-cryst.bioc.cam.ac.uk/credo)與此類似,但其可用分子形狀的描述符、PDB數據庫中配體片段、序列和結構作圖等進行檢索。PDSPKi數據庫(/kidb.php)也收集了多種配體與不同靶蛋白的親和力數據,可用受體名稱、組織來源、配體的名稱等進行檢索。生物學相互作用通用庫(BiologicalGeneralRepositoryforInteractionDatasets,BioGRID)/index.php,收集來自常見模式生物的蛋白質及基因間的相互作用信息。目前包含來自6個物種的198000相互作用數據,及來自原始文獻的酵母細胞內相互作用數據的完整集合;該庫對來自酵母的數據每月更新,并連接有蛋白質間相互作用的可視化顯示軟件Osprey。此數據庫可用于預測同類蛋白質的功能。六、藥物毒理學資源藥物誘導毒性相關蛋白數據庫(Drug-InducedToxicityRelatedProteins,DITOP)收集了與藥物相互作用或代謝中間產物造成毒性的相關蛋白質信息;其數據主要來自文獻報道,目前包含618個典型的毒性相關蛋白、529個相應的藥物、418個對應毒性術語。可以用關鍵詞、化學結構、蛋白質和毒性術語等進行檢索。有害物質目錄(/niosh/rtecs-html)、危險物質數據庫()、毒物文獻庫(/cgi-bin/sis/htmlgen?TOXLINE)等資源也可供檢索。基于藥物代謝干擾的數據庫已嘗試用于臨床治療方案的優化。七、藥物基因組資源藥物遺傳效應數據庫(PharmacoGeneticEffectDatabase,PharmGED).sg/phg/,專門提供蛋白質靶點的多態性、非編碼區突變、剪切變異、表達變異等遺傳信息對藥物作用效應的影響,已有1825條目,涉及266個不同蛋白質,414個藥物和對應文獻。八、候選小分子藥物資源SymyxACD(/products/databases/sourcing/acd/)是商業的藥物篩選常用化合物來源數據庫,可用結構進行檢索,提供分子的三維結構圖。NCBI提供了免費的化合物資源PubChem,并包含對應的三個子數據庫,提供已知的化合物的結構和基本性質、生物活性、文獻鏈接等信息。在通過網址http://cds.dl.ac.uk/cds/datasets/orgchem/screening.html可以獲得主要候選化合物數據庫和來源。劍橋結構數據庫(CambridgeStructuralDatabase,CSD)http://www.ccdc.cam.ac.uk/products/csd/,提供實驗測定的小分子結構數據。除了經典的小分子,還收集聚合度低于24個單體的寡核苷酸、小肽的結構數據,同時提供分子間相互作用的信息。九、免疫信息學資源國際免疫遺傳信息系統(theinternationalimmunogeneticsinformationsystem,IMGT)http://imgt.cines.fr,是一個綜合性的免疫信息學數據庫,收集了人體和脊椎動物的常見免疫球蛋白、T細胞受體、主要組織相容性抗原復合物(MHC)、多種生物的免疫球蛋白超家族和MHC超家族等免疫系統相關蛋白。此數據庫有五個子數據庫,包括一個序列數據庫、一個基因組數據庫和免疫反應相關蛋白的結構數據庫,提供了十多種在線工具和網絡資源。該數據庫提供了關于免疫相關疾病和抗體的較完整信息和數據,是分析潛在免疫治療靶點和免疫治療蛋白質藥物的重要信息資源。其他的免疫信息學數據庫還有MHCPEP(.au/mhcpep)、MPID(.sg)、SYFPEITHI(www.syfpeithi.de)、FIMM(.sg)、MHCBN(www.imtech.res.in/raghava/mhcbn)、IEDB(/)等。第三節藥物作用靶點發掘Section3MiningDrugTargets一、藥物靶點概述藥物靶點主要是特定物質代謝途徑或信號通路的關鍵成分,包括人體的特定大分子、小分子或病原微生物的特定對應成分。如控制胞內特定離子穩態濃度的離子通道、水解滅活環核苷酸的PDE、控制花生四烯酸(arachidonate)代謝成炎癥介質的環加氧酶、激活腺苷酸環化酶生成cAMP的腎上腺素受體。體內的代謝途徑交叉連接,有的物質也會參與多個代謝途徑;體內的信號通路之間也有交叉連接,有些成分能同時參與不同的信號通路(圖17-2)。因此,有效的藥物靶點需具備如下特征:①對影響疾病病理過程的物質代謝途徑或信號通路有控制作用;②盡可能位于誘發疾病病理過程物質代謝途徑中生成該物質的最終環節,或疾病密切相關信號通路下游與疾病發生物質代謝途徑直接交換信息的關聯環節;③盡可能不參與人體其他組織或細胞生命活動所必需的代謝過程或信號傳遞過程;④盡可能避開多個代謝途徑或信號通路的交叉點。顯然,作為一個有效的藥物靶點,上述第一個特征是所需具備的必要條件,而后面的三個特征主要是充分條件。小分子靶點的識別過程相對直接,大分子靶點的識別與確認過程就很復雜。圖17-2單個細胞內NF-B參與信號通路的連接和交叉病原微生物通常有決定其致病能力且人體不需要的代謝途徑,人體正常代謝不需要而此代謝途徑必需的任何獨特性成分都是潛在的藥物靶點;如病原細菌或真菌常需合成人體不需要的細胞壁,其細胞壁合成的所有獨特性關鍵酶都是理想的靶點。體內用于啟動病理過程的信號通路關鍵成分都是合適的藥物靶點,如費城染色體陽性的慢性髓系白血病中Bcr/Abl激酶是其治療的理想靶點,其選擇性抑制劑伊馬替尼(imatinib)是低毒性抗腫瘤藥物。體內相同代謝途徑在不同細胞中可發揮不同作用,分化的組織器官和細胞含有控制對應物質局部穩態水平的受體亞型或同工酶可作為合適的藥物靶點,如環鳥苷酸(cyclicguanidinenucleotide,cGMP)對多數細胞生理活動有重要調節作用,但PDE5是陰莖海綿體cGMP穩態水平的主要控制者而不是其他組織細胞中cGMP穩態水平的主要控制者,因此PDE5同工酶選擇性抑制劑seldinafil是療效顯著的藥物。人體蛋白質類藥物靶點可分成幾個主要的家族(表17-1)。表17-1人體蛋白質中的常用藥物靶點靶點類別治療領域G-proteincoupledreceptors代謝疾病、心血管系統疾病、炎癥Kinase腫瘤、炎癥、病毒感染NuclearReceptor腫瘤、代謝疾病Ionchannel中樞神經疾病、疼痛、感染、腫瘤、炎癥Phosphodiesterase炎癥、心血管疾病、勃起障礙、中樞神經疾病protease炎癥、骨組織疾病、腫瘤、病毒感染用生物信息學技術發掘藥物靶點是新藥發現的基礎。隨著對疾病認識的積累,發現了大批藥物靶點,目前已確認的藥物靶點約500個。隨著各種高通量測定數據的獲得,新的治療藥物靶點不斷地被發現,預期人體自身的蛋白質類靶點總數可達到3000個。人類基因組計劃的積極推進和各種疾病相關代謝途徑、相互作用分子網絡、基因表達和蛋白質譜及病原微生物基因組和蛋白組數據的積累,成為發掘藥物作用新靶點的基礎,奠定了新藥發現的重要基礎。分析大量數據發掘潛在的藥物新靶點主要有兩種策略。一種以實驗測定疾病與健康個體的相關數據為主進行比較分析推斷與疾病發生相關的基因和蛋白質,并推斷其功能和作為候選藥物新靶點的可能性;另一種分析基因組或蛋白質的序列數據,通過藥物靶蛋白的序列特征進行模式識別分類判斷候選序列作為潛在藥物靶點的可能性。以下簡介這兩類常用策略。二、分析基因組和基因型數據發掘潛在的候選藥物靶點分析基因組數據發掘藥物靶點的最直接應用是尋找病原微生物的基因組中與人體細胞代謝不同而對病原微生物的生長和致病必需的基因產物作為候選藥物靶點。對于病原微生物生長和致病所需而人體不需的代謝途徑,包括該途徑的小分子物質,都是理想的藥物靶點。即使是人體和病原微生物共同的代謝途徑,例如嘧啶核苷酸合成代謝途徑,不同的進化層次使得病原細菌對應代謝途徑的某些關鍵酶和人體對應代謝途徑的關鍵酶編碼序列也有顯著差異,對應的關鍵酶的活性中心精細結構存在差異。基于這種序列差異和預測的功能域精細三維結構的差異仍然能設計出針對病原菌代謝途徑關鍵酶的高選擇性小分子藥物。另外,對于某些特殊的微生物,其亞型不同則致病能力顯著不同。對于這些病原微生物,分析其基因型數據尋找對應的差異基因是發現新的抗感染藥物靶點的有效策略。例如肺炎鏈球菌的莢膜型和光滑型兩種亞型明顯致病能力不同,故與莢膜形成相關的基因信息必定是獨特數據,對應的編碼蛋白都是候選的藥物靶點。分析人體基因組數據發掘候選藥物靶點的應用難度相對較大。人體基因組太大,需要一定的線索關聯以縮小需要測序分析的基因范圍。分析不同基因的位點多態性等與疾病發生的內在聯系,是尋找潛在的候選靶點的有用策略之一。通過這種策略發現與疾病發生關聯的基因如屬于人體內常用的藥物靶點蛋白家族,則其作為新的藥物靶點的可能性就很大。另一種策略是分析功能基因組,解析新基因的功能并考察其是否屬于目前常用的藥物靶點蛋白家族(表17-1)。其中分析酵母基因組和對應基因功能是用實驗驗證新基因潛在功能的有效策略。目前,關于酵母的信息資源相對齊全,其基因組、蛋白質組、蛋白質相互作用網絡、蛋白質定位、缺失突變表型等都有對應數據庫,且新的數據還在增加。通過轉入基因考察功能的增強、敲除基因和功能的缺失、小分子RNA干擾目標基因表達,都是驗證基因功能的有效策略。人體基因組中與酵母基因組中進化同源的蛋白質有類似的功能,這可用于預測人體新基因的潛在功能及是否可作為潛在的藥物靶點。這種策略是疾病相關功能基因組學的重要工作之一。三、分析表達譜數據發掘潛在的藥物靶點發掘基因表達譜中隨著疾病進程表達顯著變化的基因,是尋找潛在藥物靶點的常用策略。而比較疾病與健康個體表達譜,尋找編碼常見藥物靶點蛋白質的基因表達差異與疾病發生的關聯,是快速發現潛在藥物靶點的有效策略。另一方面,對表達標簽和蛋白質組學數據的比較分析,尤其和藥物蛋白質組學技術聯合應用,能快速獲得有價值的信息。用未知靶點但明確有效的天然產物作用于疾病的動物或細胞模型,通過蛋白質組學技術分析藥物作用下發生改變的蛋白質,這些蛋白質通常與藥物的治療作用明確相關,也與此類藥物靶點參與的疾病發生機制有關。應用這種策略的典型代表,如從近海生長的海綿中分離的天然產物Bengamide在體內外都有明顯抗腫瘤作用。將此天然產物修飾成藥效更強的衍生物LAF389作用于小細胞肺癌細胞系H1299,發現了二十多個表達有差異的蛋白質,并用蛋白質的肽質量指紋圖譜對這些蛋白質進行了鑒定;進一步分析發現LAF389阻斷了一種特殊蛋白的N-端脫甲硫氨酸,并最終證實LAF389是甲硫氨酸氨肽酶(methionineaminopeptidase,MetAP)的強效抑制劑,且獲得了其復合物的晶體結構(1QZY.pdb)(圖17-3)。此策略提供了兩個重要信息,即MetAP參與的代謝途徑中,需要MetAP脫甲硫氨酸的對應目標蛋白底物(其地位相當于代謝途徑中的小分子物質)和MetAP本身都是潛在的抗腫瘤藥物靶點。圖17-3甲硫氨酸氨肽酶和Bengamide衍生物的復合物中間的配體顯示為樹枝狀,綠色為C原子,紅色為氧原子,藍色為氮原子四、分析序列數據發掘藥物靶點分析序列信息判斷對應蛋白質是否為潛在藥物靶點的策略集中分析已知藥物靶點的序列特征,通過機器學習等方法從中發掘規律并形成判斷方法,用于分類或判斷候選序列是否為靶點。這屬于典型的生物信息學策略,各種模式識別的方法都可用于發掘靶點的序列特征用于建立對應的判斷方法。一個代表性的應用是從已知藥物靶蛋白質的氨基酸序列中提取氨基酸殘基組成、氨基酸殘基的理化性質(包括疏水性、極性、電荷、溶劑可及性等,詳見第十章和本章第四節)等信息,用支持向量機模型,用特定核函數(線性、多項式或徑向基本函數RBF)和已知靶蛋白數據為訓練集,所建立判斷分類方法的正確率接近80%。經過優化訓練數據集和核函數后,盲法測試的特異性、靈敏度和正確率都能達到80%以上,用這種策略預測潛在的人體靶蛋白有一千多個。五、反向對接分析配體作用位點尋找靶點基于分子對接尋找候選配體的方法,可用已知體內和體外活性配體,從已知蛋白質晶體結構的數據庫中搜索對應的潛在靶蛋白,這是一種新的靶點發現策略。這種策略對發掘有明確藥理活性天然產物的作用靶點具有重要價值。此策略目前已有對應的在線免費服務器和程序可用(/tarfisdock/),并有對應的潛在治療性靶點的數據庫。這對很多未知靶點卻有明確治療價值的配體藥物靶點發掘和基于靶點結構的配體結構優化策略是一個很好的方向。六、識別與證實靶點的實驗設計策略從大量數據中發掘出來的候選大分子靶點還需用實驗多方面驗證。前面已提到有效藥物靶點所需要的基本特征。體內蛋白質種類非常多,藥物只有選擇性作用于靶點才能有所需治療作用和盡可能少的副作用。通常要確認一個有效的藥物靶點可用針對該靶點的已有工具藥物或臨床藥物,但對用生物信息學策略發現的候選新靶點通常沒有這類工具配體,只能多角度反復交叉驗證候選新靶點的有效性。小分子藥物的作用通常沒有組織選擇性而大分子藥物主要在循環體系發揮作用,故一個靶點在體內如分布很廣或參與其他組織的很多必需代謝過程就難以成為有效的藥物靶點。同時,驗證候選大分子靶點的有效性一般需要確認下特征:①候選靶點的功能與動物模型中疾病發生的病理學過程存在必然聯系;②細胞模型中表達的靶點功能與疾病發生的細胞病理學過程存在必然聯系;③在疾病動物模型中,(工具)配體達到有效濃度時能與靶點發生明確相互作用;④靶點和藥物間離體的相互作用數據可預測動物模型體內的(工具)配體與靶點相互作用;⑤體內靶點含量或活性與病理學過程有明確聯系。在驗證這些特征時,還需同時考慮所用動物模型是否能夠真實模擬人體疾病、存在種屬差異性時如何進行替代驗證、不同靶點應用于發現小分子及大分子藥物的適用性差異等問題。(一)分析動物疾病模型考察候選靶點與病理學過程的聯系從疾病發生病理學角度確認藥物靶點的有效性,需測定靶點功能增強、正常及抑制等情況下疾病病理過程的變化。實現此目的一般需建立疾病的動物模型并改變其靶點的功能,可用公認的對靶點功能有調節作用的工具配體(藥物)來探索這種關聯性。另外,對大分子靶點,通過基因轉染、小分子RNA干擾、核酶等增強或降低靶點的功能考察疾病發生的變化;對小分子靶點,也可直接從外部補充以觀察疾病發生過程的變化。在分析這些結果時還需考慮動物模型及不同類型工具藥物的有效性差異。(二)檢測細胞模型中表達的靶點考察與疾病發生的細胞病理學過程的關聯性從細胞和分子水平考察疾病發生過程的共性,考察細胞模型中靶點功能的調節對細胞病理學過程的影響。在細胞模型上更容易通過上述技術改變靶點的功能,同時考察同病理相關的物質的變化。尤其在細胞模型中有對應的分子實時顯影等技術證實靶點與工具藥物之間的直接作用。(三)考察在疾病動物模型中(工具)藥物達到有效濃度時與靶點的相互作用在活體內測定靶點與(工具)藥物相互作用是證實靶點有效性和藥物作用機制的最直接證據,但限于技術這類數據在藥物靶點研究的前期積累很少。通過標記藥物和靶點進行活體成像是考察活體內靶點與藥物作用的有效證據之一,這類方法提供的數據主要是來自共定位。(四)靶點和(工具)藥物間離體的相互作用及其是否可用于預測動物模型及人體內的相互作用各種技術可用于考察離體(工具)藥物與靶點的離體相互作用;建立藥物作用動態過程的數學模型,可用于模擬(工具)藥物在疾病動物模型體內的作用,并與實驗測定的疾病動物模型體內的工具藥物作用動態變化比較,考察離體的數據用于預測體內作用的有效性。在這些過程中需考慮到小分子藥物對預期靶點的分布一般沒有嚴格要求,但大分子藥物主要在血液循環系統發揮作用而很難進入細胞內,除非采用特殊的制劑與給藥策略,否則大分子藥物要求靶點暴露于循環系統。(五)人體內靶點含量或活性變化及其與病理學過程的聯系對于大分子靶點,應用熒光實時定量PCR、westernblotting等技術監測病理變化過程中靶點的含量和活性的變化;對于小分子靶點,應用高效液相層析與MS聯用等技術,可監測疾病發生的病理過程中靶點的含量變化。分析疾病發生過程中靶點的含量或活性對控制疾病進程的重要物質含量變化的響應、病理生理紊亂程度的響應,可探索在人體疾病發生發展過程中靶點的作用。第四節小分子藥物的成藥性及其預測Section4PharmaceuticalPropertiesofOrganicDrugsandTheirPrediction一、概述廣義的小分子藥物指分子量小于800Da且在人體內能發揮明確藥理學作用的化合物,這是目前臨床應用最廣的藥物,有數千種。狹義的小分子藥物不包括廣義小分子藥物中的多肽和寡核苷酸藥物。絕大多數小分子藥物能在體內預期部位發揮藥理學作用,且基本無免疫原性。這些小分子藥物主要是配體,小分子配體同大分子靶點的相互作用是治療作用的基礎,故小分子配體藥物與大分子靶點的相互作用強度,即配體的親和力(affinity),是小分子藥物成藥性的關鍵指標之一。另外,絕大多數小分子藥物本身基本無免疫原性。但除了氨基酸、糖、維生素、激素等人體內本來就有的生理活性和藥理活性物質,絕大多數小分子藥物為非營養物質,在體內需經過生物轉化(biotranformation)進行代謝并最終排泄,在這個復雜的過程中可能代謝產生新的生物活性物質而影響人體的生理活動,這也是影響小分子藥物成藥特性的關鍵環節之一。同時,小分子藥物的生物利用度也是決定其特定制劑形式要求和成藥性的關鍵指標。因此,據候選藥物結構特征預測其成藥性,是利用生物信息學技術高效率和低成本發現具有明確藥用價值候選小分子新藥的重要應用。二、結構特征和性質描述用信息學技術分析小分子藥物的作用規律需發掘其結構特征、性質與其藥理學、毒理學特征間的聯系;對配體(ligand)類藥物基于各種策略進行虛擬篩選,也需描述分子結構特征;用先導配體(leadligand)通過反對接搜索潛在藥物靶點也需要描述小分子化合物的結構特點。因此,描述小分子化學物的結構特征和性質是藥物生物信息學的必要基礎。(一)小分子化合物的結構描述和模型化按IUPAC規則對化合物命名可反映化合物結構特征,但要包含足夠信息則名稱很長且過于復雜,唯一性也不夠。化合物結構曾用過碎片碼、線性碼和拓撲碼等編碼,但仍難保障唯一性,且碎片碼和線性碼在檢索子結構不方便。連接表(connectionlist)是目前用計算機表示、記錄和檢索化合物結構最常用的信息化手段,其可包含分子結構的二維和三維信息。連接表是用文本記錄分子中所有原子、化學鍵及其空間關系的列表。連接表不需考慮不同分子的唯一性問題,原子的序號也不影響分子結構。但連接表在應用中有多種文件格式,不同分子結構模型可視化軟件有自己的特殊格式,SMD、MOL和MOL2等是通用性的結構文件格式(圖17-4),記錄了所含原子屬性和化學鍵性質等信息。用于記錄蛋白質結構的文件格式也可用于記錄小分子結構,其記錄內容也屬于連接表,系統帶有根據原子間化學鍵長確定化學鍵類型的定義詞典,所記錄的化學鍵類型由計算所得鍵長確定,但一般免費軟件不能生成這種格式的小分子結構文件。圖17-4甲醇的結構模型(a)和其連接表(b),用MOL格式記錄的結構文件(c).有多種小分子化合物模型可視化系統可用鼠標描繪分子結構模型,其中不少是免費的,如ISIS-Draw(/downloads/downloadable/)和ACD(/download/)等。通常小分子化合物的結構模型可視化系統大多可對小分子三維構象進行初步真空優化,這是建立三維定量構效關系模型的基礎。一些基于網絡和java語言的插件也可編輯分子結構。這些軟件通常可直觀顯示分子的表面性質,包括范德華表面、溶劑以及表面、溶劑排斥表面等性質。(二)小分子化合物的疏水性疏水相互作用(hydrophobicinteraction)描述物質或基團與水分子相互作用的熱力學性質。小分子化合物的疏水性(hydrophobicity)對其成藥性有重要影響。不管哪種方式給藥(口服或注射等),小分子藥物都需在體內的對應病理部位達到所需有效濃度,才能改變對應代謝途徑或信號通路上靶點的功能而表現出預期的藥理作用。口服藥物需要有足夠高的吸收利用度,即生物利用度(bioavailability);同時,即使注射給藥,藥物如要進入對應細胞內發揮預期的藥理作用,還需穿過細胞膜。疏水性是小分子藥物穿過細胞膜并在血液和胞液中達到所需濃度的關鍵因素。因此,小分子藥物的疏水性是決定口服藥物生物利用度及細胞內有效濃度等性質的關鍵特性。另一方面,多數小分子藥物為配體,發揮作用時需與靶點(蛋白)的特定功能域形成復合物,即結合(biding)。在配體類藥物同靶蛋白結合過程中,配體的疏水性越高則親和力(affinity)越高,但如疏水相互作用在配體與靶蛋白結合的自由能釋放總量中貢獻太大則配體的特異性(specificity)會降低,容易導致毒副作用。而且,藥物的疏水性過高則其與膜脂和血漿中與清蛋白等的結合率很高,不利于提高藥物在預期位點的有效濃度。即使對膜蛋白類靶點,大多數小分子藥物的作用仍主要是同膜蛋白與細胞液或體液接觸面的特定功能域形成復合物,而不是同膜蛋白中與膜脂直接接觸區域形成復合物。所以,理想的小分子藥物需有恰當的疏水性而不是越高越好;在尋找疏水性與藥物成藥性之間的聯系時,通常將小分子藥物的疏水性進行量化,才能建立對應的預測模型。在藥物研究中常通過測定小分子藥物的疏水性參數(hydrophobicparameter)定量表征小分子的疏水性。目前常用脂水分配系數(partitioncoefficient,P)作為疏水性的定量參數,即待測化合物在脂相和水相之間分配達到平衡時的脂相濃度與水相濃度的比值。測定脂水分配系數最常用的是正辛醇-水體系(圖17-5)。用各種方法測定達到平衡后的待測化合物在兩相的濃度可用于計算脂水分配系數。很多化合物同血漿蛋白達到1:1結合對應濃度與其在正辛醇-水體系的脂水分配系數有明確聯系。正辛醇的物理化學性質使其適合于測定脂水分配系數,但正辛醇-水體系與生物膜系統有差別。目前積累的脂水分配系數已很多且能用于有效表征化合物結構與活性關系。圖17-5化合物同蛋白的結合及其脂水分配系數化合物在正辛醇-水體系的脂水分配系數同其結構具有明顯聯系。同系物間脂水分配系數對取代基有累加效應,故依據間接測定小分子化合物中常見基團的脂水分配系數,可用于預測同系物中預期結構化合物的脂水分配系數;這種策略限制用于同系物。將分子結構分解成各種碎片,并測定常見類型碎片的脂水分配系數(fi),再用碎片脂水分配系數從頭計算目標化合物的脂水分配系數(式17-1])。其中系數ai和bi代表來自不同的主要結構體系相同碎片的數量,fi為對應碎片的脂水分配系數。式17-1對于能電離的物質計算其脂水分配系數還需考慮pH的影響。在免費的ACD軟件中也提供計算脂水分配系數的功能。(三)分子的電荷分布特征和電性參數電性參數(electronicparameters)主要描述分子中電荷的不對稱分布等帶來的對應性質差異。有幾種常用的描述分子結構中電性參數的概念和對應的參數化方法。1.hammett電性參數(σ)Hammett用線性自由能描述取代基化學反應效應,并據涉及帶電中間體的同系物化學反應活性進行測定。目前,可用量子化學方法計算得到這種電荷分布性質。在兩個取代基之間沒有相互作用則它們對同一分子電性參數的貢獻也有加合性。2.共軛效應及誘導效應用Hammett方程時發現當取代基存在特殊的相互作用時發現參數存在顯著偏差,所以將誘導效應(σI)和共軛效應(σR)分別考慮。3.解離常數(pKa)表示化合物整體的電性狀態。同系物的解離常數同取代基的Hammett參數之間有明確聯系。小分子藥物解離常數同其吸收、分布、代謝與排泄有明確的聯系。(四)分子立體結構特征和參數描述小分子化合物立體結構特征的相關參數很多。為應用生物信息學和化學信息的技術建立更好的成藥性預測模型,還在探索新的立體結構特征描述符號。這部分具體內容更偏重化學結構,可在所列文獻或有關專著中找到更全面的描述。以下簡要介紹常用的分子立體結構特征描述符及其參數化。1.Taft立體參數(Es)描述由于立體效應對反應中心的影響,主要用取代醋酸酯等水解測得。2.摩爾折射率(ME)考慮原子間內聚力、原子極化度、離子化勢等得到的描述配體與蛋白質功能域間相互作用的參數,近似代表分子的體積。3.Vanderwaals體積(Vw)描述分子的體積大小,可用原子半徑和化學鍵長等計算。4.多維立體參數STERIMOL配體與蛋白質間結合時,需形狀和理化性質互補。因此,Verloop等用長度、寬度等立體結構形狀描述參數表示分子結構的立體參數。5.分子形狀描述符主要用于描述同系物之間的形狀差異,以計算的結果與參考分子間的重疊體積為指標,這是描述三維定量構效關系的起點,但最初的描述方法和參數現已很少用。6.分子連接性指數用分子中非氫原子的支鏈數計算的拓撲學參數,主要指化合物中一個非氫原子與若干個非氫原子相連的數值,此參數完全靠計算獲得,但物理意義解釋不全面。另外,還有3D自相關性質、基于電子衍射編碼的分子結構、徑向分布函數編碼等更復雜的分子3D信息描述符號,是用于建立與靶點三維結構相關的定量關系模型的重要參數。三、配體與靶蛋白的對接和配體的虛擬篩選組合化學(combinatorialchemistry)的理論和技術是發現小分子新藥的重要技術。組合化學認為通過基團隨機組合合成能得到各種各樣的化合物,這些化合物構成組合庫(combinatoriallibrary);對于選定的靶蛋白,只要所用組合庫中候選化合物的結構多樣性足夠豐富,總能從中篩選到所需藥物。在小分子藥物發現過程中,用常規策略設計的小分子化合物實際上是小規模的集中組合庫。小分子配體同靶蛋白的親和力是其成藥性的關鍵指標之一。因此,制備和測定組合庫中候選配體的親和力是發現配體類小分子藥物的關鍵環節,而制備和篩選的成本與效率成為發現小分子配體藥物的難題。常規制備候選配體并測定其對靶蛋白的親和力進行篩選的成本高而效率低。高通量篩選(High-ThroughputScreening,HTS)的效率和成本相對于常規篩選具有明顯的優勢,這是與組合化學技術聯用發現新藥的重要技術,但其所需樣品制備的效率和成本仍是問題。因此,虛擬篩選(virtualscreening)應需而生。虛擬篩選用于從虛擬的大規模小分子庫(現有的非肽候選小分子配體類化合物已超過700萬個)中,通過生物信息學的手段評價候選小分子藥物的成藥性;虛擬篩選所發現的預期藥物才進行實驗制備和驗證,這樣可顯著提高新藥發現的成功率和效率并降低成本。對于配體類藥物,廣義虛擬篩選指對候選配體親和力及其成藥性的預測,狹義虛擬篩選主要指對配體與靶蛋白親和力的預測。本節討論配體類藥物的狹義虛擬篩選,即配體對靶蛋白親和力的預測。20世紀80年代,Kuntz等建立并發展了分子對接(docking)方法。分子對接是把大量的虛擬化合物庫縮減成可操作的子集,并用于快速評估配體與靶蛋白的親和力。分子對接的策略通常都考慮候選配體分子和靶蛋白在結合過程中可能的構象變化和對應的配體親和力差異,此即柔性對接;但多數方法不考慮靶蛋白的柔性以減少計算量。目前,在分子對接過程中評價配體親和力進行虛擬篩選主要有打分函數方法和機器學習方法等策略,目前已經有很多軟件可用于分子對接和評價配體的親和力。分子對接的前提是需要靶蛋白和候選小分子配體的三維結構。靶蛋白結構數據可來自PDB數據庫,候選小分子配體的.mol2數據可從ZINC或劍橋晶體數據庫或NCBI下載資源,或用分子結構編輯軟件生成并優化后再格式化以滿足不同軟件讀入分子結構信息的要求。(一)通過對接評價配體親和力的方法1.基于打分函數的評價策略目前大部分對接算法中使用的打分函數主要分為三種類型:基于配體與靶蛋白結合物理化學相互作用的打分函數、基于經驗的打分函數和基于知識的打分函數。這些打分函數能夠作為構象優化過程的適應值函數,并將預測的配體分子構象進行排序,對于分子對接篩選高親和力配體有決定性作用。(1)基于配體結合的物理化學相互作用的打分函數:基于配體結合的物理化學原理,將結合自由能表示為具有獨立物理意義的多項式之和,使得各自由能函數項能盡可能反映蛋白質內部、蛋白質與溶劑分子之間的相互作用,其準確率較高但計算量巨大。大部分基于物理化學原理的打分函數采用AMBER和CHARMm力場的非鍵相互作用部分計算相互作用能,即將配體-受體結合自由能近似為范德華力和經典相互作用的加和,忽略溶劑效應和熵效應,估算配體結合的自由能變化或焓變。為了減少計算量,通常將靶蛋白中配體結合位點劃分成很小的網格,估算候選配體的各種構象狀態下不同取代基對各個網格節點的結合自由能變化,快速比較不同候選配體的親和力差異進行篩選。(2)基于經驗的打分函數:基于經驗的打分函數利用多元線性回歸、偏最小二乘法等統計學方法將結合自由能表示成帶有權重的氫鍵、靜電、疏水效應以及熵效應等項的加和,分別計算候選配體對接時各項的貢獻及其加和。此方法計算量小,能快速直接估算出結合自由能,但所用統計學模型不能通用,打分結果對不同體系的可移植性較差。(3)基于知識的打分函數:基于知識的打分函數利用蛋白質結構數據庫中的蛋白質與配體復合物結構數據作為學習樣本,計算得到的具有統計性質的區分參數,從中提取配體與靶蛋白等結合的相互作用規律,用以判斷配體的親和力高低進行快速篩選。2.機器學習方法用已知的數據集進行訓練,機器學習法能夠建立起預測化合物某種性質的模型。自組織神經網絡法、決策樹、K最鄰近算法(k-nearestneighborsapproach,KNN)都得到嘗試和應用。這些機器學習方法都通過捕獲訓練集中化合物分子的屬性,用能區分訓練集中的不同親和力配體的這些屬性判斷未知候選配體的親和力高低。此方法計算效率很高,但受訓練集數據質量和來源的限制。(二)常用軟件簡介1.DOCKDock/DOCK/index.htm,1982年由美國加利福尼亞大學舊金山分校Kuntz研究小組開發,用于模擬小分子與生物大分子結合的三維結構及強度,是目前應用最廣泛的分子對接軟件之一。對接中固定小分子的鍵長和鍵角,將小分子配體拆分成若干剛性片段,根據受體表面的幾何性質,將小分子的剛性片段重新組合,進行構象搜索;最終以能量評分和原子接觸罰分之和作為對接結果的評價依據。DOCK進行分子對接時,配體分子可以是柔性的。對于柔性分子其鍵長和鍵角保持不變,但二面角可旋轉,并搜索數據庫。在DOCK中變化柔性分子的構象時首先確定剛性片段,然后搜索構象。構象搜索采用兩種方法:一種是錨定搜索(anchor-firstsearch);第二種方法是同時搜索(simultaneoussearch)。該軟件目前已發展至DOCK5.0。其應用主要包括如下環節:在windows系統上用cynwin軟件模擬一個unix的環境安裝dock和dms;從數據庫獲得靶蛋白結構和小分子候選配體的結構;可按DOCK教程進行分子對接,此過程主要包括如下幾步:靶蛋白處理,對接配基處理↓dms處理受體蛋白,得到球面↓運行sphgen.exe,得到負模↓選擇對接位點區域↓生成包含對接區域的box↓在box內建立網格grid↓進行對接↓分析對接結果2.AUTODOCK/,它是由Olson研究組開發的另一種分子對接程序。其用半柔性對接的方法,即允許候選配體的構象發生變化和調整,采用模擬退火和遺傳算法來尋找靶蛋白和配體最佳的相對結合構象,最終以結合自由能的大小來評價候選配體對接結果的好壞。此軟件目前缺乏數據庫搜索功能,仍僅限于實現單個配體和靶蛋白分子的對接。3.Affinity由Accelrys(MSI)和杜邦聯合開發且最早實現商業化的分子對接軟件。Affinity中候選配體和靶蛋白間匹配主要采用能量得分的評價方式,提供了精確和快速計算配合和受體之間非鍵相互作用的兩種有效方法:基于格點的能量計算方法和單元多偶極(cellmultipolemethod)方法。Affinity的分子對接主要包括通過蒙特卡羅或模擬退火計算配體分子在靶蛋白活性位點中可能的結合位置和用分子力學或分子動力學方法進行細化對接復合物兩個步驟。該方法適合對配體和受體之間的相互作用模式進行精細地考察,但計算量大,難以用于大規模數據庫的快速虛擬篩選。4.GOLDGOLD(GeneticOptimizationforLigandDocking)是一種采用遺傳算法同時考慮配體構象柔性及靶蛋白活性位點部分柔性(只考慮幾種殘基上羥基和氨基)的分子對接程序,但限制性要求配體與受體間形成氫鍵。GOLD程序中遺傳算法采用子種群策略,初始的500個體被等分為5個子種群,每個子種群之間允許個體遷移;將靶蛋白活性位點與配體構象信息分別被封裝在兩條二進制字符串中,字符串中每個字節代表一個旋轉鍵,每個旋轉鍵的允許變化范圍在-180°~180°之間,步長為1.4°,受體與配體之間的氫鍵信息則被封裝在兩條整型字符串中。GOLD采用輪盤賭選擇優勢個體,進行下一代的雜交、突變及遷移操作,最后按照達到預設的操作次數結束迭代。5.MolegroVirtualDocker(MVD)/,可在多種操作系統上運行,它提供了在Docking過程中所需的所有功能,包括從分子結構的準備到結合位點的預測以及最后小分子的結合及構象,有免費的測試版本可用。此軟件的最大特色在于其高準確性的docking結果(MVD87%、Glide82%、Surflex75%、FlexX58%),簡單易用的軟件界面讓使用者可以很快的設定及執行docking、針對docking結果提供完整的視覺及分析工具等。以下用基質金屬蛋白酶MMP14為靶蛋白簡介其候選多肽配體AHQLH的對接過程。(1)將MMP14(1BQQ.pdb中的M亞基)和候選的多肽配體AHQLH的三維結構導入到MVD軟件的主界面中并調整視角,顯示MMP14的三維模型,將配體AHQLH的結構表示成球棍狀(圖17-6)。(2)在工作空間內選擇“createsurface”創建表面(圖17-7),運行MVD軟件中的“preparation|detectcavities”預測配體結合域;共發現到三個潛在的結合域;綜合考慮配體大小等選擇恰當結合域。(3)選擇“View|DockingView”,點擊“Docking|DockingWizard”,使用默認參數進行對接;大約經過10輪的迭代之后找到了能量最優的對接模式。將對接結果保存到制定文件路徑(路徑名為全英文),再讀入MVD觀察對接后的AHQLH同MMP14aa.121-123位His-Asn-Glu接觸(圖17-8)。圖17-6MMP14的模型和其配體AHQLH圖17-7結合區域預測圖17-8優化對接狀態的接觸殘基四、藥物的定量構效關系預測候選小分子藥物的成藥性時,可將盡可能多的分子結構信息提取并量化作為藥物結構特征信息的描述集;用信息處理技術,如經典統計學方法和模式識別技術等,選擇恰當結構特征為自變量,建立化合物的結構與其成藥性的定量關系作為預測模型,用同樣參數化的候選化合物結構特征預測其成藥性。這就是定量構效關系(quantitativestructure-activityrelationship,QSAR)的主要研究內容。在QSAR研究過程中,需要提取描述分子結構特征的信息數量化后作為自變量。技術與方法的發展促進了QSAR模型朝三維(3D)方向發展。配體類藥物是目前臨床用藥的主要類型。本節簡介建立小分子配體類藥物與靶蛋白親和力的QSAR模型的常用思路。(一)小分子化合物結構特征信息的提取與量化建立針對新靶點或新系列化合物的定量構效關系模型時,結構特征描述子集應盡可能大,以便能從中找到適合描述已知化合物與靶蛋白親和力的結構特征描述符。此前介紹的疏水性、電性參數、立體結構特征都可包括在內,以便隨后用信息處理的技術篩選有效結構特征描述參數。同時,需較多數量的成藥性相差足夠大已知配體的數據,這些數據的質量是建立有預測價值的定量關系模型的決定因素。如數據量不夠多,則會限制模式識別等特殊的信息處理技術的應用。(二)定量構效關系模型的建立建立定量構效關系模型時首先需要確定合適的自變量,獲得所確定的自變量后,多元回歸分析能給出對應的定量構效關系模型。經典統計學方法,包括逐步向前或向后回歸方法,都可用于選擇自變量;也可通過模式識別先確定對配體親和力影響最大的結構特征描述符,再使用逐步回歸分析策略增加所需的結構特征參數。線性學習機及線性判別方法、基于距離的判別分類法、投影法等都可用于從候選的結構特征描述子集中找到對配體親和力影響最大的參數。實踐中,參數適宜進行歸一化預處理以縮小不同性質參數的數量級差異對自變量選擇的干擾。應用人工神經網絡也可輔助選擇自變量等建立對應的定量構效關系模型。(三)三維定量構效關系模型的建立策略配體和靶點相互作用在功能域和配體間要求構象互補,故建立3D-QSAR模型是主導發展方向。建立3D-QSAR模型需配體三維結構,這些數據可從CSD數據庫中獲得,或通過分子力學等計算獲得。依據是否有靶點三維結構的數據,建立3D-QSAR模型又有如下兩類方法。具備靶點三維結構數據時,可通過配體與分子對接后對復合物的構象進行優化,再分析配體與靶點三維結構之間的相互作用,并可通過自由能微擾等計算,結合分子動力學模擬,計算不同配體的結合自由能之差,并用于關聯已知的配體親和力和預測未知配體的親和力。不具備靶點三維結構數據時,3D-QSAR主要用通過提取候選藥物結構差異與成藥性差異的聯系建立預測模型。此過程有兩種主要策略。第一種是用成藥性最好化合物的優勢構象為基礎,比較不同小分子的體積等三維性質,尋找與成藥性相關的結構特征。另一類是比較分子場分析(comparativemolecularfieldanalysis,CoMFA),利用小分子、基團或原子作為探針計算候選分子周圍立體相互作用能,用回歸方法分析這些作用能同親和力的關系。現有CoMFA計算作用能時沒有考慮疏水相互作用,且用探針計算相互作用精度較低。CoMFA目前主要用于分析離體的成藥性數據。基于靶點三維模型的3D-QSAR策略主要用于配體類候選藥物,而不需要靶點三維結構模型的3D-QSAR策略還可用于非配體類藥物。預期在這兩種策略中更全面地考慮候選藥物同靶點的相互作用,有可能進一步改善3D-QSAR模型的預測性能,這無疑對藥物發現有重要意義。總體而言,3D-QSAR模型還不夠成熟,有許多環節還需要進一步完善。五、藥物的吸收、分布、代謝、排泄與毒性預測從給藥途徑而言,外用或口服給藥是理想的方式,但除非特意設計的局部外用或消化道局部給藥,這兩類給藥方式都面臨藥物的吸收(Absorption),即其生物利用度的問題。小分子藥物進入體內需要通過血液循環到達預期的作用位置,即需要考慮這些小分子藥物的分布(Distribution);有機小分子藥物進入體內都需被代謝(Metabolism);藥物進入體內都面臨被代謝后排泄或直接排泄(excretion);體內需相對穩定的環境,藥物在體內除了所需要的治療作用外,通常可能影響機體的正常代謝過程,即可能產生毒性(toxicity)。所以,對于靶蛋白的配體類藥物,除了預測其對靶蛋白的親和力外,還需考慮吸收、分布、代謝、排泄與毒性(ADMET)等藥物代謝動力學特性。小分子藥物的ADEME-Tox效應是決定其臨床應用成敗的關鍵特征。因此,小分子藥物發現的早期就進行ADEME-Tox效應測定,是顯著提高小分子藥物發現的成功率和臨床應用價值的關鍵環節。至今絕大多數小分子藥物ADMET效應的分子機制還不清楚。雖然細胞層次的研究經過多年的發展,已建立了一些高通量的體外ADMET研究方法。例如,測定腸吸收的細胞單層轉運實驗;基于肝細胞或提取的肝微粒體的新陳代謝和藥物-藥物相互作用實驗;基于肝細胞或其他組織細胞的生長抑制為指標的細胞毒性實驗等;但這些高通量篩選實驗還僅僅局限于少數幾種藥代動力學的特征。所以,發展有效的ADMET效應預測方法具有非常重要的意義。人體對藥物的吸收、吸收藥物的分布、藥物的體內代謝,藥物的排泄及其毒性,都涉及與人體內不同組織器官和不同蛋白等成分的非常復雜相互作用。因此,總結已有小分子藥物的結構性質同其ADMET效應的聯系,即發掘決定小分子藥物產生ADMET效應的特殊模式,成為預測小分子藥物ADMET的主要策略。這種預測的經典方法是Lipinski提出的五規則,實踐中主要應用四項特征判斷候選小分子藥物能否成為口服有效的藥物,即:①小分子化合物的分子量要小于500;②小分子化合物的脂水分配系數(logP)要小于5;③化合物上氫鍵給體,即與N和O相連的氫原子數要少于5個;④化合物上氫鍵受體,即N和O的數目少于10個。目前,直接利用小分子化合物的結構來預測它在體內的吸收及分布的方法已逐步建立,可通過直接計算小分子化合物的結構特征、電子分布特征、極性表面積等指標來預測表示分子吸收及分布的特征,例如脂水分配系數、腦血分布系數、腸穿透性以及水溶性等。而對于代謝、排泄及毒性的預測,雖然各種模式識別的方法都進行嘗試,例如人工神經網絡、模式識別方法及專家系統等,但預測的準確度仍然十分有限。模式識別方法分析小分子藥物ADMET效應的預測軟件很多,如英國Surrey大學的COMPACT預測系統,該系統主要針對與P450酶家族有關的蛋白進行毒性預測;開發的專家系統DEREK,以及HazardExpert,CASE,TOPKAT等軟件(表17-2)。另外,除了以上專門用于毒性預測的軟件外,本章第二節還提到的化合物ADMET相關數據庫,也是用于發掘決定小分子化合物ADMET效應的規律和建立預測方法的重要資源。表17-2用于ADMET預測的軟件軟件網址Gmax-BCerius2,ADME,TACD/logP,ACD/logD,ACD/pKCLOGP,CQSARLeadPMOEQikPVolS第五節藥用蛋白和多肽的成藥性預測Section5PredictionofPharmaceuticalPropertiesofProteinsandPolypeptides概述當前臨床應用的生物技術藥物中,基因治療(載體)和大分子核酸類藥物還很少,而很多細胞因子、治療性單抗、針對小分子靶點的酶類藥物已在常規應用,還有部分多肽類生物技術藥物也已經用于臨床。因此,本節主要討論蛋白質和多肽類生物技術藥物的成藥性及其預測。按照前述藥物作用模式,當需增強體內某個信號傳遞蛋白或某個物質代謝途徑的關鍵蛋白活性時,可選擇性促進該蛋白質的合成、降低該蛋白質降解、促進蛋白修飾增強活性、增強其激動劑(activator)水平甚至上述策略中多種聯用。為了實現這種效應,可用對應蛋白或特殊多肽作為藥物從外界補充以增強或阻斷對應信號通路或代謝途徑的作用。除了局部外用蛋白質藥物外,其他蛋白質藥物經過各種途徑給藥后一般需經過血液循環;蛋白質藥物很難進入細胞內,其主要是在血液循環系統發揮作用。除了藥理活性外,多數蛋白質藥物在人體內血漿的循環半衰期和人體免疫反應是其成藥性的決定因素(顯然蛋白疫苗需要其免疫反應)。決定蛋白質和多肽藥物血漿半衰期的主要因素是血漿中蛋白質藥物的腎臟濾除、熱穩定性、免疫清除、蛋白酶解等因素,這對包括疫苗在內的蛋白質藥物都適用;而除了疫苗以外,其余藥用蛋白質都需要避免其引起人體的免疫反應,以免產生過敏和炎癥反應等難以控制的副作用。多肽藥物如分子比較小則除了設計的疫苗以外,一般免疫原性很小,影響其半衰期的主要是腎臟濾除和蛋白酶解等因素。蛋白質和多肽類藥物常需修飾其N端和C端的氨基酸殘基(置換成非天然氨基酸等)以降低降解。除了蛋白質疫苗外,用親水聚合物修飾蛋白質和多肽藥物的抗原決定簇既可降低其免疫原性,又可延長其血漿半衰期。蛋白質表面能被免疫球蛋白分子的抗原結合位點或特定效應分子識別并結合的抗原區域即抗原表位(epitope)或抗原決定簇(antigenicdeterminant)。因此,預測藥用蛋白質的抗原決定簇對改善其藥代特性具有重要意義。本節簡介蛋白質與多肽類藥物除了其藥理作用外的成藥性特征及其預測。蛋白質的免疫原性預測免疫(immunity)是指機體對外源或本來不暴露的自身物質的識別,并利用相應方式進行清除以維持體內環境穩定的現象和過程,由機體的免疫系統執行,涉及免疫活性分子、免疫細胞、免疫組織和免疫器官等。動物都有免疫系統,但特異性免疫(specificimmunity)主要在脊椎動物體內,無脊椎動物的免疫系統主要是非特異性免疫。免疫應答(immuneresponse)指機體對異物刺激引起的一系列特異性生理反應以維持內環境穩定的過程;廣義的免疫應答包括非特異性免疫(即天然免疫,innateimmune)和特異性免疫。天然免疫是物種進化過程中具備的對外界刺激的自然防御系統,可遺傳且相對穩定,主要識別異種物質,由皮膚粘膜、吞噬細胞、NK細胞和組織間隙液體成分組成。特異性免疫即獲得性免疫(acquiredimmunity)或適應性免疫(adaptiveimmunity),其作用高度特異、效力強、有記憶性但不能遺傳。誘導機體的特異性免疫是使用疫苗進行防疫與治療的主要機制。參與特異性免疫反應的細胞主要是B淋巴細胞和T淋巴細胞;來自機體的參與免疫反應的主要蛋白質是抗體(antibody),補體(complement)和細胞因子(cytokine)。誘發免疫反應的是抗原(antigen),即能刺激機體產生特異性抗體或致敏淋巴細胞,并能與對應抗體等在體內外發生特異性相互作用的成分,可據其刺激B淋巴細胞產生抗體對胸腺的依賴分成胸腺依賴抗原(TDantigen)和非胸腺依賴抗原(TIantigen)。免疫反應過程中抗原需經過抗原遞呈中的識別和加工,再傳遞給特異性免疫細胞(主要是T和B淋巴細胞)。能進行抗原遞呈的細胞稱為抗原遞呈細胞(antigen-presentationcell,APC)。抗原遞呈中涉及蛋白質抗原的部分水解,主要有經過吞噬小泡進入溶酶體(lysosome)的水解途徑、經過蛋白酶體(proteosome)的降解過程。APC主要有兩類:一類表面表達主要組織相容性復合體(majorhistocompatibilitycomplex,MHC)Ⅱ分子,負責識別通過吞噬加工的外來抗原;另一類在病原體和細胞因子作用下才參與抗原遞呈,主要表達MHCⅠ分子并可識別和加工來自機體內部的自身抗原、寄生病毒、細菌抗原。T細胞依靠其表面受體識別與APC表面與MHC分子結合的連續抗原肽表位(epitope),其中CD4細胞識別與MHCⅡ結合的外來抗原,CD8識別與MHCⅠ結合的內源性抗原。B細胞識別抗原依靠表面的膜免疫球蛋白和免疫球蛋白形成的跨膜復合物,可識別TD抗原和TI抗原,但識別機制有差異。多數抗原為TD抗原,其需經過APC處理后提交給輔助性T淋巴細胞,再傳遞給B淋巴細胞;這些處理后的抗原肽含有多個抗原決定簇,分別與輔助性T淋巴細胞和B淋巴細胞作用后激活B淋巴細胞產生抗體。TI抗原不需要輔助性T淋巴細胞,可直接刺激B淋巴細胞產生抗體。免疫反應涉及復雜的細胞和分子作用網絡,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國臥式瀝青加熱罐行業投資前景及策略咨詢研究報告
- 2025至2031年中國人造金剛石磨料行業投資前景及策略咨詢研究報告
- 2025至2030年中國錐度靠尺數據監測研究報告
- 醫院新生兒急救管理
- 幼兒園教師禮貌禮儀培訓
- 儀表維修工基礎知識培訓
- 重癥監護室新護士培訓報告
- 旅游行業不文明行為勸導糾正指南
- 幼兒一日作息時間培訓
- 新買賣房屋合同
- 天然氣管道置換記錄表
- 學前幼兒園-《守衛國家安全的人》教學課件設計
- DNA的粗提取和鑒定(香蕉)
- 客戶互動知識培訓講座
- 高中生物奧賽輔導資料
- NFPA59A2021中文版液化天然氣生產儲存和裝運標準
- 富馬酸伊布利特幻燈課件
- 新譯林版高一英語新教材必修三全冊課文及翻譯(英漢對照)
- 陜西省潼關縣潼峪-蒿岔峪金礦開采項目環評報告
- 高中化學常見晶體的結構及晶胞
- 著色探傷作業指導書
評論
0/150
提交評論