人類疾病網(wǎng)絡_第1頁
人類疾病網(wǎng)絡_第2頁
人類疾病網(wǎng)絡_第3頁
人類疾病網(wǎng)絡_第4頁
人類疾病網(wǎng)絡_第5頁
已閱讀5頁,還剩67頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

人類疾病網(wǎng)絡張媛媛2010.12.2015/8/20248:58AM蠕弓蜂色岔擦松僳貪氓藍襖紀涅崖血毋繞腳杖褥鍛姨更你王鄲遺迢秀楓恒人類疾病網(wǎng)絡人類疾病網(wǎng)絡1人類疾病網(wǎng)絡5/8/2024背景在刻畫人類疾病位點的研究中,很多疾病基因的位置克隆和全基因組的關聯(lián)研究,產(chǎn)生了疾病與基因的關聯(lián)對列表。另外,蛋白質(zhì)相互作用,人類代謝圖譜和調(diào)控網(wǎng)絡等都為不同疾病基因間的相互作用提供了一些細節(jié)描述。25/8/20248:58AM作驅(qū)屑煥撫鱗燦埋涸鐮薩帚曳巳品個潘憫擁洞狼帥煞集聾凜畫腸綁底求吸人類疾病網(wǎng)絡人類疾病網(wǎng)絡2人類疾病網(wǎng)絡5/8/2024給出一個不同的方法,在細胞和有機體的組織的高水平上,探索人類遺傳疾病和對應的疾病基因是否可以彼此相關聯(lián)。通過提供有多個基因引起的疾病(基因座異質(zhì)性)的例子來支持這個方法的有效性。比方說,腦肝腎綜合癥是由至少11個基因的變異引起的,所有的都與過氧化酶體的生物發(fā)生有關。還有由一個基因的不同變異(等位基因異質(zhì)性)的疾病。比方說,TP53的變異被關聯(lián)到11個臨床上不同的癌癥相關疾病。通過發(fā)展一個全部遺傳疾病(疾病表型組)和全部疾病基因(疾病基因組)的關聯(lián)框架,得到對疾病組學的全局認識。35/8/20248:58AM蜒弛滄芝康壇呼糙雜鬃兇膳舊印匙扔抒公碘打酌害吏鞋醒失贏豆逾痕它朱人類疾病網(wǎng)絡人類疾病網(wǎng)絡3人類疾病網(wǎng)絡5/8/2024結(jié)果和討論疾病組的構(gòu)建:構(gòu)建兩個不相交頂點集的二部圖。一個集合對應所有的已知遺傳疾病,另一個集合對應人類基因組的所有已知的疾病基因。如果一個基因的變異暗示了某種疾病的發(fā)生,則疾病和基因相關聯(lián)。疾病、疾病基因和他們之間的關系的列表都是從OMIM獲得。到2005年12月,包含了1284種疾病和1777個疾病基因。我們基于被疾病所影響的生理系統(tǒng),將疾病分成22類疾病。45/8/20248:58AM炔旁豎露連扇賈滯砷分趙尚披甘廖盯浪露焦嗎采砷蔫湛完昨紋姚扭般停囂人類疾病網(wǎng)絡人類疾病網(wǎng)絡4人類疾病網(wǎng)絡5/8/2024由疾病組的二部圖可以產(chǎn)生兩個相關的生物網(wǎng)絡投影。一個是人類疾病網(wǎng)絡(HDN),頂點是疾病,當兩個疾病共享至少一個疾病基因時,二者關聯(lián)。另一個是疾病基因網(wǎng)絡(DGN),頂點是疾病基因,當兩個基因關聯(lián)到同一疾病時,二者相連。然后,我們討論了這些網(wǎng)絡對于幫助我們理解和代表所有已知疾病和表型關聯(lián)的框架的潛力。55/8/20248:58AM遮最存疵劑男澤祖棒踢霉耿橋司虹矗舍氧唯庚售熱用顛倍損極籮軍諱岔湊人類疾病網(wǎng)絡人類疾病網(wǎng)絡5人類疾病網(wǎng)絡5/8/202465/8/20248:58AM刮葉暴謗隋膀薯檔梗海埠逃弓抨舷震膜菲鑷鰓哥蹲簇閉學茫農(nóng)名尉昨貧擋人類疾病網(wǎng)絡人類疾病網(wǎng)絡6人類疾病網(wǎng)絡5/8/2024HDN的性質(zhì):如果一個人類疾病有不同并且唯一的遺傳原因,那么HDN對應的是不連通的孤立點。但,獲得的HDN包含了單個疾病間和疾病類間的很多關聯(lián)。1284個疾病中,867個至少一個邊關聯(lián)到其他疾病,516個疾病形成一個巨大的類,暗示很多疾病同其他疾病是同享遺傳原因。一個疾病關聯(lián)的基因數(shù)目s有很寬的分布,暗示大多數(shù)疾病關聯(lián)到少數(shù)基因,很少的疾病關聯(lián)到很多基因。白血病s=37,結(jié)腸癌s=34等。HDN的度分布也是冪律的,結(jié)腸癌k=5075/8/20248:58AM習沮懾炭讕芯串凜袋斟蚌既哦沙浙奎賽囂谷齋警榷罕臆恿兇磺膚銀財承庫人類疾病網(wǎng)絡人類疾病網(wǎng)絡7人類疾病網(wǎng)絡5/8/2024灰色表示linearbinning;紅色表示以2為底的對數(shù)數(shù)據(jù)85/8/20248:58AM責汰疚淚差抉花睹盡甲禹順蕭辰疽膀西忌落浩宅磐部汝鑲暴諷溪堆酵開揭人類疾病網(wǎng)絡人類疾病網(wǎng)絡8人類疾病網(wǎng)絡5/8/2024HDN有明顯的聚類現(xiàn)象,但在不同疾病類之間有明顯的不同。癌癥類因為共享很多癌基因,所以緊密相連,并且還有很多疾病同癌癥有強相關;代謝疾病沒有明顯的形成一個不同的類。如圖三為了量化這種差異,我們衡量了每個疾病類的基因座異質(zhì)性和連通性(HDN中彼此連接的一部分疾病)。如圖四,紅色代表較高的顯著性,藍色代表較低的顯著性。發(fā)現(xiàn)癌癥有著較高的異質(zhì)性和連通性,而代謝類有較低的異質(zhì)性和連通性。基因座異質(zhì)性:指多于一個基因的變異。用屬于這個類的疾病中基因的平均數(shù)目(也就是節(jié)點的平均大小)來衡量。一個類的連通性:用在HDN中彼此互相關聯(lián)的一部分疾病來衡量95/8/20248:58AM行趁五贊枉砷淮低瘓呸螟豎創(chuàng)胡儈嘴小試狗唉夏競罰漾掘琺七彬循拐滿胡人類疾病網(wǎng)絡人類疾病網(wǎng)絡9人類疾病網(wǎng)絡5/8/2024105/8/20248:58AM噪趾咆攻煌耀瞧溪烤菩泅涵蛛泰資秋雌僥蒼貍僧溪續(xù)簧井懂胯艦娘肩耶詫人類疾病網(wǎng)絡人類疾病網(wǎng)絡10人類疾病網(wǎng)絡5/8/2024115/8/20248:58AM櫻裝財憋噪鈾窗漸募宛凰鋁部業(yè)罐暈雛歸齋鈞蠢關吁月墓怪來派妻靛蓬歉人類疾病網(wǎng)絡人類疾病網(wǎng)絡11人類疾病網(wǎng)絡5/8/2024DGN的性質(zhì)基因間的關聯(lián),代表了相關表型關聯(lián),他們代表了表型相關性的衡量,這個可以用在未來的研究中,同蛋白質(zhì)相互作用、轉(zhuǎn)錄因子—啟動子相互作用、代謝相互作用關聯(lián),發(fā)現(xiàn)新的遺傳相互作用。在DGN中,1377個疾病基因連接到其他基因,903個基因?qū)儆谝粋€巨大的類。如圖五涉及多種疾病的基因數(shù)目急劇減少。如圖六125/8/20248:58AM悠井照雌蚤旺蛤爐佬聽懶摻領坊宗梁錫滔盆歷碉瘦侖搞伏激促延酵坍撅籃人類疾病網(wǎng)絡人類疾病網(wǎng)絡12人類疾病網(wǎng)絡5/8/2024135/8/20248:58AM酵阜迭冗崇炎巳溜俏嘗腳動恫鼎焙墻濫箭奎頻據(jù)置胃氧瀕乞紋怔譏雛姓褥人類疾病網(wǎng)絡人類疾病網(wǎng)絡13人類疾病網(wǎng)絡5/8/2024145/8/20248:58AM隊毒此論則殊陵曠焦悲體脾諒世淤離愛傅秤縣柳陣投撓什稍磐橙篆詣汐途人類疾病網(wǎng)絡人類疾病網(wǎng)絡14人類疾病網(wǎng)絡5/8/2024HDN和DGN的功能類在保持疾病和基因的度不變的情況下,在二部圖基礎上隨機化重連邊,得到的疾病網(wǎng)絡的最大類的平均大小是643±16,遠大于實際HDN中的516。相似,基因網(wǎng)絡的最大類的平均大小為1087±20,也遠大于實際DGN中的903(P<10^(-4))。這些不同顯示了疾病和基因的重要的病理生理學類。在實際的網(wǎng)絡中,疾病(基因)更傾向于相同疾病類中疾病(基因)的相連。155/8/20248:58AM買思瓢徐率屜相壞熏算竹涸搽國盛暇奮荔哦滋絹博圖刪逸者瀝劫拳歸振鄧人類疾病網(wǎng)絡人類疾病網(wǎng)絡15人類疾病網(wǎng)絡5/8/2024疾病關聯(lián)基因識別不同功能模塊大多數(shù)的疾病和疾病類對應細胞內(nèi)網(wǎng)絡中怎樣的不同的功能模塊仍然不清楚。假設1:如果編碼蛋白質(zhì)的疾病關聯(lián)基因在功能不同的模塊中相互作用,則在這些疾病模塊中的蛋白質(zhì)比其他蛋白質(zhì)更可能相互作用。為了檢驗這種假設,建立了蛋白質(zhì)相互作用網(wǎng)絡,發(fā)現(xiàn)290個重疊的相互作用,是隨機情況下的10倍。5/8/20248:58AM16汕券呵授擋疆習虛調(diào)常抄盈豁呵按菩僳呂訟菜志墓順惺剿娶濰拘攀沂倒薩人類疾病網(wǎng)絡人類疾病網(wǎng)絡16人類疾病網(wǎng)絡5/8/2024同一個疾病關聯(lián)的基因共享一般的細胞和功能特性,在GeneOntology(GO)中注釋。假設2:如果HDN顯示模塊化組織,則與相同疾病關聯(lián)的一組基因應該分享相似的細胞和功能特性,正如在GO中注釋的一樣。為了證實這個假設的有效性,對于GO的每個分支(生物過程、分子功能和細胞組分),我們測量了每個疾病的GO同質(zhì)性。發(fā)現(xiàn)有很高的顯著性。GO同質(zhì)性:,是疾病i關聯(lián)的有GO術(shù)語j的基因數(shù)目;是與疾病i關聯(lián)的有GO注釋的所有基因數(shù)目。5/8/20248:58AM17阮擄燙侈逸查熔漏邦吃怯拓胡蟹邵間特沈洼婉鈞董藏遇族量乏建瞅澡署岸人類疾病網(wǎng)絡人類疾病網(wǎng)絡17人類疾病網(wǎng)絡5/8/20245/8/20248:58AM18嚼并漬鉸扯粉口培蟬厚服呸涸象忘芬猙袖捏張哩國魚濤椒惕前崩星紊型全人類疾病網(wǎng)絡人類疾病網(wǎng)絡18人類疾病網(wǎng)絡5/8/2024假設3:在一般功能模塊中相互作用的編碼蛋白質(zhì)的疾病基因應該趨向于在相同的組織中表達。為了衡量,我們引入疾病的組織同質(zhì)系數(shù)。定義為:其中

表示對于疾病i的關聯(lián)基因至少在一個組織中表達的基因數(shù)目,表示在組織j中表達的基因的數(shù)目。如右圖,有68%的疾病有完全組織同質(zhì)性,隨機情況下為51%。(P<10^(-5))5/8/20248:58AM19稗聳許當燭聯(lián)巫臥呀判荷貞猶垣聰曲盧盞憊室秤香往塹傻切齋邑條屏嬰蓖人類疾病網(wǎng)絡人類疾病網(wǎng)絡19人類疾病網(wǎng)絡5/8/2024最后,參與一個功能模塊的基因應該顯示較高的表達譜相關。通過與隨機控制的比較,發(fā)現(xiàn)關聯(lián)相同疾病的基因?qū)Φ腜earson相關系數(shù)(PCCs)有較高的值。一個給定疾病的所有基因?qū)Φ腜CC的平均值也存在顯著性。大約33種疾病的平均PCC>0.6。5/8/20248:58AM20煌紹試呢散厘煞產(chǎn)逾脈淵傲豪沫炭喪鎂欄機譬獺吟汰治掩魯飄譴陸揪蹦詠人類疾病網(wǎng)絡人類疾病網(wǎng)絡20人類疾病網(wǎng)絡5/8/2024總結(jié):關聯(lián)同一疾病的基因1)他們對應的產(chǎn)物通過蛋白質(zhì)相互作用傾向于彼此連接;2)傾向于在特異性組織中共同表達;3)顯示較高的共表達水平;4)作為一個組顯示同步表達;5)傾向于共享GO術(shù)語。這些支持了對于疾病基因和他們產(chǎn)物的全局功能相關性,提供了一個疾病組的基于網(wǎng)絡的模型5/8/20248:58AM21棵箍徐束的鉻俯森浚嘩沂鋁痛曉欠怖粗爬榆勝忠背鍺懊史閘疇六郁琴稗覺人類疾病網(wǎng)絡人類疾病網(wǎng)絡21人類疾病網(wǎng)絡5/8/2024中心性和外圍性一個細胞網(wǎng)絡的結(jié)構(gòu)和它功能特性的關聯(lián)的最早的解釋是在釀酒酵母中高連通蛋白或hubs更傾向于被關鍵基因編碼。這促使研究者對人類疾病基因傾向于編碼hubs的假設進行研究,但有研究者發(fā)現(xiàn),二者僅有很弱的相關性。我們最初的研究是支持這一假設的。但是,疾病基因和hubs的關系在不同疾病基因間是不相同的。5/8/20248:58AM22簡憲啪硅靖悼亢困干攪激壕躥痢缽苯動纓幽辛裝暑尸袍醚孔饑腔韌涅曳碳人類疾病網(wǎng)絡人類疾病網(wǎng)絡22人類疾病網(wǎng)絡5/8/2024在探索疾病基因是否編碼hubs時,忽略了在早期發(fā)育中的關鍵基因,它們的改變導致高比例的自發(fā)流產(chǎn)。通過對老鼠基因的人類同源基因分析,發(fā)現(xiàn)1276個人類基因的老鼠重要同源基因,其中398個與人類疾病有關,占人類疾病基因的22%。這樣就把人類基因分為:1276個關鍵基因和1379個非關鍵疾病基因。發(fā)現(xiàn)關鍵蛋白顯示了同hubs關聯(lián)的趨勢,而其余非關鍵疾病蛋白沒有這種趨勢。5/8/20248:58AM23割斗靠奉叁疆可漱岔撓侍樁曝氯殷絡侶蕊紙拱街志適圓醒應桶如選遂詣宙人類疾病網(wǎng)絡人類疾病網(wǎng)絡23人類疾病網(wǎng)絡5/8/20245/8/20248:58AM24餒耍許辮橇釜倪矛撕壤灼凹婉做繕恢塹惜誤盡矛屢盅罕惱促盾酮悄畸楔彈人類疾病網(wǎng)絡人類疾病網(wǎng)絡24人類疾病網(wǎng)絡5/8/2024期望:關鍵基因和疾病基因的表達模式同相當數(shù)量的其他基因同步。定義關鍵基因(或非關鍵疾病基因)i和細胞中所有其他基因之間的平均基因共表達系數(shù),是從人類正常組織中計算得到的。發(fā)現(xiàn):對于關鍵基因,有高的<p>的基因比小的或負的的基因更關鍵;而對于非關鍵疾病基因正好相反。5/8/20248:58AM25草幕胰卷迂殷哲降阮璃尖利籮門喬菲準嬌胞嘩訃陶象耳抱君搔衙褂脅整刮人類疾病網(wǎng)絡人類疾病網(wǎng)絡25人類疾病網(wǎng)絡5/8/2024最后,我們問:看家基因是否有一個編碼疾病基因的趨勢?我們發(fā)現(xiàn)一個基因在越多的組織中表達,則這個基因是關鍵基因的可能性越高。而非關鍵疾病基因有在很少的組織中表達的趨勢。發(fā)現(xiàn)9.9%的看家基因?qū)郊膊』颍?3.5%的非看家基因;5/8/20248:58AM26浪榆饑篙帕遙嘴焚龐窖泊矽蔓懲東斗駁犢紫嗓毅錄縫灸敬善射臉鎖獨藻們?nèi)祟惣膊【W(wǎng)絡人類疾病網(wǎng)絡26人類疾病網(wǎng)絡5/8/2024大部分疾病基因的次要性可以用進化的觀點進行解釋。導致嚴重表型的體細胞突變更可能影響中心功能。我們分別研究了體細胞癌基因的特性,發(fā)現(xiàn)它們更可能編碼hubs、顯示了與其他基因更高的共表達性、更可能代表看家基因。體細胞癌基因的這種功能和拓撲中心性與當前的理解相吻合——很多癌基因在細胞的發(fā)育和生長中發(fā)揮很重要的作用。5/8/20248:58AM27粉珠蓑娶詠閃屯蕪傾代麻攘消騷揪串攻粗奄訟溶目波麓廢偷扔杖敗揍贛首人類疾病網(wǎng)絡人類疾病網(wǎng)絡27人類疾病網(wǎng)絡5/8/2024在人類的復雜表型中探索遺傳重疊某些疾病會在病人中高頻率(低頻)的同時發(fā)生。因此研究疾病間的遺傳重疊至關重要。我們用對多種疾病的觀察的大量的表型數(shù)據(jù)集和適當?shù)慕y(tǒng)計模型,推理表型間的遺傳重疊。比方說,孤獨癥、雙相型障礙和精神分裂癥存在重要的遺傳重疊。因此,這種疾病網(wǎng)絡假說可以很快被用在遺傳圖譜的方法設計上,它涉及看似孤立的多種表型間的聯(lián)合關聯(lián)5/8/20248:58AM28沸粹靜瑤佰筋杭恒納域契賠瘁拼塞駭昨抵驟瑤淑俘番典競閨贖凹灼輕紹駿人類疾病網(wǎng)絡人類疾病網(wǎng)絡28人類疾病網(wǎng)絡5/8/2024數(shù)據(jù)來源:哥倫比亞大學醫(yī)學中心的臨床資料庫。包括161種疾病的150萬病人記錄。這些數(shù)據(jù)包含了疾病的比較寬的范圍,從一般到稀有,影響不同的生理系統(tǒng)。5/8/20248:58AM29競崖垛捂酋疙擻謬棚蚜臀來語怯動荊警慎混七奈瘋瞥鞘在奠希儉臆戮吹撲人類疾病網(wǎng)絡人類疾病網(wǎng)絡29人類疾病網(wǎng)絡5/8/2024方法:考慮一對疾病D1和D2,模擬一個人在特定年齡或之前的表型。一個人天生帶有(沒有)疾病易感變化集合,用k1、k2和k12的隨機變量表示,這些變量確定了某個人在某個時間被診斷為某種病的概率。如果沒有時間的調(diào)節(jié),早發(fā)疾病和晚發(fā)疾病可能被錯誤的判斷為負關聯(lián)。5/8/20248:58AM30挪獵宰替罕壓晦赦汞日罷沽宴草礁漚棗概違牧鄖炮弗塹扮雛娶籠摘睡膿浚人類疾病網(wǎng)絡人類疾病網(wǎng)絡30人類疾病網(wǎng)絡5/8/20245/8/20248:58AM31梢皆練詹珊壽臂奠娥韶敦條環(huán)賃久酗靶縱踏翔恤嚼攫摯矚縱領窯惺撼屑壓人類疾病網(wǎng)絡人類疾病網(wǎng)絡31人類疾病網(wǎng)絡5/8/2024假設1)如果有兩種(多種)不同疾病是在相同環(huán)境下發(fā)生的,那么它們通常是通過分子機制引發(fā)的。2)對于每個表型對D1和D2,整個人類基因組被分為四個不相交的核苷酸位點集合。3)涉及連接疾病表型的四個集合中遺傳變異的假設機制。在位點的疾病易感集合中,遺傳變異的數(shù)目越大,疾病表型越可能顯現(xiàn)出來。5/8/20248:58AM32馬茄商抄豺匣好潘滑慫凱來戍夜縣盅缽釉荷氏旭芍爸纖造葬饒涌濫毅蕊酵人類疾病網(wǎng)絡人類疾病網(wǎng)絡32人類疾病網(wǎng)絡5/8/2024這兒考慮兩類遺傳外顯率函數(shù):sharp-threshold和soft-threshold。Sharp-threshold是指當多態(tài)性的數(shù)目超過閾值時,表現(xiàn)出表型i的特征來。是指表現(xiàn)疾病表型i所需要的,在疾病特異性核苷酸位點的有害多態(tài)性的最少數(shù)目。Soft-threshold是指,閾值是一個隨機變量,滿足均值為,方差為的二項分布。()5/8/20248:58AM33怨共謬佛臉裳娘法鍍燼嘶臟氛掉汽獄寞疏截著圈骨兔兇逢頻妹憲秸傍呀晃人類疾病網(wǎng)絡人類疾病網(wǎng)絡33人類疾病網(wǎng)絡5/8/2024對每一個疾病對,我們選擇三種模型中的一種進行分析:二者不相關(也就是沒有遺傳重疊);二者負相關(競爭遺傳重疊);二者正相關(合作遺傳重疊)。合作模型比標準的遺傳多效模型更一般。因為合作模型除了分享的多態(tài)性,還允許關聯(lián)影響各自的遺傳多態(tài)性。獨立模型是兩個重疊模型的特殊情況,我們通過將兩個重疊模型同獨立模型比較,用兩個對數(shù)似然比統(tǒng)計代表我們分析的結(jié)果。進一步,我們的參數(shù)模型提供了對假定遺傳重疊的大小的評估。5/8/20248:58AM34監(jiān)傲啡駝燎聚斃枕橢穗肋卯荊離扦塵鄉(xiāng)腸咎塊炳熄莊秋瘸坊認齒夫樁苞峙人類疾病網(wǎng)絡人類疾病網(wǎng)絡34人類疾病網(wǎng)絡5/8/2024相關性和重疊對于遺傳重疊的分析顯示了疾病間的大量的相關性,很多都被很好的確定,但有些相關性先前沒有描述過。與孤獨癥的遺傳重疊的疾病分為四類;雙相型障礙和精神分裂癥也類似分析。這三種疾病同其余158中疾病的關聯(lián),紅線代表正相關,藍線代表負相關。5/8/20248:58AM35譏鴨吏祿恩腿憂蕩磷放翼碳適蟻梅為芭晰技厘王瘁瓦伍惕躺巫畔秸牲胞哮人類疾病網(wǎng)絡人類疾病網(wǎng)絡35人類疾病網(wǎng)絡5/8/20245/8/20248:58AM36遁肯食盈端豎蹋擰霜五目繳夜辱適涕幢弄汗匆抑瘓兆暇擺禍閥里見善錢娩人類疾病網(wǎng)絡人類疾病網(wǎng)絡36人類疾病網(wǎng)絡5/8/2024非孟德爾疾病的表型經(jīng)常定義一個模糊度,尤其是神經(jīng)學上的。很多情況下,觀察到的疾病是有相似癥狀但可能不同遺傳原因的多種病態(tài)的混合。我們對一對疾病間遺傳疾病的解釋不排除一個疾病是另一個疾病的原因的可能5/8/20248:58AM37腕巖蒙腿追寅并暮錄庭奠釬吳轄蠕斟癡匹凸兇因贈桿轄履占渴迄渾戊傷瀉人類疾病網(wǎng)絡人類疾病網(wǎng)絡37人類疾病網(wǎng)絡5/8/2024具體方法:對于病人i的兩個疾病D1和D2,第i個病人用下式表示N是數(shù)據(jù)庫中病人的總數(shù);是病人的年齡;是病人的性別;是病人的種族;和分別指病人被診斷為疾病D1,D2的年齡。當病人沒有被診斷為疾病Dk時,為∞。5/8/20248:58AM38輯蟻撂諾擄泛虞丫韻訊陷捷蹤晰芒杖廁掃腔隱毅訊杭廁質(zhì)盈茸綿隙攆套趟人類疾病網(wǎng)絡人類疾病網(wǎng)絡38人類疾病網(wǎng)絡5/8/2024對于疾病D1和D2,將整個基因組分為四個不相交的集合。盡管我們是集中在點突變的研究,但是我們的方法可以擴展到遺傳多態(tài)性的其他類型,比方說插入、刪除、倒置和替換。對于D1和D2,我們定義四種表型

基因型:的概率。對病人i,我們用隨機變量三元組表示所有有害多態(tài)性,這些多態(tài)性被分成。這三個隨機變量完全描述了病人涉及到疾病D1,D2的基因型。假設獨立的服從poisson分布,參數(shù)分別為。如果一個疾病相關的核苷酸位點集合很小,可以假設用二項分布代替poisson分布。5/8/20248:58AM39硅付拌蛙神卡歇庫篇爪店形耳渙膝換茁靶籌沙談溺鈣意異官沁妓真撥屢炎人類疾病網(wǎng)絡人類疾病網(wǎng)絡39人類疾病網(wǎng)絡5/8/2024給定,的概率(外顯函數(shù))我們用表示一個病人在他生命結(jié)束時涉及到疾病D1和D2。定義兩個外顯函數(shù):一個是在和中的有害變異的數(shù)目大于等于一個閾值;另一個定義是指,閾值本身是一個隨機變量,所以疾病發(fā)生的概率隨有害多態(tài)性數(shù)目的增加而逐漸增加。給定,的概率用表示一個人在時間t之前的表型。令和表示第一次診斷到D1和D2的時間,等價于。因此對于和,兩個疾病表型狀態(tài)的可能可以用聯(lián)合失效時間模型來研究,基于類似于年齡和性別的遺傳因子和協(xié)方差5/8/20248:58AM40仟成瞅孺碼倔駭婚池命朽死蒼屏獻途礫丟忌驅(qū)沸店忌夫祿煮澤熙犁駒薊拄人類疾病網(wǎng)絡人類疾病網(wǎng)絡40人類疾病網(wǎng)絡5/8/2024然后,我們定義下面的條件概率其中k=1,2.我們可以直接從數(shù)據(jù)估計,的估計如圖一。最后我們定義,在給定,的概率以的形式給出。5/8/20248:58AM41播每穎邏淄暇碰陛鋸有瑞酪逗討撥瑣歐坦燭只薪悠程疚啼焚克壞生盾邁蛆人類疾病網(wǎng)絡人類疾病網(wǎng)絡41人類疾病網(wǎng)絡5/8/2024病人i被診斷為疾病Di的概率為

5/8/20248:58AM42畜謂烽宋唾司幀零緣崖藥末窒取塘續(xù)鐵譴甩機扁譯嘻很乃坦倍插距解滇聞人類疾病網(wǎng)絡人類疾病網(wǎng)絡42人類疾病網(wǎng)絡5/8/2024兩類遺傳重疊模型:合作和競爭在合作模型中,重疊基因可以同時對兩種疾病貢獻;在競爭模型中,重疊基因僅對于其中一種病有貢獻,具體對那種病有影響是隨機的。似然比檢驗為了計算第i個病人的似然值,我們需要對給定的在所有可能的取值()和上的概率求和。如果我們假設對于所有的e和g,參數(shù)向量都是一樣的,則似然函數(shù)是所觀察表型的概率的乘積(所有病人);或者,我們根據(jù)種族和性別將數(shù)據(jù)細分,對每個數(shù)據(jù)子集估計參數(shù)的集合。5/8/20248:58AM43鄉(xiāng)恰婪梆怎獎鎬件哈霉仍游玉癬拓辛暈注靖負硫蔣吁霓糾廬沸胃熒嫡傀蠢人類疾病網(wǎng)絡人類疾病網(wǎng)絡43人類疾病網(wǎng)絡5/8/2024核心:我們的分析是模型選擇的問題。1)當兩種疾病有任意大的遺傳重疊時,我們對同一模型有兩種看法。(合作或競爭)2)當兩個疾病在遺傳上是獨立的時,我們有一個更簡單的模型嵌套在前兩個模型里,即為空,因此,我們可以用一個標準似然比統(tǒng)計量來計算。隨著樣本數(shù)的增加,漸近的服從分布。通過計算和區(qū)分三個模型(獨立、合作和競爭)。5/8/20248:58AM44除瑰碳牲隙諺稿驅(qū)講逝崔度玩倒遞沂汀饞呻乍滔菌恕悲女復芥干揚坐得旬人類疾病網(wǎng)絡人類疾病網(wǎng)絡44人類疾病網(wǎng)絡5/8/2024研究人類表型的動態(tài)網(wǎng)絡方法通過證明以下事實,我們提供了關于表型疾病網(wǎng)絡的結(jié)構(gòu)同疾病發(fā)展的理解相關的根據(jù):1)一個人患的某種病在網(wǎng)絡中與曾經(jīng)患過的病接近;2)對于不同性別和種族的病人,疾病在網(wǎng)絡中沿著網(wǎng)絡邊的發(fā)展是不同的;3)在表型疾病網(wǎng)絡中,有高連通的疾病的病人要比低連通疾病更易于死亡;4)在網(wǎng)絡中,后發(fā)生的疾病比先發(fā)生的有較多的連通,并且與較高的死亡率相關聯(lián)。5/8/20248:58AM45灸按樞秸鶴售懷彎烴妄吝礎憲稠囂粵傻墻纂滅限砧藏弟郴化神題弧坤怯尉人類疾病網(wǎng)絡人類疾病網(wǎng)絡45人類疾病網(wǎng)絡5/8/2024我們的結(jié)果顯示,疾病的發(fā)展可以用網(wǎng)絡的方法進行研究,并且提供了加強對人類疾病的起源和進化的理解的可能性。5/8/20248:58AM46世拽壬萬捏逢塘粘盟絳書剃嚙褒浪汗盂蟲圈邊魄設樹著駁女泄甚沙柒梨婁人類疾病網(wǎng)絡人類疾病網(wǎng)絡46人類疾病網(wǎng)絡5/8/2024方法數(shù)據(jù)醫(yī)療機構(gòu)提供關于疾病診斷的有效的,系統(tǒng)的和完整的數(shù)據(jù)。每條記錄包括:拜訪的日期、最初的診斷和到第九級的診斷,所有的都被一個5位的ICD9碼指定。前三位指定了主要的疾病類,后兩位提供關于疾病的其他信息。ICD-9-CM分類在3位水平上分為657類,而在5位水平上分為16459類。我們基于1990-1993年的住院治療的MedPAR記錄編寫了原始的醫(yī)療保險聲明(medicareclaims)。大部分是65歲以上的老人。5/8/20248:58AM47滲冤捍鞘捆止殆促詐猿垣鱗撞辭美鬼重墊綁筍瑟丸寂廂雛慰泄笛沒處潮炸人類疾病網(wǎng)絡人類疾病網(wǎng)絡47人類疾病網(wǎng)絡5/8/20245/8/20248:58AM48MFM+FW4910362(37.66%)6835054(52.42%)11745416(90.08%)B386663(2.97%)596432(4.57%)983095(7.54%)B+W5297025(40.62%)7431486(56.99%)12728511(97.62%)B+W+Other5440490(41.72%)7598529(58.28%)Other(Hispanic+Asian+NativeAmerican+Other)310507(2.38%)Total13039018(100%)挾家心鉛捆祈酷鉀廊揭趨鄒綸瑰污嗡遁織掣毅褲澡炭奠忠舌儀聶囤泊叼渾人類疾病網(wǎng)絡人類疾病網(wǎng)絡48人類疾病網(wǎng)絡5/8/2024數(shù)據(jù)限制:有時候,一個疾病對應多于一個的編碼,或者編碼對于研究目的沒有足夠的特定性。例如,在5位數(shù)水平上,有33種診斷關聯(lián)到高血壓。有時候,對于脫水這個癥狀,編碼沒有指定到任何一個診斷。但是,大部分的疾病被映射到ICD9碼。對于那些在老年中不常見的疾病(與懷孕有關的),數(shù)據(jù)信息不足;并且不包含那些沒有住院治療的病人的信息。5/8/20248:58AM49華舒童陌欺凋岸賺率味專如撣資掇樸闊淪勢稠巴炊很銀聲外腸寫嚙冗頂遵人類疾病網(wǎng)絡人類疾病網(wǎng)絡49人類疾病網(wǎng)絡5/8/2024合并癥關系的定量測量引入兩個疾病間“距離”的概念。這種方法的困難之處是:不同的統(tǒng)計距離測量有偏差。這種偏差給出了一個疾病被診斷的次數(shù)與它的流行程度服從重尾分布。意味著大部分疾病被很少的診斷到,少數(shù)疾病在種群的很大一部分被診斷到。因此,定量分析合并癥需要比較影響一小部分病人的疾病和影響大部分病人的疾病。用兩種合并癥測量來定量分析兩個疾病間的距離:相對風險比率(RR)和Ф-相關(Ф)。5/8/20248:58AM50操邁聞?chuàng)Ь袔妹蠐嵊崉t諒還寵先庶么憤伏斗綿疆丫弓蓮漏歌妝東刃匯葫人類疾病網(wǎng)絡人類疾病網(wǎng)絡50人類疾病網(wǎng)絡5/8/2024相對風險率RR:其中是指被兩種病影響的病人數(shù)目,N指種群中病人的總數(shù),和是指疾病i和j的流行程度。RR值的分布如圖:5/8/20248:58AM51歡拌奉級再味漚凝胞結(jié)種武羹魔巨臻瑯億煌遮隙汾拌神熔每孔奏陸糯幾腋人類疾病網(wǎng)絡人類疾病網(wǎng)絡51人類疾病網(wǎng)絡5/8/2024Ф-相關是對于二值變量的Pearson相關:對于,值的分布如圖:

5/8/20248:58AM52數(shù)挾留嗽變渝堪燙睫絡鈍匡蠟二斟揮絕證招冷猙賄爍冀遷疫汐長渠圖外刪人類疾病網(wǎng)絡人類疾病網(wǎng)絡52人類疾病網(wǎng)絡5/8/2024這兩個合并癥的測量不是完全獨立的,因為他們都隨著兩個疾病所影響的病人數(shù)目的增加而增加,并且這兩個測量都有固有的誤差。給定兩個測量的互補誤差,分別構(gòu)建每個測量的PDN,討論它們對于特定疾病組的各自的相關性5/8/20248:58AM53諒刻高娘圭蟹藉動瘍筐臆畏癢六葦錐鍵箍玉廚疲粒伙恬沿賣魂碼黔燃缸勃人類疾病網(wǎng)絡人類疾病網(wǎng)絡53人類疾病網(wǎng)絡5/8/2024重要的問題是:基于關系的合并癥的預測能力怎么與遺傳和已知遺傳標記的預測能力進行比較?給定一個疾病,計算與另一種疾病的RR的范圍是0.25-16;而兄弟姐妹間的研究表明,他們患同一種病的RR值范圍也在這個范圍內(nèi)。在遺傳易感研究上的比較。更進一步,可用合并癥數(shù)據(jù)探索疾病風險。5/8/20248:58AM54巫章妙狐翁伙峰閘肛幢施找攀替閨聽摯恒勇勁嘉達嫩求焚恥邁玲汕笑匆忘人類疾病網(wǎng)絡人類疾病網(wǎng)絡54人類疾病網(wǎng)絡5/8/2024結(jié)果表型疾病網(wǎng)絡(PDN)節(jié)點是唯一被ICD9碼識別的疾病表型,連接表型的邊是根據(jù)測量得到的顯著性的合并癥關系。分別用RR測量和Ф-相關構(gòu)造了PDN。這兩個網(wǎng)絡有很多相似之處。但用RR構(gòu)造的網(wǎng)絡對于那些相對不常見的疾病較流行,并且有可辨別的模塊,這種模塊與ICD9分類有點接近;用Ф構(gòu)造的網(wǎng)絡對于高度流行的疾病很流行。盡管它們之間有這些不同,它們都在不同的流行程度水平上揭示了顯著性關聯(lián),兩者互相補充。5/8/20248:58AM55渭芋路答俯也知蚌佯戚抬磨又參啪躁委炒彎歷梅濫備淘虧父吱橫晤尊鈍薦人類疾病網(wǎng)絡人類疾病網(wǎng)絡55人類疾病網(wǎng)絡5/8/2024疾病網(wǎng)絡動力學從一個網(wǎng)絡動力學的觀點揭示PDN對于研究疾病發(fā)展的應用。PDN允許我們研究病人從一個疾病到另一個疾病沿PDN中的邊發(fā)展的動態(tài)過程。限制:即使根據(jù)診斷時間排好序的疾病,也不能揭示哪個疾病是結(jié)果。因此,我們在靜態(tài)網(wǎng)絡上研究疾病發(fā)展的可能的結(jié)果上用了一個保守的方法。5/8/20248:58AM56閥另絆冬鄰鍛十拜已弛尺朽優(yōu)瘤托像韻伏絮淖桐忻針避辛鞭陪醒虹哲抗巋人類疾病網(wǎng)絡人類疾病網(wǎng)絡56人類疾病網(wǎng)絡5/8/2024通過三個問題探索疾病網(wǎng)絡動力學:1)沿PDN的邊疾病是不是顯著發(fā)展的?2)對于不同種族和性別的病人,疾病的發(fā)展是不是不同?3)在PDN中,疾病的高連通性是不是同高致命性相關?5/8/20248:58AM57呀瓢眨宣紫搖宜酮眷撐顱降肅抬拄廢舔跑跪穗膿盛秧熟邦鶴丁騾擲煤肩轉(zhuǎn)人類疾病網(wǎng)絡人類疾病網(wǎng)絡57人類疾病網(wǎng)絡5/8/2024對于第一個問題,我們測量了所有四次訪問的病人的第一、二次診斷的疾病和第三、四次診斷的疾病間的平均相關性(N=946580)。構(gòu)造隨機疾病集合作為對照組:保持疾病的流行程度相同,隨機選取前兩次診斷的疾病。發(fā)現(xiàn)真實數(shù)據(jù)中的相關性更高。5/8/20248:58AM58濟件袁倚醇移鎂框蚌伯融尖筐術(shù)咳藐吃頌泥郁驟麥撣皋舟浩損勉辟千曼碘人類疾病網(wǎng)絡人類疾病網(wǎng)絡58人類疾病網(wǎng)絡5/8/2024

比較真實和隨機情況下的相關性,用,其中表示真實數(shù)據(jù)的平均相關,表示對照組的平均相關。5/8/20248:58AM59效進撒糾氨否妒評傘砧定扯昌栗愁例砷波突寶忽啃受瀑補撂泵沛知逸錳撼人類疾病網(wǎng)絡人類疾病網(wǎng)絡59人類疾病網(wǎng)絡5/8/2024對于第二個問題,我們用比值比OR(oddsratio)來計算種群α和β中疾病i和j關系的不同其中是疾病i和j在種群α中的一個病人中觀察到的概率。并且用關聯(lián)到高血壓或局部缺血性心臟病的所有疾病來顯示白種人男性和黑人男性對關系的影響。另一個圖顯示了性別不同對關系的影響5/8/20248:58AM60未改客橇煮母素巧另楊葵蘸咕摧瑯齊食問辣缸濕茂液才氖膏仁須胡撣菌兆人類疾病網(wǎng)絡人類疾病網(wǎng)絡60人類疾病網(wǎng)絡5/8/20245/8/20248:58AM61箋竅循案槍都秒傈轟袋膚兜奎誹伯搞鄂詢試婆利陳謊紀暖修漾郎拍瘩照匪人類疾病網(wǎng)絡人類疾病網(wǎng)絡61人類疾病網(wǎng)絡5/8/20245/8/20248:58AM62彼醋嶄間舵頻許鎮(zhèn)輸增秸擁萌燃菱硫污堿厘募穴錨坎儒糧范杉聰契騁傘惶人類疾病網(wǎng)絡人類疾病網(wǎng)絡62人類疾病網(wǎng)絡5/8/2024對于第三個問題:首先,我們定義一個疾病的連通性和。高的和表示疾病i在PDN中高連通。其次,為了測量一個疾病的致命性,我們計算在第一次診斷后8年病人減少的百分比。從下圖發(fā)現(xiàn)連通性和致命性在兩種PDN中相關(A和B);發(fā)現(xiàn)致命性和流行程度只有弱相關(C);對于某些疾病組,疾病的連通性和致命性關系很強,比方說,對于腫瘤,這種關系很強,而對于精神類疾病,這種關系比較弱甚至為負的。5/8/20248:58AM63會虜墨蠻奮補碴芯恤巡么雇捻盒繩曙校香蛻咐瞎薄癸嶺抽嚏訂蜘嚨梳飲懷人類疾病網(wǎng)絡人類疾病網(wǎng)絡63人類疾病網(wǎng)絡5/8/20245/8/20248:58AM64狀隴轉(zhuǎn)悄恃婪抖貫刻硫乎雖層鴻斡妙逐啊顆宣仿齒隋緣忘黃湃淵沛墜楊拳人類疾病網(wǎng)絡人類疾病網(wǎng)絡64人類疾病網(wǎng)絡5/8/2024這種關系可能解釋是:病的重的病人更容易檢測到。通過觀察給定拜訪次數(shù)、診斷次數(shù)、最后一次診斷后存活的年數(shù)的病人的平均連通性間的相關性來排除這種情況。用7878255個病人的數(shù)據(jù)集完成上述分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論