基因芯片分析的理論與方法ppt課件_第1頁
基因芯片分析的理論與方法ppt課件_第2頁
基因芯片分析的理論與方法ppt課件_第3頁
基因芯片分析的理論與方法ppt課件_第4頁
基因芯片分析的理論與方法ppt課件_第5頁
已閱讀5頁,還剩67頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基因芯片分析的實際與方法ericexist163. com:7049971基因芯片概論基因芯片分析的概念n基因芯片(Gene chip)技術是指經過微陣列(Microarray)技術將高密度DNA片段陣列經過高速機器人或原位合成方式以一定的順序或陳列方式使其附著在如玻璃片等固相外表,以熒光標志的DNA探針,借助堿基互補雜交原理,進展大量的基因表達及監測等方面研討的技術。基因芯片分析的優點n快速n高通量(104 - 106)n自動化n運用的試劑少n低本錢基因芯片分析的運用范圍nAcademic research of genetic diseasesnCancernPrenatal geneti

2、cs產前遺傳學研討nGeneral genetic diseasesnInfectious diseasesnDrug discoverynAnimal farming/veterinary nIndustrial (fermentation)nEnvironmental開展的方向:從多角度研討提示生命景象nStages: developmental,transformation, time fter treatment, etc.nTreatments (stimuli, drugs, nutrients, etc.) nPhysiological states (stressed, fas

3、ting, etc.)nTissue distributionn(position, 3D)基因芯片的開展是推進系統生物學開展的動力利用基因芯片研討生命景象的測略nFactors involved = ComponentsnOrder of events = PathwaysnInteractions = Circuit KEGGGO基因芯片的分類E xp ressio n C h ip sG en o m ic C h ip sS eq u en cin g C h ip sD N A C h ip s基因芯片的分類nOligonucleotide arrayn Synthesized on

4、 a chip Affymetrixn Spot on a solid matrix CompugenncDNA array Incyte 一些開展中的基因芯片技術平臺n利用生物分子的電物理特性進展基因表達監測:監測速度很快,適用于基因表大,蛋白質組及基因型的研討n利用電場原理進展高密度芯片消費:基于適宜用于生物學的集成電路,集成電路包含可以獨立尋址的微電極陣列,結合特殊的液體流動系統,可以使大部分生物分子按照來自于計算機的數字指令運動。n噴墨點樣技術:以高度定位的方式把合成好的寡核苷酸分子噴點倒玻璃外表。n寡核苷酸包被的微珠芯片n平行信號測序技術:對基因表達進展定量分析基因芯片分析實驗方法基

5、因芯片分析的主要步驟cDNA基因芯片分析的主要步驟cDNA芯片分析的主要步驟nSpot by Array spottercDNA芯片分析的主要步驟Hybridizing by Automatic hybridization processorcDNA芯片分析的主要步驟nLaser scannerOligonucleotide array GeneChip總總RNA的制備的制備反轉錄反轉錄體外體外轉錄轉錄生物素標志的生物素標志的cRNAcRNA片段化處置片段化處置帶標志的帶標志的cRNA片斷片斷35-200 bases0.5-2 ug/ul起始用量起始用量5-10ug5-10ugIVT操作流程以

6、真核生物為例操作流程以真核生物為例標志的標志的cRNA片斷片斷雜交混合液的制備雜交混合液的制備EukaryoticHyb.ControlControlOligo B2 雜交雜交16hour 數據分析數據分析 掃掃 描描 洗脫洗脫染色染色Oligonucleotide array 的特點1 個平方厘米的面積至少可陳個平方厘米的面積至少可陳列四十多萬個探針合成區列四十多萬個探針合成區“點點基因基因2 2基因基因1cDNA1cDNA基因基因2cDNA2cDNA用于用于cDNAcDNA芯片的探針芯片的探針Oligo probeOligo probe基因基因1 1多個檢測結果可以參考多個檢測結果可以參考

7、Oligonucleotide array 的優越性 序列準確性高 原位合成 PCR擴增,點樣 起始Total RNA 110ug 50ug 均一的退火溫度 25mer 300bp3Kb 特異性更高 多段探針 單個探針 非特異性雜交 2 30cDNA 芯片芯片Affy 芯片芯片優優 勢勢芯片分析數據的規范化nQuantitation ndata-quality assessmentsn背景處置:圖像上各點的吸光度值包含了樣品和背景信號,在提取數據前必需將背景扣除n雜交點質量:由于點樣或膜變形等緣由目前較多的軟件對雜交點的識別定位仍需求人為的調整n數據的規范化:其目的是防止基因芯片實驗中因系統差

8、別呵斥芯片間數據比較的困難。最常用的是“看家基因法,它預先選擇一組表達程度不變的看家基因,計算出這組基因平均ratio 值為1 時的規范化系數,然后將其運用于全部的數據以到達規范化的目的Scatter plots for a Cy5-liver/Cy3-liver control hubridization A Cy5-ovarian tumor/Cy3-normal ovary hubridization The value of Cy3 and Cy5 hydridization signals from each clone were plotted directly onto the

9、plot 卵巢癌Data Analysis - Reveal the Difference基因芯片數據分析和信息發掘方法一. 聚類分析聚類分析n聚類分析是方式識別中一種非常有吸引力聚類分析是方式識別中一種非常有吸引力的方法,特別適用于方式分類數不知道的的方法,特別適用于方式分類數不知道的情況。情況。n從機器學習的角度來看,有兩種根本的聚從機器學習的角度來看,有兩種根本的聚類分析:類分析:n有教師聚類有教師聚類n無教師聚類無教師聚類n基因表達數據聚類分析普通包括以下幾個基因表達數據聚類分析普通包括以下幾個步驟:步驟:n確定基因表達的數據確定基因表達的數據n計算類似性矩陣,各個矩陣元素代計算類似性

10、矩陣,各個矩陣元素代表兩個基因的表達能否類似表兩個基因的表達能否類似n選擇算法進展聚類分析選擇算法進展聚類分析n顯示分析結果。顯示分析結果。n對數據進展聚類分析之前,必需將包含在基因表對數據進展聚類分析之前,必需將包含在基因表達矩陣中的數據進展類似程度分析,并且對分析達矩陣中的數據進展類似程度分析,并且對分析結果進展量化。結果進展量化。 n通常情況下,類似往往被賦于一個較大的量化的通常情況下,類似往往被賦于一個較大的量化的值,而不類似那么由一個較小的量化的值來表示。值,而不類似那么由一個較小的量化的值來表示。n在實踐計算中,往往以間隔替代類似的概念,類在實踐計算中,往往以間隔替代類似的概念,類

11、似性度量被轉化為兩個基因表達方式之間的間隔。似性度量被轉化為兩個基因表達方式之間的間隔。間隔越小,表達方式越相近,反之,那么表達方間隔越小,表達方式越相近,反之,那么表達方式差別大。式差別大。兩個表達方式之間的關系(a) 類似(b) 變化趨勢一致(c) 兩個基因的調控結果不一樣或甚至相反聚類分析的目的n可誘導基因是共表達的 n許多構成性表達的基因不受調理n根據表達類似形陳列基因n功能類似的基因被聚為不同的類n可以提示細胞的生理形狀n可以協助研討未知基因的功能聚類結果顯示聚類結果顯示: Cluster, Cluster viewer二二. 基因調控網絡分析基因調控網絡分析2.1 基 本 理 論定

12、義n一個基因網絡一個基因網絡(pathway)由一組生物分子如基由一組生物分子如基因、蛋白質以及它們之間的相互作用構成,這因、蛋白質以及它們之間的相互作用構成,這些生物分子共同完成一些特定的細胞功能義務些生物分子共同完成一些特定的細胞功能義務n在實踐分析過程中,往往以圖這種數據構造表示在實踐分析過程中,往往以圖這種數據構造表示基因網絡,圖中的節點代表基因或者蛋白質,而基因網絡,圖中的節點代表基因或者蛋白質,而節點之間的連線代表基因、蛋白質之間的相互作節點之間的連線代表基因、蛋白質之間的相互作用?;蚓W絡描畫了特定細胞或組織中的功能途用?;蚓W絡描畫了特定細胞或組織中的功能途徑,如代謝、基因調控

13、,信號傳導等。徑,如代謝、基因調控,信號傳導等。原理n基因表達實踐上是細胞、組織、器官受遺傳和環基因表達實踐上是細胞、組織、器官受遺傳和環境影響的結果。境影響的結果。n一個基因的轉錄和表達由細胞的生化形狀所決議,一個基因的轉錄和表達由細胞的生化形狀所決議,在一個基因的轉錄過程中,一組轉錄因子作用于在一個基因的轉錄過程中,一組轉錄因子作用于該基因的啟動子區域,控制該基因轉錄,而這些該基因的啟動子區域,控制該基因轉錄,而這些轉錄因子本身又是其它基因的產物。轉錄因子本身又是其它基因的產物。n當一個基因經過轉錄、翻譯形勝利能基因產物后,當一個基因經過轉錄、翻譯形勝利能基因產物后,它將改動細胞的生化形狀

14、,從而直接或間接地影它將改動細胞的生化形狀,從而直接或間接地影響其它基因的表達,甚至影響本身的表達。多個響其它基因的表達,甚至影響本身的表達。多個基因的表達不斷變化,使得細胞的生化形狀不斷基因的表達不斷變化,使得細胞的生化形狀不斷地變化。地變化。n一個基因的表達受其它基因的影響,而這一個基因的表達受其它基因的影響,而這個基因又會影響其它基因的表達,這種相個基因又會影響其它基因的表達,這種相互影響、相互制約關系構成了復雜的基因互影響、相互制約關系構成了復雜的基因表達調控網絡。表達調控網絡。 n基因表達數據之中隱含基因之間的相互作基因表達數據之中隱含基因之間的相互作用關系,因此可以經過分析基因表達

15、數據,用關系,因此可以經過分析基因表達數據,構建基因調控網絡構建基因調控網絡運用nBetter understand the physiology of the organismnPredict the effect of a drug Predict the weaknesses or side effects of a drugnPredict good or bad drug combinationsnUnderstand disease processesnGene function assignmentnMake a “perfect simulation of cellularnf

16、unction to use as an experimental modelnMany tools “feed into this understanding including microarrays2.2 pathway 數據庫引見Pathway 數據庫nGOnKEGGnGENMAPPnBIACARTAnGeneNetn細胞因子網絡數據庫n自在基信號數據庫關于GOnGO(gene ontology)是基因本體論結合會(Gene Ontology Consortium)所建立的數據庫,旨在建立一個適用于各種物種的,對基因和蛋白功能進展限定和描畫的,并隨著研討的不斷深化而更新的言語詞匯規范。

17、GO是多種生物學本體論言語中的一種,提供了三層構造的系統定義方式,用于描畫基因產物的功能。nGO可以被用來在小鼠基因組中查詢和信號轉導相關的基因產物nGO開展了具有三級構造的規范言語ontologies。根據基因產物的相關分子功能,生物學途徑,細胞學組件而給予定義,無物種相關性。關于KEGGnKEGG (Kyoto Encyclopedia of Genes and Genomes) 京都大學基因和基因組百科全書數據庫京都大學基因和基因組百科全書數據庫nKEGG 是系統分析基因功能的數據庫,將基因組的信息是系統分析基因功能的數據庫,將基因組的信息與基因功能聯絡起來,旨在提示生命景象的遺傳與化學

18、藍與基因功能聯絡起來,旨在提示生命景象的遺傳與化學藍圖圖數據庫KEGG PATHWAY DatabaseKEGG GENES DatabaseKEGG LIGAND Database用途搜索pathway, 產生能夠的反響途徑搜索類似的基因序列搜索類似的基因組序列搜索類似的復合物構造,類似的多糖構造及類似的反響類別通路信息基因組信息化學信息KEGG中的通路分為五大類:1 新陳代謝通路2 遺傳信息處置通路3 環境信息處置通路4 細胞內通路5 人類病癥相關通路PATHWAY提供所選定通路的參考資料、涉及的反響和在其他生物中的通路情況。由GIF等平板文件類型圖示,方框顯示為涉及的酶EC稱號,圓滑框為

19、反響類型,以實線和箭頭銜接反響物和方向,虛線指向預測的反響類型。關于GenMappnGemapp (GenMAPP.org) nGenMAPP 是一個以學術研討為根底的科學團體,提供100個以上的通路圖. Silicon Genetics公司曾經和 GenMAPP組織達成了協議 ,把這些通路整合到了 GeneSpring的通路庫. 利用 GeneSpring分析的基因芯片數據可以用 GenMAPP的通路可視化,使研討者研討某些基因在通路中的作用.關于BioCartanBioCarta:“Carta中文意思是地圖,BioCarta 即用圖形來描畫生物相關知識,構成生物學家所熟習的生化調控通路(b

20、iochemical pathways)。nBioCarta 公司為客戶免費提供通路繪制軟件,讓他們根據本人的研討領域發表通路,建成數據庫,通路中的蛋白都是按照HUGO的規范建立的.nBioCarta已搜集各物種共大約120,000基因及個調控通路,數據庫載不斷添加,其信號傳導通路(signal transduction pathways)是當前最全的.GeneNetn真核生物生理過程的調控網絡(GeneNet)nGeneNet展現了協調方式下基因的整體功能,良好的調控功能和對外界刺激的反響。該基因網具有以下根本功能:n(a) 描畫執行特定生物功能時所涉及到的整體基因交互作用n(b) 描畫基因

21、的蛋白質編碼n(c) 描畫基因對外界刺激的傳感途徑n(d) 經過一組反響自動地穩定網絡參數或者使網絡轉換到新的功能形狀n(e) 利用外部信號、激素和代謝產物作為生理學參數激發基因網糾正其作用n該基因網描畫了四類實體:n (a) 細胞(組織,器官)n (b) 蛋白質n (c) 基因n (d) 物質n該基因網還描畫了實體間兩種關系:n(a) 反響reaction, 即經過交互作用產生新的實體或過程n(b) 調控regulatory事件, 特定反響對實體的作用。 2.3 功能富集分析功能富集分析定義n功能富集分析(Functional Enrichment Analysis)又稱功能聚類分析,借助于

22、各種生物學信息數據庫如GO , KEGG, GENMAPP, BIACARTA, TRANSFAC, OMIM和分析工具如MAPPFinder, ArrayXPath進展統計分析,發掘同差別表達或共表達這組感興趣基因具有顯 著差別的功能類別。n功能富集分析的統計原理是用超幾何分布型來檢驗一組基 因共表達或差別表達中某個功能類的顯著性,并結合 多重假設檢驗判別思想選擇同這組基因顯著相關功能類別MAPPFindernMAPPFinder is a tool that creates a global gene-expression profile across all areas of biolo

23、gy by integrating the annotations of the Gene Ontology (GO) Project with the free software package nGenMAPP GenMAPP.org. 可以整合GO定義,產生整體的基因表達譜. 輸出可以搜索的閱讀器,協助用戶快速識別代表性的差別表達基因在GO的定義。任務方式Z值得計算GOminernGominer:最初Version在算法上雖亞于GenMAPP, 在再建立可視關系上(tree-like structure 和directed acyclic graph)有其獨特之處.n今年對Origina

24、l Version進展較大改良,不僅可以富集significant GO categories, 還可以同時對多套芯片實驗數據批量分析,控制假發現率FDR, 還整合轉錄因子結合位點信息.綜合而言, 尤其適宜TIME-COURSE功能富集分析n需求建立當地Mysql數據庫,建立JDB數據源 Pathway ExplorernPathwayExplorer:provides comprehensive and easily accessible representations of expression profiles onto major regulatory, metabolic and c

25、ellular pathways. The integrated pathway resources include KEGG, BioCarta and GenMAPP.nLocusLink was again used as root identifier. The LocusLinks are linked with the user-defined gene identifier groups (UniGene, GeneOntology, GenBank and/or RefSeq), which are used then to align the mapped gene IDs.

26、nhttpspathwayexplorer.genome.tugraz.atArrayXPathna web-based service for mapping and visualizing microarray gene-expression data for integrated biological pathway resources nWhen one inputs gene-expression clusters, ArrayXPath produces a list of the best matching pathways for each cluster napplied Fishers exact

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論