基因芯片chapter8.ppt_第1頁
基因芯片chapter8.ppt_第2頁
基因芯片chapter8.ppt_第3頁
基因芯片chapter8.ppt_第4頁
基因芯片chapter8.ppt_第5頁
已閱讀5頁,還剩51頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生物信息學在基因芯片中的應用,第一節 概述,. 基因芯片簡介,生物信息學和基因芯片是生命科學研究領域中的兩種新方法和新技術,生物信息學與基因芯片密切相關,生物信息學促進了基因芯片的研究與應用,而基因芯片則豐富了生物信息學的研究內容,()基因芯片的基本原理及生物信息學的作用,基因芯片(gene chip),又稱DNA微陣列(microarray),是由大量DNA或寡核苷酸探針密集排列所形成的探針陣列,其工作的基本原理是通過雜交檢測信息。 基因芯片把大量已知序列探針集成在同一個基片上,經過標記的若干靶核酸序列通過與芯片特定位置上的探針雜交,便可根據堿基互補匹配的原理確定靶基因的序列。,根據探針的類

2、型和長度,基因芯片可分為兩類。 其中一類是較長的DNA探針(100mer)芯片 這類芯片的探針往往是PCR的產物,通過點樣方法將探針固定在芯片上,主要用于RNA的表達分析。 另一類是短的寡核苷酸探針芯片 其探針長度為25 mer左右,一般通過在片(原位)合成方法得到,這類芯片既可用于RNA的表達監控,也可以用于核酸序列分析。,原理 - 通過雜交檢測信息,一組寡核苷酸探針,TATGCAATCTAG,CGTTAGAT,ACGTTAGA,ATACGTTAGATC,TACGTTAG,由雜交位置確定的一組,核酸探針序列,GTTAGATC,雜交探針組,TATGCAATCTAG,重組的互補序列,靶序列,TA

3、CGTTAG,ACGTTAGA,ATACGTTA,CGTTAGAT,GTTAGATC,ATACGTTA,基因芯片,熒光標記的樣品,共聚焦顯微鏡,獲取熒光圖象,雜交結果分析,探 針 設 計,雜交,()基因芯片制備,基因芯片的制備主要有兩種基本方法: 一是在片合成法, 在片合成法是基于組合化學的合成原理,它通過一組定位模板來決定基片表面上不同化學單體的偶聯位點和次序。在片合成法制備DNA芯片的關鍵是高空間分辨率的模板定位技術和固相合成化學技術的精巧結合。 另一種方法是點樣法。 基因芯片點樣法首先按常規方法制備cDNA(或寡核苷酸)探針庫,然后通過特殊的針頭和微噴頭, 分別把不同的探針溶液,逐點分配

4、在玻璃、尼龍或者其它固相基底表面上不同位點,并通過物理和化學的結合使探針被固定于芯片的相應位點。,()靶基因樣品的制備及芯片雜交,根據基因芯片的檢測目的不同,可以把樣品制備方法分為 用于表達譜測量的mRNA樣品制備 用于多態性(或突變)研究的基因樣品的制備,()雜交信號檢測,對于用熒光素標記經擴增(也可用其他放大技術)的序列或樣品,與芯片上的探針進行雜交,然后沖洗,采集熒光圖像。 圖像的采集用落射熒光顯微鏡 或電荷偶聯裝置照相機 非共聚焦激光掃描儀等進行。,. 基因芯片對于生物分子信息檢測的作用和意義,在生命科學領域中,基因芯片為分子生物學、生物醫學等研究提供了強有力的手段。 利用基因芯片技術

5、,可研究生命體系中不同部位、不同生長發育階段的基因表達,比較不同個體或物種之間的基因表達,比較正常和疾病狀態下基因及其表達的差異。 基因芯片技術也有助于研究不同層次的多基因協同作用的生命過程,發現新的基因功能,研究生物體在進化、發育、遺傳過程中的規律。,. 基因芯片研究和應用中所涉及到的生物信息學問題,提取什么信息 如何提取信息 如何處理和利用信息,確定芯片檢測目標 芯片設計 數據管理與分析,探針設計 解決雜交條件一致性問題,芯片優化 提高芯片制備效率,公共 數據庫,專用 數據庫,確定目標 選擇待檢測的目標序列,數據分析 分析雜交檢測結果及可靠性,基因芯片 數據庫,圖像處理,數 據 庫 查 詢

6、 序 列 分 析,生 物 信 息 學 數 據 挖 掘 數 據 可 視 化,雜交檢測圖像,基因芯片數據流圖,()生物信息學在基因芯片中的應用,生物信息學在基因芯片中的應用主要體現在三個方面: 確定芯片檢測目標 芯片設計 實驗數據管理與分析,()基因芯片研究與應用中 所要解決的信息學問題,在基因芯片信息學方面要解決以下幾個關鍵的問題: 第一是芯片設計問題 第二是可靠性分析問題 第三是數據挖掘問題,第二節 基因芯片設計,. 基因芯片設計的一般性原則 基因芯片設計主要包括兩個方面: (1)探針的設計 指如何選擇芯片上的探針 (2)探針在芯片上的布局 指如何將探針排布在芯片上。,確定芯片所要檢測的目標對

7、象 查詢生物分子數據庫 取得相應的DNA序列數據 序列對比分析 找出特征序列,作為芯片設計的參照序列。 數據庫搜索 得到關于序列突變的信息及其它信息。,在進行探針設計和布局時必須考慮以下幾個方面: (1)互補性 (2)敏感性和特異性 (3)容錯性 (4)可靠性 (5)可控性 (6)可讀性,. DNA變異檢測型芯片與基因表達型芯片的設計,對于DNA序列變異分析,最基本的要求是能夠檢測出發生變異的位置,進一步的要求是能夠發現發生了什么樣的變化。 從雜交的單堿基錯配辨別能力來看,當錯配出現在探針中心時,辨別能力強,而當錯配出現在探針兩端時,辨別能力非常弱。所以,在設計檢測DNA序列變異的探針時,檢測

8、變化點應該對應于探針的中心,以得到最大的分辨率。,. cDNA芯片與寡核苷酸芯片的設計,cDNA芯片設計的關鍵在于數據庫的建立和數據庫信息的利用以及各種文庫的建立。 cDNA芯片制備方法一般采用點樣法,多用于基因表達的監控和分析。 寡核苷酸芯片制備一般采用在片合成方法。優化是寡核苷酸芯片設計的一個重要環節,包括探針的優化和整個芯片設計結果的優化。,. 寡核苷酸探針的優化設計,. 基因芯片布局,雜 交 模 式,探 針 布 局 圖,Target T C C G T T A G C T G A C T G C,AGCT,TG變異,. 基因芯片布局,基于Tm值梯度場的布局方法,凸點均勻分布布局方法,(

9、a) (b) 凸點均勻分布優化結果示意 (a)優化前; (b)優化后。,. 基因芯片優化,高密度寡核苷酸芯片設計的結果是形成芯片合成方案和步驟,產生制作掩膜板的CAD文件。高密度基因芯片制備的一個關鍵是掩膜板技術,利用掩膜板進行定位并控制探針的在片合成,從而得到很高的探針密度。 但是制作掩膜板的代價較高,為了盡可能地提高基因芯片制備效率,需要對設計好的基因芯片進行優化,以減少制備芯片所需要的掩膜板個數,同時也減少芯片探針循環合成次數,這對于基因芯片應用有著重要的意義。,第三節 基于芯片的序列分析,. 測定未知序列 早期基于芯片雜交的序列分析實驗中,芯片上的探針是長度為k(一般為8)的所有寡核苷

10、酸的組合。這是一種完備的探針集合,根據互補關系,通過各個探針的雜交結果確定DNA靶序列中存在的所有k長度片段,形成靶序列的k長度片段譜,然后根據這些片段重構靶序列。,. 直接檢測目標序列,在同一塊芯片上設計多組探針,每一組探針分別檢測一條目標序列,探針的長度在20到30之間。一般要求同一組探針之間相互獨立,盡可能不重疊或少重疊,以提高探針的敏感性和特異性。,. DNA序列突變檢測分析,有兩種方法可以進行已知突變點的分析: 一種方法是對于目標序列上已知的突變點,以該點為中心,從目標序列選取一個片段,作為設計探針的參考序列。根據參考序列,分別設計四個高度特異的探針,這四個探針除中心位置外均相同并與

11、參考序列互補 另一種方法是對于目標序列上已知的突變點,分別設計四組探針,其中每一組探針分別檢測一種核苷酸替換。同一組中的各個探針長度相同,相互之間交疊,并且每個探針均覆蓋對應的突變點。,. 基因型和多態性分析,在同一物種不同種群和個體之間,有著多種不同的基因型,這往往與個體的不同性狀和多種遺傳性疾病有著密切的關系。通過對大量具有不同性狀的個體的基因型進行比較,就可以得出基因與性狀的關系。,為了進行SNPs研究,發現目標序列上可能出現的變化,最直接的方法就是根據已知的目標序列設計一系列寡核苷酸探針,其中每一個探針用于檢測目標序列特定位置上的核苷酸是否發生變化,探察位置位于探針的中心。這種方法又稱

12、等長等覆蓋移位法,第二種方法為單核苷酸分析法。針對目標序列每個位置上所有可能出現的變化設計相應的探針。,第四節 基于芯片的基因功能分析,. 基因表達分析 基因表達是根據基因的DNA模板進行mRNA和蛋白質合成的過程,各種基因的表達存在差異,一種組織中基因表達水平的差異可達1萬倍。功能基因研究的一種重要的方法就是采用高通量基因表達檢測技術,全面分析基因的表達水平,了解基因的功能。,. 高密度基因表達芯片,. 基因表達圖譜,基于芯片的表達監控實驗產生大量的數據,在這些數據背后隱藏著豐富的基因相互作用、基因功能信息,需要通過細致的數據分析揭示這些信息,得到有益的結果 這種根據基因芯片獲得的新的表達圖

13、譜有別于以前的物理圖和功能圖,它能夠更為直接地揭示基因組中各基因相互關系。,. 尋找基因功能,DeRisi等應用酵母cDNA基因芯片研究在有絲分裂和孢子狀態下基因轉錄和表達水平的差異。 Affymetrix公司制備的酵母基因表達型芯片,包括酵母基因組開放讀碼框中的260 000個25mer探針陣列。Wodicka 等采用這種基因芯片對不同生活狀態下酵母細胞的基因表達進行了研究。,第五節 基因芯片檢測結果的分析,. 熒光檢測圖像處理 基因芯片與樣本雜交以后,用圖像掃描儀器捕獲芯片上的熒光圖像。在計算機中,一幅圖像由二維象素點所組成,通常用一個8-bit的整數存貯象素點的灰度值,取值范圍為0,25

14、5,其中0代表“黑”,255代表“白”。,一個理想的基因芯片圖像具有以下幾個性質: (1)芯片單元的形狀和尺寸相同; (2)每個單元的中心位于象素點上; (3)無灰塵等引起的噪聲信號; (4)最小和均勻的圖像背景強度。,網格定位結果,背景濾除,熒光信號提取,. 檢測結果分析,如果芯片檢測的目的是測定樣本序列,則需要根據芯片上每個探針的雜交結果判斷樣本中是否含有對應的互補序列片段,并利用生物信息學中的片段組裝算法連接各個片段,形成更長的目標序列。,如果芯片檢測的目的是進行序列變異分析,則要根據全匹配探針以及錯配探針在基因芯片對應位置上的熒光信號強度,給出序列變化的位點,并指明發生什么變化。,如果

15、芯片檢測的目的是進行基因表達分析,則需要給出芯片上各個基因的表達圖譜,定量描述基因的表達水平,進一步的分析還包括根據基因表達模式進行聚類,尋找基因之間的相關性,發現協同工作的基因,. 檢測結果可靠性分析,可靠性分析可以從兩個方面進行: 一是根據實驗統計誤差(如探針合成的錯誤率、全匹配探針與錯配探針的誤識率等),計算出基因芯片最終實驗結果的可靠性。 二是對基因芯片與樣本序列雜交過程進行分子動力學研究,建立芯片雜交過程的計算機仿真實驗模型,以便在制作芯片之前分析所設計芯片的性能,預測芯片實驗結果的可靠性。,. 數據分析,基因芯片數據分析包括實驗數據管理、數據質量控制、數據處理等 進一步將基因芯片實

16、驗數據與公共數據庫中的信息相關聯,利用數據挖掘方法進行分析處理,揭示各種數據之間的關系,發現新的生物學知識。,第六節 基因芯片信息的管理和利用,. 芯片信息管理 目前已出現一些芯片信息管理數據庫,這些數據庫主要收集、管理表達型基因芯片的實驗數據。與基因芯片相關的信息包括芯片功能的描述、芯片的描述、實驗對象的描述、實驗結果和分析結果的描述。,以基因表達型芯片為例,數據庫至少含有下列信息: (1)數據來源 (2)雜交目標序列 (3)目標對象 (4)mRNA轉錄的數量 (5)統計的顯著性,.數據集成和交叉索引,基因組信息是相互關聯的,合理地解釋實驗檢測數據依賴于將實驗數據與其它相關數據庫的集成。 對于基因表達數據,通過用戶定義的或缺省的標準進行數據鏈接,經分析可以得到關于基因調控的概貌。,常用的表達譜分析軟件General Microarray Analysis Software,ArrayTools DChip(DNA-Chip Analyzer) SAM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論