




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1.轉錄組2.高通量測序3.轉錄組數據分析4.差異表達基因分析5.趨勢性上調和下調基因分析6.基因集功能富集分析1.1transcriptome轉錄組(transcriptome)是指特定生物體在某種狀態或某一生理條件下,細胞內所有基因轉錄產物的總和,包括信使RNA、核糖體RNA、轉運RNA及非編碼RNA;狹義上指所有mRNA的集合。從RNA層次研究基因表達的情況,即為轉錄組學(transcriptomics),是研究細胞表型和功能的一個重要手段。1.2轉錄組研究的重要性轉錄組是連接基因組遺傳信息與生物功能的蛋白質組的紐帶,轉錄水平的調控是最重要也是目前研究最廣泛的生物體調控方式。轉錄組的研究比基因組的研究能給出更高效的有用信息。與基因組不同,轉錄組更有時間空間性。除了異常的mRNA降解現象(如轉錄衰減)以外,轉錄組反映的是特定條件下活躍表達的基因轉錄組的研究可以提供什么條件下什么基因表達什么信息,從而推斷相應未知基因的功能,揭示特定調節基因的作用機制對轉錄本的定量可以了解特定基因的活性和表達量,用于疾病的診斷和治療通過對轉錄組的研究,也讓個性化醫療的目標,從共性轉移到個性,成為可能1.3轉錄組研究的技術主要包括如下三種:1)基于雜交技術的微陣列技術;2)基于Sanger測序法的SAGE(serialanalysisofgeneexpression)和MPSS(multipleparallelsignaturesequencing);3)基于新一代高通量測序技術的轉錄組測序。幾種轉錄組研究所用技術的比較轉錄組所用技術MicroarraySAGE和MPSSRNA-seq原理寡核苷酸雜交Sanger測序高通量測序信號熒光信號數字化信號數字化信號分辨率數個-上百個單堿基單堿基分辨率高低高背景高低低成本高高相對較低起始RNA用量多多少DNA芯片技術:只適用于檢測已知序列,卻無法捕獲新的mRNA。雜交技術靈敏度有限,對于低豐度的mRNA,微陣列技術難以檢測,也無法捕獲到目的基因mRNA表達水平的微小變化。
SAGE(基因表達系列分析):可以全面了解特定組織或細胞類型中基因群體表達狀態,它的顯著特點是能夠大量獲取基因組范圍基因表達的類別與豐度,該技術成功地應用于特異組織或細胞的轉錄組研究和mRNA群體間差異表達基因鑒定。缺點是需要大量的mRNAMPSS(多重性平行定序):對于功能基因組研究非常有效,能在短時間內捕獲細胞或組織內全部基因的表達特征;對于鑒定致病基因并揭示該基因在疾病中的作用機制等發揮了重要作用。可以偵測到極為罕見的基因表現1.4轉錄組測序(1)RNA聚合酶I和III負責種類稀少、功能重要的看家非編碼RNA基因的轉錄,包括rRNA,tRNA,snoRNA,snRNA等。由這兩類RNA聚合酶轉錄的非編碼RNA屬于看家RNA,在各種生理和病理狀態下都被高水平轉錄,轉錄產物占細胞內RNA總量的95%以上,不是生命科學研究前沿領域的主要關注對象(2)RNA聚合酶II負責蛋白質編碼基因和調控非編碼RNA的轉錄,在真核生物的不同生理和病理狀態下表達量被嚴格調控,一直吸引著各生命科學研究領域的重點關注,無比幸運的是,由RNA聚合酶II生成的轉錄的末端均含有3’端多聚腺苷尾【3’poly(A)tail】。轉錄組測序一般是對用多聚胸腺嘧啶(oligo-dT)進行親和純化的RNA聚合酶II轉錄生成的成熟mRNA和ncRNA進行高通量測序。這樣的數據有效排除了看家非編碼RNA的干擾,可以通過一次測序獲得一種細胞內幾乎所有重要基因的表達參數。轉錄組高通量測序的優勢?高通量、更精確的數字信號、無需已知序列、能夠在單核苷酸水平對任意物種的整體轉錄活動進行檢測,在分析轉錄本的結構和表達水平的同時,還能夠發現未知轉錄本和稀有轉錄本,精確的識別可變剪接位點以及cSNP(編碼序列單核苷酸多態性),提供最全面的轉錄組信息。轉錄組前沿研究簡介單細胞轉錄組分析轉錄組測序確定RNA結構轉錄組測序在疾病中的應用2.高通量測序測序技術的發展高通量測序技術(High-throughputsequencing)又稱“第二代”測序技術(“Next-generation”sequencingtechnology),高通量測序使得對一個物種的轉錄組和基因組進行細致全貌的分析成為可能,所以又被稱為深度測序(deepsequencing)2.1高通量測序優勢?價格比第一代大幅度降低可擴展的高通量需要樣品量少新穎的測序化學技術單個或配對末端支持2.2高通量測序技術的應用重頭測序(denovosequencing)重測序(resequencing)全轉錄組測序(wholetranscriptomeresequencing)小分子RNA測序(smallRNAsequencing)染色質免疫共沉淀測序(ChIP-seq)2.3三種常見的測序平臺IlluminaGenomeAnalyzer
專利核心技術“DNA簇”和“可逆性末端終結”,達成自動化樣本制備及基因組數百萬個堿基大規模平行測序。具有高準確性,高通量,高靈敏度,和低運行成本等突出優勢,可以同時完成傳統基因組學研究(測序和注釋)以及功能基因組學(基因表達及調控,基因功能,蛋白/核酸相互作用)研究。GenomeAnalyzerIIx測序技術原理1)文庫制備:將基因組DNA打成幾百個堿基(或更短)的小片段,并在兩個末端加上接頭(adapter)。2)橋式PCR產生DNA簇a、Solexa測序專用的測序芯片(flowcell)表面連接有一層單鏈引物(Primer),單鏈狀態的
DNA片斷與芯片表面的引物通過堿基互補被一端固定在芯片上;b、通過擴增反應使得單鏈
DNA成為雙鏈
DNA;c、雙鏈再次變性后成為單鏈,其一端固定在測序芯片上,另外一端(5’或
3’)隨機和附近的另外一個引物互補,被固定住,形成“橋“(bridge);d、在測序芯片上同時有上千萬
DNA單分子發生以上的反應;e、c中形成的單鏈橋,以周圍的引物為擴增引物,在測序芯片表面再次進行擴增,形成雙鏈;f、雙鏈經變性成單鏈,再次形成橋,成為下一輪擴增的模板繼續擴增反應;g、在反復進行30多輪擴增,每個單分子得到了1000倍擴增,成為單克隆“DNA簇群”;h、“DNA簇群”在GenomeAnalyzerIIx測序儀上進行序列分析;3)測序反應IlluminaGenomeAnalyzerIIx是一種基于單分子簇的邊合成邊測序技術,基于專有的可逆終止化學反應原理。測序時加入帶有4種熒光標記的dNTP,每個堿基末端被保護基團封閉,每個循環只允許單個堿基合成,經過掃描,讀取該次反應后的熒光信號結果,該保護基團被除去,下一個反應可繼續進行,如此反復,得出堿基的精確序列。illumina測序平臺的特點
1)可控制的高通量:一次實驗可讀取量大于15億個堿基/芯片2)上樣需求低:上樣量只在pmol級(ng級)3)簡單、快速、自動化4)低錯誤測序比例利用新穎的可逆熒光標記終止子,可以在DNA鏈延伸的過程中檢測單個堿基摻入。由于四個可逆終止子dNTP在每個測序循環都存在,自然的競爭減少了摻入的錯配。454/GS-FLX系統的測序技術1)技術原理:GSFLXSystem是一種基于焦磷酸測序原理而建立起來的高通量基因組測序系統。焦磷酸測序的原理如下:(1)1個特異性的測序引物和單鏈DNA模板結合,然后加入酶混合物(包括DNAPolymerase、ATPSulfurylase、Luciferase和Apyrase)和底物混合物(包括APS和Luciferin)。(2)向反應體系中加入1種dNTP,如果它剛好能和DNA模板的下一個堿基配對,則會在DNA聚合酶的作用下,添加到測序引物的3’末端,同時釋放出一個分子的焦磷酸(PPi)。(3)在ATP硫酸化酶的作用下,生成的PPi可以和APS結合形成ATP;在熒光素酶的催化下,生成的ATP又可以和熒光素結合形成氧化熒光素,同時產生可見光。通過CCD光學系統即可獲得一個特異的檢測峰,峰值的高低則和相匹配的堿基數成正比。(4)反應體系中剩余的dNTP和殘留的少量ATP在Apyrase的作用下發生降解。(5)加入另一種dNTP,使第2-4步反應重復進行,根據獲得的峰值圖即可讀取準確的DNA序列信息。2)工作流程:3.GSFLX系統的技術優勢和限制1)讀長優勢:單個序列的讀長平均可達到450個堿基左右;2)操作簡便高效,不需建庫、克隆挑取、質粒提取等工作;3)分析結果快速、信息高通量,10小時的運行當中可獲得100多萬個讀長,讀取超過4-6億個堿基信息;4)應用廣泛且穩定,測序結果一致性較高;5)同聚物的限制,即相同堿基的連續摻入,如AAA或GGG,由于沒有終止元件來阻止單個循環的連續摻入,同聚物的長度就需要從信號強度中推斷出來。此處可能產生誤差。因此,主要錯誤類型是插入-缺失,而不是替換。ABISOLID3systemSOLID平臺技術原理:SOLID是基于寡核苷酸連接和檢測進行測序的技術。它以4色熒光標記寡核苷酸的連續連接反應為基礎,以雙堿基編碼技術為檢測技術,對單拷貝的DNA片段進行大規模擴增和高通量測序。基本過程如下:(1)文庫制備:根據實際情況制備文庫:片段文庫或末端配對文庫(2)乳液PCR(3)磁珠富集技術制備單分子模板:含有DNA模板的磁珠共價結合在SOLiD玻片表面。(4)連接測序:上機測序,邊連接邊測序,獲得SOLiD原始顏色序列。SOLiD系統特點1)高準確度:雙堿基編碼檢測技術在測序過程中對每個堿基判讀兩遍,從而減少原始數據錯誤,提供內在的校對功能。2)高通量:單次運行可產生50GB的序列數據。3)可擴展性4)靈活性5)運行時間較長,測序片段相對較小:單次運行時間長達7天,最短3.5天。最長2*50bp。測序技術的比較IlluminaGenomeAnalyzer3.轉錄組數據分析4.差異表達基因分析統計學分析:1.Foldchange,一般2-foldincreaseordecrease(平行實驗的樣本較少)2.p-value(平行實驗的樣本較多)under-expressedover-expressed
/2
/24.1差異倍數法Foldchange=log2(A/B)Foldchange=log2(A/B)A:sampleA表達值B:sampleB表達值通常以1和-1為作為差異表達的閾值,判斷基因是否差異表達倍數法是比較常用的一種方法,因為比較簡單和直接。但是,這種方法也是有其重大缺陷的。比如,在某個實驗中,基因表達水平的變化不大,如果選擇判別閾值為2倍,則有可能找不到幾個差異表達的基因,假陰性率比較高。但如果是主觀縮小判斷閾值,又有可能增大假陽性率。這一方法沒有考慮到差異表達的統計顯著性。4.2卡方檢驗條件:a.所有單元頻數都不能等于零,b.要求樣本含量應大于40且每個格子中的理論頻數不應小于5。當樣本含量大于40但理論頻數有小于5的情況時卡方值需要校正,當樣本含量小于40時只能用確切概率法計算概率。?2=[(ad-bc)2(a+b+c+d)]/[(a+b)(c+d)(a+c)(b+d)]df=1sampleAsampleBGeneiabSum(genei)cd根據?2求出p值,對于p<=0.05或0.01的,拒絕原假設,存在顯著的統計學意義。統計學家已證明,當自由度比較大時,誤差較小;自由度等于1時,特別n比較小,或理論頻數<5時,誤差較大,使得所得概率值偏小,因此需要校正。4.2.Fisher精確檢驗英國統計學家Fisher提出的2*2表的確切概率計算法,它基于四格表的邊際和固定。當?2檢驗的條件不滿足時,這個檢驗非常有用。在樣本比較小時(單元的頻數小于4),需要用Fisher精確檢驗來做獨立檢驗。Fisher檢驗是建立在超幾何分布的基礎上的,對于單元頻數小的表來說,特別適合。對于2*2列聯表,原假設“兩變量無關”。計算步驟:1.確定統計量,如?2,計算?2記為?02;2.對于每個可能的四格表計算?2和P;3.符合?2>=?02的那些四格表的P值之和,即為確切概率P值sampleAsampleBGeneiai1bi2Sum(genei)Sum(a1)Sum(b2)假設檢驗問題Ⅰ型錯誤(假陽性)即在假設檢驗作推斷結論時,拒絕了實際上正確的檢驗假設,即將無差異表達的基因判斷為差異表達。Ⅱ型錯誤(假陰性)即不拒絕實際上不正確的,即將有差異表達的基因判斷為無差異表達。在進行差異基因挑選時,整個差異基因篩選過程需要做成千上萬次假設檢驗,導致假陽性率的累積增大。對于這種多重假設檢驗帶來的放大的假陽性率,需要進行糾正。常用的糾正策略有Bonferroni效正,控制FDR(FalseDiscoveryRate)值等。FalseDiscoveryRate(FDR)錯誤發現率是評估檢驗統計顯著性的最有力工具。統計學家都想用更符合統計學的手段得到差異基因,具體說來就是想用假設檢驗后賦予每個基因統計顯著性或者P值,使得每個基因的判別更有統計學上的意義。為了達到這個目的,統計學家們常常用控制錯誤發現率
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國脈絡膜新生血管行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國肥料原料行業市場深度調研及發展趨勢與投資前景預測研究報告
- 2025-2030年中國聚脲涂料行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國聚丁烯1行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國耐硫酸鹽的波特蘭水泥行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國網球拍行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國綠色蔬菜行業市場深度調研及發展趨勢與投資戰略研究報告
- 2025-2030年中國絕緣金屬墻板行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國細胞健康檢查行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025-2030年中國糖果繩篩行業市場現狀供需分析及投資評估規劃分析研究報告
- 地七年級下冊全冊知識要點總復習-2024-2025學年七年級地理教學課件(人教版2024)
- 創業大賽活動策劃方案
- 西部計劃考試試題及答案
- 【廣安】2025上半年四川廣安理工學院籌建處第一次招聘非事業編制專任教師15人筆試歷年典型考題及考點剖析附帶答案詳解
- 2025醫院護理面試題庫及答案
- 2025新疆西北興業城投集團有限公司崗位招聘(12人)筆試參考題庫附帶答案詳解
- 餐廳供餐協議書范本
- 期中素養測評卷(試題)2024-2025學年五年級下冊科學教科版
- 供水公司筆試試題及答案
- 2024年寶雞市城投資產管理有限公司招聘真題
- 上海市華師大二附中2025屆高三第三次測評英語試卷含解析
評論
0/150
提交評論