




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精選Small RNA:生物體內一類高度保守的重要的功能分子,其大小在18-30nt,包括microRNA、siRNA、snRNA、snoRNA和piRNA(piwi-interacting RNA)等,它的主要功能是誘導基因緘默,調控細胞生長、發育、基因轉錄和翻譯等生物學過程。以miRNA為例介紹它們的功能:miRNA與RNA誘導緘默復合體(RNA induced silencing complex, RISC)結合,并將此復合體與其互補的mRNA序列結合,依據靶序列與miRNA的互補程度,從而導致靶序列降解或干擾靶序列蛋白質的翻譯過程。SD 區域:Segment duplication,串
2、聯重復是由序列相近的一些 DNA 片段串聯組成。串聯重復在人類基因多樣性的靈長類基因中發揮重要作用。Genotype and phenotype:基因型與表型,基因型是指某一生物個體全部基因組合的總稱;表型,又稱性狀,是基因型和環境共同作用的結果。基因組:Genome,單倍體細胞核、細胞器(線粒體、葉綠體)或病毒粒子所含的全部DNA分子或RNA分子。全基因組de novo測序:又稱從頭測序,它不依靠于任何現有的序列資料,而直接對某個物種的基因組進行測序,然后利用生物信息學分析手段對序列進行拼接、組裝,從而獲得該物種的基因組序列圖譜。全基因組重測序:對已有參考序列(Reference Seque
3、nce)物種的不同個體進行基因組測序,并以此為基礎進行個體或群體水平的遺傳差異性分析。全基因組重測序能夠發覺大量的單核苷酸多態性位點(SNP)、拷貝數變異(Copy Number Variation,CNV)、插入缺失(InDel,Insertion/Deletion)、結構變異(Structure Variation,SV)等變異類型,以精確快速的方法將單個參考基因組信息上升為群體遺傳特征。轉錄組:Transcriptome,是指特定生長階段某組織或細胞內全部轉錄產物的集合;狹義上指全部mRNA的集合。轉錄組測序:對某組織在某一功能狀態下所能轉錄出來的全部RNA進行測序,獲得特定狀態下的該物
4、種的幾乎全部轉錄本序列信息。通常轉錄組測序是指對mRNA進行測序獲得相關序列的過程。其依據所爭辯物種是否有參考基因組序列分為轉錄組de novo測序(無參考基因組序列)和轉錄組重測序(有參考基因組序列)。外顯子組測序:是指利用序列捕獲技術將全基因組外顯子區域DNA捕獲并富集后進行高通量測序的基因組分析方法。外顯子測序相對于基因組重測序成本較低,對爭辯已知基因的SNP、InDel 等具有較大的優勢。目標區域測序:應用相關試劑盒對基因組上感愛好的目標區域進行捕獲富集后進行大規模測序,一般需要依據目標區域特地定制捕獲芯片。宏基因組:Metagenome,指特定生活環境中全部微小生物遺傳物質的總和。它
5、包含了可培育的和未可培育的微生物的基因。目前主要指環境樣品中的細菌和真菌的基因組總和。宏基因組16S rRNA測序:可以對特定環境下的細菌和古細菌群體的微生物種類和豐度進行有效的鑒定。對不同地點、不同條件下的多個樣本16S rRNA的PCR產物平行測序,可以比較不同樣本間的微生物組成及成分差異,進而闡明物種豐度、種群結果等生態學信息。表觀遺傳學:Epigenetics,是指在基因組DNA序列沒有轉變的狀況下,基因的表達調控和性狀發生了可遺傳的變化。表觀遺傳的現象很多,已知的有DNA甲基化(DNA methylation),基因組印記(genomic impriting),母體效應(matern
6、al effects),基因緘默(gene silencing),核仁顯性,休眠轉座子激活和RNA編輯(RNA editing)等。全基因組甲基化測序:DNA 甲基化是指在 DNA 甲基化轉移酶的作用下,在基因組 CpG 二核苷酸的胞嘧啶5'碳位共價鍵結合一個甲基基團。DNA 甲基化已經成為表觀遺傳學和表觀基因組學的重要爭辯內容。甲基化是基因表達的主要調控方式之一,爭辯染色體DNA甲基化狀況是了解基因調控的重要手段。對已經有參考基因組的物種的基因組DNA用標準亞硫酸氫鹽(Bisulfite)處理后,未甲基化的胞嘧啶C會脫氨基形成尿嘧啶U,經PCR擴增,U替換為胸腺嘧啶T,而發生甲基化的
7、胞嘧啶C保持不變。將處理組與參考基因組序列進行比對,可發覺甲基化位點并對甲基化狀況進行定量分析的方法叫做全基因組甲基化測序。ChIp-Seq:Chromatin Immunoprecipitation sequencing,即染色質免疫共沉淀-測序技術,即通過染色質免疫共沉淀技術特異性地富集目的蛋白結合的DNA片段。對富集得到的DNA片段進行純化與文庫構建,然后進行高通量測序,從而得到全基因組范圍內可以與目的蛋白相互作用的DNA片段的方法叫做ChIP-Seq。數字表達譜:Digital Gene Expression Profile,利用新一代高通量測序技術和高性能計算分析技術,能夠全面、經濟
8、、快速地檢測某一物種特定組織在特定狀態下的基因表達狀況,即運用特定的酶對mRNA距polyA tail 21-25nt的位置進行酶切,所獲得的帶polyA尾的序列(Tag)通過高通量測序,該tag被測得的次數即是對應基因的表達值。數字基因表達譜已被廣泛應用于基礎科學爭辯、醫學爭辯和藥物研發等領域。特點是經濟,但獲得的數據量有限。若想獲得轉錄本的更多信息的話,一般都接受轉錄組測序的方法來測序。SBS:sequencing by synthesis,邊合成邊測序反應,是指在DNA聚合酶的作用下延長堿基所進行的測序。Run:指高通量測序平臺單次上機測序反應。Lane:也叫channel,單泳道,每條
9、泳道包含2列(column),每列分布有多個小區(tile)。不同的測序平臺Flow Cell中所含的Lane不一樣,如HiSeq 2000是2個flow cell,每個flow cell中含有8個lane;HiSeq 2500是包含2個mini flow cell(快速運行模式)和2個high output flow cell,兩個模式不能同時運行,其中每個mini flow cell包含2個lane,每個high output flow cell中包含8個lane;Miseq系統的flow cell僅含有1個lane。Tile:小區,每條Lane中有2列tile,合計120個小區。每個小區
10、上分布數目繁多的簇結合位點。Cluster:簇,在Illumina測序平臺中會接受橋式PCR方式生產DNA簇,每個DNA簇才能產生亮度達到CCD可以辨別的熒光點。Index:標簽,在Illumina平臺的多重測序(Multiplexed Sequencing)過程中會使用Index來區分樣品,并在常規測序完成后,針對Index部分額外進行7個循環的測序,通過Index的識別,可以在1條Lane中區分12種不同的樣品。Barcode:與Index同義,多指在Roche GS FLX 454測序平臺的16S PCR產物的測序過程中接頭序列所包含的的用來區分不同樣本的序列。PF%:PF%是指符合測序
11、質量標準的簇的百分比,與測序的通量相關聯。Fasta:一種序列存儲格式。一個序列文件若以FASTA格式存儲,則每一條序列的第一行以“>”開頭,而跟隨“>”的是序列的ID號(即唯一的標識符)及對該序列的描述信息;其次行開頭是序列內容,序列短于61nt的,則一行排列完;序列長于61nt的,則每行存儲61nt,最終剩下小于61nt的,在最終一行排列完;其次條序列另起一行,仍舊由“>”和序列的ID號開頭,以此類推。Fastq:Fastq是Solexa測序技術中一種反映測序序列的堿基質量的文件格式。第一行以“”符號開頭,后面緊跟一個序列的描述信息;其次行是該序列的內容;第三行以“+”符
12、號開頭,后面可以是該序列的描述信息,也可省略;而第四行是其次行中的序列內容每個堿基所對應的測序質量值。Read:高通量測序平臺產生的序列標簽就稱為 reads。基因組組裝:進行基因組或轉錄組de novo測序時,物種基因組經構建不同的文庫測序所得的片段需經過生物信息學手段對其進行整理拼接,并通過肯定的標準(如N50)對后續組裝結果進行質量評估等,最終獲得高精確度的基因組序列的過程。基因組測序深度:測序得到的總堿基數與待測基因組大小的比值。如測一個物種的全基因組的重測序,基因組大小約為5G,測序獲得100G的數據量,則測序深度為20×。基因組掩蓋率:指測序獲得的序列占整個基因組的比例。
13、由于基因組中的高GC、重復序列等簡單結構的存在,測序最終拼接組裝獲得的序列往往無法掩蓋有所的區域,這部分沒有獲得的區域就稱為Gap。例如一個細菌基因組測序,掩蓋率是98%,那么還有2%的序列區域是沒有通過測序獲得的。Contig:在de novo測序中拼接軟件基于 reads 之間的 overlap 區,拼接獲得的中間沒有gap的序列稱為Contig(重疊群)。Scaffold:基因組 de novo 測序,通過 reads 拼接獲得 Contigs 后,往往還需要構建 454 Paired-end 庫或Illumina Mate-pair 庫,以獲得肯定大小片段(如 3Kb、8Kb、10Kb
14、、20Kb)兩端的序 列。基于這些序列,可以確定一些 Contig 之間的挨次關系,這些先后挨次已知的 Contigs 組成 Scaffold。Contig N50:Reads拼接后會獲得一些不同長度的Contigs。將全部的Contig長度相加,能獲得一個Contig總長度。然后將全部的Contigs依據從長到短進行排序,如獲得Contig 1,Contig 2,Contig 3Contig 25。將Contig依據這個挨次依次相加,當相加的長度達到Contig總長度的一半時,最終一個加上的Contig長度即為Contig N50。舉例:Contig 1+Contig 2+ Contig 3
15、 +Contig 4=Contig總長度*1/2時,Contig 4的長度即為Contig N50。Contig N50可以作為基因組拼接的結果好壞的一個推斷標準。Scaffold N50:Scaffold N50與Contig N50的定義類似。Contigs拼接組裝獲得一些不同長度的Scaffolds。將全部的Scaffold長度相加,能獲得一個Scaffold總長度。然后將全部的Scaffolds依據從長到短進行排序,如獲得Scaffold 1,Scaffold 2,Scaffold 3Scaffold 25。將Scaffold依據這個挨次依次相加,當相加的長度達到Scaffold總長度
16、的一半時,最終一個加上的Scaffold長度即為Scaffold N50。舉例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold總長度*1/2時,Scaffold 5的長度即為Scaffold N50。Scaffold N50可以作為基因組拼接的結果好壞的一個推斷標準。Isotig:指在轉錄組de novo測序時,用454平臺測序完成后組裝出的結果,一個isotig可視為一個轉錄本。Isogroup:指轉錄組de novo測序中,用454平臺測序完成后組裝出的結果獲得的可聚類到同一個基因的轉錄本群。GC%:GC
17、含量,全基因組范圍內或在特定基因組序列內的4種堿基中,鳥嘌呤和胞嘧啶所占的比率。SNP:single nucleotide polymorphism,單核苷酸多態性,個體間基因組DNA序列同一位置單個核苷酸變異(替代、插入或缺失)所引起的多態性;不同物種個體基因組 DNA 序列同一位置上的單個核苷酸存在差別的現象。有這種差別的基因座、DNA序列等可作為基因組作圖的標志。SNP 在CG序列上消滅最為頻繁,而且多是C轉換為T,緣由是CG中的C 常為甲基化的,自發地脫氨后即成為胸腺嘧啶。一般而言,SNP 是指變異頻率大于1 %的單核苷酸變異,主要用于高危群體的發覺、疾病相關基因的鑒定、藥物的設計和測
18、試以及生物學的基礎爭辯等。InDel:Insertion/Deletion,插入/缺失,在基因組重測序進行mapping時,進行容Gap的比對并檢測可信的Short InDel,如基因組上小片段>50bp的插入或缺失。在檢測過程中,Gap的長度為15個堿基。CNV:copy number variation,基因組拷貝數變異,是基因組變異的一種形式,通常使基因組中大片段的DNA形成非正常的拷貝數量。如人類正常染色體拷貝數是2,有些染色體區域拷貝數變成1或3,這樣,該區域發生拷貝數缺失或增加,位于該區域內的基因表達量也會受到影響。假如把一條染色體分成A-B-C-D四個區域,則A-B-C-C
19、-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D 分別發生了C區域的擴增及缺失,擴增的位置可以是連續擴增如 A-B-C-C-D也可以是在其他位置的擴增,如A-C-B-C-D。SV:structure variation,基因組結構變異,染色體結構變異是指在染色體上發生了大片段的變異。主要包括染色體大片段的插入和缺失(引起 CNV 的變化),染色體內部的某塊區域發生重復復制、翻轉顛換、易位、兩條染色體之間發生重組(inter-chromosome trans-location)等。基因表達差異:是指某一物種或特定細胞在特定時期/功能狀態下,多樣本間不同基因在mRNA水平上表達量的差異
20、,可通過RPKM/FPKM值來體現。RPKM:Reads Per Kilobase per Million mapped reads Mortazavietal.,2008,是指每 1 百萬個map 上 的reads 中 map 到外顯子的每1K 個堿基上的reads 個數。計算公式四RPKM=106C/NL/103,其中C為唯一比對到目的基因的reads數;N為唯一比對到參考基因的總reads數,L是目的基因編碼區的堿基數。RPKM法可以消退基因長度、數據量之間的差異進行計算基因表達量。可變剪切:alternative splicing大多數真核基因轉錄產生的mRNA前體是按一種方式剪接產生出一種mRNA,因而只產生一種蛋白質。但有些基因產生的mRNA前體可按不同的方式剪接,產生出兩種或更多種mRNA,即可變剪接。基因融合:Ge
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年絹綿/羊絨混紡紗項目投資價值分析報告
- 2025至2030年純棉雙面法蘭絨行業深度研究報告
- 規范靜脈輸液保證患者安全
- 2025至2030年電腦多彩裝飾燈項目投資價值分析報告
- 2025至2030年激光喇曼分光計項目投資價值分析報告
- 2025至2030年棉紗松緊帶項目投資價值分析報告
- 2025至2030年時尚沙發戒座項目投資價值分析報告
- 2025至2030年天然氣制乙炔行業深度研究報告
- PLC功能指令編程-機械手控制系統設計
- 2025至2030年中國天然石膏行業市場分析與投資咨詢報告
- 2024年10月自考04741計算機網絡原理試題及答案含評分參考
- 數字化技術在中國會計師事務所中應用的研究報告 2024
- “雙碳”碳達峰碳中和完全解讀
- 2024專利代理人考試真題及答案
- 人民醫院手術室裝修及安裝方案
- 《蘭亭集序》公開課一等獎省公開課獲獎課件說課比賽一等獎課件
- 中國老年骨質疏松癥診療指南(2023)解讀課件
- 企業創業孵化與創新基地管理制度
- 精 《校園的早晨》同步課件
- 高中英語新課程標準解讀課件
- 2024年河南省機關單位工勤技能人員培訓考核高級工技師《職業道德》題庫
評論
0/150
提交評論