




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
癌癥相關數據庫廖
奇寧波大學醫學院http://2016./Team:NJU-China/Background癌癥在中國的情況http://2016./Team:NJU-China/Background癌癥相關數據庫Nucleic
AcidsResearch雜志中列出癌癥相關的數據庫列表:/nar/database/subcat/8/33基因組變異數據庫(突變、SNP、插入、缺失、拷貝)癌癥相關基因數據庫(促癌、抑癌基因、轉移相關基因)癌癥基因表達數據庫(利用基因芯片、測序檢測等技術檢測基因在各癌癥的表達情況、差異表達分析)癌癥表觀遺傳修飾數據庫(DNA甲基化、表觀遺傳修飾)非編碼RNA(癌癥相關miRNAs,circRNAs,lncRNAs等)
癌癥調節網絡關系數據庫(癌癥基因間的調節關系)癌癥大規模數據儲存、分析平臺(癌癥相關高通量數據的查詢、訪問及分析)癌癥基因組變異數據庫COSMIC:
人類癌癥體細胞突變數據庫,
最大、最全面,https://cancer.sanger.ac.uk/cosmic,包含4個子數據庫,
分別為:COSMIC,COSMIC核心
,專業審核過的體細胞突變Cell
Lines
Project,超過1000個癌癥細胞系的突變譜COSMIC-3D,三維結構下動態展示癌癥的突變Cancer
Gene
Census,癌癥突變基因HGMD:實驗驗證的人類基因突變數據庫http://www.hgmd.cf.ac.uk/ac/index.phpClinVar
:
a
public
archive
of
reports
of
the
relationships
among
human
variations
and
phenotypes
(包含癌癥)https:///clinvar/OMIM
:人類基因和遺傳紊亂的數據庫(包含癌癥)/DriverDBv2:主要來自外顯子測序的人類腫瘤driver基因/突變數據庫:.tw/driverdbIntOGen:腫瘤driver/突變基因數據庫,https://TCGA
:癌癥基因組突變數據庫,
/CaSNP
:
SNP芯片來源的基因拷貝數據庫.
/CaSNP/癌癥基因相關數據庫CCGD:
基于鼠遺傳篩選來源的癌癥基因數據庫,http://ccgd-
/about.phpTumorAssociatedGene:利用Pubmed數據庫的文本挖掘方法鑒定的腫瘤相關基因,.tw/TAG/GeneDoc.phpTissGDB:癌癥中組織特異基因數據庫,
/TissGDB/index.htmlHCMDB:
癌癥轉移相關基因數據庫,/index癌癥基因表達數據庫Cancer
RNA-seqNexus:來自GEO數據庫和TCGA數據庫中癌癥相關RNA-seq處理的差異表達基因,
.tw/Expression
Atlas:不同條件下(包括癌癥)基因表達情況數據庫,
https://www.ebi.ac.uk/gxa/homeOncomine:大型腫瘤基因芯片數據庫,提供基因在癌癥的表達信息、差異分析和工標的分析,GEPIA:基因在癌癥的表達信息、生存分析(
TCGA來源的數據),/非編碼RNA相關miRCancer:癌癥相關miRNAs數據庫,/OncomiRDB:癌癥相關miRNAs數據庫,
/member/jgu/oncomirdb/lnc2Cancer:癌癥相關lncRNAs數據庫,
/lnc2cancer/Lnc2Catlas:癌癥相關lncRNAs數據庫,
/LncRNA-Cancergene
co-expressionnetwork:
癌癥基因與lncRNAs共表達關系數據庫,/癌癥調節關系數據庫NCG5.0:
癌癥基因相互作用,如蛋白蛋白相互作用,miRNA調節關系,也提供表達等相關信息,http://ncg.kcl.ac.uk/index.phpCistrome
cancer:
癌癥中轉錄因子調節關系數據庫,/CistromeCancer/starBase:
包含非編碼RNAs調節關系(miRNA-target,ceRNA等)在癌癥的表達相關性分析,/index.php癌癥表觀遺傳修飾數據庫MethHC:來自TCGA
的癌癥DNA甲基化譜,.tw/php/index.phpMethyCancer:癌癥DNA甲基化基因數據庫,/PubMeth:癌癥DNA甲基化基因數據庫,http://matrix.ugent.be/pubmeth/癌癥數據平臺cBioPortal:
展示、分析和下載大規模癌癥基因組數據的平臺,/臨床資料相關數據庫SEER:
提供的臨床數據,數據記錄中包括患者的注冊編號、個人信息、原發病灶部位、腫瘤尺寸、腫瘤編碼、治療方案、死亡原因等信息,
/data/單個腫瘤基因數據庫Cervical
cancer:
/raghava/ccdb/Breast
cancer:
/ermb/bcgd/bcgd.htmlColorectal
cancer:
Gastriccancer:
/dbgc/index.doThe
CancerGenomeAtlas
(TCGA)起始于2005,由NationalCancer
Institute
(NCI)和National
Human
GenomeResearch
Institute
(NHGRI)共同負責,預計2006~2009年花費1.1
億美元獲取癌癥基因組的遺傳變異。美國政府投入5億美元,預計再接下來的5年內(2010~2015)獲得20~30種癌癥的基因組變異。目的:利用大規模基因組測序技術,挖掘癌癥的基因組圖譜,加快我們對癌癥分子基礎的理解,提高我們對癌癥的診斷、治療和預防能力。目前TCGA項目涉及33種癌癥,11328個病人,樣本包含癌癥組織、癌旁組織,血液等,總數據大小為2.5
petabytes
。數據類型Tumorcharacteristics:DNA
mutationCopy-number
variationGene
expressionDNA
methylationMicroRNA
activityCellular
proteinactivityClinical
dataDNA
sequencingWhole
genome
sequencesWhole
exome
sequencesSequence
tracesMutations,including
coding,
splice
site,
germline
and
noncoding
somatic
variantsRNA
sequencingmiRNAsequences
(calculated
expressionper
miRNA
andisoform)mRNAsequences
(calculated
expressionper
gene,
exon,splice
junction,
isoform)TotalRNA
sequences
(calculated
expression
per
gene,
exon,splice
junction,
isoform)Expressionsignals
per
gene,
exon,splice
junction,
miRNA,and
isoformCopy
numberArrays
(raw,
unnormalized,
normalized)Low-passDNAsequencing
(wholegenomessequences,
variants,
coverage)Array-based
expressionGene
expression(raw,
normalized,
calls)Exon
expression
(raw,
normalized,
calls)miRNA
expression(raw,
normalized,
calls)DNA
methylationBisulfitesequencing
(wholegenome
sequence,methylation
andmutation
calls)Array-based
methylation
(raw
signal
intensity,
calculated
beta
values)OtherProtein
expression
(high-resolution
imagesof
protein
arrays,
raw
signals,
normalized
expression)Microsatelliteinstability
(markers,classifications)Clinical
information
about
participants
(e.g.,
sex,
race,
ethnicity,
drugs
taken,
and
response
to
treatment);Information
about
the
samples
(e.g.,
the
weight
of
a
sample
portion,
days
to
collect,
and
time
of
freezing);
andImages
of
the
tumors
(allows
estimation
of
number
of
proliferating
cells,
how
many
cells
have
died,
how
many
immune
cells
are
present,
etc.)數據水平TCGA提供不同水平的處理數據:Level
1: 原始數據,被控制訪問(controlled),如fastq、fasta文件。Level
2:處理的數據,被控制訪問(controlled),如read比對基因組的bam文件。Level
3:被分割或解釋的數據,公開(open),如標準化后的最終基因表達值。Level4:感興趣的區域或概要信息,基于兩個或多個數據的關聯,公開(open)。利用TCGA數據發表的文獻GCCs:TheGenomeCharacterization
centers
used
several
technologiestoanalyzegenomicchangesinvolvedin
cancerincluding
geneexpression
levelsand
structural
rearrangementsof
the
genome.數據訪問和下載(Data
Portal)/鼠標放置每種癌癥類型上面,可以顯示該癌癥的case數目以及文件數目。舉例:搜索colorectal數據的選擇、過濾和篩選數據的呈現直腸相關的case注意:并不是只有一種癌癥類型或只有一套數據集病人的ID項目ID(通常為一種腫瘤)腫瘤來源部位突變的基因突變位點Case的分布情況Seq:高通量測序的底層處理數據,通常為bam格式的比對文件。Exp:測序數據處理過的表達譜,可以包括基因表達譜和miRNA表達譜、有count、FPKM類型的表達值SNV:
SimpleNucleotide
Variation,包括MAF和VCF格式的文件,其中體細胞突變的結果(MAF格式文件)公開。CNV:
CopyNumber
Variation,DNA拷貝變異數據,txt格式,公開。Meth:甲基化數據,txt格式,公開Clinical:臨床資料信息,包括病人的臨床特征、手術處理、藥物處理、隨訪資料等信息。Bio:關于生物樣品的信息按突變頻率排序的基因生存曲線每個基因的具體描述所有癌癥中出現突變的百分比突變位點信息點擊Survival圖標突變和未突變病人的生存曲線比較突變的影響數據分析:對所保存的數據集做交集或并集分析對所保存的數據集進行生存分析以及性別、存活情況、年齡的分布數據分析:1.
建立數據集分別選中COAD和READ種突變頻率最高的top
100個基因。2.
保存數據集3.點擊Analysis,選擇數據集選中所要分析的數據集生存分析性別分布存活情況分布年齡分布檢索基因和變異:以MYC基因為例Cases在癌癥部位、項目種類、疾病類型、性別、存活情況的分布對Mutation
的過濾和篩選舉例:檢索所有lncRNA突變頻率較高的lncRNAsTCGA數據在線分析工具:GEPIAGEPIA:
查看基因在各腫瘤的表達情況,生存分析及共表達的基因;查看各腫瘤差異表達的基因,與生存相關的基因。http://gepia.cancer-pk/打開主頁,輸入基因名以基因為單位進行查詢腫瘤和正常組織中的表達情況,顏色深淺表示表達高低。其他數據庫的鏈接LINC01578在各癌癥的差異表達情況LINC01578在各癌癥的差異表達情況LINC01578
top相關的共表達基因查看在具體某個癌癥的表達情況選擇所關心的癌癥(可選擇多個)如果選擇TCGA和GTEx,表示正常樣本加上GTEx數據庫的正常樣本如果選擇只是TCGA,表示正常樣本只來自TCGA。Expression
DIY
Boxplot可知該基因在腸腺瘤中低表達。查看在某癌癥不同期的表達情況Expression
DIY
Stage選擇所關心的癌癥(可選擇多個)1LINC01578在腸腺瘤各癌癥階段的表達情況Major
stage
Sub
stage生存分析Survival
Survival
Plots選擇高低表達的分組選擇生存時間單位選擇所關心的癌癥(可選擇多個)盡管LINC01578在COAD中低表達,但其表達量越低,生存時間反而卻越長。尋找共表達的基因選擇要計算的表達譜顯示top
20個共表達的基因顯示2個基因的表達散點圖選擇要計算的表達譜輸入要顯示的2個基因名或ID注意:Top
基因相關系數高,不一定有好的散點圖RP11-1299A16.1反而排序較后的可能有較好的散點圖癌癥差異表達分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安裝維護工費合同協議
- 學生托管班合作協議合同
- 安裝護欄改造合同協議
- 家具軟裝合同協議書范本
- 家政公司正規合同協議
- 委托圖紙設計合同協議
- 委托乙方付款合同協議
- 客戶按揭車合同協議
- 婚慶公司租車合同協議
- 廢料承包合同協議
- (正式版)JBT 14449-2024 起重機械焊接工藝評定
- 新安法下怎樣做到「盡職免責」
- 2022年10月自考00830現代語言學試題及答案含解析
- 三年級下冊數學計算去括號練習400道及答案
- 2024年四川蓬安相如旅游開發有限責任公司招聘筆試參考題庫含答案解析
- 統編版語文四年級下冊第二單元 快樂讀書吧:十萬個為什么 整書閱讀 課件
- 保安員心理測試題及答案
- YY/T 0489-2023一次性使用無菌引流導管及輔助器械
- 中醫藥適宜技術頸椎病課件
- 幼小銜接視野下大班幼兒學習習慣的現狀調查及養成策略研究
- 中職電子商務班級建設方案
評論
0/150
提交評論