tcga gdc官网,全球最大的癌症基因信息数据库

简介

TCGA (The cancer genome atlas)是一个非常重要的癌症数据库,其主要收录各种人类癌症(包括亚型在内的肿瘤)的临床数据,基因组变异,mRNA表达,miRNA表达,甲基化等数据,是癌症研究者很重要的数据来源。

TCGA数据库官网:https://portal.gdc.cancer.gov/

tcga gdc

主要功能和优势

作为目前最大的癌症基因信息数据库,TCGA的全面不仅仅体现在众多癌型上,还体现在多组学数据,包括基因表达数据、miRNA表达数据、拷贝数变异、DNA甲基化、SNP。而相对于GEO数据库,TCGA最大的优势是丰富且规范的临床数据,以及针对每种癌型的大样本量。对于肿瘤研究者来说,TCGA数据库就是一个资源宝库,里面有很多有价值的信息可以挖掘。

tcga gdc

TCGA数据库即肿瘤基因组图谱计划,由美国国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)合作建立,通过收集整理多种癌症相关的各种组学数据,提供了一个大型的癌症研究参考数据库,包括:ClinicalmRNAmicroRNACopyNumberMutationProteinMethylation与Proteome等。

TCGA数据库中正常样本数量较小或没有正常样本的肿瘤类型进行后续分析会非常受限,若继续进行差异分析,则需要增加正常样本的数量。实际应用中常通过三种方式处理:Gtex联合分析(非正常死亡人数据)、不做Tumor_Normal差异分析、从GEO数据库找T_N数据做差异分析,差异基因在TCGA进行生存分析。

tcga gdc

相关导航

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...