tcga样本编号_数据挖掘专题 | 一文搞懂TCGA数据整理
时间: 2023-07-29 20:05:48 浏览: 331
TCGA免疫浸润_TCGA_perl脚本tcga_mRNA_merge.pl_perl整理tcga_
5星 · 资源好评率100%
TCGA(The Cancer Genome Atlas)是一个旨在系统性地分析癌症基因组学的研究计划。该计划的目标是对30多种癌症类型进行基因组学研究,从而促进癌症预防、诊断和治疗的发展。
在TCGA计划中,每个肿瘤样本都有一个唯一的样本编号。这个编号由数字和字母组成,通常包括4个部分,分别是“TCGA”、“样本来源”、“肿瘤类型缩写”和“患者ID”。 例如,TCGA-02-0003-01A-01W-0186-08代表的是一个来源于肾脏的肾透明细胞癌样本。其中,“02”代表样本来自的TCGA数据中心编号,“0003”代表该样本所属的肿瘤类型编号,“01A”代表该样本来自的组织部位编号,“01W”代表该样本来自的癌症等级编号,“0186”代表该患者的病例编号,“08”代表该样本的技术重复编号。
在进行TCGA数据整理时,需要先确定需要分析的癌症类型和对应的组织部位编号,然后根据样本编号筛选出符合条件的样本数据。在进行数据处理和分析时,还需要考虑数据的质量、缺失值等问题。
总之,TCGA数据整理是一个复杂的过程,需要仔细分析和处理每个样本的数据,才能得到可靠的结果。
阅读全文