TCGA样本barcode命名规则
时间: 2023-10-11 20:07:43 浏览: 470
代码命名规则
TCGA(The Cancer Genome Atlas)数据集中的样本barcode命名规则包含了许多有用信息。其命名规则如下:
- 第1-4个字符:TCGA的缩写,表示数据集来源(如TCGA表示来自The Cancer Genome Atlas)
- 第5-12个字符:患者ID,唯一标识一个病人,由数字和字母组成
- 第13-15个字符:样本来源,如T表示肿瘤组织,N表示正常组织
- 第16-17个字符:组织类型,如01表示肾脏,02表示肝脏
- 第18-19个字符:病理分期,如01表示I期,02表示II期等
- 第20-21个字符:性别,如01表示男性,02表示女性
- 第22-25个字符:样本编号,唯一标识一个样本,由数字和字母组成
因此,TCGA样本barcode的命名规则可以提供丰富的信息,方便进行数据分析和研究。
阅读全文