TCGA的fpkm文件是怎么来的
时间: 2024-06-02 20:09:39 浏览: 144
TCGA-ESCA-mRNA表达数据——食管癌表达及临床数据集整理
5星 · 资源好评率100%
TCGA(The Cancer Genome Atlas)是一个由美国国家癌症研究所(NCI)和国立人类基因组研究所(NHGRI)联合发起的项目,旨在通过对人类多种肿瘤的全面基因组和表观基因组分析,揭示肿瘤形成和发展的分子机制,并为个性化肿瘤治疗提供依据。
在TCGA项目中,研究人员利用高通量测序技术对患者的癌症样本进行基因表达谱分析,得到了基因的FPKM(Fragments Per Kilobase of transcript per Million mapped reads)值。FPKM值是一种基因表达量的定量指标,它考虑了基因长度和测序深度等因素,可以客观反映基因在样本中的表达水平。
具体来说,研究人员首先将样本中的RNA提取出来,并使用RNA-seq技术对其进行测序,得到了包含数十亿条reads的原始测序数据。然后,利用生物信息学软件对这些reads进行比对,将其与参考基因组进行比对,得到每个基因的reads覆盖度。最后,根据每个基因的长度和样本的测序深度,计算出基因的FPKM值。
TCGA的FPKM数据可以在TCGA数据库中下载,并且已经成为了癌症研究领域中的重要资源,为研究人员提供了宝贵的基因表达信息,有助于揭示肿瘤发生机制和开发新的治疗方法。
阅读全文