Control-FREEC指南:深度测序数据分析的CNV与LOH工具详解

需积分: 50 3 下载量 131 浏览量 更新于2024-09-02 收藏 1.02MB PDF 举报
Control-FREEC是一款专为深度测序数据设计的软件,它在遗传学研究中被广泛用于检测染色体片段的拷贝数变异(CNV)和等位基因失衡(LOH),特别是在肿瘤学领域。它由Institut Curie的生物信息学实验室开发,现在由Institut Cochin的Valentina Boeva团队维护。这款工具的核心功能是通过自动计算、标准化和分析深度测序数据中的拷贝数和β等位基因频率(BAF),从而识别出基因座的拷贝数改变和LOH。 从v8.0版本开始,Control-FREEC扩展了其功能,能够检测亚克隆增益和损失,并评估样品的最可能平均倍性,这对于理解肿瘤异质性和进化至关重要。同时,软件对肿瘤纯度的评估也得到了提升,这对于确保结果的准确性至关重要。 对于输入数据,Control-FREEC支持SAM、BAM、SAMtools堆积格式的单端或配对端序列数据,从v8.0起,不再支持Eland、BED、SOAP、arachne、psl和Bowtie格式。针对CNA检测,用户需要提供对齐后的文件,如GZipped SAM或BAM。对于CNA+LOH检测,可以选择两种方式:一是提供SAMtools堆积格式的文件;二是提供BAM文件并配合“makePileup”和“fastaFile”选项。 输出结果包括增益、丢失和LOH区域的具体位置,以及标准化的拷贝数和BAF配置文件,这些数据对于后续的生物学解读和科研分析非常有用。Control-FREEC的最新版本v8.0还优化了多线程处理能力,例如,使用6个线程可以在一小时内处理带有控制样本的30倍全基因组测序数据(WGS)。 这篇文档的引用文献指出,Control-FREEC是基于生物信息学方法的有力工具,发表在2012年的《生物信息学》期刊上,作者们详细介绍了其原理、应用及性能特点,对于想要深入理解和使用该软件的研究人员来说,是一份重要的参考资料。