SeqCap EZ 目标富集数据分析指南

版权申诉
0 下载量 176 浏览量 更新于2024-07-19 收藏 683KB PDF 举报
"该文档是关于如何评估SeqCap EZ目标富集数据的指南,主要针对Roche的SeqCap EZ系列产品的靶向测序数据分析。它适用于SeqCap EZ Exome、SeqCap EZ Developer、SeqCap EZ Choice、SeqCap EZ Prime Choice和SeqCap EZ Prime Developer等产品。这份技术笔记发布于2017年6月,旨在为科研用途提供指导,不应用于诊断程序。" 在靶向测序领域,SeqCap EZ系统是一种常用的目标捕获技术,用于特定基因或区域的富集。富集后的样本在Illumina测序平台上进行测序。数据分析通常依赖于多种公开的开源工具,这些工具可能随时间而变化,Roche公司对其结果不提供保证或承担法律责任。用户应直接联系第三方工具的作者获取支持和文档。 标准的变异呼叫分析工作流程通常包括以下几个步骤: 1. **测序读质量评估**:首先,对测序产生的原始数据进行质量控制,通过FastQC等工具检查序列的质量分数分布、接头污染、GC含量等指标,以确保数据的可靠性。 2. **数据预处理**:使用BWA-MEM、Bowtie2等比对工具将测序 reads 对齐到参考基因组上,然后使用Picard、SAMtools等工具去除PCR重复和低质量reads,生成整理好的 BAM 文件。 3. **变异检测**:利用GATK(Genome Analysis Toolkit)进行变异呼叫。GATK的HaplotypeCaller或FreeBayes等工具可以识别SNPs(单核苷酸多态性)和INDELs(插入/缺失变异)。 4. **变异数量和质量过滤**:根据VQSR(Variant Quality Score Recalibration)策略,对变异进行过滤,保留高质量的变异。这一步骤涉及计算每个变异的得分,并基于训练数据集进行重新校准。 5. **注释和功能预测**:使用SnpEff、VEP(Variant Effect Predictor)等工具对变异进行功能注释,预测其在基因编码、调控区域的影响。 6. **覆盖率分析**:评估捕获区域的覆盖度是否均匀,可使用BEDTools、DeepTools等工具计算每个区域的读数覆盖情况,以确认富集效果和潜在的区域偏好。 7. **变异验证**:为了确认变异的准确性,可以选择部分变异进行实验室验证,如Sanger测序或qPCR。 8. **生物信息学分析**:最后,结合生物知识和疾病模型,分析变异的潜在生物学意义,可能涉及到网络分析、通路分析和基因集合富集分析等。 这个流程旨在为SeqCap EZ目标富集的数据提供一个全面的分析框架,但具体实施时应根据实验设计、研究目的和可用资源进行调整。对于不熟悉这些工具的用户,建议寻求专业的生物信息学支持。