剑桥大学2018单细胞转录组分析实战教程

5星 · 超过95%的资源 需积分: 45 27 下载量 15 浏览量 更新于2024-07-18 4 收藏 28.84MB PDF 举报
剑桥大学于2018年发布的单细胞转录组分析教程,是一份针对生物信息学专业人士和研究者的实用指南,旨在深入讲解单细胞RNA-seq的数据处理、分析和解读。该教程由Vladimir Kiselev、Tallulah Andrews、Jennifer Westoby、Davis McCarthy、Maren Büttner和Martin Hemberg等人编撰,涵盖了单细胞测序技术与R语言包在实际应用中的关键步骤。 课程大纲包括以下几个部分: 1. **课程介绍** - 视频教程:提供视频形式的教学内容,便于理解和实践。 - 注册与参与:学员可以通过注册获取课程资源,包括GitHub仓库和Docker镜像(RStudio环境)。 - 手动安装:对于无法使用Docker的用户,提供了手动安装指导。 - 许可证信息:明确课程的版权和使用许可。 - 预先知识:对参与者的基本技能要求,如编程基础(特别是R语言)、生物信息学基础知识等。 - 联系方式:提供课程作者和维护者的联系方式,以便咨询和交流。 2. **单细胞RNA-seq概述** - 介绍传统的bulk RNA-seq与单细胞测序技术的区别。 - 流程概览:从样本收集到数据分析的整体流程。 - 计算分析:强调了单细胞数据的复杂性以及计算挑战。 - 实验设计建议:针对实验平台选择给出建议。 3. **处理原始单细胞RNA-seq数据** - FastQC:数据质量初步检查。 - 读取修剪:去除低质量序列,提高后续分析的准确性。 - 文件格式:解释常用的文件格式,如FASTQ、 BAM等。 - 多重标记解码:针对多色或多平台实验的处理方法。 - 使用STAR进行序列比对:详细介绍星形图比对工具在单细胞数据中的应用。 - Kallisto和Pseudo-Alignment:介绍基于假想转录本的方法,如Kallisto,作为比对替代方案。 4. **构建表达矩阵** - 读取质量控制:对经过比对的读取进行质量评估。 - 读取映射:解释如何将读取与参考基因组或转录本集对应起来。 - 映射示例:通过实例展示读取到基因表达的转换过程。 - 映射质量控制:确保比对结果的准确性和完整性。 - UMI(Unique Molecular Identifiers):介绍独特的分子标识符在减少噪音和计数误差中的作用。 5. **R/Bioconductor入门** - R语言介绍:强调其在生物信息学领域的广泛应用,包括数据处理、可视化和统计分析。 - Bioconductor库:展示了如何利用Bioconductor生态系统中的各种工具进行单细胞RNA-seq数据分析。 本教程以R语言为主线,详细介绍了单细胞转录组分析的核心步骤,从数据预处理到生物信息学分析,为研究者提供了一个全面且实用的指南,帮助他们解析复杂的单细胞基因表达数据。学习者在完成本教程后,将具备分析单细胞RNA-seq数据的专业技能,以应对现代生物学研究中的挑战。