高通量测序中,reads、contigs、scaffold之间的联系
时间: 2023-07-10 08:03:09 浏览: 221
在高通量测序中,reads(读取)是原始的DNA序列数据,通常由测序仪器生成。这些reads可以很短,通常只有几十个碱基(bp),或者非常长,可能超过数万bp。
为了更好地理解DNA序列,研究人员通常会将reads组装成更长的序列,形成contigs(连通片段)。Contigs是由相互重叠的reads拼接而成的,通常比reads长得多,可以包含数千到数百万个碱基对(bp)。
然而,contigs通常仍然不足以代表完整的染色体或基因组,因为它们无法覆盖所有的DNA区域。为了解决这个问题,研究人员会利用一些辅助信息,例如物理图谱、基因组映射数据等,将contigs组装成更大的序列,形成scaffold(支架)。Scaffold是由多个contigs拼接而成的,其中一些区域是未知的,由一些N(代表未知碱基)填充。
因此,在高通量测序中,reads、contigs和scaffold之间存在以下关系:reads是初始的DNA序列数据,contigs是由reads组装而成的更长的序列,scaffold是由contigs组装而成的更大的序列。这些序列可以被用来研究基因组结构、功能和进化等方面。
阅读全文