UPGMA与Fitch-Margoliash算法在生物信息学中的应用

需积分: 50 13 下载量 137 浏览量 更新于2024-08-08 收藏 6.19MB PDF 举报
"平均连接聚类法系统树的实现与Fitch-Margoliash算法的解释在生物信息学中的应用" 在生物信息学中,系统树的构建是研究物种进化关系的重要手段。"平均连接聚类法系统树"是一种常用的方法,尤其在处理距离矩阵时,如在图5.5所示。这种方法,即UPGMA(Unweighted Pair Group Method with Arithmetic mean),是由Nei等人在1983年提出的。UPGMA基于一个假设,即所有分支上的突变率是恒定的。当这个条件成立时,UPGMA通常能产生较为理想的树形结构。然而,当各分支的突变率不相等时,这种方法可能无法准确反映实际的进化关系,因为这违反了分子钟假设,即在一定的时间内,不同物种的基因序列发生相同数量的变异。 Fitch-Margoliash算法是对UPGMA的一种改进,它不再局限于恒定突变率的假设。Fitch和Margoliash在1967年提出该算法,通过引入"丢失的"祖先节点来解决非恒定突变率的问题。该方法通过逐步拟合分枝长度来适应三个OTU(Operational Taxonomic Units,操作分类单元)的组。例如,在一个例子中,人类(hu)和黑猩猩(ch)作为一组,大猩猩(go)、猩猩(or)和长臂猿(gi)作为另一组,通过引入祖先节点C,可以建立一个树结构,其中a、b和x分别代表从C到A、B和X的距离。通过三个成对距离,我们可以求解出这些未知的距离,从而构建出更符合实际的进化树。 这份资料来源于樊龙江教授的《生物信息学札记(第3版)》,它详细介绍了生物信息学的基础知识,包括分子数据库、序列分析、基因组测序、分子进化等多个方面。书中不仅包含了传统的生物信息学内容,如UPGMA和Fitch-Margoliash算法,还与时俱进地涵盖了小RNA分析和遗传多态性检测等现代生物信息学的研究热点。 随着高通量测序技术的发展,生物信息学的应用范围不断扩大,例如在第七章中,详细讨论了如何分析小RNA数据,而在第八章则涉及遗传多态性和正向选择的检测,这些都是当前生物信息学研究的重要领域。作者团队,包括樊龙江教授及其学生,持续更新和丰富这份资料,使其始终保持与学科发展同步,为学习者提供了宝贵的参考资源。