概率论模型在生物序列分析中的应用——基于HMM和系统发育
需积分: 50 22 浏览量
更新于2024-08-08
收藏 3.81MB PDF 举报
"信息安全技术 网站内容安全检查产品安全技术要求"
本文主要探讨了系统发育(phylogeny)的概率论模型,特别是在生物序列分析中的应用。系统发育学是一个研究物种或生物群体之间演化关系的领域,而概率论模型在此领域的应用旨在通过序列数据推断出这些关系,即构建系统发育树。
在描述中,提到基于概率论的系统发育学的主要目标是根据树的似然性P(data|tree)对树进行排序,或者是根据贝叶斯观点,依赖后验概率P(tree|data)。为了实现这些目标,我们需要定义并计算给定一棵树后数据的概率P(x•|T, t•),其中x•代表n条序列,T是具有n个叶节点的树,t•是树的边长。进化模型在这里起着关键作用,它描述了序列在树的边沿上如何随时间演变。
概率P(x|y, t)定义了祖先序列y沿着边长t演变为序列x的概率。一旦为树的节点分配了特定的祖先集合,树的概率可以通过所有进化概率的乘积来计算。例如,图8.1展示了如何计算一棵包含三条序列的树的概率。
此外,文章还提到了1992年David Haussler及其团队在神经网络会议上引入的隐马尔可夫模型(HMM)在生物序列分析中的应用。HMM是一种概率模型,特别适用于从生物序列中提取信息。这个概念随后被多个研究团队采纳并扩展,用于RNA二级结构分析和各种其他生物信息学问题。
本文涵盖了概率论在系统发育学中的核心概念,包括序列数据分析、进化模型的构建以及HMM在生物序列分析中的重要性。这些技术不仅用于推断生物体间的演化关系,还广泛应用于蛋白质结构预测、基因识别和系统发育分析等多个领域。书中强调了概率论建模方法的实用性和对生物序列分析基础的通俗介绍。
2020-11-16 上传
2021-08-05 上传
2018-08-10 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
龚伟(William)
- 粉丝: 32
- 资源: 3899
最新资源
- lex and yacc
- 某公司考试题 doc 文件
- struts架构指导
- 基于Linux的信用卡授权程序的设计与实现
- javascript高级教程.pdf
- 高质量cc++编程.pdf
- ajax “煤炭子鬼”版主帮助处理后的文档
- 银行帐户管理系统需求分析
- 利用OpenSSL生成证书详解
- oracledi_getting_started入门指南
- Shell脚本调试技术
- java编程实例100
- 操作系统 考研 汤子赢
- HP-UX环境下Shell程序调试
- 单 片 机的40个实验
- 编写一个用户注册信息填写验证程序,注册信息包括用户名、密码、EMAIL地址、联系电话。要求验证联系电话中只能输入数字,EMAIL地址中需要包括“@”符号,密码域不少于6位。要求联系电话在输入过程中保证不能有非数字,而其他两个域在点击注册按钮时再进行数据检查。