概率论建模在生物序列分析中的应用——从HMM到随机文法

需积分: 50 39 下载量 32 浏览量 更新于2024-08-08 收藏 3.81MB PDF 举报
"这篇文档是关于GA/T 1396-2017 信息安全技术网站内容安全检查产品安全技术要求的补充读物,它提及了计算分子生物学和生物序列分析的相关教材和资料,特别介绍了概率论模型在生物序列分析中的应用,特别是隐马模型(HMM)在蛋白质序列分析领域的进展。" 本文档首先提到了一些计算分子生物学的参考书籍,如Waterman的《Introduction to Computational Biology》、Baldi & Brunak的《Bioinformatics - The Machine Learning Approach》以及Sankoff & Kruskal的《Time Warps, String Edits, and Macromolecules》等,这些都是供读者深入理解分子生物学和生物信息学领域的经典著作。此外,还推荐了Watson et al.的《Molecular Biology of the Gene》作为无分子生物学背景读者的入门读物,以及Branden & Tooze的《Introduction to Protein Structure》作为蛋白质结构学习的初级指南。 文档的核心内容涉及1992年David Haussler及其团队在神经网络会议上提出的隐马模型(HMM)在蛋白质序列分析中的应用。这一创新性的模型随后被Richard Durbin、Graeme Mitchison、Sean R. Eddy等研究者接纳并发展,他们分别在UCSC和剑桥大学的MRC分子生物学实验室进行了HMM软件包的开发和扩展,包括将其应用于RNA二级结构分析。同时,Pierre Baldi领导的JPL/Caltech小组也在同一时期进行了基于HMM的研究。 作者们注意到,尽管HMM在语音识别领域已有详尽的文献,但在生物序列分析领域的应用仍然不广为人知。因此,他们决定撰写一本专注于生物序列分析的书籍,强调概率论建模的重要性,特别是HMM在蛋白质结构预测、基因识别和系统发育分析等方面的应用。书中旨在提供序列分析基础知识的易懂介绍,并展现概率论方法在生物信息学中的价值,而不是提供一个全面的实用指南。 通过这篇文档,我们可以了解到HMM作为一种强大的数学工具,在生物信息学尤其是蛋白质序列分析中的关键作用,以及当时科研社区对于概率论建模技术的接纳和进一步探索的热忱。