生物信息学实践:序列相似性比较与基因预测

需积分: 50 13 下载量 107 浏览量 更新于2024-08-08 收藏 6.19MB PDF 举报
"序列相似性比较法在生物信息学中的应用,通过PHP+MySQL实现在线测试答题实例。" 本文介绍了序列相似性比较法在预测新基因中的应用,特别是在生物信息学领域的实践。序列相似性比较法是基于已知序列与未知序列的相似度来推断新基因的一种方法。随着基因序列数据的不断积累,如Expressed Sequence Tags (ESTs) 和已知蛋白质序列的增多,这种方法变得越来越重要。 首先,通过使用BLAST (Basic Local Alignment Search Tool) 等工具,以已知基因的cDNA序列对EST数据库进行比对,找出高度相似的EST序列。然后,利用Seqlab的Fragment Assembly软件将这些EST序列组装成重叠群,并得到一致序列。根据重叠群的情况,可以拼接出新基因的全长序列或者多个片段。接下来,对编码区蛋白质序列进行比较,分析其与已知基因蛋白质功能域的相似性,从而预测新基因可能的功能。 此外,通过将新基因序列或EST序列与STS (Sequence Tagged Sites) 数据库进行BLAST分析,可以确定新基因在染色体上的定位。若某一EST与STS有重叠,即可定位新基因的位置。 这个过程在本实例中被转化为一个在线测试答题系统,可能使用PHP编程语言处理查询和比较,MySQL数据库存储和管理序列数据。这样的系统为生物信息学研究提供了便利,使得研究人员能够快速有效地进行序列比对和基因预测。 本书《生物信息学札记(第3版)》由樊龙江教授编写,涵盖了生物信息学的多个主题,包括分子数据库、序列分析、基因组测序、分子进化、蛋白质结构预测以及随着高通量测序技术发展而新增的小RNA分析和遗传多态性检测等内容。作者强调了资料的实时更新,以适应快速发展的生物信息学领域。 总结来说,序列相似性比较法是生物信息学中预测新基因的重要手段,通过在线测试答题系统,可以将这一科学方法实际应用于教学和研究中,帮助科学家更好地理解基因功能和进化关系。