DNA序列分析与特征基因提取的生物信息学研究

需积分: 50 2 下载量 10 浏览量 更新于2024-08-10 收藏 4.05MB PDF 举报
"本文是湖南大学硕士研究生曾诚关于DNA序列分析及特征基因提取方法的研究,由导师廖波指导,完成于2008年。文章主要探讨了生物信息学中的两个关键领域:DNA序列分析和微阵列数据分析。" 在生物信息学中,DNA序列分析是一个核心的课题,它涉及从大量生物数据中提取有用信息。本文在这一领域有两方面的贡献。首先,作者介绍了DNA序列的图形表示方法,这是理解和比较DNA序列的重要手段。通过对核苷酸二联体的4维表示法,作者提出了一种新的序列相似性分析方法。这种方法能够更有效地比较不同生物的DNA序列,通过实验验证,该方法在分析11种生物B基因的第一外显子DNA序列时表现出了有效性。 其次,文章聚焦于微阵列数据分析,这是处理基因表达数据的关键技术。作者概述了基因微阵列的发展和应用,以及特征选择在分类中的重要性。为了降低微阵列数据的冗余,作者引入了灰色关联分析,这是一种在连续数据处理中用于挖掘相关性的统计方法。通过优化最小生成树,他改进了灰色关联聚类算法的时间复杂度,进一步提升了特征提取的效率。 此外,论文还涵盖了数据降维和特征提取的常用工具,这些都是处理高维生物数据的关键步骤。在结论部分,作者总结了研究的主要成果,指出了工作中的不足,并提出了未来可能的研究方向。 这篇论文深入研究了DNA序列分析的新方法和微阵列数据处理策略,对生物信息学领域的研究有着积极的推动作用,尤其是在特征基因的识别和数据处理效率上提供了新的思考。