基于核苷酸二联体的DNA序列相似性分析与微阵列特征选择方法研究

需积分: 50 2 下载量 73 浏览量 更新于2024-08-10 收藏 4.05MB PDF 举报
本篇硕士学位论文探讨了生物信息学领域的重要议题,特别是DNA序列分析和特征基因提取方法。作者曾诚在计算机体系结构专业背景下,针对生物学信息爆炸性增长的需求,结合计算机技术的快速发展,深入研究了离散型数据处理中的DNA序列相似性分析和数值型数据处理中的微阵列数据分析。 首先,论文详细阐述了DNA序列的图形表示方法,包括基于核苷酸二联体的表示法,这是一种新颖且直观的方式来描述DNA序列。作者重点介绍了一种基于这种表示法的序列相似性分析方法,通过计算不同序列在核苷酸水平上的相似度,以评估它们之间的亲缘关系或功能关联。 接着,论文回顾了基因分类的发展历程,以及微阵列技术在生物研究中的应用。微阵列技术是现代生物技术中一种重要的高通量数据分析工具,它能同时检测多个基因的表达水平。论文还涉及了微阵列特征选择算法,这是为了从大量的微阵列数据中筛选出最具代表性和差异性的基因特征,以支持后续的生物学研究。 针对微阵列数据中的冗余问题,论文提出了基于灰色关联分析的方法。灰色关联分析是一种非参数统计方法,可以有效地量化和减小数据中的相关性,提高特征选择的精度。通过实验验证,这种方法在实际应用中展现了显著的效果,能够提升基因表达谱分析的准确性和效率。 这篇论文对DNA序列分析的关键技术和微阵列数据分析中的特征选择策略进行了深入研究,为生物信息学领域的数据处理提供了新的思路和技术支持,有助于挖掘生物学数据中的有价值信息,推动生物科学的进步。关键词包括DNA序列分析、微阵列、基因表达谱、特征选择和灰色关联分析。