灰色关联分析与FKM聚类在微阵列数据特征基因提取中的比较

需积分: 50 2 下载量 130 浏览量 更新于2024-08-10 收藏 4.05MB PDF 举报
"这篇硕士论文探讨了DNA序列分析和特征基因提取方法,主要关注于离散数据处理(DNA序列分析)和数值型数据处理(微阵列数据分析)。论文作者是曾诚,指导教师是廖波,来自湖南大学计算机体系结构专业,完成于2008年4月17日。" 在DNA序列分析部分,论文提到了DNA序列的图形表示法,特别是基于核苷酸二联体的表示法,这是对DNA序列的一种简化和抽象。这种方法有助于理解序列间的相似性,并在此基础上提出了一种新的序列相似性分析方法。 接着,论文转向基因分类和微阵列技术的研究,微阵列是一种用于大规模并行检测基因表达水平的技术。在特征选择算法上下文中,论文特别强调了灰色关联分析的应用,这是一种统计方法,用于量化两个时间序列或数据集之间的相似性。作者提出使用灰色关联分析来减少微阵列数据中的冗余,通过实验验证了该方法的有效性。 在特征基因提取部分,论文比较了两种聚类方法——灰色关联聚类和FKM(Fuzzy C-Means)聚类。结果显示,灰色关联聚类在各种类别数级别上均优于FKM算法,特别是在支持向量机(SVM)的分类测试中。此外,论文还使用了文献中提到的Golub的50个特征基因进行测试,进一步探讨了特征基因在实际应用中的效果。 这篇论文为生物信息学领域的研究提供了新的视角和方法,尤其是关于DNA序列的分析和微阵列数据的处理。它不仅探讨了现有的技术和理论,还通过实验验证了新方法的有效性,对于理解基因表达数据和提高分类性能具有一定的贡献。