MOLION算法:基因表达数据的关联聚类新策略

0 下载量 188 浏览量 更新于2024-08-30 收藏 598KB PDF 举报
本文介绍了一种名为MOLION的投影聚类算法,它在处理基因表达数据分析时,突破了传统方法假设基因相互独立的局限。在现有的聚类技术中,许多算法依赖于单个基因的独立区分度来选择投影空间,这种方法可能忽视了基因间的相互作用,而这在生物系统中是非常关键的。MOLION算法旨在捕捉这种关系,通过将基因表达数据转换为基因序列的形式,引入用户偏好函数,利用分界判定法对样本进行深度优先遍历。 算法的核心是采用一种新颖的方法来评估基因间的关联性,这包括构建样本穷举树,并运用高效的削减和优化策略。这种方法允许算法在保持计算效率的同时,更好地理解基因之间的协同作用,这对于理解疾病的表型形成机制提供了新的见解。在实验验证阶段,作者使用了几个真实的世界微阵列数据集,结果显示MOLION算法在效率和预测准确性方面表现出色,这表明它在实际应用中具有显著的优势。 该研究由多位专家合作完成,其中包括赵宇海博士,他在生物信息与数据挖掘领域有深入研究;王国仁教授,他的研究领域涵盖了数据库理论、生物信息学等多个交叉学科;于长永和毛克明两位博士研究生则专注于生物信息的具体领域。他们的联合工作体现了多学科交叉的优势,为基因表达数据分析提供了强大的技术支撑。 关键词:基因表达数据、投影聚类、基因序列、数据挖掘,这些关键词揭示了文章的核心研究内容,同时也表明了其在生物信息学和计算机科学中的重要地位。MOLION算法的提出是对当前基因表达数据处理技术的一个重要贡献,它为深入理解基因调控网络和疾病发生机制提供了有力工具。