基于序列挖掘的分等级进化算法：稳定遗传与高效搜索

需积分: 5 72 浏览量更新于2024-08-13 收藏 828KB PDF 举报

本文主要探讨了"基于序列挖掘的分等级搜索可持续进化算法"（SEAHSM），这是一项发表于2011年的自然科学论文，针对的是计算机科学领域中的优化搜索与遗传算法的创新应用。研究者首先引入了最大频繁序列模式（MFSP）的概念，这是一种在数据挖掘中用于发现频繁出现的模式的技术。最大频繁序列模式挖掘算法（MFSPMA）被设计出来，目的是从大量数据中筛选出具有代表性和普遍性的序列模式。论文的核心思想是将MFSPMA与公平竞争层次模型（HFC）相结合。HFC是一种多层次的搜索策略，它允许算法在不同适应度等级的种群中进行搜索，这样可以为不同适应度水平的个体提供生存空间。通过这种方式，算法能够更好地平衡搜索的广度和深度，防止过早收敛，即过早地锁定在局部最优解而忽视全局最优。 SEAHSM的独特之处在于，它不仅挖掘种群中的优良基因，即最频繁或最有效的解决方案，而且通过将这些优良基因模块注入到不同适应度水平的种群中，实现了遗传信息的稳定继承，减少了优良基因在进化过程中丢失的可能性。这种方法有助于保持遗传多样性和长期进化能力，提高了搜索的精度和效率。实验结果显示，SEAHSM在保持遗传信息的稳定性、防止早熟收敛以及提升搜索性能方面表现出色。这些优势使得该算法在解决复杂问题时具有显著的优势，特别是在需要长时间稳定探索和高精度解决方案的领域，如机器学习、数据分析和优化问题等。关键词包括最大频繁序列模式、序列挖掘、遗传信息、基因重用和可持续进化算法，这些词汇揭示了文章的核心研究内容和焦点。这篇文章为进化计算和序列数据分析提供了新的视角和方法，对于推动相关领域的研究和技术应用具有重要的理论价值和实践意义。

第３９卷　第７期

２０１１年　７月　

华中科技大学学报（自然科学版）

Ｊ．ＨｕａｚｈｏｎｇＵｎｉｖ．ｏｆＳｃｉ．＆Ｔｅｃｈ．（ＮａｔｕｒａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ）

Ｖｏｌ．３９Ｎｏ．７

　Ｊｕｌ．　２０１１

收稿日期　２０１０‐１１‐１０．

作者简介　杨观赐（１９８３‐），男，博士研究生；李少波（通信作者），教授，Ｅ‐ｍａｉｌ：ｌｉｓｈａｏｂｏ＠

ｇ

ｚｕ．ｅｄｕ．ｃｎ．

基金项目　教育部新世纪优秀人才支持计划资助项目（ＮＣＥＴ０９‐００９４）；国家自然科学基金资助项目（６０９７５０４９）；

贵州省科学技术基金资助项目（黔科合Ｊ字［２０１０］２０９５）．

基于序列挖掘的分等级搜索可持续进化算法

杨观赐

１

　李　琴

２

　李少波

１，２

　钟　勇

１

（１中国科学院成都计算机应用研究所，四川成都６１００４１；

２贵州大学教育部现代制造技术重点实验室，贵州贵阳５５０００３）

摘要　讨论了最大频繁序列模式和公平竞争层次模型（ＨＦＣ），设计了最大频繁序列模式的挖掘算法

（ＭＦＳＰＭＡ），把ＭＦＳＰＭＡ同ＨＦＣ结合起来，提出了基于序列挖掘技术的分等级搜索可持续进化算法

（ＳＥＡＨＳＭ）．该进化算法设置多个不同层次的种群为不同适应度水平的个体提供生存空间，采用最大频繁子

模式挖掘算法挖掘种群中的优良基因，并将具有优良基因模块的新个体注入到不同适应度水平的种群，从而

实现遗传信息的稳定继承，有效避免优良基因的丢失．实验结果表明：ＳＥＡＨＳＭ在维持遗传信息稳定性、避免

早熟收敛、提高搜索精度等方面表现良好．

关键词　最大频繁序列模式；序列挖掘；遗传信息；基因重用；可持续进化算法

中图分类号　ＴＰ１８；ＴＰ３０１　　文献标志码　Ａ　　文章编号　１６７１‐４５１２（２０１１）０７‐００４０‐０５

Ｓｕｓｔａｉｎａｂｌｅｅｖｏｌｕｔｉｏｎａｒｙａｌｇｏｒｉｔｈｍｕｓｉｎｇ

ｈｉｅｒａｒｃｈｉｃａｌｓｅａｒｃｈａｎｄｓｅｑｕｅｎｃｅｍｉｎｉｎｇ

Ｙａｎ

ｇ

Ｇｕａｎｃｉ

１

　ＬｉＱｉｎ

２

　ＬｉＳｈａｏｂｏ

１，２

　Ｚｈｏｎ

ｇ

Ｙｏｎ

ｇ

１

（１ＣｈｅｎｇｄｕＩｎｓｔｉｔｕｔｅｏｆＣｏｍｐｕｔｅｒＡｐｐｌｉｃａｔｉｏｎｓ，ＣｈｉｎｅｓｅＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓ，Ｃｈｅｎｇｄｕ６１００４１，Ｃｈｉｎａ；

２ＫｅｙＬａｂｏｒａｔｏｒｙｏｆＡｄｖａｎｃｅｄＭａｎｕｆａｃｔｕｒｉｎｇＴｅｃｈｎｏｌｏｇｙ，ＧｕｉｚｈｏｕＵｎｉｖｅｒｓｉｔｙ，Ｇｕｉｙａｎｇ５５０００３，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ　Ｔｈｅｍａｘｉｍａｌｆｒｅｑｕｅｎｔｓｅｑｕｅｎｔｉａｌｐａｔｔｅｒｎｓａｎｄｈｉｅｒａｒｃｈｉｃａｌｆａｉｒｃｏｍｐｅｔｉｔｉｏｎ（ＨＦＣ）ｆｒａｍｅ‐

ｗｏｒｋｗｅｒｅｄｉｓｃｕｓｓｅｄ．Ｔｈｅｎ，ａｍａｘｉｍａｌｆｒｅｑｕｅｎｔｓｅｑｕｅｎｔｉａｌｐａｔｔｅｒｎｍｉｎｉｎｇａｌｇｏｒｉｔｈｍ（ＭＦＳＰＭＡ）ｗａｓ

ｄｅｓｉｇｎｅｄａｎｄｔｈｅｓｕｓｔａｉｎａｂｌｅｅｖｏｌｕｔｉｏｎａｒｙａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｈｉｅｒａｒｃｈｉｃａｌｓｅａｒｃｈａｎｄｓｅｑｕｅｎｃｅｍｉｎｉｎｇ

（ＳＥＡＨＳＭ）ｗａｓｐｒｏｐｏｓｅｄｂｙｃｏｍｂｉｎｉｎｇＭＦＳＰＭＡｗｉｔｈＨＦＣ．ＳＥＡＨＳＭｅｍｐｌｏｙｅｄｓｅｖｅｒａｌｓｕｂｐｏｐｕ‐

ｌａｔｉｏｎｓｗｉｔｈｖａｒｉｏｕｓｆｉｔｎｅｓｓｌｅｖｅｌｓｆｏｒｄｉｆｆｅｒｅｎｔｉｎｄｉｖｉｄｕａｌｓｂｙｕｓｉｎｇＭＦＳＰＭＡｔｏｅｘｔｒａｃｔｅｘｃｅｌｌｅｎｔ

ｇ

ｅｎｅｓｆｒｏｍｐｏｐｕｌａｔｉｏｎ，ａｎｄｐｏｕｒｅｄｉｎｄｉｖｉｄｕａｌｓｃａｒｒｙｉｎｇｗｉｔｈｅｘｔｒａｃｔｅｄｇｅｎｅｓｃｈｅｍａｉｎｔｏｓｕｂｐｏｐｕｌａ‐

ｔｉｏｎｓｔｏａｃｈｉｅｖｅｓｔａｂｉｌｉｚｉｎｇｉｎｈｅｒｉｔａｎｃｅｏｆｇｅｎｅｔｉｃｉｎｆｏｒｍａｔｉｏｎａｎｄｔｏａｖｏｉｄｓｏｍｅｇｅｎｅｓｄｙｉｎｇｏｕｔ．Ｔｈｅ

ｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔＳＥＡＨＳＭｉｓｐｒｏｍｉｓｉｎｇｔｏｍａｉｎｔａｉｎｓｔａｂｉｌｉｚｉｎｇｉｎｈｅｒｉｔａｎｃｅｏｆｇｅｎｅｔｉｃｉｎ‐

ｆｏｒｍａｔｉｏｎ，

ｐ

ｒｅｖｅｎｔｐｒｅｍａｔｕｒｅｃｏｎｖｅｒｇｅｎｃｅ，ｔｏｐｒｏｍｏｔｅａｃｃｕｒａｃｙｏｆｓｏｌｕｔｉｏｎｓ．

Ｋｅｙｗｏｒｄｓ　ｍａｘｉｍａｌｆｒｅｑｕｅｎｔｓｅｑｕｅｎｔｉａｌｐａｔｔｅｒｎｓ；ｓｅｑｕｅｎｃｅｍｉｎｉｎｇ；

ｇ

ｅｎｅｔｉｃｉｎｆｏｒｍａｔｉｏｎ；

ｇ

ｅｎｅｓｒｅ‐

ｕｓｅ；ｓｕｓｔａｉｎａｂｌｅｅｖｏｌｕｔｉｏｎａｒｙａｌｇｏｒｉｔｈｍ

　　在自然进化系统中，新生个体的基因与父代

间有很大的共同部分，子代继承了整个种族进化

过程中的绝大多数信息，甚至不同物种间的差异

也比较小，但在智力、体型、适应能力等方面表现

出了巨大差异

［１］

．进化算法中新生个体的产生方

式充满了随意性，特别是通过随机生成的方式进

入进化种群的个体；而通过交叉与变异操作产生

的新个体，往往与父代个体的基因有很大的差异，

这就导致了遗传信息继承不稳定地局面．基于分

等级进化模型的进化算法

［２］

，将个体按适用性划

分成不同的子种群而进行独立的遗传操作，在一

定程度上可以减少遗传繁殖过程中新旧个体基因

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38592420

粉丝: 6
资源: 935

基于序列挖掘的分等级进化算法：稳定遗传与高效搜索

最新资源