第39卷 第7期
2011年 7月
华 中 科 技 大 学 学 报 (自 然 科 学 版)
J .Huazhong Univ .of Sci .& Tech .(Natural Science Edition)
Vol .39 No .7
Jul . 2011
收稿日期 2010‐11‐10 .
作者简介 杨观赐(1983‐) ,男 ,博士研究生 ;李少波(通信作者) ,教授 ,E‐mail :lishaobo@
g
zu .edu .cn .
基金项目 教育部新世纪优秀人才支持计划资助项目 (NCET09‐0094) ;国家自然科学基金资助项目 (60975049) ;
贵州省科学技术基金资助项目 (黔科合 J 字[2010]2095) .
基 于 序 列 挖 掘 的 分 等 级 搜 索 可 持 续 进 化 算 法
杨观赐
1
李 琴
2
李少波
1 ,2
钟 勇
1
(1 中国科学院成都计算机应用研究所 ,四川 成都 610041 ;
2 贵州大学教育部现代制造技术重点实验室 ,贵州 贵阳 550003)
摘要 讨论了最大频 繁 序 列 模 式和公平竞 争 层 次 模 型 (HFC ) ,设 计 了 最 大 频 繁 序 列 模 式 的 挖 掘 算 法
(MFSPMA) ,把 M FSPM A 同 HFC 结合起来 ,提出了基于序列挖掘技术的分等级搜索可持续进化算 法
(SEA HSM ) .该进化算法设置多个不同层次的种群为不同适应度水平的个体提供生存空间 ,采用最大频繁子
模式挖掘算法挖掘种群中的优良基因 ,并将具有优良基因模块的新个体注入到不同适应度水平的种群 ,从而
实现遗传信息的稳定继承 ,有效避免优良基因的丢失 .实验结果表明 :SEAHSM 在维持遗传信息稳定性 、避免
早熟收敛 、提高搜索精度等方面表现良好 .
关键词 最大频繁序列模式 ;序列挖掘 ;遗传信息 ;基因重用 ;可持续进化算法
中图分类号 T P18 ;T P301 文献标志码 A 文章编号 1671‐4512(2011)07‐0040‐05
Sustainable evolutionary algorithm using
hierarchical search and sequence mining
Y an
g
Guanci
1
L i Qin
2
L i Shaobo
1 ,2
Zhon
g
Yon
g
1
(1 Chengdu Institute of Computer Applications ,Chinese Academy of Sciences ,Chengdu 610041 ,China ;
2 Key Laboratory of Advanced Manufacturing Technology ,Guizhou University ,Guiyang 550003 ,China)
Abstract The maximal frequent sequential patterns and hierarchical fair competition (HFC ) frame‐
work were discussed .Then ,a maximal frequent sequential pattern mining algorithm (M FSPMA ) was
designed and the sustainable evolutionary algorithm based on hierarchical search and sequence mining
(SEAHSM ) was proposed by combining MFSPMA with HFC .SEAHSM employed several subpopu‐
lations with various fitness levels for different individuals by using M FSPMA to extract excellent
g
enes from population ,and poured individuals carrying with extracted gene schema into subpopula‐
tions to achieve stabilizing inheritance of genetic information and to avoid some genes dying out .The
experimental results show that SEAHSM is promising to maintain stabilizing inheritance of genetic in‐
formation ,
p
revent premature convergence ,to promote accuracy of solutions .
Key words maximal frequent sequential patterns ;sequence mining ;
g
enetic information ;
g
enes re‐
use ;sustainable evolutionary algorithm
在自然进化系统中 ,新生个体的基因与父代
间有很大的共同部分 ,子代继承了整个种族进化
过程中的绝大多数信息 ,甚至不同物种间的差异
也比较小 ,但在智力 、体型 、适应能力等方面表现
出了巨大差异
[1]
.进化算法中新生个体的产生方
式充满了随意性 ,特别是通过随机生成的方式进
入进化种群的个体 ;而通过交叉与变异操作产生
的新个体 ,往往与父代个体的基因有很大的差异 ,
这就导致了遗传信息继承不稳定地局面 .基于分
等级进化模型的进化算法
[2]
,将个体按适用性划
分成不同的子种群而进行独立的遗传操作 ,在一
定程度上可以减少遗传繁殖过程中新旧个体基因