ICEA: 数据流中高效概念漂移的集成分类器设计

需积分: 9 5 下载量 46 浏览量 更新于2024-09-09 1 收藏 247KB PDF 举报
该篇论文名为《数据流中概念漂移检测的集成分类器设计》(Design of Ensemble Classifiers for Detecting Concept Drifts from Data Streams),作者是孙岳、毛国君和刘旭,他们来自北京工业大学计算机学院的北京市多媒体与智能软件重点实验室。研究领域集中在数据挖掘和人工智能领域,特别是在数据流分析中的一个重要问题——概念漂移。 概念漂移是指数据流中的模式随时间变化,导致原有分类模型的有效性降低的现象。论文提出的ICEA(Incremental Classification Ensemble Algorithm,增量集成分类器算法)是一项创新的数据流挖掘技术。ICEA采用集成分类器的方法,实现了对数据流中概念漂移的实时、增量式的检测和学习,旨在提高在处理快速概念漂移时的精确度和时间效率。 论文指出,ICEA的优势在于其能够有效地应对数据流环境下的动态变化,通过结合多个分类器的结果,减少了单个模型可能因局部过拟合或欠拟合而导致的误判。通过实验验证,ICEA在实时性、准确性和效率方面表现优秀,对于实时数据分析和在线学习系统具有重要的实际应用价值。 该研究还受到国家自然科学基金项目的资助(60496322, 60496327),这表明了其研究的理论基础和资金支持。论文的关键词包括数据挖掘、数据流和概念漂移,反映了研究的核心内容。论文的发表年份为2008年,期刊代码为1001/3695,表明了其在学术界的影响力和相关领域的研究进展。 总结来说,这篇论文不仅介绍了ICEA算法的设计原理和工作方式,还通过实验展示了其在数据流概念漂移检测上的实际效果,为数据流挖掘领域的研究者提供了一个有效的解决方案,并对相关领域的实践应用具有指导意义。