边缘分类能力与动态集成选择算法在OA分类器选择中的应用

需积分: 6 1 下载量 83 浏览量 更新于2024-09-07 收藏 1.2MB PDF 举报
"这篇论文提出了一种新的基于边缘分类能力的动态集成选择算法,用于优化分类器集成。通过使用随机参考分类器模拟原分类器,建立分类能力的概率模型,然后结合动态集成选择策略,将特征空间划分为不同能力区域,并在每个区域内构建最优的分类器集成。实验结果显示,这种方法在UCI数据集上相比其他排序准则表现更优,具有更高的分类正确率、更小的集成规模和更短的分类时间。研究由国家自然科学基金和安徽省自然科学基金资助,作者包括陈睿、黄海军、黄雯和胡劲松,主要研究方向涉及图像处理、模式识别和信息安全技术。" 这篇论文的核心是改进分类器集成的方法,尤其是动态集成选择算法。传统的集成学习方法如bagging(自助采样法)通常通过构建多个分类器并结合它们的预测来提升整体性能。然而,这篇论文提出的新方法关注的是分类器的边缘分类能力,这是一种衡量分类器在边界样本上的表现的能力。 边缘分类能力排序准则是该算法的关键。它使用随机参考分类器来模拟原始分类器,这有助于建立一个反映分类器分类能力的概率模型。这个概率模型能够量化分类器在处理特征空间不同区域时的表现。通过这种方式,可以更准确地评估每个分类器的性能,特别是在决策边界的复杂区域。 接下来,算法将特征空间划分为多个具有不同分类能力的区域。在每个区域内,算法会构建一个最优的分类器集合,这些集合在特定区域内的分类效果最佳。这样做可以确保集成中的每个分类器都专注于其最擅长的样本部分,从而增强整体集成的性能。 最后,动态集成选择算法被应用到未知样本的分类上。这意味着在分类过程中,算法可以根据样本的特征和之前确定的分类器能力模型动态选择最合适的分类器组合,从而提高分类效率和准确性。 实验结果证明了这种方法的有效性。在UCI数据集上的对比实验显示,基于边缘分类能力的排序准则优于现有的排序方法,而基于这种新准则的动态集成选择算法在分类正确率、集成规模和分类时间上都优于传统的分类器集成算法。 这篇研究为分类器集成提供了一个创新的视角,强调了分类器在决策边界附近的性能,并开发了一种动态策略来优化集成选择,这在实际应用中可能具有显著的优势,特别是在处理复杂和多变的数据集时。