显露模式分类器的级联新算法与实验研究

需积分: 9 2 下载量 97 浏览量 更新于2024-07-23 收藏 1.04MB PDF 举报
"cascading an emerging pattern based classifier全文翻译" 这篇论文探讨了基于显露模式的分类器的级联方法,旨在克服这类分类器存在的两个主要问题:全局离散化对数值属性的影响和对支持度阈值的高度敏感性。显露模式,即在特定类别中频繁出现而在其他类别中罕见的属性组合,是分类器构建的基础。它们提供了识别对象所属类别的依据。 文章首先介绍了分类器使用新兴模式的基本概念,强调了这种分类器的精确性和可解释性。然而,全局离散化过程可能导致信息丢失,降低分类准确性,而支持度阈值的选择直接影响分类效果,需要手动调整。 为了改进这一情况,论文提出了一种新的算法,该算法不需要全局离散化数值属性,从而保留更多原始信息。此外,作者还引入了一种级联分类器的构建方法,通过结合使用不同支持度阈值的分类器,既能利用高支持度阈值带来的高精度,也能利用低支持度阈值捕获更广泛的信息。级联结构允许分类器逐步处理输入,提高整体性能。 实验结果显示,级联的基于CEPM(Crisp Emerging Pattern Mining)的分类器在与最先进的分类器对比中表现出更高的精确度,包括那些基于显露模式的最精确分类器。这一发现证明了级联策略的有效性,尤其是在生物信息学、数据流分析、入侵检测等应用领域。 关键词:分类器级联、可理解分类器、显露模式分类器 在引言部分,作者指出监督学习的目标是通过代表性样本创建模式,用于预测或理解问题领域。显露模式分类器自Dong和Li的工作以来,已发展成为一种实用的工具,尤其在处理复杂数据集时。Bailey等人的工作是基于显露模式的分类器的一个里程碑,但其全局离散化和对支持度阈值的依赖限制了其潜力。 论文的其余部分详细描述了新算法的实现,包括如何从决策树中提取模式,以及如何构建和评估级联分类器。实验部分提供了具体的数据集和比较,进一步证实了新方法的优势。最后,结论部分总结了研究的主要贡献,并表达了对未来工作的展望。 这篇论文为基于显露模式的分类器提供了一个改进方案,通过级联和避免全局离散化,提高了分类的准确性和鲁棒性,为理解和应用这类分类器提供了新的视角。
2021-09-02 上传