属性相似度云分类器:一种高维数据高效分类方法

需积分: 5 0 下载量 127 浏览量 更新于2024-08-12 收藏 3.74MB PDF 举报
"基于属性相似度的云分类器 (2005年) - 张国英, 沙芸, 余有明, 刘玉树 - 北京理工大学 & 北京石油化工学院" 本文主要介绍了针对高维对象分类问题的一种新方法——基于属性相似度的云分类器。在传统的高维数据分类中,权重问题是一个挑战,因为不同属性对分类的影响可能差异巨大。作者引入了属性相似度的概念来解决这个问题,通过这个概念,可以更好地量化和调整各个属性在分类过程中的重要性。 云理论是本文的核心工具,它是一种模糊逻辑与概率论相结合的理论,能够处理不确定性和模糊性的信息。在云分类器中,每个属性都有一个对应的云模型,用于表达属性值对其所属类别中心(Ex)的隶属程度。云模型可以看作是对离散或连续数据的一种概率描述,它包含了类别的主观不确定性。 分类模型是通过集成各个属性模型构建的,其中属性权重的确定依据属性相似度。如果两个类别间的某个属性相似度较高,意味着这个属性对于区分这两个类别贡献较小,因此在计算权重时应给予较低的考虑。反之,如果属性相似度低,那么该属性在分类过程中将起到更大的作用。 为了进一步优化分类模型,作者采用了粒子群优化算法来寻找最佳的类别中心(E-μ)。粒子群优化是一种基于群体智能的全局优化方法,能够在多维空间中搜索最优解。在本研究中,它被用来优化云模型的中心位置,从而提高分类的精度。 实验部分,作者将提出的基于属性相似度的云分类器与普通的云分类器应用于Iris数据集,结果表明,基于属性相似度的云分类器在分类效果上优于传统的云分类器。Iris数据集是机器学习领域常用的多类分类数据集,包含多个属性和类别,适合作为分类算法的测试平台。 关键词:属性相似度、云模型、云分类器、粒子群优化算法 通过上述方法,该研究提供了一种改进的分类策略,尤其在处理高维数据和复杂分类问题时,能有效提升分类性能。这种方法对于大数据分析和机器学习领域的高维数据处理具有一定的理论价值和实践意义。