自组织分级聚类在数据挖掘中的应用

需积分: 5 0 下载量 187 浏览量 更新于2024-08-13 收藏 232KB PDF 举报
"该文提出了一种基于自组织分级聚类的数据挖掘方法,旨在改进传统自组织聚类方法在处理多维数据和发现强关联规则时的局限性。该方法结合最大似然分类自组织特征网络(MAXNET)和自下而上的层次聚类,对有畸变的二值化输入模式进行有效分类。通过在销售电脑商场的交易数据集上的应用,展示了从低层次概念到高层次概念的关联分析,并通过与传统方法的比较验证了新方法的有效性。" 本文探讨的是数据挖掘领域的一个创新方法,作者杨天奇提出了一种基于自组织分级聚类的技术,以解决传统自组织映射(Self-Organizing Map, SOM)方法在多维度数据处理和发现强关联规则时存在的问题。SOM是一种无监督学习的神经网络模型,常用于数据可视化和聚类,但其在处理复杂数据分布和寻找深层次关联时可能会遇到挑战。 为克服这些局限,作者引入了最大似然分类自组织特征网络(MAXNET)作为预处理步骤。MAXNET利用最大似然原则对数据进行分类,能更好地适应数据的畸变和多样性。随后,该方法结合自下而上的层次聚类策略,这种层次聚类方法能够根据数据间的相似性构建一个分层的聚类结构,从而揭示不同层次的概念关系。 在实际应用中,作者选取了一个销售电脑商场的交易数据集进行分析。通过对交易数据的挖掘,不仅能够识别出低层次的消费模式,如单一商品的购买行为,还能进一步提炼出高层次的消费者行为,如消费者的购买偏好或购物习惯。这有助于商家理解顾客需求,制定更精准的营销策略。 为了证明新方法的有效性,作者使用了MADAB仿真软件,将新方法与传统聚类方法进行了对比。实验结果表明,新方法在发现数据内在结构和关联规则方面表现出更好的性能,证实了这种方法在数据挖掘领域的实用价值。 这项研究为数据挖掘提供了新的工具,特别是在处理复杂、多维数据和发现深层次关联时。这种方法的提出,对于商业智能、市场分析以及其它依赖数据洞察的领域具有重要的理论和实践意义。