M-DBSCAN：一种混合属性密度聚类新算法

需积分: 10 55 浏览量更新于2024-08-11 收藏 268KB PDF 举报

"基于维度距离的混合属性密度聚类算法研究 (2009年)，吴天虹，黄德才，翁挺，马晨明，浙江工业大学信息工程学院" 本文主要探讨的是针对混合属性数据的聚类问题，特别是在DBSCAN（Density-Based Spatial Clustering of Applications with Noise）算法的局限性上进行的改进。DBSCAN是一种经典的无中心、无参数的聚类算法，它通过检测高密度区域来发现聚类，并将低密度区域视为噪声。然而，DBSCAN在处理包含不同类型的混合属性数据时，可能会遇到困难，因为这些数据可能需要不同的相似度度量标准。作者们提出了一个新的算法，名为M-DBSCAN（Mixed-Attribute DBSCAN），该算法引入了“面向维度的距离”的思想。在M-DBSCAN中，对于不同类型的属性，算法定义了不同的相似度度量方法，这允许更灵活地处理各种数据类型。例如，数值型数据可能使用欧几里得距离，而类别型数据可能使用Jaccard相似度或其他合适的度量。此外，算法还采用了不同的相似度阈值，进一步减少了对全局相似度阈值的依赖，使得算法能更好地适应混合属性数据集的复杂性。通过仿真实验，M-DBSCAN算法展示了其在处理混合属性数据时的有效性，成功解决了DBSCAN在处理这类数据时的不足，实现了较好的聚类效果。这种改进对于数据挖掘领域具有重要意义，因为它提高了对复杂数据集的聚类能力，尤其是在现实世界中的多源、异构数据集上。关键词：数据挖掘、聚类、混合属性、密度。文章的发表在《浙江工业大学学报》2009年第37卷第4期，表明这是科学研究领域的成果，对于理解如何利用密度基础的方法处理混合属性数据提供了有价值的理论和技术支持。中图分类号：TP302.1，文献标识码：A，文章编号：1006-4303(2009)04-0445-04，表明了该论文在计算机科学与技术，特别是数据处理与信息管理方向的专业性。

weixin_38592611

粉丝: 8
资源: 879

M-DBSCAN：一种混合属性密度聚类新算法

基于网格密度的聚类算法研究

文本聚类中基于密度聚类算法的研究与改进

谱聚类算法研究谱聚类算法研究.pdf

一种混合属性数据的聚类算法

各种密度聚类算法.pdf

DCHT：一种基于层次树的高效密度聚类算法

"基于低密度分割密度敏感距离的谱聚类算法研究综述

基于图像空间关系的ICM聚类算法研究

【进阶】高级文本聚类算法：谱聚类、密度聚类算法

基于增量式学习的聚类算法研究

最新资源