DBSCAN密度聚类
时间: 2023-09-02 08:09:17 浏览: 67
DBSCAN密度聚类是一种用于聚类的算法。它的主要优点是可以对任意形状的稠密数据集进行聚类,并且可以在聚类的同时发现异常点。相对于其他聚类算法如K-Means,DBSCAN对聚类结果没有偏差,并且对数据集中的异常点不敏感。
DBSCAN的簇定义是由密度可达关系导出的最大密度相连的样本集合。这意味着如果样本点A可以通过一系列的密度可达关系与样本点B相连,则A和B属于同一个簇。
DBSCAN的缺点是,当样本集的密度不均匀、聚类间距差很大时,聚类质量较差,不适合使用DBSCAN进行聚类。而且,当样本集较大时,聚类收敛时间较长,可以通过对搜索最近邻时建立的KD树或者球树进行规模限制来改进。此外,DBSCAN的调参相对于传统的聚类算法稍复杂,需要对距离阈值和邻域样本数阈值进行联合调参,不同的参数组合会对最后的聚类效果产生较大影响。
举个例子来说明DBSCAN的聚类过程,如图2所示,点A是一个核心点,点B是一个边界点,因为A直接密度可达B。虽然B不直接密度可达A,但C直接密度可达A,并且A直接密度可达B,所以C密度可达B。但是B不直接密度可达A,因此B不密度可达C。但是B和C是密度相连的。这样,C、A和B会被划分为同一个簇。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* [基于密度的聚类算法(1)——DBSCAN详解](https://blog.csdn.net/weixin_50514171/article/details/127195711)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *2* *3* [DBSCAN聚类算法简介](https://blog.csdn.net/dsdaasaaa/article/details/94590159)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]