首页综述常用的聚类算法（包括：单聚类算法和双聚类算法）

综述常用的聚类算法（包括：单聚类算法和双聚类算法）

时间: 2023-07-09 20:55:22 浏览: 174

聚类是一种无监督学习方法，其目标是将数据集中相似的数据点分组为若干个类别。常用的聚类算法包括单聚类算法和双聚类算法。 1. 单聚类算法单聚类算法是指只能将数据集分成一个整体类别的聚类算法。常用的单聚类算法有K-Means、层次聚类和DBSCAN。 - K-Means：将数据集分成K个类别，每个类别的中心是该类别所有数据点的平均值。 - 层次聚类：将数据集分成一颗树形结构，每个节点表示一个类别，叶子节点表示单个数据点，根节点表示所有数据点属于同一个类别，树的高度表示K的大小。 - DBSCAN：通过密度来定义一个簇，簇的边界由密度较低的区域来划分。 2. 双聚类算法双聚类算法是指能将数据集分成多个行和列的聚类算法。常用的双聚类算法有Biclustering、Spectral Co-Clustering和Non-Negative Matrix Factorization。 - Biclustering：将数据集分成子矩阵，其中行和列的聚类结构是相互独立的。 - Spectral Co-Clustering：基于谱聚类的思想，在行和列两个维度上分别进行谱聚类。 - Non-Negative Matrix Factorization：将数据矩阵分解为两个非负矩阵，分别表示行和列的聚类特征。以上是常见的聚类算法，不同的算法适用于不同的数据集和问题，需要根据实际情况进行选择。

阅读全文