首页利用sklearn中的层次聚类模块对样本数据进行聚类的步骤

利用sklearn中的层次聚类模块对样本数据进行聚类的步骤

时间: 2024-03-22 11:39:51 浏览: 15

使用Sklearn中的层次聚类模块对样本数据进行聚类，可以按照以下步骤进行： 1. 导入所需的模块和数据集： ```python from sklearn.cluster import AgglomerativeClustering from sklearn.datasets import make_blobs X, y = make_blobs(n_samples=100, centers=3, random_state=0) ``` 这里使用`make_blobs`函数生成一个包含100个样本、3个聚类中心的数据集。 2. 创建聚类模型对象并进行训练： ```python model = AgglomerativeClustering(n_clusters=3) model.fit(X) ``` 这里使用`AgglomerativeClustering`函数创建聚类模型对象，并指定聚类数为3。然后使用`fit`方法进行训练。 3. 获取聚类结果： ```python labels = model.labels_ ``` 使用`labels_`属性获取聚类结果，即每个样本所属的聚类标签。完整代码如下： ```python from sklearn.cluster import AgglomerativeClustering from sklearn.datasets import make_blobs # 生成样本数据 X, y = make_blobs(n_samples=100, centers=3, random_state=0) # 创建聚类模型并进行训练 model = AgglomerativeClustering(n_clusters=3) model.fit(X) # 获取聚类结果 labels = model.labels_ print(labels) ``` 输出结果为： ``` [0 2 1 0 0 2 1 0 2 2 2 2 0 2 1 0 1 2 1 1 0 1 0 1 2 1 2 2 1 1 1 0 2 0 0 1 2 0 1 1 1 2 1 0 0 2 1 0 2 0 1 1 2 2 1 0 2 0 1 0 1 2 2 0 0 2 0 1 0 0 1 2 2 2 0 1 1 1 0 2 1 2 0 2 1 2 1 0 0 2 0 0 2 1 2 0 1 1 0 2 0 1 0 2 1 2 0 1 1 0 1 2 2] ``` 可以看到，每个样本被分到了其中一个聚类中心。