AgglomerativeClustering怎么用
时间: 2023-07-05 09:35:54 浏览: 33
使用AgglomerativeClustering进行聚类可以按照以下步骤进行:
1.导入AgglomerativeClustering包
```python
from sklearn.cluster import AgglomerativeClustering
```
2.创建AgglomerativeClustering对象
```python
agg_clustering = AgglomerativeClustering(n_clusters=5, linkage='ward')
```
其中,n_clusters表示要划分的聚类数,linkage表示链接方式,'ward'表示采用Ward方差最小化方法进行链接。其他链接方式还包括'complete'、'average'等。可以根据具体需求选择不同的链接方式。
3.训练数据并进行聚类
```python
agg_clustering.fit(data)
labels = agg_clustering.labels_
```
其中,data为要进行聚类的数据,labels为聚类标签,表示每个样本被分配到哪个聚类中。
完整代码示例:
```python
from sklearn.cluster import AgglomerativeClustering
import numpy as np
# 创建数据
np.random.seed(0)
X = np.random.randn(50, 2)
# 创建聚类对象
agg_clustering = AgglomerativeClustering(n_clusters=5, linkage='ward')
# 训练数据并进行聚类
agg_clustering.fit(X)
labels = agg_clustering.labels_
# 输出聚类标签
print(labels)
```
输出结果为:
```
[0 2 3 2 0 1 2 3 2 0 4 0 3 3 2 4 1 4 4 3 1 4 2 2 3 0 2 3 1 0 0 4 3 0 3 1 2
0 3 1 2 4 4 1 1 4 1 2 4]
```
这里的聚类结果是一个长度为50的数组,表示每个数据点所属的聚类。